APÉNDICE 10.1 – ASPECTOS METODOLÓGICOS
POBLACIÓN DE REFERENCIA Y POTENCIAL DE MEJORA
Existen varias características relacionadas con las carreteras que influyen en el riesgo de un accidente. Las carreteras rurales principales, que se diseñan y operan siguiendo estándares más altos que los de las carreteras secundarias, suelen ser más seguras en términos de accidentes por vehículo-km.
En cualquier carretera, el nivel de seguridad no es constante. Por ejemplo, la densidad de accidentes suele ser menor en los enlaces que en los nodos, debido a las diferencias en el número de conflictos relacionados con el tráfico. En los nodos, las intersecciones en T suelen ser más seguras que las intersecciones en + por la misma razón, y así sucesivamente.
En consecuencia, el potencial de mejora depende en gran medida de la naturaleza del emplazamiento objeto de estudio y de las modificaciones que se puedan prever.
Por lo tanto, es necesario definir poblaciones de referencia distintas para ayudar a determinar lo que constituye un nivel de seguridad representativo para un tipo de emplazamiento determinado. Dichas poblaciones se definen teniendo en cuenta las principales características de la carretera que repercuten en la seguridad vial. Por ejemplo, se puede definir una población de referencia para intersecciones de dos carriles en + en zonas urbanas con paradas en los ramales secundarios y otra población para intersecciones en T en carreteras similares, etc. Dada la importancia de los flujos de tráfico con respecto a los accidentes, lo ideal sería desarrollar poblaciones de referencia distintas para diferentes combinaciones de flujos de tráfico.
El establecimiento de poblaciones de referencia requiere de un buen conocimiento tanto de los factores que contribuyen a los accidentes como de los datos disponibles, lo que limita de forma rápida el número de posibles poblaciones que se pueden definir. En la práctica, el desarrollo de modelos estadísticos multivariantes se utiliza a menudo para sortear las limitaciones de los datos.
CARÁCTER ALEATORIO DE LOS ACCIDENTES
Uno de los principales problemas que surgen al utilizar datos de accidentes para detectar deficiencias de seguridad vial tiene que ver con la naturaleza aleatoria de estos eventos.
Para que sea más fácil entender este concepto y sus consecuencias, usemos un dado como analogía, ya que lanzar el dado también es un evento aleatorio, cuyo resultado depende del número de caras del dado y del valor de cada cara. En un dado estándar de seis caras, el rango de valores posibles es simple: [1, 2, 3, 4, 5, 6]. Cuando se lanza un dado muchas veces, cada cara debería salir un número equivalente de veces siendo el valor medio resultante de tales lanzamientos 3,5: (1 + 2 + 3 + 4 + 5 + 6) / 6 = 3,5. Este valor puede describirse como la “media a largo plazo” del dado. Cuando el dado se lanza solo un número limitado de veces, por ejemplo, tres, la media obtenida puede variar entre valores extremos de 1 y 6. Si este resultado se utiliza para estimar la media a largo plazo del dado, la precisión variará enormemente. Algo similar ocurre con la frecuencia de los accidentes. El número de accidentes que se producen en un lugar durante un período de un año (f) puede compararse con un lanzamiento del dado, mientras que su frecuencia media de accidentes a largo plazo (m) puede compararse con la media a largo plazo del dado. Desde un punto de vista estadístico, se dice que el lanzamiento del dado sigue una distribución uniforme, mientras que los accidentes siguen una distribución de Poisson.
Distribución de Poisson

Donde:
p(f;m) = probabilidad de observar f accidentes, dado que el nivel de seguridad es m.
f = Frecuencia de accidentes
m = nivel de seguridad
Se trata de una ecuación fundamental en el análisis de la seguridad vial. Se puede utilizar para calcular la probabilidad de una frecuencia de accidentes determinada (f) cuando se conoce el nivel de seguridad (m). Por ejemplo, si el valor m de un lugar es de 5 accidentes/año, la probabilidad de tener exactamente 1 accidente/año es del 3,4 %, mientras que la probabilidad de tener 6 o más accidentes es del 38 % (Figura 10.A1). La calculadora de la Distribución de Poisson puede utilizarse para calcular esta última probabilidad.

Cada punto de una red viaria tiene su propio valor “m” basado en su conjunto de características (siguiendo con la analogía de los dados, habría varios dados, cada uno con un número distinto de caras y valores).
En la práctica, las dificultades surgen debido a que el nivel de seguridad (m) es desconocido y debe estimarse (m ̂) a partir de las frecuencias de accidentes notificadas (f).
Por ello, se proporciona una calculadora (CALCULADORA: INTERVALO DE CONFIANZA) para estimar la incertidumbre de “m” basada en una frecuencia de accidentes detectada.
Esta estimación de m se vuelve más fiable estadísticamente a medida que aumenta el período, pero puede resultar menos representativa respecto a las condiciones predominantes si se han producido cambios en el lugar durante el período considerado. Para evitar este tipo de sesgo, a menudo se utilizan intervalos de accidentes relativamente cortos (de 3 a 5 años).
REGRESIÓN A LA MEDIA
El fenómeno de regresión a la media es común para una serie de eventos aleatorios y consiste en una tendencia general de los valores extremos a volver a los valores medianos. Sir Francis Galton, que observó que los hijos de padres altos solían ser más bajos, y viceversa, fue el primero en identificar la regresión a la media en el siglo XIX (Galton, 1886). Este fenómeno también se aplica a los accidentes. Cuando la frecuencia de accidentes es anormalmente alta durante un período determinado, tiende a disminuir durante el período siguiente y a acercarse a la media a largo plazo del lugar (y viceversa).
SESGO DE SELECCIÓN
El carácter aleatorio de los accidentes y la dificultad de ampliar los períodos de accidente tanto como sea necesario para alcanzar una precisión suficiente, crean dos tipos de sesgos durante la fase de identificación. Estos sesgos se traducen en que las zonas normales pueden ser detectadas como inseguras y las zonas inseguras pueden no ser detectadas. La figura 10.A1, extraída de Hauer y Persaud (1984), ilustra el problema. El rectángulo representa todas las zonas de una red viaria. La elipse 1 representa todas las zonas inseguras (aquellas con un alto valor "m"). Es únicamente en estos lugares donde un tratamiento está justificado. La elipse 2 representa las zonas que se detectaron como desviadas durante la fase de identificación (aquellas con un alto valor "f"). Dado esto, pueden surgir cuatro tipos de situaciones (dominios A-D):

El objetivo de la etapa de identificación es obtener la mejor superposición posible de las elipses 1 y 2 y limitar las áreas A y C. Se considera que las técnicas de identificación que tienen en cuenta el carácter aleatorio de los accidentes reducen el sesgo de selección.