Académique Documents
Professionnel Documents
Culture Documents
Presentado a
Tutor:
FRANCISCO CABRERA DÍAZ
Presentado por
Jhon Wilfer VIRGUEZ SIERRA – 1053332035
WIRIS RAFAEL CONTRERAS QUINTERO - 1051816706
JUAN DIEGO BERNAL OROZCO - 1053818828
Grupo No.
100105_112
Introducción.
El desarrollo de esta actividad se hizo con el fin de aplicar los conceptos estudiados
en el curso Estadística Descriptiva de la Unad, siendo este un conocimiento
indispensable para el continuo aprendizaje en nuestro programa. Así mismo tiene
como fin llevar a la práctica los conceptos y ejercicios trabajando con escenario real.
Adicional a la obtención del reconocimiento de los recursos para realizar una
planeación del desarrollo de las actividades, se llevó a cabo porque hace parte de
nuestra formación académica. Haciendo buen uso de las herramientas y el material
variado y competente para indagar acerca del tema propuesto, hemos desarrollado
la actividad de manera didáctica con el fin de compartir con todos los participantes
y contribuir al aprendizaje colaborativo, generando así unos resultados
satisfactorios y significativos.
Teniendo en cuenta que el interés por aprender es constante, fue de buen agrado y
mayor provecho dedicar tiempo para plasmar las ideas según lo solicitado, y de esta
forma continuar con el proceso de aprendizaje, y demostrar de manera consecuente
el entendimiento y enriquecimiento del saber. Así mismo la intencionalidad de
contribuir a la formación y cumplimiento de acuerdo al desarrollo de las actividades.
.
Justificación.
Objetivos
General
Específicos
Conceptos Básicos
La Población, se habla del total de eventos que representan un estudio,
para el caso concreto, la población son los accidentes de tránsito ocurridos
a en el territorio Nacional, durante el 2015
El tamaño de la muestra, y ubicación espacio temporal de la muestra, es la
definición y delimitación de la proporción que se va a estudiar y la que
permitirá extrapolar los resultados a una conclusión más general, de acuerdo
a la representatividad de los datos, para el caso particular la muestra que se
va a estudiar son los 110 accidentes de tránsitos presentados en la ciudad
de Medellín durante el 2015.
La unidad estadística, se dice que es la unidad básica de cualquier análisis
estadístico, es la parte indivisible del proceso de análisis y representa cada
una de las observaciones, para el caso de nuestro análisis esta unidad es
Cada uno de los registros de accidente
Las variables; estas pueden ser de dos tipos, discretas o continuas, siendo
las primeras: variables de tipo cuantitativo que puede tomar un solo valor,
entre cierta cantidad de valores dados dentro del problema de estudio, su
valor siempre será finito y solo acepta valores enteros. Mientras que las
variables continuas son las que pueden tomar cualquier valor que exista entre
dos magnitudes, es decir puede tomar infinitos valores, además estos valores
admiten fracciones y son el resultado de algún método de medición
o Cualitativas; Tipo de Vehículo, Genero, Mes, Día de la semana, Otros
Factores, Tipo de Vía, involucra peatones
o Cuantitativas.
Las Variables discretas son : número de heridos,
número de muertos
Variables continuas son: grado de alcohol del
conductor, hora, costo estimado del siniestro, edad,
velocidad velocidad
Las medidas de dispersión hacen referencia al análisis de los datos que se alejan
del centro, y que por tanto no dan información útil en los cálculos de promedio o de
tendencia central, pero que son necesarios para conocer cuál es la realidad de los
datos con los que se pretende analizar una situación dada. Las principales medidas
de dispersión son; el rango o recorrido, la varianza, el coeficiente de variación, el
puntaje típico o estandarizado y las medidas de asimetría o apuntalamiento.
Una vez revisado, a modo general, algunos conceptos sobre las variables y sus
medidas procederemos a hacer el respectivo análisis teniendo en cuenta los datos
aportados por la investigación y orientados a resolver la problemática planteada
“Principales Causas que incrementan e (inciden) en el número de accidentes de
tránsito, ocurridos en el territorio Nacional”
Frecuencia
Frecuencia Frecuencia
Edad Frecuencia Relativa
Acumulada Relativa
Acumulada
38 7 63 6,36% 57,27%
42 3 66 2,73% 60,00%
43 2 68 1,82% 61,82%
44 1 69 0,91% 62,73%
45 3 72 2,73% 65,45%
46 14 86 12,73% 78,18%
48 1 87 0,91% 79,09%
50 1 88 0,91% 80,00%
52 6 94 5,45% 85,45%
53 1 95 0,91% 86,36%
54 6 101 5,45% 91,82%
55 5 106 4,55% 96,36%
56 2 108 1,82% 98,18%
60 2 110 1,82% 100,00%
Total 110 100%
Medidas de Tendencia Central
Moda 46
Mediana 36
Media 36,97
Medidas de Posición
Cuartiles Edad Deciles Edad Percentiles Edad
Q1 25.25 D5 36 P30 29,7
Q2 36 D7 46 P50 36
Q3 46
Como se evidencia las personas de 46 años fueron las que en mayor número se
vieron involucradas en accidentes de tránsito, así mismo, vemos que los datos
tienden a agruparse alrededor de los 36 años; el promedio de edad de las personas
involucradas en accidentes es de los 36, casi 37 años, además el 50% de los
14
15
9
10 6
5
0
(0,00 – (0,438 – (0,875 – (1,31 – (1,75 – (2,19 – (2,62 – (3,06 –
0,438] 0,875] 1,31] 1,75] 2,19] 2,62] 3,06] 3,5]
Grados de Alcohol
Polígono de Frecuencias
15 15 14
10 9
6
personas)
0
(0,00 – (0,438 – (0,875 – (1,31 – (1,75 – (2,19 – (2,62 – (3,06 –
0,438] 0,875] 1,31] 1,75] 2,19] 2,62] 3,06] 3,5]
Grados de Alcohol
Como se aprecia en los cálculos anteriores, las personas con 1,4 grados de alcohol
fueron las que mayoritariamente se vieron involucradas en accidentes de tránsito,
así mismo el promedio de 1,74 grados de alcohol en los accidentes ocurridos indican
una concentración de los datos entorno a los valores que se encuentran por encima
de 0,5 y por debajo de los 2,5 grados. De acuerdo a los resultado podemos ver que
los datos presentan una distribución sesgada hacia la derecha, donde 𝑀𝑜 < 𝑀𝑒 <
𝑥̅
2. Medidas Univariantes de Dispersión
histograma, una fuerte concentración entre los grados0,5 y 2,5; esto se explicaría
por la levedad de embriaguez que le da al conductor una mayor confianza a usar el
carro, que además se podría aventurar a decir, que al ser somero el nivel de trago
ingerido por el conductor, no hay presión social por no usar el carro, es decir si no
es evidente el estado de embriaguez raramente existirá presión de amigos o
familiares por dejar de conducir, cosa contraria a cuando esta es evidente. Esto
supone que es más peligrosa una persona con niveles medios de alcohol que una
totalmente ebria, dado que si lo está el grupo presionara por hacerlo desistir de
manejar y eso explica porque en niveles más altos no se encuentran involucrados.
12
10
Numero de Mertos
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Grados de Alcohol del Conductor
𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2
Total
190,3 531,0 1213,8 426,5 3601,0
∑
𝑌̂ = 𝑎 + 𝑏𝑋
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 110 ∗ 1213,8 − (190,3 ∗ 531) 32468,70
𝑏= = = = 3,0351
𝑛 ∑ 𝑥 2 − (∑ 𝑋)2 (110 ∗ 426,47) − (190,3)2 10697,61
∑ 𝑌 − 𝑏 ∑ 𝑋 531 − (3,0351 ∗ 190,3) −46,5863
𝑎= = = = −0,4235
𝑛 110 110
𝑌̂ = 𝑎 + 𝑏𝑋 → 𝑌̂ = 3,0351𝑋 − 0,4235
Dónde:
𝑌̂: Variable dependiente (la que se va a predecir):
𝑎: Intercepto de la variable Y
𝑋: Variable independiente
𝑏: Pendiente de la recta
Para determinar la confiabilidad del modelo matemático o la recta de regresión se hará
uso del cálculo del Error estándar del estimado: el cual mide el grado de confiabilidad
de la ecuación de la recta estimada, indicando el grado de dispersión o variabilidad de
los datos observados alrededor de la línea de regresión:
∑ 𝒚𝟐 − 𝒂 ∑ 𝒚 − 𝒃 ∑ 𝒙𝒚
𝑆𝑒 = √
𝒏−𝟐
Del modelo matemático, que permite predecir el efecto de la variable grados de alcohol,
sobre el número de muertos, se puede concluir que es una estimación muy buena, pues
el Coeficiente de determinación es alto, cerca del 87%, lo que permite concluir que la
variación de los datos no es muy alta y se encuentra recogida dentro del modelo, la
información está determinada por la variabilidad de las estadísticas revisadas.
12
GRADOS DE ALCOHOL DEL
10 CONDUCTOR
8
Pronóstico para Numero de
6 Muertos
4
Linear (Pronóstico para
2 Numero de Muertos)
0
-2 0.0 1.0 2.0 3.0 4.0
GRADOS DE ALCOHOL DEL CONDUCTOR
Con el valor del error estándar del estimado, se procede a calcular el coeficiente
de determinación, que es la medida que permite estimar el porcentaje de la
información que es recogida o explicada por el modelo de regresión escogido; a
partir de medir la variación de la variable dependiente. Cuando el 𝑹𝟐 es cercano a 1,
se dice que el modelo de regresión lineal ajustado tiene un alto grado de
confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo
y se recomienda no utilizar el modelo de regresión estimado
𝑺𝒆𝟐 1,14072
𝑹 = 𝟏 − ( 𝟐 ) = 𝑹𝟐 = 1 −
𝟐
= 0,8790
𝑺𝒚 9,4338
Primero toca calcular 𝑺𝟐𝒚 la varianza de la variable dependiente Y.
∑𝒚 3601
𝑺𝟐𝒚 = ( ̅𝟐 = 𝑺𝟐𝒚 = (
)−𝒚 ) − (4,8272)𝟐 = 9,4338
𝒏 𝟏𝟏𝟎
Generalmente, por cuestiones de interpretación, se usa con mayor frecuencia el
coeficiente de correlación lineal o coeficiente de Pearson, que es la raíz cuadrada
del coeficiente de determinación; esta toma valores que van desde +1 hasta el -1. e
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
16
Informe Final
indica el grado de asociación entre las variables, si es 0 indica que no existe relación
alguna y los valores extremos +1 y -1 indican una correlación perfecta positiva o
negativa respectivamente.
Como se pudo apreciar la relación entre las variables es alta, es además positiva lo
que quiere decir que la ocurrencia de una implica una afectación de la otra, y la
fuerza de explicación entre una y otra es alta, lo que indica que, si existe, con un
93% de probabilidad la ocurrencia de la otra. Saberlo implica mayor conciencia
sobre la responsabilidad que se tiene al conducir, pues si es evidente que se tiene
mayor probabilidad de verse involucrado en un accidente donde se presenten
muertos.
Regresión y Correlación Lineal Múltiple.
160
y = 16.488x + 44.684
140 R² = 0.7369
120
100
80
60
y = 1.1744x + 1.632
40 R² = 0.5109
20
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
8
Número de Heridos
6
4 Pronóstico Número de
Heridos
2
Linear (Pronóstico
0 Número de Heridos)
0 50 100 150 200
Velocidad
6
5 Número de Heridos
4
Pronóstico Número de
3
Heridos
2
Linear (Pronóstico
1 Número de Heridos)
0
0.0 1.0 2.0 3.0 4.0
Grados de Alcohol del Conductor
𝑋1 𝑋2 𝑌 𝑋1 𝑌 𝑋2 𝑌 𝑋1 𝑋2 𝑋1 2 𝑋2 2 𝑌2
𝑌̂ = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2
∑ 𝑋1 𝑌 = 𝑎 ∑ 𝑋1 + 𝑏1 ∑ 𝑋1 2 + 𝑏2 ∑ 𝑋1 𝑋2 → 811,4
∑ 𝑋2 𝑌 = 𝑎 ∑ 𝑋2 + 𝑏1 ∑ 𝑋1 𝑋2 + 𝑏2 ∑ 𝑋2 2 → 31606
𝑎 = 0,59
𝑏1 = 0,79
𝑏2 = 0,023
𝑌̂ = 𝑎 + 𝑏𝑋 → 𝑌̂ = 0,79𝑋1 + 0,023𝑋2 + 0.59
Dónde:
𝑌̂: Variable dependiente (la que se va a predecir):
𝑎: Intercepto de la variable Y
𝑋1 , 𝑋2: Valores de las Variables independientes
𝑏1 , 𝑏2 : Pendientes asociadas con cada variable independiente en la recta
∑ 𝒀𝟐 − 𝒂 ∑ 𝒀 − 𝑏1 ∑ 𝑿𝟏 𝒀 − 𝑏2 ∑ 𝑿𝟐 𝒀
𝑆𝑒 = √ → 𝑆𝑒
𝒏−𝟑
̅𝟐
𝒂 ∑ 𝒀 + 𝑏1 ∑ 𝑿𝟏 𝒀 + 𝑏2 ∑ 𝑿𝟐 𝒀 − 𝒏𝒚
𝑹𝟐 =
∑ 𝒀𝟐 − 𝒏𝒚
̅𝟐
(0,59 ∗ 403) + (0,59 ∗ 403) + (0,79 ∗ 811,4) − (110 ∗ 13,422)
→
1739 − (110 ∗ 13,422)
237,77 + 641.006 + 726,938 − 1476,445 129,269
= = = 0,49235
1739 − 1476,445 262,554
vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los picos
o segmentos de edad de los conductores donde es mayor la probabilidad de verse
involucrado en un accidente de tránsito y estas edades son los 46 (con 14 casos),
los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17, 18 29 y
59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor control a
los conductores con este tipo de edades, pues su sola edad implica un aumento en
la probabilidad de verse involucrado en un accidente, quizá porque en estas edades
aumentan los consumos de alcohol.
A este análisis se debe sumar el que se hizo con respecto a la velocidad donde se
encontró un alto nivel de confiabilidad en el modelo de regresión que analiza la
relación entre heridos y velocidad, cerca del 88 de los accidentes se explican por
este concepto, donde según el modelo se encuentra que después de 28km/h se
corre el riesgo de cometer un accidente y que esto aumenta en la medida que
aumente de ahí en adelante la velocidad. Sin embargo al analizar en un mismo
sistema la velocidad y los grados de alcohol (análisis de regresión múltiple), vemos
que el nivel de confiabilidad del modelo, explicada por el coeficiente de
determinación, cae a solo el 49%, sin embargo el nivel de correlación es alto, pues
cerca es del 70%, lo que nos indica que existe una correlación lineal positiva entre
el número de heridos explicada por el grado de alcohol y la velocidad del carro.
Según la ecuación de la recta cada herido se explica en un 56% por el efecto
alcohol, un 42% por otro tipo de situaciones, esto es el error, y un 2% por el efecto
velocidad. Esto nos pone de relieve que el problema central es el grado de alcohol,
que se debe controlar en un segmento específico de la población y se debe hacer
énfasis en la medida de lo posible en la disminución de la velocidad.
Propuesta consolidada
Del diagrama estadístico de dispersión se desprende que existe una correlación
lineal directa entre el número de heridos y el grado de alcohol; esta información está
confirmada por el valor del coeficiente de determinación que nos indica que el
modelo de regresión nos explica cerca del 87% de los casos de accidentes
observados en el estudio, es decir el modelo es altamente confiable. Así mismo si
revisamos el polígono de frecuencias, la media de alcohol dentro de la muestra es
de 1,74 grados, donde hay que resaltar que cerca del 70 por ciento de las muestras
se concentran en un rango de alcohol de entre 0,5 y 2,7, razón por la cual hasta el
más leve nivel de alcohol representa un riesgo importante para el bienestar de los
peatones.
También una alternativa es que en el promedio de la hora en que ocurrieron los
accidente fuero aproximadamente a las 11:10hrs, y cada vehículo tenga una
distancia al otro de por lo menos 5 metros, para así prevenir los herido y muerto
ocasionado por lo accidente de tránsito, esto se desprende de un análisis de
regresión de los resultado de la tabla de velocidad, grado de alcohol, numero de
muerto y herido.
Otro dato que también es importante analizar es la edad de los conductores
involucrados en los accidentes, aunque la media y la moda estén muy cercanas,
vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los picos
o segmentos de edad de los conductores donde es mayor la probabilidad de verse
involucrado en un accidente de tránsito y estas edades son los 46 (con 14 casos),
los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17, 18 29 y
59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor control a
los conductores con este tipo de edades, pues su sola edad implica un aumento en
la probabilidad de verse involucrado en un accidente, quizá porque en estas edades
aumentan los consumos de alcohol. A este análisis se debe sumar el que se hizo
con respecto a la velocidad donde se encontró un alto nivel de confiabilidad en el
modelo de regresión que analiza la relación entre heridos y velocidad, cerca del 88
de los accidentes se explican por este concepto, donde según el modelo se
encuentra que después de 28km/h se corre el riesgo de cometer un accidente y que
esto aumenta en la medida que aumente de ahí en adelante la velocidad. Sin
embargo al analizar en un mismo sistema la velocidad y los grados de alcohol
(análisis de regresión múltiple), vemos que el nivel de confiabilidad del modelo,
explicada por el coeficiente de determinación, cae a solo el 49%, sin embargo el
nivel de correlación es alto, pues cerca es del 70%, lo que nos indica que existe una
correlación lineal positiva entre el número de heridos explicada por el grado de
alcohol y la velocidad del carro. Según la ecuación de la recta cada herido se explica
en un 56% por el efecto alcohol, un 42% por otro tipo de situaciones, esto es el
error, y un 2% por el efecto velocidad. Esto nos pone de relieve que el problema
central es el grado de alcohol, que se debe controlar en un segmento específico de
la población y se debe hacer énfasis en la medida de lo posible en la disminución
de la velocidad. Siendo un poco más atrevidos, podría pretenderse establecer un
patrón general que regulase algunos componentes fisicoquímicos del conductor,
entre los cuales estaría la capacidad sensorial y emocional, ya que pese a que el
alcohol es uno de los altos índices de riesgos de accidentalidad, la capacidad
fisicoquímica hace la gran diferencia entre el poder y el querer.
Recomendaciones
Algunas recomendaciones para prevenir estos accidentes son:
Bibliografía