Vous êtes sur la page 1sur 33

ESTADÍSTICA DESCRIPTIVA

UNIDAD 1: PASO 2 - ORGANIZACIÓN Y PRESENTACIÓN (FORO DE DISCUSIÓN)

ESTUDIANTE EN FORMACIÓN
HILLARY GEOVANA BALLESTA MONTERROSA

GRUPO: 204040_353

TUTOR
MILENA DIAZ

PROGRAMA
PISCOLOGÍA

UNIVERSIDAD ABIERTA Y A DISTANCIA UNAD

SEDE PLATO MAGDALENA


2020
Contenido
Introducción:.........................................................................................................................................3

Objetivos................................................................................................................................................5

Objetivos específicos..............................................................................................................................5

Mapa conceptual....................................................................................................................................6

Actividad 2. Ficha Técnica.......................................................................................................................7

Actividad 3. Clasificación de variables................................................................................................8

Actividad 4. Muestreo...........................................................................................................................9

Variable cuantitativa...........................................................................................................................12

MEDIDAS UNIVARIANTES: Desarrollar en el paso (3)................................................................16

Regresión y Correlación lineal Simple...............................................................................................24

Conclusión.:.........................................................................................................................................32

Referencias bibliográficas...................................................................................................................33
Introducción:
En el siguiente trabajo vemos un análisis directo sobre regresión y correlación con la finalidad de
buscar o encontrar la relación en los mismo, dado de unas variables seleccionada de la base de
datos otorgada por la UNAD, en al cual se basa en la investigación de los Indicadores de
accidentalidad -220 municipios 2020 (16-1)

También sobre la estadística y sus métodos de aplicación donde vemos temas como moda,
media y la mediana, siendo estas material de análisis, en punto central vemos las medidas
univariantes viables cuantitativas discretas.
Justificación.
Debido a esto el desarrollo está enmarcado en los factores en influyen en el rendimiento
académico de los estudiante, se desarrolló el presente trabajo con el fin de dar solución a los
diferente ejercicios propuesto relacionados con todos los términos que van de la mano de la
estadísticas descriptiva como tal, donde por medio de los aportes de los demás participantes del
grupo se puede interactuar y poder llegar a la finalidad de la actividad.
Objetivos.
Conocer los fundamentos básicos de la Estadística Descriptiva y las etapas dentro de una
investigación, por medio de datos tomados de un fenómeno real, de su entorno.

Objetivos específicos.
Analizar la problemática presentada con el fin de obtener los resultados estadísticos.

Reconocer los fundamentos básicos de la Estadística Descriptiva y las etapas dentro de

una investigación

El estudiante relacionará los conceptos básicos de la estadística con la base de datos de la

problemática.
Mapa conceptual.
Actividad 2. Ficha Técnica.

Definir los siguientes conceptos e identificarlos en la problemática estudiada “¿Cuáles son los
factores que influyen en la accidentalidad de vehículos y en el grado de muertes asociadas a
los accidentes de tránsito en Colombia?”, bajo la siguiente ficha técnica:

Concepto Identificación según la base de datos


Población. la población de Colombia
Corresponde a los 200 municipios que
Tamaño de la muestra. fueron base fundamental para dar
desarrollo a la investigación.
La investigación se basa en los datos
Instrumento de recopilados referente a fallecidos por
Recolección de la actor vial esta información fue
información. suministrada por la agencia vial y tomada
desde la base de datos de la UNAD.
Se desarrolló en la población de los 200
Ubicación espacio municipios de Colombia en el lapso de
temporal del estudio. tiempo de los meses de enero y febrero.
En una zona rural y urbana.
Se le atribuye a cada uno de los
individuos que se le género y aplico el
plan de investigación y acción para dar
Unidad estadística
desarrollo a la encuesta, e investigación
misma, centrada en los 200 municipios
esto tiene un total de: 11.752.153
Actividad 3. Clasificación de variables.

Clasificar las variables de la base de datos “¿Cuáles son los factores que influyen en la
accidentalidad de vehículos y en el grado de muertes asociadas a los accidentes de tránsito
en Colombia?” en cualitativas (nominales, ordinales), y cuantitativas (Discretas o Continuas),
siguiendo el esquema:

CUALITATIVAS CUANTITATIVAS
Nominales Ordinales Discretas Continuas
Usuario de
Genero Hora bicicleta Tasa de fallecidos
Código del Tasa de
Rural o urbana departamento Peatón lesionados
Zona de Código del
ocurrencias municipio Usuario de moto Hora
 Nombre del Usuario de V.
departamento Individual Velocidad
Nombre del
municipio Usuario T. Carga Pesos
Usuario T.
 Capitales Pasajeros
 Día Edad
Actividad 4. Muestreo.

Si se desea establecer una muestra representativa para estudiar el problema de “¿Cuáles son los
factores que influyen en la accidentalidad de vehículos y en el grado de muertes asociadas a
los accidentes de tránsito en Colombia?” a través del muestreo aleatorio simple, con un nivel
de confianza del 97%, un error estimado del 3% y una población de 1.124 municipios, ¿Cuál
sería el tamaño de la muestra?; en el caso de no contar con una población definida, ¿Cuál sería el
tamaño de la muestra?.

Tamaño de muestra conociendo la población.

N 1124
Z 2,17
P 0,5
Q 0,5
e 0,03

1323,2009
2,187925

tamaño de muestra 604,774341

Tamaño de muestra la población no definida.

Z 2,17
P 50,00%
Q 50,00%
e 3,00%

1,177225
0,09%
tamaño de muestra 1308,02778

LABORATORIO DIAGRAMAS ESTADÍSTICOS: Desarrollar en el paso (2)


Variable cualitativa. A partir de la base de datos “Indicadores de accidentalidad -220
municipios 2020 (16-1)”, la cual se encuentra en el Entorno de aprendizaje colaborativo; cada
estudiante deberá tomar una variable cualitativa y resolver los siguientes aspectos:
a) Organizar la variable cualitativa en una tabla de frecuencias, que contenga como mínimo
lo siguiente:

Frecuencias
departament frecuencias absoluta frecuencia frecuencia
o Absoluta acumulada relativa porcentual
Antioquia 40 40 0,2 20
Atlántico 23 63 0,115 11,5
Bolívar 30 93 0,15 15
Boyacá 27 120 0,135 13,5
Caldas 27 147 0,135 13,5
Caquetá 16 163 0,08 8
Cauca 37 200 0,185 18,5
TOTAL 200 826 1 100

b) Representar la información por medio de diferentes diagramas estadísticos, según


corresponda: (diagrama de barras, diagramas circulares, etc.).
45
40
35
30
25
20
15
10
5
0
ia o ar cá as tá a
qu ntic olív ya ald ue auc
o tlá B o C q C
A nti A
B Ca
Antioquia
Atlántico
Bolívar
Boyacá
Caldas
Caquetá
Cauca

c) Hallar la moda de la variable cualitativa asocia con la situación objeto de estudio.

Para hallar la moda de los departamentos con mayor accidentalidad de vehículos y en el

grado de muertes asociadas a los accidentes de tránsito en Colombia, respecto a la base de

datos de los 200 municipios primero organizamos nuestros datos, teniendo en cuenta la

organización de los mismos de mayor a menor tomando el valor con mayor frecuencia,

siendo para este caso la moda 40

d) Mencionar dos conclusiones a partir del gráfico

 Podemos concluir que el departamento con mayor accidentes o muertes causadas por
accidentes e Antioquia, que es donde podemos ver la moda como tal.
 Por medio de los diagramas podemos identificar la gran magnitud de la problemática
reflejada en los distintos departamentos.
 Tabla de contingencia. Realizar una tabla de contingencias o de doble entrada, con dos
variables cualitativas.
Departamentos
Antioqui Atlántic Bolíva Boyac Calda Caquet Cauc Total
Género a o r á s á a general
hombre 27 15 25 17 18 11 26 139
mujer 13 8 5 10 9 5 11 61
Total
general 40 23 30 27 27 16 37 200

hombre y mujeres de los departamento donde se dan grado de muertes asociadas a los
accidentes de tránsito en Colombia
30

25

20

15

10

0
Antioquia Atlántico Bolívar Boyacá Caldas Caquetá Cauca

Variable cuantitativa. A partir de la base de datos “Indicadores de accidentalidad -220


municipios 2020 (16-1)”, la cual se encuentra en el Entorno de aprendizaje colaborativo, cada
estudiante debe elegir como mínimo, una variable cuantitativa distinta y caracterizarla; es decir:

velocidad
Frecuencias absoluta frecuencia
de frecuencias A frecuencia porcentual
acumulada relativa
accidentes
61 3 3 0,015 1,50
62 2 5 0,025 2,50
63 4 9 0,045 4,50
64 2 11 0,055 5,50
65 3 14 0,07 7,00
66 5 19 0,095 9,50
67 2 21 0,105 10,50
68 2 23 0,115 11,50
69 4 27 0,135 13,50
70 2 29 0,145 14,50
71 0 29 0,145 14,50
72 5 34 0,17 17,00
73 4 38 0,19 19,00
74 2 40 0,2 20,00
75 3 43 0,215 21,50
76 3 46 0,23 23,00
77 5 51 0,255 25,50
78 7 58 0,29 29,00
79 1 59 0,295 29,50
80 1 60 0,3 30,00
81 2 62 0,31 31,00
82 2 64 0,32 32,00
83 2 66 0,33 33,00
84 1 67 0,335 33,50
85 0 67 0,335 33,50
86 3 70 0,35 35,00
87 0 70 0,35 35,00
88 3 73 0,365 36,50
89 3 76 0,38 38,00
90 2 78 0,39 39,00
91 3 81 0,405 40,50
92 4 85 0,425 42,50
93 3 88 0,44 44,00
94 5 93 0,465 46,50
95 4 97 0,485 48,50
96 2 99 0,495 49,50
97 5 104 0,52 52,00
98 2 106 0,53 53,00
100 1 107 0,535 53,50
101 1 108 0,54 54,00
102 7 115 0,575 57,50
103 0 115 0,575 57,50
104 2 117 0,585 58,50
105 3 120 0,6 60,00
106 2 122 0,61 61,00
107 4 126 0,63 63,00
108 4 130 0,65 65,00
109 9 139 0,695 69,50
110 2 141 0,705 70,50
111 2 143 0,715 71,50
112 5 148 0,74 74,00
113 2 150 0,75 75,00
114 4 154 0,77 77,00
115 8 162 0,81 81,00
117 7 169 0,845 84,50
118 1 170 0,85 85,00
119 1 171 0,855 85,50
120 1 172 0,86 86,00
121 4 176 0,88 88,00
122 2 178 0,89 89,00
123 1 179 0,895 89,50
124 1 180 0,9 90,00
125 4 184 0,92 92,00
126 2 186 0,93 93,00
127 3 189 0,945 94,50
128 4 193 0,965 96,50
129 1 194 0,97 97,00
130 4 198 0,99 99,00
99 2 200 1 100,00

a) Representar la información por medio de un histograma, polígono o diagramas de barras,


según corresponda

velocidad promedio
67
61
55
49
43
37
31
25
19
13
7
1
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
velocidad

1 2 3 4 5 6 7 8 9 10 11 12 13 14
15 16 17 18 19 20 21 22 23 24 25 26 27 28
29 30 31 32 33 34 35 36 37 38 39 40 41 42
43 44 45 46 47 48 49 50 51 52 53 54 55 56
57 58 59 60 61 62 63 64 65 66 67 68 69

b) Mencionar dos conclusiones a partir del gráfico

Por medio de la relación de la caracterización de la viable podemos determinar Promedio de


velocidad que inciden en la accidentalidad de vehículos y en el grado de muertes asociadas a los
accidentes de tránsito en Colombia.

Sin duda alguna la velocidad toma un factor importante en la problemática de muertes por
accidentalidad de vehículos.
MEDIDAS UNIVARIANTES: Desarrollar en el paso (3)
MEDIDAS UNIVARIANTES PARA VARIABLE CUANTITATIVA DISCRETA

A partir de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-1)”,


encontrada en el entorno de aprendizaje Colaborativo Paso 2– organización y presentación, cada
estudiante deberá resolver para una variable cuantitativa discreta diferente, los ejercicios
que aparecen a continuación y socializarlos en el foro.

Variables discreta seleccionadas: edad promedio

1. Medidas Univariantes de Tendencia Central.


a. Para la variable elegida, se deberán calcular las medidas univariantes de tendencia
central:

marca o frecuencia fre frecuencia


liimite in limite su clase absoluta acomula r fre r acu
20 23 21,5 23 23 0,115  
24 27 25,5 34 57 0,17  
28 31 29,5 31 88 0,155  
32 35 33,5 29 117 0,145  
36 39 37,5 43 160 0,215  
40 43 41,5 29 189 0,145  
44 47 45,5 11 200 0,055  
48 51 49,5 0 200 0  
      200   1  

n∗K
Utilizamos la fórmula: P=
100

Todos los cuartiles. Resaltamos que la variable a trabajar es edad promedio

 Media,
 Mediana,
 Moda.

moda 24
mediana 33
media 32,705
b. Calcular:
 Todos los cuartiles

CUARTIL POSICION VALOR


Q1 50 23,5
Q2 100 25
Q3 150 32,5
Q4 200 30

 Deciles 5 y 7;

DECIL POSICON VALOR


D5 100 25
D7 140 29,5

 Percentiles 25, 50

PRECENTIL POSICION VALOR


P25 50 23,5
P50 100 25

c. Interpretar sus resultados

En los cuartiles consiste en dividir los datos obtenidos en 4 partes, en los deciles en 10 y en
los percentiles en 100, en este caso podemos decir que la media se encuentra en el tercer
cuartil.

2. Medidas univariantes de dispersión:


a. Para la variable elegida, se deberán calcular las medidas univariantes de dispersión:
 Rango

Rango: cosiste en la resta del valor máximo con el mínimo.

Obtenemos el rango

num 200
max 45
min 20
rango 25

 Varianza
3. Para obtener la varianza es necesario tener en cuenta la siguiente formula

n
2
∑ ( x j −x )
s2= i=1
n−1

fre
liimite limite marca frecuencia acomul frecuencia fre r (xi- (xi-
in su o clase absoluta a r acu media)^2 media)^2*(fi)
20 23 21,5 23 23 0,115   125,552025 2887,696575
24 27 25,5 34 57 0,17   51,912025 1765,00885
28 31 29,5 31 88 0,155   10,272025 318,432775
32 35 33,5 29 117 0,145   0,632025 18,328725
36 39 37,5 43 160 0,215   22,992025 988,657075
40 43 41,5 29 189 0,145   77,352025 2243,208725
44 47 45,5 11 200 0,055   163,712025 1800,832275
48 51 49,5 0 200 0   282,072025 0
      200   1     10022,165

Obtenemos la varianza.

varianza 50,110825

 Desviación típica
Desviación típica. Al obtener la varianza podemos obtener la desviación sacando su raíz
cuadrada.

desviación 7,07889999

 Coeficiente de variación.

3 ( x−mediana )
Para este utilizamos la formula p=
s

Obtenemos el coeficiente de variación

-
Coeficiente 0,04167314

b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio

En el caso de la variables estudiada la edad promedio, el rango consiste en indicar la dispersión


entre los valores extremos de la variable, la desviación se encarga de identificar las diferencias
de cada dato respecto a la media, la varianza también se encarga de  medir la dispersión de los
valores de una variable respecto a la media y el coeficiente de variación, determina la razón
existente entre la desviación estándar  y la media, entonces podemos decir que el este caso de por
muerte en esto municipios atribuidos al promedio de edad de 25 años, esto quiere decir que esta
edad es la más afectada dentro del transcurso de la relación del a investigación.

Variable escogida: edad promedio.

EDAD
43
20
37

34

28
31
37
25
33
43
31
34
28
37
24
36
20
41
31
20
42
44
41
26
37
22
34
27
40
39
25
25
38
22
32
38
28
23
44
31
36
32
28
38
26
33
33
33
33
26
21
29
35
20
23
28
33
34
41
37
29
38
42
39
24
35
36
39
37
31
42
41
31
39
24
29
40
28
37
36
24
22
36
39
45
31
24
37
43
24
24
24
33
30
42
25
44
35
31
23
27
39
26
33
28
40
28
44
22
40
39
22
38
35
37
24
38
29
41
39
26
33
25
27
26
36
43
29
39
33
45
40
36
42
26
39
23
44
31
34
25
20
45
25
31
26
33
36
23
29
36
20
43
34
24
24
32
39
32
41
39
30
32
37
41
41
34
28
35
38
23
26
26
31
40
43
43
45
37
38
24
24
41
38
39
43
32
44
37
21
44
22
21
31
40
24
29
21
22
30

Regresión y Correlación lineal Simple


A partir de la base de datos suministrada “Indicadores de accidentalidad -220 municipios 2020
(16-1)”, deberá:
a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.
FALLECIDOS EN FEBRERO
PEATON
b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo
de asociación entre las variables.

FALLECIDOS EN FEBRERO VS PEATON


20
18
16
14
12
Axis Title

10
8
6
4
2
0
0 50 100 150 200 250 300 350 400
Axis Title

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Podemos ver la relación de los fallecidos en febrero con peatón, donde su relación es constante,
presentando mayor concentración en los valores dados reflejados en los distintos factores.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
La fórmula matemática es
y=0,0005 x 2+ 0,2211 x−3,5655R ²=0,9881
FALLECIDOS EN FEBRERO VS PEATON
20
f(x) = − 0 x² + 0.22 x − 3.57
18 R² = 0.99
16
fallecidos en febrero
14
12
10
8
6
4
2
0
0 50 100 1 50 2 00 250 3 00 350 400
peaton

La fórmula matemática tiene un grado de confiabilidad del 98 % por lo que se dice que confiable
en una fórmula matemática poligonal.

Determine el grado de relación de las dos variables.


  Columna 1 Columna 2
Columna 1 1
Columna 2 0,6911873 1

Las variables relacionadas tienen un grado de correlación de 69% podemos decir que la relación de las
dos variables es aceptable ya que está dentro del os parámetros aceptados.

a. Relacionar la información obtenida con el problema.


Los resultados anteriores de las variables Fallecidos en febrero y peatones obtuvimos una
confiabilidad de 98% y un grado de correlación de 69%, vamos al problema de investigación y
decimos que el grado de fallecidos en febrero afecta directamente a los peatones y se presentan
cada vez en estos municipios que fueron materia de investigación.

b. Establezca al menos 3 nuevos valores independientes para ser hallados a


través del modelo matemático calculado.
Nuevos valores

25 5
40 10
20 12
18 15
70 14
45 7
65 8

fallecidos en febrero vs peaton


20
f(x) = − 0 x² + 0.22 x − 3.26
18 R² = 0.81
16
14
12
Axis Title

10
8
6
4
2
0
0 50 100 1 50 2 00 250 300 3 50 400
Axis Title

FALLECIDOS EN FEBRERO PEATON


371 8
33 3
39 4
33 3
27 2
21 1
27 2
63 8
15 0
15 0
39 4
27 2
51 6
39 4
21 1
27 2
15 0
27 2
27 2
33 3
39 4
27 2
45 5
27 2
39 4
27 2
15 0
27 2
21 1
21 1
33 3
39 4
69 9
15 0
33 3
105 15
27 2
27 2
15 0
21 1
21 1
27 2
63 8
15 0
15 0
39 4
27 2
51 6
39 4
21 1
27 2
15 0
27 2
27 2
33 3
39 4
27 2
45 5
27 2
39 4
27 2
15 0
27 2
21 1
33 3
39 4
69 9
15 0
33 3
105 15
27 2
27 2
15 0
21 1
15 0
27 2
15 0
39 4
27 2
33 3
15 0
27 2
39 4
21 1
45 5
33 3
51 6
81 11
27 2
33 3
27 2
21 1
39 4
39 4
27 2
51 6
39 4
21 1
21 1
21 1
39 4
21 1
27 2
27 2
15 0
21 1
51 6
33 3
27 2
15 0
15 0
27 2
39 4
123 18
69 9
27 2
27 2
27 2
21 1
33 3
39 4
21 1
21 1
21 1
39 4
21 1
27 2
27 2
15 0
21 1
51 6
33 3
27 2
15 0
15 0
27 2
39 4
123 18
69 9
27 2
27 2
27 2
21 1
33 3
27 2
27 2
21 1
27 2
63 8
15 0
15 0
27 2
33 3
39 4
27 2
45 5
27 2
39 4
27 2
27 2
33 3
27 2
15 0
21 1
39 4
33 3
27 2
21 1
27 2
63 8
15 0
15 0
39 4
27 2
51 6
39 4
21 1
27 2
15 0
27 2
27 2
33 3
39 4
27 2
45 5
27 2
39 4
27 2
15 0
27 2
21 1
21 1
33 3
39 4
69 9
15 0
33 3
105 15
27 2
27 2

Conclusión.:
Por medio de la realización de esta actividad se pudo acumular la masa de datos numéricos provenientes
de la observación del problema presentado, procesándolos de forma razonable. Los datos se agrupan en
clases con igual rango o amplitud, el rango se calcula sustrayendo el límite inferior del superior.
Referencias bibliográficas
Martínez Bencardino; Ciro. Ecoe Ediciones. ISBN: 978-958-648-702-3,978-1-4492-7849-6.
Página 10 - 12

Montero, J. M. (2007). Conceptos Generales Estadística descriptiva. Madrid: Paraninfo. Página 3


- 16

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10

Vous aimerez peut-être aussi