Académique Documents
Professionnel Documents
Culture Documents
comunicación
OpenCourseWare UPV/EHU
Sexo n
Hombre
Hombres 2
Mujer
Mujeres 3
Distribución de frecuencias y representaciones gráficas
(Barón 2004)
Distribución de frecuencias y representaciones gráficas
ni Ni fi Fi pi Pi
Fuente: Eustat
Distribución de frecuencias y representaciones gráficas
900000
500000
400000
300000
200000
100000
Fuente: Eustat
superiores
Distribución de frecuencias y representaciones gráficas
Diagrama/gráfico de barras:
Fuente: VV.AA
Distribución de frecuencias y representaciones gráficas
Diagrama/gráfico de barras:
Barras apiladas: permiten describir las diferencias entre cada modalidad o
periodo en la magnitud general y desagregada
Distribución de frecuencias y representaciones gráficas
Diagrama/gráfico de barras:
Barras agrupadas: permiten comparar las diferencias entre las modalidades o
periodos y si esas diferencias varían en los grupos formadas según otra
variable (por ejemplo sexo)
Esperanza de vida a los 20 años según el nivel de estudios, CAPV 1996-2001
Diagrama/gráfico de barras:
Histograma: Gráfico para variables continuas
Similar al diagrama de barras pero sin hueco, para dar idea de continuidad.
También puede tener un polígono de frecuencias asociado
250
200
Recuento
150
100
50
20 40 60 80
16 4
País A País B
Fuente: elaboración propia
Distribución de frecuencias y representaciones gráficas
Diagrama de sectores
Gráfico II “A Ud. le parece bien o mal que en la misma clase hay alumnos y
alumnas de distintos orígenes y culturas. Euskadi 2004
6%
89%
2%
3%
Bien
Ni bien ni mal
Mal
No contesta
Diagrama de sectores
Tendencias temporales:
Se suelen representar mediante gráficos de barras o diagramas de líneas
Distribución de frecuencias y representaciones gráficas
Tendencias temporales:
Distribución de frecuencias y representaciones gráficas
Cartogramas
Hombres Mujeres
Ejemplo:
1,1,1,2,2,3,3,4,4,5
x = (1 + 1 + 1 + 2 + 2 + 3 + 3 + 4 + 4 + 5) = 2,6
1
10
Principales medidas de tendencia central: media, mediana y
moda
Ejemplo:
1
(1 ⋅ 3 + 2 ⋅ 2 + 3 ⋅ 2 + 4 ⋅ 2 + 5 ⋅ 1) = 2,6
xi ni fi
x=
1 3 0,3 10
x = 1 ⋅ 0,3 + 2 ⋅ 0,2 + 3 ⋅ 0,2 + 4 ⋅ 0,2 + 5 ⋅ 0,1 = 2,6
2 2 0,2
3 2 0,2
4 2 0,2
5 1 0,1
Principales medidas de tendencia central: media, mediana y
moda
Propiedades de la media:
1)
yi = xi + k ⇒ y = x + k
1,2,3 media = 2
2,3,4 media = 3
2)
yi = xi ⋅ k ⇒ y = x ⋅ k
1,2,3 media = 2
2,4,6 media = 4
Principales medidas de tendencia central: media, mediana y
moda
3) zi = xi + yi ⇒ z = x + y
zi = a ⋅ xi + b ⋅ yi ⇒ z = a ⋅ x + b ⋅ y
N
4) ∑ (x
i =1
i − x) = 0
1,2,3 media= 2
(-1)+0+1=0
Na ⋅ x a + Nb ⋅ x b
x=
Na + Nb
Principales medidas de tendencia central: media, mediana y
moda
Examen 7 puntos xp = i =1
N
Trabajo 3 puntos ∑w
i =1
i
Pares
1 2 3 4 2+3
M ed = = 2,5
2
Datos agrupados:
Impares
Xi ni Ni Con 57 observaciones el valor de la mediana será el que
1 10 10 ocupe el orden 29 (57/2=28,5)
2 20 30
3 10 40
Orden … 27 28 29 30 31
4 17 57
Valor … 2 2 2 2 3
Total 57
Principales medidas de tendencia central: media, mediana y
moda
Datos agrupados:
Pares
xi ni Ni Fi Con 50 observaciones el valor de la mediana será
1 10 10 0,2 el que ocupe el orden 25 y 26 (50/2=25)
2 15 25 0,5
3 20 45 0,9
4 5 50 1 Orden … 24 25 26 27 28
Valor … 2 2 3 3 3
Total 50
2,5,7,9,11 Med=7
2,5,7,9,527 Med=7
- Cálculo rápido e interpretación sencilla
- Siempre es un valor de la variable que estudiamos (importante
en discretas)
Principales medidas de tendencia central: media, mediana y
moda
- La mediana divide al histograma en dos partes iguales
“Tiempo dedicado a dormir los días laborables”
120
100
80
Frecuencia
60
40
20
Mean = 510,188
Std. Dev. = 99,00566
N = 500
0
500,00 750,00 1000,00 1250,00
Tiempo dormir
Principales medidas de tendencia central: media, mediana y
moda
1 10 Primarios 317
2 20 Secundarios 132
3 10
Superiores 51
4 17
Total 57 Total 500
Principales medidas de tendencia central: media, mediana y
moda
120 200
100
150
80
Frecuencia
Frecuencia
60 100
40
50
20
Estadísticos
N Percentiles
Válidos Perdidos Media Mediana Moda 25 50 75
Tiempo
500 0 510,1880 495,0000 480,00 450,0000 495,0000 554,0000
dormir
Tiempo
tareas 500 0 126,1820 75,0000 ,00 ,0000 75,0000 230,0000
domésticas
Principales medidas de posición
Q2=D5=P50=Med
Principales medidas de posición
Los percentiles en la vida diaria…
Cálculo de percentiles
Variables discretas (datos agrupados y sin agrupar):
P24 = 2
xi ni Ni Fi
1 10 10 0,2
2 15 25 0,5 24%= 12 Posiciones 12º y 13º
3 20 45 0,9
4 5 50 1 ¿Qué significa P24 = 2?
Total 50
D3= 2
30% = 15, posiciones 15º y 16º
10 20 30 40 50
Medidas de dispersión
Q3 − Q1
IQ = Q3 − Q1 Q=
2
∑x i −x ∑x i − x ⋅ ni
DM = i =1
= i =1
∑ i
( x − x ) 2
∑ i
x 2
S x2 = i =1
= i =1
− ( x )2
n n
( 28 − 30 ) 2
+ ... + ( 32 − 30 ) 2
S A2 = = 1,43
7
(10 − 30 ) 2
+ ... + (50 − 30) 2
S B2 = = 200
9
Medidas de dispersión
Datos agrupados:
j j
∑i i
n ⋅ ( x − x ) 2
∑i i
n ⋅ x 2
S x2 = i =1
= i =1
− ( x )2
n n
xi ni x = 1,5
1 2 (1 − 1,5) 2
⋅ 2 + ( 2 − 1,5) 2
⋅2
S =
2
= 0,25
2 2 4
Desviación típica:
Sx = S 2
x
S A = 1,43 = 1,19
S B = 200 = 14,14
Medidas de dispersión
yi = xi + k ⇒ S = S 2
y
2
x
yi = xi ⋅ k ⇒ S y2 = S x2 ⋅ k 2
Medidas de dispersión
Comparando la variabilidad de dos variables:
En una población se han obtenido las siguientes medidas
respecto a la altura (centímetros) y peso (kilogramos) de sus
individuos:
X p = 67; S p = 20
X a = 176; S a = 30
14,00 23
12,00
Valor atípico
10,00
Se desvía 2S
Mediana 8,00
Q1yQ3
6,00
Valor mayor
4,00
y menor
2,00
0,00
VAR00001
Medidas de dispersión
1250,00
44
1.409
1000,00
1.167 1.840 1.155
70 25
1.785 191
176 1.791
Tiempo dormir
1.991 1.473
750,00 1.393
1.173 13
2.138
1.704
500,00
2.240 2.170
250,00 577 2.085 1.661
685
1.531
0,00
V1
200
40
30 100
Frecuencia
Frecuencia 20
0
27 37 45 53 61 69 77 85 93
32 41 49 57 65 73 81 89 99
10
Mesocúrtica
Mean = 4,02
Std. Dev. = 1,774
0 N = 143
0 2 4 6 8
V1
400
V5
300
30
200
25
100
Frecuencia
20
Frecuencia
0
3 27 37 47 57 67 77 87 97 108 15
16 32 42 52 62 72 82 92 102 138
Leptocúrtica 10
Mean = 3,97
Std. Dev. = 1,98
0 N = 143
0 2 4 6 8
V5
Principales medidas de forma y asimetría
Coeficiente de asimetría:
Una distribución es simétrica si su parte derecha es igual a
la izquierda (espejo)
La asimetría es positiva o negativa dependiendo de donde
este la cola de la distribución
La media tiende a desplazarse hacia los valores extremos
En distribuciones simétricas media, mediana y moda
coinciden
¿En asimétricas positivas, la media es mayor o menor
que la mediana?
Principales medidas de forma y asimetría
3( X − M e )
As =
Sx
n
∑ (xi − x ) ⋅ ni
3
m3
As = 3
; m3 = i =1
Sx n
Estadísticos
V1 V2 V3
N Válidos 143 143 143
Perdidos 0 0 0
Media 4,02 5,20 -5,20
Mediana 4,00 4,00 -4,00
Moda 4 4 -4
Desv. típ. 1,774 3,492 3,492
Asimetría -,001 1,161 -1,161
Error típ. de asimetría ,203 ,203 ,203
Curtosis -,865 ,676 ,676
Error típ. de curtosis ,403 ,403 ,403
Veamos….
Principales medidas de forma y asimetría
V1
Estadísticos 40
V1 V2 V3
N Válidos 143 143 143
Perdidos 0 0 0
Media 4,02 5,20 -5,20 30
Mediana 4,00 4,00 -4,00
Moda 4 4 -4
Frecuencia
Desv. típ. 1,774 3,492 3,492
Asimetría -,001 1,161 -1,161
Error típ. de asimetría ,203 ,203 ,203 20
Curtosis -,865 ,676 ,676
Error típ. de curtosis ,403 ,403 ,403
10
Mean = 4,02
Std. Dev. = 1,774
0 N = 143
0 2 4 6 8
V1
Principales medidas de forma y asimetría
V2
40
Estadísticos
V1 V2 V3
N Válidos 143 143 143
Perdidos 0 0 0
Media 4,02 5,20 -5,20
Mediana 30
4,00 4,00 -4,00
Moda 4 4 -4
Desv. típ. 1,774 3,492 3,492
Frecuencia
Asimetría -,001 1,161 -1,161
Error típ. de asimetría ,203 ,203 ,203
Curtosis -,865 ,676 ,676 20
Error típ. de curtosis ,403 ,403 ,403
10
Mean = 5,2
Std. Dev. = 3,492
0 N = 143
0 5 10 15
V2
Principales medidas de forma y asimetría
V3
40
Estadísticos
V1 V2 V3
N Válidos 143 143 143
Perdidos 0 0 0
Media 4,02 5,20 -5,20 30
Mediana 4,00 4,00 -4,00
Moda 4 4 -4
Desv. típ. 1,774 3,492 3,492 Frecuencia
Asimetría -,001 1,161 -1,161
Error típ. de asimetría ,203 ,203 ,203
20
Curtosis -,865 ,676 ,676
Error típ. de curtosis ,403 ,403 ,403
10
Mean = -5,2
Std. Dev. = 3,492
0 N = 143
-15 -10 -5 0
V3
Principales medidas de forma y asimetría
Coeficiente de curtosis:
-Nos indica el grado de apuntamiento de una distribución comparada
con una distribución normal. Mide si las observaciones se agrupan
alrededor de un valor central o si existen valores alejados de la media
1 n
∑ ( )
300
− ⋅ ni
4
xi x
m4 n i =1
a4 = 4 − 3 = −3
200
2
Sx 1 n
∑ ( xi − x ) 2 ⋅ ni
100
Frecuencia
0
27 37 45 53 61 69 77 85 93
n i =i 400
32 41 49 57 65 73 81 89 99
200
Frecuencia
0
3 27 37 47 57 67 77 87 97 108
Leptocúrtica
Principales medidas de forma y asimetría
Principales medidas de forma y asimetría
Estadísticos
V4 V5
N Válidos 143 143
Perdidos 0 0
Media 4,20 3,97
Mediana 4,00 4,00
Moda 4 2a
Curtosis 2,134 -1,222
Error típ. de curtosis ,403 ,403
a. Existen varias modas. Se mostrará el menor de los valores.
Veamos….
Principales medidas de forma y asimetría
V4
Estadísticos 100
V4 V5
N Válidos 143 143
80
Perdidos 0 0
Media 4,20 3,97
Frecuencia
Mediana 4,00 4,00 60
Moda 4 2a
Curtosis 2,134 -1,222
40
Error típ. de curtosis ,403 ,403
a. Existen varias modas. Se mostrará el menor de los valores.
20
Mean = 4,2
Std. Dev. = 1,043
0 N = 143
0 2 4 6 8
V4
Principales medidas de forma y asimetría
Estadísticos
V4 V5
V5
N Válidos 143 143
Perdidos 0 0 30
Media 4,20 3,97
Mediana 4,00 4,00 25
Moda 4 2a
Curtosis 2,134 -1,222 20
Frecuencia
Error típ. de curtosis ,403 ,403
a. Existen varias modas. Se mostrará el menor de los valores. 15
10
Mean = 3,97
Std. Dev. = 1,98
0 N = 143
0 2 4 6 8
V5