Académique Documents
Professionnel Documents
Culture Documents
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y
sobre eleje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.
Ejemplo:
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el
siguiente resultado:
Grupo sanguneo
fi
AB
20
Polgonos de frecuencia
Un polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.
Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos
mediante segmentos.
Ejemplo:
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:
Hora
Temperatura
12
12
14
15
11
2
18
12
21
10
24
Color de pelo
fi
Rubio
Pelirrojo
Moreno
Pr e do mina e l pe lo
2 El siguie n te po lgo no de fr e cue ncia mue s tra la me dia de te mpe ratura diar ia e n
una ciuda d po laca a lo lar go lo s sie te d a de una se mana. Co m ple ta la tabla y
r e spo nde a las pre gu ntas :
Hora
Temperatura
Q u da hiz o me no s fr o ?
Hiz o me no s fr o e l da
ce r o.
3 El siguie n te diagram a de bar ras mue stra las no tas de lo s alumno s de una clase
de una clase de 3 ESO. C o mple ta la tab la y re spo nde a las pr e gunta s:
Nota
fi
Insuficiente
Suficiente
Bien
Notable
Sobresaliente
Q u no ta e s la ms co mn?
e stud iante s.
e stud iante s.
H ay
est udian te s.
N de comidas
Personas
2
3
4
5
6
Ejem plo :
Alumnos
ngulo
Baloncesto
12
144
Natacin
36
Ftbol
108
Sin deporte
72
Total
30
360
Histograma
Polgono de frecuencia
Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de
cada rectngulo.
Ejemplo:
ci
fi
Fi
[50, 60)
55
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
10
[100, 110)
105
63
[110, 120)
115
65
65
Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de
frecuencias acumuladas o su correspondiente polgono.
11
Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de
los rectngulosdel histograma.
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por
un grupo de 50 alumnos.
fi
[0, 5)
15
12
hi
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica.
Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica.
Tipos de parmetros estadsticos
Medidas de centralizacin
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos.
Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor.
La medidas de posicin son:
Cuartiles
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin.
Las medidas de dispersin son:
14
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a
la media.
Varianza
15
Ejemplo:
Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:
fi
[60, 63)
[63, 66)
18
[66, 69)
42
[69, 72)
27
[72, 75)
100
16
Ejemplo:
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por
un grupo de 50 alumnos. Calcular la moda.
fi
hi
[0, 5)
15
[5, 7)
20
10
17
[7, 9)
[9, 10)
12
50
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones
centrales.
7, 8, 9, 10, 11, 12Me = 9.5
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas.
Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:
fi
Fi
[60, 63)
[63, 66)
18
23
[66, 69)
42
65
19
[69, 72)
27
92
[72, 75)
100
100
100/2 = 50
Clase de la mediana: [66, 69)
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre
el nmero total de datos.
es el smbolo de la media aritmtica.
Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula
la puntuacin media.
xi
fi
xi fi
[10, 20)
15
15
[20, 30)
25
200
[30,40)
35
10
350
[40, 50)
45
405
[50, 60
55
440
[60,70)
65
260
[70, 80)
75
150
42
1 820
21
1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a la media de la
misma igual acero.
La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 =
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a
un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.
xi
fi
[60, 63)
61.5
[63, 66)
64.5
18
[66, 69)
67.5
42
[69, 72)
70.5
27
[72, )
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de ltimo intervalo.
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro
partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
23
2, 5, 3, 6, 7, 4, 9
2, 5, 3, 4, 6, 7, 1, 9
ai es la amplitud de la clase.
Ejercicio de cuartiles
fi
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
25
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Clculo de los deciles
fi
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
27
28
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
P50 coincide con D5.
Clculo de los percentiles
fi
29
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Percentil 35
Percentil 60
30
La desviacin respecto a la media es la diferencia en valor absoluto entre cada valor de la variable
estadstica y lamedia aritmtica.
Di = |x - x|
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la
media.
Ejemplo:
31
Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:
Ejemplo:
xi
fi
xi fi
|x -x|
|x - x| fi
[10, 15)
12.5
37.5
9.286
27.858
[15, 20)
17.5
87.5
4.286
21.43
[20, 25)
22.5
157.5
0.714
4.998
[25, 30)
27.5
110
5.714
22.856
[30, 35)
32.5
65
10.714
21.428
21
457.5
32
98.57
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a
las anteriores.
Ejercicios de varianza
Ejercicio 1:
33
9, 3, 8, 8, 9, 8, 9, 18
Ejercicio 2:
xi
fi
xi2 fi
xi fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
34
Propiedades de la varianza
1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la varianza no vara.
3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por
el cuadrado de dicho nmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede
calcular lavarianza total.
Si todas las muestras tienen el mismo tamao:
1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.
35
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn
elevadas al cuadrado.
La desviacin tpica es la raz cuadrada de la varianza.
Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.
La desviacin tpica se representa por .
Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Ejercicio 1:
36
Ejercicio 2:
xi
fi
xi2 fi
xi fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60)
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
37
1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara.
3 Si todos los valores de la variable se multiplican por un nmero la desviacin
tpica queda multiplicada por dichonmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se
puede calcular la desviacin tpica total.
Si todas las muestras tienen el mismo tamao:
38
1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones
extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica.
3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.
Coeficiente de variacin
El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que
sus mediassean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s.
La mayor dispersin corresponder al valor del coeficiente de variacin mayor.
Ejercicio:
Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 24. Cul de las dos presenta mayor
dispersin?
39
Puntuaciones diferenciales
Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmtica.
xi = Xi X
Puntuaciones tpicas
Las puntuaciones tpicas son el resultado de dividir las puntuaciones diferenciales entre la desviacin
tpica. Este proceso se llama tipificacin.
Las puntuaciones tpicas se representan por z.
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 52.4
kg. Las desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70
kg y el de Ana es 65 kg. Cul de ellos puede, dentro del grupo de alumnos de su sexo, considerarse ms
grueso?
40