Académique Documents
Professionnel Documents
Culture Documents
FACULTAD DE CIENCIAS
DOCENTE: YOLANDA DAZ HEREDIA
UNIDAD 2
-10, 2, 3, 4, 5 y 17
La mediana es 3.5
Definicin.- La media de n observaciones x1 ,...,xn es el promedio aritmtico de los mismos
(suma de todos los valores divididos para el total n) y denotamos por X , es decir
1 n
X xi
n i 1
Esta medida tambin se llama media aritmtica o media muestral.
Observacin. El smbolo x se referir a la media de una muestra. La media de todas las
observaciones de una poblacin se representar con el smbolo . Obsrvese que en general no
es posible medir ; ms bien es un parmetro desconocido que se desea estimar a partir de la
informacin de una muestra, en general se estima con x . La media de un conjunto de
observaciones solamente localiza el centro de la distribucin de los datos; por si misma no
ofrece una descripcin adecuada de un conjunto de observaciones.
El valor de la media muestral es ms preciso que la precisin asociada con cada observacin. En
consecuencia, muchas veces se notifica la media muestral con un dgito ms que los utilizados
en cada medicin. Si consideramos nuevamente los datos
-10, 2, 3, 4, 5 y 17
donde la mediana y la media es 3.5, esto se debe a que las observaciones son simtricas. Pero
note que pasa con los datos 1, 2, 3, 4, 5, 17 la media es 5.33 . En este caso, es evidente que la
media muestral no dice mucho con respecto a la tendencia central de la mayor parte de los
datos. Sin embargo, la mediana sigue siendo 3.5 y sta es, probablemente, una medida de
tendencia central ms significativa para la mayor parte de los datos.
En conclusin si los datos son simtricos la media y la mediana coinciden. Si, adems, los datos
tienen una sola moda (esto es, son unimodales), entonces la moda, la mediana y la media
coinciden. Si los datos estn sesgados (esto es, son asimtricos, con una larga cola en uno de los
extremos) entonces se tiene que
moda < mediana < media
si la distribucin est sesgada a la derecha, mientras que
media< mediana < moda
Si la distribucin est sesgada hacia la izquierda.
La moda es preferida cuando virtualmente todas las puntuaciones en la distribucin son las
mismas, til para todo tipo de variables.
Medidas de dispersin.
Las medidas de tendencia central no necesariamente proporcionan informacin suficiente para
describir datos de manera adecuada. Por ejemplo, considrense las tres muestras de datos:
Muestra 1: 1, 2, 3, 4, 5, 6;
Muestra 2: 1, 1, 1, 6, 6, 6;
Muestra 3: -13, 2, 3, 4, 5, 20.
Realizando clculos tenemos que la mediana y la media coinciden con el valor 3.5, dicho valor
se creera que es representativo para los tres grupos. Sin embargo, se observa a simple vista que
la dispersin o variabilidad de la muestra 3 es mucho mayor que la muestra 2 y sta ltima es
mayor que la muestra 1. Por lo que stas medidas no describen de manera adecuada a los tres
conjuntos dados.
En una tarea donde se manejen datos estadsticos (notas de exmenes, edades o estaturas de los
alumnos, etc.) es necesario saber la variacin de los datos o saber que tan dispersos estn entre
ellos o respecto a una medida de tendencia central. Ahora daremos algunas definiciones que
realizan esta actividad como por ejemplo el rango o recorrido, la varianza, la desviacin
estndar y el coeficiente de variacin.
Una de las medidas de dispersin ms elemental es el rango de una muestra.
Definicin.- El rango r es la diferencia entre el valor mximo y el valor mnimo de las
observaciones. Entonces, el rango es
r = mx.(xi) - mn.(xi)
Para las tres muestras dadas anteriormente, el recorrido de la muestra 3 es r 3 = 20 - (-13) = 33,
mientras que de la muestra 2 es r 2 = 6 - 1 = 5 y de la muestra 1 es r 1 = 6 - 1 = 5. De estos
resultados es claro que entre ms grande sea el rango, mayor ser la variabilidad en los datos.
Sin embargo no es suficiente esta medida, pues la variabilidad de las muestras 1 y 2 es notoria y
es necesario entonces definir otras medidas de variabilidad como la varianza.
Definicin.- La varianza de las observaciones x1,...,xn es el promedio del cuadrado de las
distancias entre cada observacin y la media del conjunto de observaciones. La varianza
muestral de las observaciones se denota por S 2 y es:
2
1 n
x
)
x
i
n 1 i 1
A mayor varianza dentro del conjunto de observaciones corresponde una mayor dispersin
dentro del mismo conjunto.
La varianza es til en la comparacin de la variacin relativa
de dos conjuntos de
observaciones, pero slo aporta informacin con respecto a la variacin en un slo conjunto de
datos cuando se interpreta en trminos de la desviacin estndar.
CV
S
x100
X
Esta medida fue desarrollada por Karl Pearson y sirve para comparar la dispersin de dos
distribuciones diferentes. Ejemplo: comparar la desviacin estndar de una distribucin de
ingresos anuales y la desviacin estndar de una distribucin de ausentismo del mismo grupo de
empleados es imposible. No podemos decir que s= 1200 de ingresos sea mayor que s= 4.5 das
de ausentismo no!, no podemos comparar dlares y das. De manera general, se puede decir
que, el coeficiente de variacin se usa en dos casos particuares: a) Cuando queremos comparar
dos distribuciones, las cuales estn en unidades diferentes y cuando los datos estn en las
mismas unidades, pero las medias son muy distintas.
Ejemplo. El nmero de hijos por familia en la ciudad de Riobamba (X) y el tiempo de
transaccin bancaria (Y) tienen las siguientes medias y desviaciones estndar:
X = 2.96 3 hijos
Sx = 1.79 hijos
Y = 3.26 minutos
Sy = 2.48 minutos
CV(Y) = 76.07 %
Comparando estos valores, (aunque no tiene mucho sentido hacerlo) se dice que los tiempos de
transaccin tienen mayor variabilidad que el nmero de hijos por familia.
Problema resuelto. Se ha realizado la recopilacin de la siguiente informacin.
31
24
32
29
33
29
28
28
30
28
26
27
55
30
30
30
28
28
32
28
30
35
28
31
26
29
26
33
57
28
26
24
32
31
46
26
27
39
34
33
33
37
33
31
30
28
39
31
27
28
28
47
31
34
37
45
59
29
28
36
55
27
61
34
31
27
27
28
43
40
36
30
30
29
31
Frecuencia
2
1
6
9
13
6
8
8
3
5
3
2
2
2
Edad
38
39
40
41
42
43
44
45
46
47
48
49
50
51
Frecuencia
0
2
1
0
0
1
1
1
1
1
0
0
0
0
Edad
52
53
54
55
56
57
58
59
60
61
Frecuencia
0
0
0
2
0
1
0
1
0
1
Total
83
b) Construya una tabla de frecuencias(con los valores de clase y sus respectivas frecuencias
absolutas, acumuladas y relativas). Utilice 9 clases.
Clase
1
2
3
4
5
6
7
8
9
Intervalo
(20-25]
(25-30]
(30-35]
(35-40]
(40-45]
(45-50]
(50-55]
(55-60]
(60-65]
Total
ci
22.5
27.5
32.5
37.5
42.5
47.5
52.5
57.5
62.5
fi
3
42
21
7
3
2
2
2
1
83
fi
0.036
0.506
0.253
0.084
0.036
0.024
0.241
0.241
0.012
1.000
F
3
45
66
73
76
78
80
82
83
F
0.0361
0.5422
0.7952
0.8795
0.9157
0.9398
0.9639
0.9880
1.0000
Fi
3
42
21
7
3
2
2
2
1
83
FiXi
67.5
1155.0
682.5
262.5
127.5
95.0
105.0
115.0
62.5
2673.0
Media = 2673/83 = 32.2
Clculo de la moda
La clase modal coincide en este caso con la clase mediana, por lo tanto el punto medio de esta
clase representa la moda, y es 27.5.
luego las medidas de tendencia central son:
Media
Mediana
Moda
32.2
29.58
27.5
64.34
8.02