Vous êtes sur la page 1sur 8

ESCUELA SUPERIOR POLITCNICA DE CHIMBORAZO

FACULTAD DE CIENCIAS
DOCENTE: YOLANDA DAZ HEREDIA

UNIDAD 2

Medidas de Centralizacin y de Dispersin


Medidas de Centralizacin o de Tendencia Central
Los ndices estadsticos o medidas de tendencia central llamadas tambin de localizacin que
se presentan son: la moda, la mediana y la media aritmtica o media simplemente, presentado
as por el orden de dificultad. Es simple darse cuenta que la moda refleja el significado comn
de la palabra, sin embargo la media es la ms conocida. En raras ocasiones se escucha hablar de
moda y de mediana no obstante dichos ndices describen de manera diferente un conjunto de
datos, por lo que seleccionamos estas medidas dependiendo de la naturaleza del fenmeno que
se estudie y de los objetivos que se han trazado en la investigacin estadstica.
Definicin.- La moda es la observacin que se presenta con mayor frecuencia en la muestra.
La moda muestra hacia que valor tienden los datos a agruparse.
Puede existir en una muestra ms de una moda. Por ejemplo, consideremos las siguientes
observaciones
-2, 1, -4, 2, 1, 0, -2, 10, 1, -2, 0, 7, -1 y 4
Las modas son -2 y 1, puesto que ambos valores presentan el mismo nmero de veces; tres, y
ningn otro ms lo hace con mayor frecuencia. En este caso se dice que la muestra es bimodal.
Tambin debemos estudiar la observacin que ocupa el lugar central entre los datos ordenados
de forma creciente o decreciente se dice tambin de manera ascendente o descendente.
Definicin.- La mediana de un conjunto de datos ordenados de manera creciente es el valor
para el cual, la mitad de stos es menor que ste valor y la otra mitad mayor. De modo que el
50% de datos son mayores y 50% son menores que la mediana
Nota. El valor de la mediana de datos no necesariamente es un valor observado. La ventaja de la
mediana es que los valores extremos no tienen influencia sobre ella. Para ilustrar lo dicho,
consideremos que las observaciones de una muestra son

-10, 2, 3, 4, 5 y 17
La mediana es 3.5
Definicin.- La media de n observaciones x1 ,...,xn es el promedio aritmtico de los mismos
(suma de todos los valores divididos para el total n) y denotamos por X , es decir

1 n
X xi
n i 1
Esta medida tambin se llama media aritmtica o media muestral.
Observacin. El smbolo x se referir a la media de una muestra. La media de todas las
observaciones de una poblacin se representar con el smbolo . Obsrvese que en general no
es posible medir ; ms bien es un parmetro desconocido que se desea estimar a partir de la
informacin de una muestra, en general se estima con x . La media de un conjunto de
observaciones solamente localiza el centro de la distribucin de los datos; por si misma no
ofrece una descripcin adecuada de un conjunto de observaciones.
El valor de la media muestral es ms preciso que la precisin asociada con cada observacin. En
consecuencia, muchas veces se notifica la media muestral con un dgito ms que los utilizados
en cada medicin. Si consideramos nuevamente los datos
-10, 2, 3, 4, 5 y 17
donde la mediana y la media es 3.5, esto se debe a que las observaciones son simtricas. Pero
note que pasa con los datos 1, 2, 3, 4, 5, 17 la media es 5.33 . En este caso, es evidente que la
media muestral no dice mucho con respecto a la tendencia central de la mayor parte de los
datos. Sin embargo, la mediana sigue siendo 3.5 y sta es, probablemente, una medida de
tendencia central ms significativa para la mayor parte de los datos.
En conclusin si los datos son simtricos la media y la mediana coinciden. Si, adems, los datos
tienen una sola moda (esto es, son unimodales), entonces la moda, la mediana y la media
coinciden. Si los datos estn sesgados (esto es, son asimtricos, con una larga cola en uno de los
extremos) entonces se tiene que
moda < mediana < media
si la distribucin est sesgada a la derecha, mientras que
media< mediana < moda
Si la distribucin est sesgada hacia la izquierda.

Generalmente la media muestral es ms estable que la mediana, en el sentido que sta no


cambia mucho de una muestra a otra. En consecuencia, muchas tcnicas estadsticas analticas
utilizan la media muestral. Sin embargo, la moda y la mediana se utilizan mucho como medidas
descriptivas de los datos.
Resumen:
No hay que hacer mezcla de subgrupos en el clculo de la media; para evitar tal insensatez, hay
que informar por separado las medias para subgrupos distintos.

La media se la usa de preferencia cuando la distribucin es normal. Util para variables


cuantitativas

La mediana es preferida cuando la distribucin est sesgada. Util para variables


cuantitativas y variables ordinales.

La moda es preferida cuando virtualmente todas las puntuaciones en la distribucin son las
mismas, til para todo tipo de variables.

Medidas de dispersin.
Las medidas de tendencia central no necesariamente proporcionan informacin suficiente para
describir datos de manera adecuada. Por ejemplo, considrense las tres muestras de datos:
Muestra 1: 1, 2, 3, 4, 5, 6;
Muestra 2: 1, 1, 1, 6, 6, 6;
Muestra 3: -13, 2, 3, 4, 5, 20.

Realizando clculos tenemos que la mediana y la media coinciden con el valor 3.5, dicho valor
se creera que es representativo para los tres grupos. Sin embargo, se observa a simple vista que
la dispersin o variabilidad de la muestra 3 es mucho mayor que la muestra 2 y sta ltima es
mayor que la muestra 1. Por lo que stas medidas no describen de manera adecuada a los tres
conjuntos dados.
En una tarea donde se manejen datos estadsticos (notas de exmenes, edades o estaturas de los
alumnos, etc.) es necesario saber la variacin de los datos o saber que tan dispersos estn entre
ellos o respecto a una medida de tendencia central. Ahora daremos algunas definiciones que
realizan esta actividad como por ejemplo el rango o recorrido, la varianza, la desviacin
estndar y el coeficiente de variacin.
Una de las medidas de dispersin ms elemental es el rango de una muestra.
Definicin.- El rango r es la diferencia entre el valor mximo y el valor mnimo de las
observaciones. Entonces, el rango es
r = mx.(xi) - mn.(xi)
Para las tres muestras dadas anteriormente, el recorrido de la muestra 3 es r 3 = 20 - (-13) = 33,
mientras que de la muestra 2 es r 2 = 6 - 1 = 5 y de la muestra 1 es r 1 = 6 - 1 = 5. De estos
resultados es claro que entre ms grande sea el rango, mayor ser la variabilidad en los datos.
Sin embargo no es suficiente esta medida, pues la variabilidad de las muestras 1 y 2 es notoria y
es necesario entonces definir otras medidas de variabilidad como la varianza.
Definicin.- La varianza de las observaciones x1,...,xn es el promedio del cuadrado de las
distancias entre cada observacin y la media del conjunto de observaciones. La varianza
muestral de las observaciones se denota por S 2 y es:

2
1 n

x
)
x
i
n 1 i 1

A mayor varianza dentro del conjunto de observaciones corresponde una mayor dispersin
dentro del mismo conjunto.
La varianza es til en la comparacin de la variacin relativa

de dos conjuntos de

observaciones, pero slo aporta informacin con respecto a la variacin en un slo conjunto de
datos cuando se interpreta en trminos de la desviacin estndar.

Definicin.- La desviacin estndar de un conjunto de observaciones es la raz cuadrada


positiva de la varianza, es decir :
2

Es til comparar la variabilidad de dos o ms conjuntos de datos que difieren de manera


considerable en el promedio de las observaciones, para hacer esto, se utiliza una medida
adimensional de variacin relativa, llamada coeficiente da variacin y se denota por CV.
Definicin.- El coeficiente de variacin CV es una medida de dispersin relativa expresada en
porcentaje de un conjunto de datos, que se obtiene dividiendo la desviacin estndar entre la
media, es decir

CV

S
x100
X

Esta medida fue desarrollada por Karl Pearson y sirve para comparar la dispersin de dos
distribuciones diferentes. Ejemplo: comparar la desviacin estndar de una distribucin de
ingresos anuales y la desviacin estndar de una distribucin de ausentismo del mismo grupo de
empleados es imposible. No podemos decir que s= 1200 de ingresos sea mayor que s= 4.5 das
de ausentismo no!, no podemos comparar dlares y das. De manera general, se puede decir
que, el coeficiente de variacin se usa en dos casos particuares: a) Cuando queremos comparar
dos distribuciones, las cuales estn en unidades diferentes y cuando los datos estn en las
mismas unidades, pero las medias son muy distintas.
Ejemplo. El nmero de hijos por familia en la ciudad de Riobamba (X) y el tiempo de
transaccin bancaria (Y) tienen las siguientes medias y desviaciones estndar:
X = 2.96 3 hijos

Sx = 1.79 hijos

Y = 3.26 minutos

Sy = 2.48 minutos

Los coeficientes de variacin respectivos son:


CV(X) = 1.79/2.96 = 0.6047 y CV(Y) = 2.48/3.26 = 0.7607
O, expresando en porcentajes que es la forma ms comn se tiene:
CV(X) = 60.47 % y

CV(Y) = 76.07 %

Comparando estos valores, (aunque no tiene mucho sentido hacerlo) se dice que los tiempos de
transaccin tienen mayor variabilidad que el nmero de hijos por familia.
Problema resuelto. Se ha realizado la recopilacin de la siguiente informacin.

Las edades de 83 docentes universitarios


29
44
27
27
26
25
27
35

31
24
32
29
33
29
28
28

30
28
26
27
55
30
30
30

28
28
32
28
30
35
28
31

26
29
26
33
57
28
26
24

32
31
46
26
27
39
34
33

33
37
33
31
30
28
39
31

27
28
28
47
31
34
37
45

59
29
28
36
55
27
61
34

31
27
27
28
43
40
36
30

30
29
31

a) Ordenar los datos en una tabla de dos encabezados (Edad y frecuencias)


Edad
24
25
26
27
28
29
30
31
32
33
34
35
36
37

Frecuencia
2
1
6
9
13
6
8
8
3
5
3
2
2
2

Edad
38
39
40
41
42
43
44
45
46
47
48
49
50
51

Frecuencia
0
2
1
0
0
1
1
1
1
1
0
0
0
0

Edad
52
53
54
55
56
57
58
59
60
61

Frecuencia
0
0
0
2
0
1
0
1
0
1

Total

83

b) Construya una tabla de frecuencias(con los valores de clase y sus respectivas frecuencias
absolutas, acumuladas y relativas). Utilice 9 clases.
Clase
1
2
3
4
5
6
7
8
9

Intervalo
(20-25]
(25-30]
(30-35]
(35-40]
(40-45]
(45-50]
(50-55]
(55-60]
(60-65]
Total

ci
22.5
27.5
32.5
37.5
42.5
47.5
52.5
57.5
62.5

fi
3
42
21
7
3
2
2
2
1
83

fi
0.036
0.506
0.253
0.084
0.036
0.024
0.241
0.241
0.012
1.000

F
3
45
66
73
76
78
80
82
83

c) Represente grficamente la distribucin de frecuencias obtenida en el literal b)

F
0.0361
0.5422
0.7952
0.8795
0.9157
0.9398
0.9639
0.9880
1.0000

d) Calcule las medidas de tendencia central


Clculo de la media
i
Xi
1 22.5
2 27.5
3 32.5
4 37.5
5 42.5
6 47.5
7 52.5
8 57.5
9 62.5
Total

Fi
3
42
21
7
3
2
2
2
1
83

FiXi
67.5
1155.0
682.5
262.5
127.5
95.0
105.0
115.0
62.5
2673.0
Media = 2673/83 = 32.2

Clculo de la moda
La clase modal coincide en este caso con la clase mediana, por lo tanto el punto medio de esta
clase representa la moda, y es 27.5.
luego las medidas de tendencia central son:
Media
Mediana
Moda

32.2
29.58
27.5

e) Calcule las medidas de dispersin.


Varianza
Desviacin estndar

64.34
8.02

f) Calcule el coeficiente de variacin.


C.V. = (8.02/32.2)100% = 24.6%

g) De los resultados obtenidos emita su interpretacin.


Tanto el histograma como el polgono de frecuencias de los datos de las edades de los docentes
universitarios demuestran una tendencia hacia la derecha, efectivamente se comprueba al ver
que se cumple la condicin: Mo < Me < X.
Al ser C.V. < 33% (su valor es de 24.6%) se puede decir que las edades de los docentes
universitarios son homogneas. La edad promedio de los docentes universitarios es 32.2 aos,
es bastante joven, el 50.6% flucta entre 25 y 30 aos.
Resumen:
La variacin existente en una o ms distribuciones es lo que se cuantifica con las medidas de
dispersin y las razones fundamentales son las siguientes:

Nos da una medida de la confiabilidad de la media. Un valor pequeo en una medida de


dispersin indica que los datos estn estrechamente agrupados alrededor de la media,
entonces la media es representativa de los datos, la media es confiable. Un valor grande de
dispersin indica que la media no es confiable, no es representativa de los datos.

Se usa para comparar la dispersin de dos o ms distribuciones.

Vous aimerez peut-être aussi