Vous êtes sur la page 1sur 13

UNIVERSIDAD PEDRO DE VALDIVIA

APUNTES N 2
ASIGNATURA: ESTADISTICA
MATERIA: Estadgrafos de Tendencia Central, Variabilidad y Posicin.
PROFESOR: Carlos Flores Carvajal.
MEDIDAS DE DESCRIPTIVAS.
INTRODUCCIN.
Los datos organizados en una distribucin de frecuencias destacan sus caractersticas
ms esenciales, como marcas de clases, centro, forma de distribucin (asimtrica,
simtrica) etc. Sin embargo, los indicadores que describen mejor los datos en forma
ms precisa, deben calcularse. Estos indicadores resumen los datos en medidas
descriptivas que se refieren a la centralizacin o posicin, a la dispersin o
variacin, a la asimetra etc.
Las medidas de tendencia central, denominados promedios, ubican el centro de los
datos, como la media aritmtica la mediana etc.
MEDIA ARITMETICA.
Definicin. La media aritmtica, denominada simplemente media, es la suma de los
valores observados de la variable, dividido por el nmero de observaciones.
Para valores de una variable x observados en una muestra, la media aritmtica se
_
denota por x , para una poblacin se denota .
CALCULO DE LA MEDIA ARITMETICA PARA DATOS NO AGRUPADOS.
Formulas.
n

xi
i 1

( Muestra )

xi

( Poblacin )

i 1

Donde: Xi = Los valores que toma la variable


n = Nmero de observaciones en la muestra
N = Nmero de observaciones en la Poblacin
Ejemplo.
1.- A continuacin se muestran los pesos en kilos de 10 animales.
30

20

23

26

25

33

26

34

Calcule el peso promedio.


Solucin.
n

xi
i 1

30 20 23 26 25 33 26 34 36 19
27.2
10

36

19

N2
CALCULO DE LA MEDIA ARITMETICA PARA DATOS AGRUPADOS
DE VARIABLE DISCRETA.
FORMULA.
n

xini

( Muestra )

i 1

xini
i 1

( Poblacin )

Donde : ni = Frecuencia absoluta


Ejemplo.
Calcular la media aritmtica de la distribucin del nmero de hijos de la siguiente
tabla.
Solucin
Clculo de la media del nmero de hijos por familia.
Valores de X

Xi
0
1
2
3
4
Total

Frecuencias
ni
1
4
7
6
2
20

Productos
Xi*ni
0
4
14
18
8
44

Resultado:
n

xini
i 1

44
2 .2
20

CALCULO DE LA MEDIA ARITMTICA (Promedio) PARA DATOS


AGRUPADOS POR INTERVALOS.
Frmulas:
n

yini
i 1

( Muestra )

n
Donde yi = La marca de clase

yini
i 1

( Poblacin )

N 3
Ejemplo:
Calcular la media de la distribucin de frecuencias de los 45 ingresos semanales de la
tabla.
Calculo de la media de los ingresos de una
Muestra de 45 personas.
Intervalos

26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total

N Personas
ni
1
2
4
10
16
8
3
1
45

Marca clase
Yi
30
38
46
54
62
70
78
86

Productos
Yi*ni
30
76
184
540
992
560
234
86
2702

Resultando.
n

yini
i 1

2702
60.1
45

CALCULO DE LA MEDIA ARITMETICA PONDERADA


Cuando calculamos un promedio, podemos estar cometiendo un grave error si no
contemplamos el hecho de que no todas las cantidades tienen la misma importancia
en relacin con el fenmeno que se describe.
Formula.
x

w1x1 w2 x 2 ......wkxk
w1 w2 .....wk

Donde : xi = Valores de la variable.

Wi = Ponderacin o Pesos

Ejemplo.
Un estudiante de la carrera de Medicina Veterinaria en la asignatura de Biologa,
obtuvo las siguientes calificaciones, con sus correspondientes ponderaciones.
Determine su nota promedio.
Prueba
1
2
3
4

Nota
5.2
4.8
6.2
3.2

Ponderacin
25%
35%
15%
25%

Solucin.

w1x1 w2 x 2 ......wkxk
w1 w2 .....wk

471
4.71
100

5.2 * 25 4.8 * 35 6.2 * 15 3.2 * 25


25 35 15 25

N4
LA MEDIANA.
Definicin. La mediana o valor mediano de una serie de valores observados es el
nmero Me que separa a la serie de datos ordenados en forma creciente (o
decreciente) en dos partes de igual nmeros de datos.
La mediana es la medida promedio que depende del nmero de datos ordenados y no
de los valores de estos datos.
CALCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS.
Para calcular la mediana de n valores no agrupados de alguna variable cuantitativa x,
se sigue el siguiente proceso.
1) Se ordenan los datos en forma creciente.
2) Luego, se ubica el valor central Me. Si n es impar la mediana es un dato
observado. Si n es par la mediana es la semisuma de los dos valores centrales.
Ejemplo.
Calcular la mediana para las siguientes series de datos.
a) 120 - 3 - 14 - 1 - 99 - 7 - 30 - 2000 - 16
b) 30 - 77 - 3 - 300 - 36 - 11 - 10000 - 29
Solucin.
a) La serie ordenada de los 9 datos es: 1 - 3 - 7 - 14 - 16 - 30 - 99 - 120 2000
La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos
cada uno, Me = 16.
b) La serie ordenada de los 8 datos es: 3 - 11 - 29 - 30 - 36 - 77 - 300 10000
La mediana en este caso, puede ser cualquier nmero situado entre 30 y 36, ya que,
dividir a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la infinidad
de valores, la mediana se elige como la semisuma de los valores centrales. Esto es:
Me = (30 + 36) / 2 = 33.
Nota: La mediana no depende de la magnitud de los datos. Depende slo del
nmero de ellos.
CALCULO DE LA MEDIANA PARA DATOS AGRUPADOS PARA
VARIABLE CUANTITATIVA DISCRETA.
Si los valores de una variable discreta se tabulan en una distribucin de frecuencias,
el clculo de la mediana se hace siguiendo el procedimiento anterior. Debido a que
los datos estn ordenados. Por ejemplo, la mediana para la distribucin del nmero de
hijos por familias es 2.
CALCULO DE LA MEDIANA DATOS AGRUPADOS EN INTERVALOS
DE CLASE.
Formula.

Me = L.I.M +

2 Ni 1

*A
ni

N 5
Donde: n = Nmero de observaciones
ni = Frecuencia del intervalo

Ni-1 = Frecuencia acumulada


Anterior al intervalo
A = Amplitud

Ejemplo.
Calcular la mediana para la muestra de los 45 ingresos semanales.

Ingresos
26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total

Calculo de la Mediana
Nmero de
Frec
personas
5cum...
ni
Ni
1
1
2
3
4
7
10
17
16
33
8
41
3
44
1
45
45

Solucin

Me = L.I.M +

2 Ni 1

*A
ni

n 45

22.5
2
2

22.5 17
5.5
* 8 58

* 8 = 58 + 0.34375*8= = 58 + 2.75 = 60.75


16

16

Me = 58

LA MODA.
Definicin. La moda de una serie de datos es el valor Mo, que se define como el dato
que ms veces se repite.
La moda no siempre existe y si existe, no siempre es nica.
La moda es una medida promedio que se usa cuando se quiere sealar el valor que
ms se repite en una serie de datos.
La moda es el promedio menos importante debido a su ambigedad.
Ejemplo.
La moda de los datos:
a) 7 9 7 8 7 4 7 13 7 es igual a 7. Esta serie de datos es
unimodal.
b) 5 3 4 5 7 3 5 6 3 es igual tanto a 3, como a 5. Esta serie de
datos bimodal.
c) 31 11 19 12 no existe (Tambin vale decir que cada uno de los datos es
una moda)
LA MODA DE DATOS AGRUPADOS POR INTERVALOS.
Para calcular la moda n datos tabulados por intervalos, primero se determina el
intervalo que contiene a la moda esto es, el intervalo que tiene la mayor frecuencia
(intervalo modal). Luego se utiliza la frmula.

N 6

d1

Mo = L.I.M +
*A
d1 d 2
Donde:
Li.M = al lmite inferior del intervalo modal.
A = amplitud del intervalo modal
d1 = ni ni-1, esto es, d1 es igual a la frecuencia del intervalo modal menos la
frecuencia del intervalo inmediatamente anterior.
d2 = ni - ni+1, esto es, d2 es igual a la frecuencia del intervalo modal menos la
frecuencia del intervalo inmediatamente posterior.
Ejemplo.
Calcular la moda de los 45 ingresos semanales tabulados en intervalos de clase.
Ingresos
26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total

Calculo de la Moda
Nmero de
personas
ni
1
2
4
10
16
8
3
1
45

Frec 6Acum...
Ni
1
3
7
17
33
41
44
45

Solucin

d1

Mo = L.I.M +
*A
d1 d 2

d1 = 16 10 = 6

d2 = 16 8 = 8

Mo = 58 +
* 8 58 0.428 * 8 58 3.48 61.43
6 8
MEDIDAS DE DISPERSION
Introduccin.
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadstica. Los promedios determinan el centro, pero nada
indican acerca de cmo estn situados los datos respecto al centro.
En primer lugar se necesita una medida del grado de dispersin o variabilidad con
respecto al centro al centro con la finalidad de ampliar la descripcin de los datos o de
comparar dos o ms series de datos.
En segundo lugar se necesita una medida del grado de asimetra o deformacin en
ambos lados del centro de una serie de datos, con el fin de describir la forma de la
distribucin de los datos. Esta medida se denomina ndice de asimetra.

MEDIDAS DE DISPERSIN.

Las medidas de dispersin o variabilidad son nmeros que miden el grado de


separacin de los datos con respecto a un valor central, que generalmente es la
media aritmtica .
Las principales medidas de dispersin son:
El rango
La varianza
La desviacin estndar
El coeficiente de variacin.
RANGO O RECORRIDO PARA UNA VARIABLE.
Definicin. El rango de variacin o recorrido, R, de una serie de datos, es la
diferencia entre sus valores mximos y mnimo. Esto es.
R = Xmax - Xmin

Siendo Xmax el valor mximo , Xmin el valor mnimo.

El rango de variacin o recorrido , R, en una tabla de distribucin de frecuencia en


intervalos de clase , es la diferencia entre el valor del lmite superior del ltimo
intervalo menos el valor del lmite inferior del primer intervalo. Esto es.
R = Lmite superior del ultimo intervalo - Lmite inferior del primer intervalo
Ejemplo.
a) 1 4 4 5 5 5 5 6 6 - 9
b) 1 2 3 4 5 6 7 8 - 9
Ambas series de datos tienen la misma media , 5 , y el mismo rango, 8, pero las dos
series no tienen la misma dispersin, ya que la segunda tiene mayor variabilidad.
c) Calcular con los datos de la tabla de los ingresos de una muestra de 45 personas.
R = 90 - 26 = 64
El empleo del rango como medida de comparacin de variacin puede estar
justificado cuando se precise rpidamente de una medida de dispersin y no haya
tiempo de calcular algunas de las otras.
VARIANZA Y DESVIACIN ESTNDAR
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de los
valores de una variable cuantitativa con respecto a su media aritmtica. Si los valores
tienden a concentrarse alrededor de su media, la varianza ser pequea. Si los valores
tienden a distribuirse lejos de la media , la varianza ser grande.
La varianza calculada a partir de una muestra ser denotada por
una poblacin se denotara por
.

y referida a

Definicin. La varianza se define como la media aritmtica de los cuadrados de las


diferencias de los datos con respecto a su media aritmtica.
La varianza es una medida de dispersin con unidades de medicin al cuadrado, por
ejemplo, $, Km, etc.
Definicin: La desviacin estndar es la raz cuadrada positiva de la varianza.
La desviacin estndar calculada a partir de una muestra se denotar por S y referida
a la poblacin por . Esto es,

N 8

CALCULO DE LA VARIANZA PARA DATOS NO AGRUPADOS.


Formula.

S =

( xi x)

2 =

(Muestra)

( xi )

n 1

Donde :

(Poblacin)

N1

Xi = valores de la Variable

x = La media aritmtica de
la muestra.
= La media aritmtica de la poblacin.

Ejemplo.
Calcular la varianza y la desviacin estndar del siguiente conjunto de nmeros
57 51 58 60 63 54 64 52.
Solucin.
(Varianza )

1) x

51 52 54 57 58 60 63 64 459

57,375
8
8

2 y 3)
Xi
51
52
54
57
58
60
63
64

(2)
(Xi X)
- 6,37
- 5,37
- 3,37
- 0,37
0,62
2,62
5,62
6,62

(3)
(Xi X)
40,64
28,89
11,39
0,140
0,390
6,890
31,64
43,89
163,87

4) Se suma y se divide por el nmero total de observaciones.

S =

( xi x)

n 1

Solucin

( La desviacin estndar )

S=

( xi x)
i 1

163,87 163,87

23.41
8 1
7

n 1

23.41 4.84

N 9

CALCULO DE LA VARIANZA PARA DATOS AGRUPADOS


PARA VARIABLE CUANTITATIVA DISCRETA.
Formulas
Varianza

S =

( xi x)

ni

( Muestra )

n 1

= ( xi )

ni

( Poblacin )

Donde: ni = Frecuencia absoluta

x La media aritmtica

xi = Valores de la variable

= La media aritmtica en la poblacin

Desviacin Estndar

S=

( xi x)
i 1

ni

( Muestra )

n 1

( xi )
i 1

ni

( Poblacin )

Ejemplo.
Calcular la varianza y la desviacin estndar del nmero de hijos en una muestra de
20 familias.
Nmero de hijos en una muestra de 20 familias
Xi
0
1
2
3
4

ni
1
4
7
6
2
20

Solucin.
Calculo de la varianza para variable discreta
(1)
(2)
(3)
(4)
Xi
0
1
2
3
4

ni
1
4
7
6
2
20

Xi * ni
0
4
14
18
8
44

(Xi X)
- 2.2
- 1.2
- 0.2
0.8
1.8
N 10

(Xi X)
4.84
1.44
0.04
0.64
3.24

(Xi X)ni
4.84
5.76
0.28
3.84
7.68
22.4

xini
i 1

4.4

2.2
20

ni

n 1

22.4
1.18
19

( xi x) 2 ni

S=

S =

( xi x)

i 1

1.18 1.08

n 1
CALCULO DE LA VARIANZA PARA DATOS AGRUPADOS
PARA VARIABLE CUANTITATIVA CONTINUA.
Formulas.
Varianza.

S =

( yi x)

ni

( Muestra )

( yi )

ni

i 1

n 1

( Poblacin )
DESVIACIN ESTNDAR

S=

( yi x)
i 1

ni

( Muestra )

n 1

( yi )

ni

( Poblacin )

i 1

Donde : yi = Marca de clase


Ejemplo.
Para los datos de salarios diarios que se presentan, la media muestral es de
$2949,50. Calcular la Varianza y la Desviacin Estndar de la muestra.
Solucin.
Hoja de trabajo para calcular la varianza y la desviacin estndar.
Salarios
Diarios
$ 2400 2499
2600 - 2799
2800 2999
3000 3199
3200 3399
3400 - 3599

Marca
Clase
Yi
2499.50
2699.50
2899.50
3099.50
3299.50
3499.50

N de
Trabajadores
ni
7
20
33
25
11
4
100

N 11
Entonces

Yi - x

- 450
- 250
- 50
150
350
550

yi x

202500
62500
2500
22500
122500
302500

yi x

ni

1417500
1250000
82500
562500
1347500
1210000
5870000

S =

( yi x)

ni

n 1

( yi x)

S=

i 1

ni

5870000
59293
99

58293 244

n 1
COEFICIENTE DE VARIACIN.
Definicin. El coeficiente de variacin, C:V. es una medida de dispersin relativa
(libre de unidades de medidas), que se define como la desviacin estndar dividido
por la media aritmtica: Esto es.
Formula.
CV =

x 100

s = La desviacin estndar de la muestra

El coeficiente de variacin se utiliza para comparar la variabilidad de dos o ms


series de datos que tengan medidas iguales o diferentes ( por decir, una serie en
kilogramos y otra serie en metros ).
Ejemplo.
Si dos horarios H1 y H2 de matemtica I, tienen la misma media desviacin
estndar igual a 14, no podemos concluir que los dos horarios tienen la misma
variabilidad. As mismo, si las desviaciones estndares de H1 y H2 son iguales a 2
y 4 respectivamente no podemos concluir que las notas de H2 son ms dispersas
que las de H1. La variabilidad depende de las medias de los dos grupos.
Si la media del horario H1 es 16 y la media del horario H2 es 15, los coeficientes de
variacin respectivos son:
Solucin
CV1 =

s1

x1

14
0.875 87.5 %
16

CV2 =

s2

x2

14
0.93 93 %
15

Es decir, las calificaciones obtenidas en H1 son ms homogneas o tienen menor


variabilidad que las calificaciones del horario H2.
USO DE LAS MEDIDAS DE DISPERSIN
La varianza viene expresada en unidades cuadrticas en las que vienen expresados
los datos. La desviacin estndar viene expresada en las mismas unidades en las
que vienen expresados los datos. El coeficiente de variacin viene expresada en
nmeros abstractos (suprimiendo las unidades en las que vienen expresados los
datos.
1.- Si dos o mas series de datos tienen medias aritmticas iguales ( o casi iguales <9
es ms dispersa la serie que tiene mayor medida de variabilidad: Rango, La
varianza, La desviacin estndar o el coeficiente de variacin.

N 12

2.- Si dos o mas series de datos , no tienen medidas iguales ( o casi iguales ), o no
tienen las mismas unidades de medicin, entonces , es ms dispersa la serie que
tenga mayor coeficiente de variacin
MEDIDAS DE POSICIN
Cada una de las medidas descriptivas que resumen un conjunto de datos es un
nmero que representa cierta caracterstica de una poblacin o muestra. Sin
embargo, en algunas circunstancias puede ser til usar nmeros para mostrar la
posicin de la distribucin, ms all del promedio, la mediana o la moda.
Por ejemplo, las personas encargadas de reclutar personal para una clnica, quien
est de visita en cierta universidad, puede tener inters en algo ms que la nota
media o mediana de los alumnos de ltimo ao. Quiz, quiera saber los valores que
determinan 10 o 20% superior de una generacin. En estos casos los cuantiles son
muy tiles.
Cuantiles

Deciles

Cuartiles

Valores de la variable
que
dividen
la
distribucin en 10
partes iguales de 10%
cada una

Valores de la variable
que
dividen
la
distribucin en cuatro
partes iguales de 25%
cada una

Percentiles

Valores de la variable
que
dividen la
distribuci
n en 100
partes

CALCULO DE CUARTILES, DECILES Y PERCENTILES PARA


DATOS AGRUPADOS EN INTERVALOS DE CLASES.
FORMULAS:

Qk = L.I. +

nk

4 Ni 1

*A
ni

k = 1,2,3

Dk = L.I +

nk

10 Ni 1

*A
ni

k = 1,2,3.,9

DECILES

Pk = L.I +

nk

100 Ni 1

*A
ni

CUARTILES

k = 1,2,3,99

Donde : n = Nmero de observaciones

PERCENTILES

k = Cuantil en estudio

Ni-1 = Frecuencia acumulada anterior del intervalo seleccionado.


ni = Frecuencia absoluta del intervalo seleccionado.
A = Amplitud del intervalo seleccionado

N 13
EJEMPLO.

Los datos siguientes representan los siguientes ingresos en miles de pesos de una
muestra de 200 familias de una cierta comuna.
Ingresos
0.8
1.5
2.2
2.9
3.6
4.3

1.4
2.1
2.8
3.5
4.2
4.9

Frecuencia
( ni )
35
65
50
25
15
10

Frecuencia
Acumulada ( Ni)
35
100
150
175
190
200

Calcular el primer, el tecer cuartil, y el percentil 90. Interprete el resultado


Solucin. Primer cuartel.

Qk = L.I. +

Solucin

nk

4 Ni 1

*A
ni

Tercer cuartel

Qk = L.I. +

nk

4 Ni 1

*A
ni

Solucin

Percentil 90

50 35
* 0.6 1.6
65

Qk = 1.5 +

nk 200 x3

150
4
4

150 100
* 0.6 2.8
50

Q3 = 2.2 +

nk
200 x90

180
100
100

Pk = L.I +

nk

100 Ni 1

*A
ni

nk 200

50
4
4

180 175
* 0.6 3.8
15

P90 = 3.6 +

Vous aimerez peut-être aussi