Vous êtes sur la page 1sur 28

1-1

Captulo cuatro

Descripcin de los datos: medidas de dispersin


OBJETIVOS
Al terminar este captulo podr:

UNO Calcular e interpretar la amplitud de variacin, la desviacin media, la variancia, y la desviacin estndar de los datos originales. DOS Calcular e interpretar la amplitud de variacin, la variancia y la desviacin estndar de datos agrupados. TRES Explicar las caractersticas, usos, ventajas y desventajas de cada medida de dispersin.

2001 Alfaoemega Alfaomega Grupo Gruo Editor Editor

1-1

Captulo cuatro

continuacin

Descripcin de datos: medidas de dispersin


OBJETIVOS
Al terminar este captulo podr:

CUATRO Entender el problema de Chebyshev y la regla normal o emprica, y su relacin con un conjuto de observaciones. CINCO Calcular y explicar los cuartiles y la amplitud de variacin intercuartlica. SEIS Elaborar e interpretar los diagramas de caja. SIETE Calcular y entender el coeficiente de variacin y el coeficiente de asimetra.

2001 Alfaoemega Gruo Editor Alfaomega Grupo Editor

4-3

Desviacin media

Desviacin media: media aritmtica de los valores absolutos de las desviaciones respecto a la media aritmtica.

XX MD n
2001 Alfaomega Grupo Editor

4-4

EJEMPLO 1

Los pesos de una muestra de cajas con libros en una librera son (en lb) 103, 97, 101, 106 y 103. X = 510/5 = 102 lb = 1 + 5 + 1 + 4 + 1 = 12 MD = 12/5 = 2.4 Por lo comn los pesos de las cajas estn a 2.4 lb del peso medio de 102 lb.
2001 Alfaomega Grupo Editor

4-5

Variancia de la poblacin

La varianza de la poblacin para datos no agrupados es la media aritmtica de las desviaciones cuadrticas respecto a la media de la poblacin.

( X ) 2 N
2001 Alfaomega Grupo Editor

4-6

EJEMPLO 2

Las edades de la familia Dunn son 2, 18, 34, y 42 aos. Cul es la variancia de la poblacin?

X / N 96 / 4 24

( X ) / N 944 / 4 236
2 2

2001 Alfaomega Grupo Editor

4-7

Variancia poblacional

continuacin

Una frmula alternativa para la variancia poblacional es:

X N

X 2 ( ) N

2001 Alfaomega Grupo Editor

4-8

Desviacin estndar poblacional

La desviacin estndar poblacional () es la raz cuadrada de la variancia de la poblacin. Para el EJEMPLO 2, la desviacin estndar poblacional es 15.19 (raz cuadrada de 230.81).

2001 Alfaomega Grupo Editor

4-9

Variancia muestral

La variancia muestral estima la variancia de la poblacin.


2 ( X X ) Frmula conceptual= S 2 = n 1 2 ( X ) X 2 n Frmula operativa = S 2 = n 1

2001 Alfaomega Grupo Editor

4-10

EJEMPLO 3

Una muestra de cinco salarios por hora para varios trabajos en el rea es: $7, $5, $11, $8, $6. Encuentre la variancia. X = 37/5 = 7.40 s 2 = 21.2/(5-1) = 5.3

2001 Alfaomega Grupo Editor

4-11

Desviacin estndar muestral

La desviacin estndar muestral es la raz cuadrada de la variancia muestral. En el EJEMPLO 3, la desviacin estndar de la muestra es = 2.30

2001 Alfaomega Grupo Editor

4-12

Medidas de dispersin: datos no agrupados

Para datos no agrupados, la amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos. AMPLITUD = valor mayor - valor menor EJEMPLO 4: una muestra de cinco graduados de contadura indic los siguientes salarios iniciales: $22 000, $28 000, $31 000, $23 000, $24 000. La amplitud es $31 000 - $22 000 = $9 000. 2001 Alfaomega Grupo Editor

4-13

Variancia muestral para datos agrupados

La frmula de la variancia para datos agrupados usada como estimador de la vaiancia poblacional es: 2 ( fX ) fX 2 n 2 S n 1
donde f es la frecuencia de clase y X es el punto medio de la clase.
2001 Alfaomega Grupo Editor

4-14

Interpretacin y usos de la desviacin estndar

Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1.

2001 Alfaomega Grupo Editor

4-15

Interpretacin y usos de la deviacin estndar

Regla emprica: para una distribucin de frecuencias simtrica de campana, cerca de 68% de las observaciones estar dentro de 1 de la media (); cerca de 95% de las observaciones estar dentro de 2 de la media (); alrededor de 99.7% estar dentro de 3 de la media ().
2001 Alfaomega Grupo Editor

Curva en forma de campana que muestra la relacin entre y

3
2001 Alfaomega Grupo Editor

2 1

+1 +2 +3

4-17

Dispersin relativa

El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como porcentaje:

s CV (100%) X

2001 Alfaomega Grupo Editor

4-18

Asimetra

Asimetra (sesgo) es la medida de la falta de simetra en una distribucin. El coeficiente de asimetra se calcula mediante la siguiente frmula:
3(media - mediana) desviacin estndar

Sk =

2001 Alfaomega Grupo Editor

4-19

Amplitud intercuartlica

La amplitud intercuartlica es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1. Amplitud intercuartlica = tercer cuartil - primer cuartil = Q3 - Q1

2001 Alfaomega Grupo Editor

4-20

Primer cuartil

El primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25% de las observaciones en un conjunto ordenado de datos. n CF 4 Q1 L + (i ) f
donde L = lmite de las clasese que contienen Q1, CF = frecuencia acumulda que precede a la clase que contiene a Q1, f = frecuencia de la clase que contiene Q1, i= tamao de la clase que
2001 Alfaomega Grupo Editor

4-21

Tercer cuartil

El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75% de las observaciones en un conjunto ordenado de datos:
3n Q3 = L + 4 CF f (i )

donde L = lmite inferior de la clase que contiene a Q3, CF = frecuencia acumulada precedente a la clase que contiene a Q3, f = frequencia de la clase que contiene a Q3, i = tamao de la clase que contiene a Q3.
2001 Alfaomega Grupo Editor

4-22

Desviacin cuartlica

La desviacin cuartlica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1. QD = [Q3 - Q1]/2

2001 Alfaomega Grupo Editor

4-23

EJEMPLO 5

Si el tercer cuartil = 24 y el primer cuartil = 10, cul es la desviacin cuartlica? La amplitud intercuartlica es 24 - 10 = 14; por lo tanto, la desviacin cuartlica es 14/2 = 7.

2001 Alfaomega Grupo Editor

4-24

Amplitud cuartlica

Cada conjunto de datos tiene 99 porcentiles, que dividen el conjunto en 100 partes iguales. La amplitud cuartlica es la distancia entre dos porcentiles establecidos. La amplitud cuartlica 10 a 90 es la distancia entre el 10 y 90 porcentiles.

2001 Alfaomega Grupo Editor

4-25

Frmula para porcentiles

P Lp = ( n + 1) 100

2001 Alfaomega Grupo Editor

4-26

Diagramas de caja

Un diagrama de caja es una ilustracin grfica, basada en cuartiles, que ayuda a visualizar un conjunto de datos. Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mnimo, el primer cuartil, la mediana, el tercer cuartil, y el valor mximo.

2001 Alfaomega Grupo Editor

4-27

EJEMPLO 6

Con base en una muestra de 20 entregas, Marcos Pizza determin la siguiente informacin: valor mnimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos, valor mximo = 30 minutos. Desarrolle un diagrama de caja para los tiempos de entrega.

2001 Alfaomega Grupo Editor

4-28

EJEMPLO 6

continuacin

mediana
mn Q1 Q3 mx

12

14

16

18

20

22

24

26

28

30

32

2001 Alfaomega Grupo Editor