Vous êtes sur la page 1sur 100

ESTADISTICA UNAM SUA

Material de apoyo didctico.


Aura Mlida De la Selva Menndez
Recomendaciones

El presente material ha sido preparado


como apoyo para las clases de las
materias de Estadstica Descriptiva e
Inferencial y en ningn momento
sustituye la lectura y consulta detallada
de la bibliografa recomendada as como
la elaboracin de los ejercicios de
prctica a cada una de las tcnicas.
1-2

Qu significa estadstica?

Estadstica es la ciencia de
recolectar, organizar, presentar,
analizar e interpretar datos con el
propsito de ayudar a una toma de
decisiones ms efectiva.
1-3

Quin usa estadstica?

Las tcnicas estadsticas se usan


ampliamente por personas en reas
de ciencias sociales, economa,
demografa, sociologa,
comercializacin, contabilidad,
control de calidad, consumidores,
deportes, administracin de
hospitales, educacin, poltica,
medicina, etctera...
1-4

Tipos de estadsticas
Estadstica descriptiva: mtodos para
organizar, resumir y presentar datos
de manera informativa.
EJEMPLO 1: un sondeo de opinin encontr
que 49% de las personas en una encuesta saban
el nombre del primr libro en la Biblia. La
estadstica 49 describe el nmero de cada 100
personas que saben la respuesta.

EJEMPLO 2: segn el Consumer Reports, los


dueos de lavadoras de ropa Whirlpool reportaron
9 problemas por cada 100 mquinas durante
1995. La estadstica 9 describe el nmero de
problemas por cada 100 mquinas.
1-5

Tipos de estadsticas

Estadstica inferencial: una decisin,


estimacin, prediccin o generalizacin sobre
una poblacin, con base en una muestra.
Una poblacin es un conjunto de todos los
posibles individuos, objetos o medidas de
inters.
Una muestra es una porcin, o parte, de la
poblacin de inters.
1-6

Tipos de estadsticas
(ejemplos de inferencia estadstica)
EJEMPLO 3: el departmento de contabilidad de una
empresa elegir una muestra de facturas para
verificar la exactitud de todas las facturas de la
compaa.
EJEMPLO 4: los catadores de vino prueban unas
cuantas gotas para tomar la decisin de liberar todo el
vino para la venta.
EJEMPLO 5: las cadenas de TV monitorean la
popularidad de sus programas contratando a Nielsen
y otras organizaciones para muestrear las
preferencias de televidentes.
1-7

Tipos de variables

Variable cualitativa o de atributos: la


caracterstica o variable que se estudia
no es numrica.
EJEMPLOS: sexo, afiliacin religiosa,
tipo de automvil que se posee, lugar
de nacimiento, color de los ojos.
1-8

Tipos de variables

Variable cuantitativa: la variable se


puede registrar numricamente.
EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, nmero de nios en una
familia.
1-9

Tipos de variables

Las variables cuantitativas se pueden


clasificar como discretas o continuas.
Variables discretas: slo pueden
adquirir ciertos valores y casi siempre
hay brechas entre esos valores.
EJEMPLO: el nmero de habitaciones en
una casa (1,2,3,..., etc.).
1-10

Tipos de variables

Las variables cuantitativas se pueden


clasificar como discretas o continuas.
Variables continuas: pueden tomar
cualquier valor dentro de un intervalo
especfico.
EJEMPLO: el tiempo que toma volar de
la Ciudad de Mxico a Nueva York.
1-11

Resumen de tipos de variables

DATOS

Cualitativos o de atributos Cuantitativos o numricos


(tipo de auto que posee)

discretos continuos
(nmero de hijos) (tiempo para resolver el examen)
1-12

Fuentes de datos estadsticos

Los problemas de investigacin suelen


requerir datos publicados. Se pueden
encontrar estadsticas relacionadas en
artculos publicados, revistas y peridicos.
No todos los temas disponen de datos
publicados. En esos casos, la informacin
deber recolectarse y analizarse.
Una manera de recolectar datos es
mediante encuestas.
1-13

Niveles de medicin

Nivel nominal: los datos slo se puede


clasificar en categoras, no se pueden
ordenar.
EJEMPLOS: color de los ojos, sexo,
afiliacin religiosa.
1-14

Niveles de medicin

Mutuamente excluyente: un indivduo,


objeto o artculo, al ser incluido en una
categora, debe excluirse de las dems.
EJEMPLO: color de los ojos.
Exhaustivo: cada persona, objecto o
artculo debe clasificarse en al menos una
categora.
EJEMPLO: afiliacin religiosa.
1-15

Niveles de medicin

Nivel ordinal: involucra datos que se pueden


ordenar, pero no es posible determinar las
diferencias entre los valores de los datos o no
tienen significado.
EJEMPLO: en una prueba de sabor de 4
refrescos de cola, el C se clasific como
nmero 1, el B como nmero 2, el A como 3 y
el D como nmero 4.
1-16

Niveles de medicin

Nivel de intervalo: similar al nivel


ordinal, con la propiedad adicional de
que se pueden determinar cantidades
significativas de las diferencias entre los
valores. No existe un punto cero natural.
EJEMPLO: temperatura en la escala de
grados Fahrenheit.
1-17

Niveles de medicin

Nivel de razn: el nivel de intervalo


con un punto cero inicial inherente. Las
diferencias y razones son significativas
para este nivel de medicin.
EJEMPLOS: dinero, altura de los
jugadores de basquetbol de la NBA.
Bibliografa
1. FERRIS J. RITCHEY, Estadstica para las Ciencias
Sociales. 2da. Edicin, McGraw Hill Editores, ISBN
10-970-10-6699-5, Impreso en Mxico, 2008.
2. Murray R. Spiegel y Larry J. Stephens.
ESTADISTICA. 3a. Edicin, McGraw-Hill, Mxico
2002.Captulos 6 al 12, Pgs. 127 a 283.
3. Aprenda Fcil ESTADSTICA. Grupo Patria Cultural.
Sexta reimpresin 2005.
Bibliografa ......

1. John Freund y Simon Gary. Estadstica Elemental.


Mxico, Prentice Hall-Hispanoamerica, 1994, Pg. 89-
383.B.
2. Jorge Padua. Tcnicas de investigacin aplicadas
a las ciencias sociales. Colegio de Mxico, FCE,
Mxico, 1992.
3. Hubert Blalock, Estadstica Social. Mxico, FCE,
1978.Guillermo Briones. Mtodos y tcnicas de
investigacin para las Ciencias Sociales, Mxico, Ed.
Trillas, 1990.
Estadstica Descriptiva

Material de Apoyo didctico


UNAM FCPyS SUA Educacin a
Distancia.
Profesora Aura Mlida De la Selva
Menndez Vol.2
Primera sesin

UNO
Organizar los datos en una distribucin de frecuencias.
DOS
Prresentar una distribucin de frecuencias en un histograma, un
polgono de freucencias y un polgono de frecuencias
acumuladas.
TRES
Desarrollar una representacin de tallo y hoja.
CUATRO
Presentar datos mediante tcnicas de graficacin como grficas
de lneas, de barras y circulares.
2-2

Distribucin de frecuencias

Distribucin de frecuencias:
agrupamiento de datos en categoras
que muestran el nmero de observacines
en cada categora mutumente
excluyente.
2-3

Elaboracin de una distribucin


de frecuencias

pregunta que recoleccin organizacin presentacin obtencin


se desea de datos de datos de datos de
responder (datos originales) (grfica) conclusiones

distribucin
de frecuencias
2-4

Distribucin de frecuencias
Marca de clase (punto medio): punto que
divide a la clase en dos partes iguales. Es
el promedio entre los lmites superior e
inferior de la clase.
Intervalo de clase: para una distribucin de
frecuencias que tiene clases del mismo
tamao, el intervalo de clase se obtiene
restando el lmite inferior de una clase del
lmite inferior de la siguiente.
2-5

EJEMPLO 1
Dr. Xes el director de la escuela de
ciencias sociales y desea determinar cunto
estudian los alumnos en ella. Selecciona una
muestra aleatoria de 30 estudiantes y
determina el nmero de horas por semana
que estudia cada uno: 15.0, 23.7, 19.7, 15.4,
18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6,
12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9,
10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9,
27.1, 16.6.
Organice los datos en una distribucin de
frecuencias.
2-6

EJEMPLO 1 continuacin
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El
intervalo de clase es 5 (13 - 8).

Horas de estudio Frecuencia, f


8-12 1
13-17 12
18-22 10
23-27 5
28-32 1
33-37 1
2-7

Sugerencias para elaborar


una distribucin de frecuencias

Los intervalos de clase usados en la


distribucin de frecuencias deben ser
iguales.
Determine un intervalo de clase sugerido
con la frmula: i = (valor ms alto - valor
ms bajo)/nmero de clases.
2-8

Sugerencias para elaborar


una distribucin de frecuencias
Use el intervalo de clase calculado sugerido
para construir la distribucin de frecuencias.
Nota: este es un intervalo de clase sugerido;
si el intervalo de clase calculado es 97,
puede ser mejor usar 100.
Cuente el nmero de valores en cada clase.
2-9

Distribucin de frecuencia relativa


La frecuencia relativa de una clase se obtiene dividiendo la
frecuencia de clase entre la frecuencia total.

Frecuencia, Frecuencia
Horas f relativa
8-12 1 1/30=.0333

13-17 12 12/30=.400

18-22 10 10/30=.333

23-27 5 5/30=.1667

28-32 1 1/30=.0333

33-37 1 1/30=.0333

TOTAL 30 30/30=1
T
2-10

Representaciones de tallo y
hoja
Representaciones de tallo y hoja: tcnica
estadstica para representar un conjunto de
datos. Cada valor numrico se divide en dos
partes: los dgitos principales son el tallo y el
dgito siguiente es la hoja.
Nota: una ventaja de la representacin de
tallo y hoja comparado con la distribucin de
frecuencias es que no se pierde la identidad
de cada observacin.
2-11

EJEMPLO 2
Colin logr las siguientes calificaciones en el
doceavo examen de contabilidad del semestre:
86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85.
Construya una representacin de tallo y hoja para
los datos.

tallo hoja
6 9
7 89
8 234568
9 126
2-12

Presentacin grfica de una


distribucin de frecuencias
Las tres formas de grficas ms usadas son
histogramas, polgonos de frecuencia y
distribuciones de frecuencias acumuladas
(ojiva).
Histograma: grfica donde las clases se
marcan en el eje horizontal y las frecuencias de
clase en el eje vertical. Las frecuencias de
clase se representan por las alturas de las
barras y stas se trazan adyacentes entre s.
2-13

Presentacin grfica de una


distribucin de frecuencias
Un polgono de frecuencias consiste
en segmentos de lnea que conectan
los puntos formados por el punto
medio de la clase y la frecuencia de
clase.
Una distribucin de frecuencias
acunulada (ojiva) se usa para
determinar cuntos o qu proporcin
de los valores de los datos es menor
o mayor que cierto valor.
2-14

Histograma para el ejemplo de


horas de estudio

14
12
Frecuencia

10
8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
2-15

Polgono de frecuencias para


las horas de estudio

14
12
10
Frecuencia

8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
2-16

Distribucin de frecuencias
acumuladas menor que para
las horas de estudio
35
30
25
Frecuencia

20
15
10
5
0
10 15 20 25 30 35
Horas de estudio
2-17

Grfica de barras

Una grfica de barras se puede usar para


describir cualquier nivel de medicin
(nominal, ordinal, de intervalo o de razn).
EJEMPLO 3: construya una grfica de barras
para el nmero de personas desempleadas
por cada 100 000 habitantes de ciertas
ciudades en 1995.
2-18

EJEMPLO 3 continuacin

Ciudad Nmero de desempleados


por 100 000 habitantes
Atlanta, GA 7300
Boston, MA 5400
Chicago, IL 6700
Los Angeles, CA 8900
New York, NY 8200
Washington, D.C. 8900
2-19

Grfica de barras para los


datos de desempleados
# desempleados/100 000 10000 8900 8900
8200
8000 7300 6700
5400 Atlanta
6000
Boston
4000 Chicago
Los Angeles
2000
New York
0 Washington
1 2 3 4 5 6
Ciudades
2-20

Grfica circular

Una grfica circular es en especial til


para desplegar una distribucin de
frecuencias relativas. Se divide un
crculo de manera proporcional a la
frecuencia relativa y las rebanadas
representan los diferentes grupos.
EJEMPLO 4: se pidi a una muestra de
200 corredores que indicaran su tipo
favorito de zapatos para correr.
2-21

EJEMPLO 4 continuacin

Dibuje una grfica circular basada en la siguiente


informacin.
Tipo de zapato # de corredores
Nike 92
Adidas 49
Reebok 37
Asics 13
Otros 9
2-22

Grfica circular para tipos


de zapatos

Asics
Reebok
Otros
Nike
Adidas
Reebok
Adidas Asics
Otros
Nike
Descripcin de los datos:
medidas de ubicacin

UNO
Calcular la media aritmtica, mediana, moda, media ponderada y media
geomtrica.
DOS
Explicar las caractersticas, utilizacin, ventajas y desventajas de cada
medida de ubicacin.
TRES
Identificar la posicin de la media aritmtica, la mediana, y la moda,
tanto para distribuciones simtricas como asimtricas o sesgadas.
3-2

Media de la poblacin
Para datos no agrupados, la media de la
poblacin es la suma de todos los valores en
ella dividida entre el total de valores en la
poblacin:
X / N
donde representa la media de la poblacin.
N es el nmero total de elementos en la
poblacin.
X representa cualquier valor en particular.
indica la operacin de sumar.
3-3

EJEMPLO 1

Parmetro: una caracterstica de una


poblacin.
La familia Kiers posee cuatro carros. Los datos
son las millas recorridas por cada uno:
56 000, 23 000, 42 000 y 73 000. Encuentre el
promedio de millas de los cuatro carros.
Esto es (56 000 + 23 000 + 42 000 + 73 000)/4
= 48 500
3-4

Media de una muestra


Para datos no agrupados, la media de una
muestra es la suma de todos los valores
divididos entre el nmero total de los mismos:

X X / n
donde X denota la media muestral
n es el nmero total de valores en la muestra.
3-5

EJEMPLO 2
Dato estadstico: una caracterstica de una
muestra.
Una muestra de cinco ejecutivos recibi la
siguiente cantidad en bonos el ao pasado:
$14 000, $15 000, $17 000, $16 000 y
$15 000. Encuentre el promedio en bonos para los
cinco ejecutivos.
Como estos valores representan la muestra de 5
ejecutivos, la media de la muestra es
(14 000 + 15 000 + 17 000 + 16 000 +
15 000) / 5 = $15 400.
3-6

Propiedades de la media
aritmtica
Todo conjunto de datos de nivel de intervalo
y de nivel de razn tiene un valor medio.
Al evaluar la media se incluyen todos los
valores.
Un conjunto de valores slo tiene una media.
La cantidad de datos a evaluar rara vez
afecta la media.
La media es la nica medida de ubicacin
donde la suma de las desviaciones de cada
valor con respecto a la media, siempre es
cero.
3-7

EJEMPLO 3

Considere el conjunto de valores: 3, 8 y


4. La media es 5. Para ilustrar la
quinta propiedad, (3 - 5) + (8 - 5) + (4 -
5) = - 2 + 3 - 1 = 0. En otras palabras,

( X X ) 0
3-8

Media ponderada

La media ponderada de un conjunto de


nmeros X1, X2, ..., Xn, con las
ponderaciones correspondientes w1, w2,
...,wn, se calcula con la frmula:

Xw ( w1 X 1 w2 X 2 ... wn X n ) /( w1 w2 ... wn )
Xw ( w * X ) / w
3-9

EJEMPLO 6
Durante un periodo de una hora en una
tarde calurosa de un sbado, el cantinero
Chris sirvi cincuenta bebidas. Calcule la
media ponderada de los precios de las
bebidas. (Precio ($), cantidad vendida):
(.50,5), (.75,15), (.90,15), (1.10,15).
La media ponderada es: $(.50 x 5 + .75 x
15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 +
15) = $43.75/50 = $0.875
3-10

Mediana
Mediana: es el punto medio de los valores
despus de ordenarlos de menor a mayor, o de
mayor a menor. La misma cantidad de valores
se encuentra por arriba de la mediana que por
debajo de ella.
Nota: para un conjunto con un nmero par de
nmeros, la mediana ser el promedio
aritmtico de los dos nmeros medios.
3-11

EJEMPLO 4
Calcule la mediana para los siguientes datos.
La edad de una muestra de cinco estudiantes es:
21, 25, 19, 20 y 22.
Al ordenar los datos de manera ascendente
quedan: 19, 20, 21, 22, 25. La mediana es 21.
La altura, en pulgadas, de cuatro jugadores de
basquetbol es 76, 73, 80 y 75.
Al ordenar los datos de manera ascendente
quedan: 73, 75, 76, 80. La mediana es 75.5.
3-12

Propiedades de la mediana
La mediana es nica para cada conjunto de datos.
No se ve afectada por valores muy grandes o muy
pequeos, y por lo tanto es una medida valiosa de
tendencia central cuando ocurren.
Puede obtenerse para datos de nivel de razn, de
intervalo y ordinal.
Puede calcularse para una distribucin de
frecuencias con una clase de extremo abierto, si la
mediana no se encuentra en una de estas clases.
3-13

Moda

La moda es el valor de la observacin


que aparece con ms frecuencia.
EJEMPLO 5: las calificaciones de un
examen de diez estudantes son: 81,
93, 84, 75, 68, 87, 81, 75, 81, 87.
Como la calificacin 81 es la que ms
ocurre, la calificacin modal es 81.
3-14

Media geomtrica
La media geomtrica (MG) de un
conjunto de n nmeros positivos se
define como la raz n-sima del producto
de los n valores. Su frmula es:

MG n ( X 1)( X 2)( X 3)...( Xn)


La media geomtrica se usa para encontrar
el promedio de porcentajes, razones, ndices
o tasas de crecimiento.
3-15

EJEMPLO 6
Las tasas de inters de tres bonos son 5%, 7% y
4%.
La media geomtrica es MG 3 (7)(5)(4)
= 5.192.
La media aritmtica es (6 + 3 + 2)/3 = 5.333.
La MG da una cifra de ganancia ms
conservadora porque no tiene una ponderacin
alta para la tasa de 7%.
3-16

Media geomtrica continuacin

Otra aplicacin de la media geomtrica


es determinar el porcentaje promedio
del incremento en ventas, produccin u
otros negocios o series econmicas de
un periodo a otro. La frmula para este
tipo de problema es:

MG n (valor al final del periodo)/( valor al inicio del periodo) 1


3-17

EJEMPLO 7

El nmero total de mujeres inscritas en


colegios americanos aument de 755 000 en
1986 a 835 000 en 1995.
Aqu n = 10, as (n - 1) = 9.

MG 8 835 000 / 755 000 1 .0127 .


Es decir, la media geomtrica de la tasa de
crecimiento es 1.27%.
3-18

Media de datos agrupados


La media de una muestra de datos
organizados en una distribucin de
frecuencias se calcula mediante la
siguiente frmula:

Xf Xf
X
f n
3-19

EJEMPLO 9

Una muestra de diez cines en una gran


rea metropolitana dio el nmero total de
pelculas exhibidas la semana anterior.
Calcule la media de las pelculas
proyectadas.
Xf Xf
X
f n
3-20

EJEMPLO 9 continuacin

Pelculas frecuencia punto medio (f)(X)


exhibidas f de clase X
1-2 1 1.5 1.5
3-4 2 3.5 7.0
5-6 3 5.5 16.5
7-8 1 7.5 7.5
9-10 3 9.5 28.5
Total 10 61

61/10 = 6.1 pelculas


3-21

Mediana de datos agrupados


La mediana de una muestra de datos
organizados en una distribucin de
frecuencias se calcula mediante la siguiente
frmula:
Mediana = L + [(n/2 - FA)/f] (i)
donde L es el lmite inferior de la clase que
contiene a la mediana, FA es la frecuencia
acumulada que precede a la clase de la
mediana, f es la frecuencia de clase de la
mediana e i es el intervalo de clase de la
mediana.
3-22

Clculo de la clase de la
mediana
Para determinar la clase de la mediana de datos
agrupados:
Elabore una distribucin de frecuencias acumulada.
Divida el nmero total de datos entre 2.
Determine qu clase contiene este valor. Por
ejemplo, si n=50, 50/2 = 25, despus determine
qu clase contiene el 25 valor (la clase de la
mediana).
3-23

EJEMPLO 10
Pelculas Frecuencia Frecuencia
exhibidas acumulada
1-2 1 1
3-4 2 3
5-6 3 6
7-8 1 7
9-10 3 10

La clase de la mediana es 5 - 6, ya
que contiene el 5 valor (n/2 = 5)
3-24

EJEMPLO 10 continuacin

De la tabla, L = 5, n = 10, f = 3, i = 2, FA
= 3.
As, mediana = 5 + [((10/2) - 4)/3](2) =
6.33
3-25

Moda de datos agrupados

La moda de los datos agrupados se


aproxima por el punto medio de la clase
que contiene la frecuencia de clase
mayor.
Las modas en el EJEMPLO 10 son 5.5 y
9.5. Cuando dos valores ocurren una
gran cantidad de veces, la distribucin se
llama bimodal, como en el ejemplo 10.
3-26

Distribucin simtrica

sesgo cero moda = mediana =


media
3-27

Distribucin con asimetra positiva


sesgo a la derecha: media y mediana se
encuentran a la
derecha de la moda.

moda < mediana < media


3-28

Distribucin con asimetra negativa


sesgo a la izquierda: media y mediana
estn a la izquierda de la moda.

media < mediana < moda


3-29

NOTA

Si se conocen dos promedios de una


distribucin de frecuencias con sesgo
moderado, el tercero se puede aproximar.
moda = media - 3(media - mediana)
media = [3(mediana) - moda]/2
mediana = [2(media) + moda]/3
Descripcin de los datos:
medidas de dispersin

OBJETIVOS
Al terminar este captulo podr:
UNO
Calcular e interpretar la amplitud de variacin, la desviacin
media, la variancia, y la desviacin estndar de los datos
originales.
DOS
Calcular e interpretar la amplitud de variacin, la variancia y la
desviacin estndar de datos agrupados.
TRES
Explicar las caractersticas, usos, ventajas y desventajas de cada
medida de dispersin.
Descripcin de datos:
medidas de dispersin Continuacin

CUATRO
Entender el problema de Chebyshev y la regla normal o
emprica, y su relacin con un conjuto de observaciones.
CINCO
Calcular y explicar los cuartiles y la amplitud de variacin
intercuartlica.
SEIS
Elaborar e interpretar los diagramas de caja.
SIETE
Calcular y entender el coeficiente de variacin y el coeficiente de
asimetra.
4-3

Desviacin media

Desviacin media: media aritmtica de


los valores absolutos de las
desviaciones respecto a la media
aritmtica.

X X
MD
n
4-4

EJEMPLO 1

Los pesos de una muestra de cajas con libros


en una librera son (en lb) 103, 97, 101, 106 y
103.
X = 510/5 = 102 lb
= 1 + 5 + 1 + 4 + 1 = 12
MD = 12/5 = 2.4
Por lo comn los pesos de las cajas estn a
2.4 lb del peso medio de 102 lb.
4-5

Variancia de la poblacin

La varianza de la poblacin para datos


no agrupados es la media aritmtica de
las desviaciones cuadrticas respecto a
la media de la poblacin.

( X ) 2


2
N
4-6

EJEMPLO 2

Las edades de la familia Dunn son 2, 18,


34, y 42 aos. Cul es la variancia de la
poblacin?

X / N 96 / 4 24

2 ( X ) 2 / N 944 / 4 236
4-7

Variancia poblacional continuacin

Una frmula alternativa para la variancia


poblacional es:

X 2
X 2
2
( )
N N
4-8

Desviacin estndar
poblacional

La desviacin estndar poblacional ()


es la raz cuadrada de la variancia de la
poblacin.
Para el EJEMPLO 2, la desviacin
estndar poblacional es 15.19 (raz
cuadrada de 230.81).
4-9

Varianza muestra

La varianza muestra estima la variancia


de la poblacin.
2 ( X X )2
Frmula conceptual = S =
n 1
( X ) 2
X 2
Frmula operativa = S 2 = n
n 1
4-10

EJEMPLO 3

Una muestra de cinco salarios por


hora para varios trabajos en el rea
es: $7, $5, $11, $8, $6. Encuentre la
variancia.
2
s X = 37/5 = 7.40 = 21.2/(5-1) = 5.3
4-11

Desviacin estndar muestral

La desviacin estndar muestral es la


raz cuadrada de la variancia muestral.
En el EJEMPLO 3, la desviacin
estndar de la muestra es = 2.30
4-12

Medidas de dispersin:
datos no agrupados
Para datos no agrupados, la amplitud es la
diferencia entre los valores mayor y menor en un
conjunto de datos.
AMPLITUD = valor mayor - valor menor
EJEMPLO 4: una muestra de cinco graduados
de contadura indic los siguientes salarios
iniciales: $22 000, $28 000, $31 000,
$23 000, $24 000. La amplitud es $31 000 - $22
000 = $9 000.
4-13

Varianza muestral para datos


agrupados
La frmula de la varianza para datos
agrupados usada como estimador de la
variancia poblacional es:

( fX ) 2

fX 2
S2 n
n 1
donde f es la frecuencia de clase y X es el
punto medio de la clase.
4-14

Interpretacin y usos de la
desviacin estndar

Teorema de Chebyshev: para cualquier


conjunto de observaciones, la
proporcin mnima de valores que est
dentro de k desviaciones estndar
desde la media es al menos 1 - 1/k ,
donde k2 es una constante mayor que 1
(uno).
4-15

Interpretacin y usos de la
deviacin estndar
Regla emprica: para una distribucin de
frecuencias simtrica de campana,
cerca de 68% de las observaciones
estar dentro de 1 de la media ();
cerca de 95% de las observaciones
estar dentro de 2 de la media ();
alrededor de 99.7% estar dentro de
3 de la media ().
Curva en forma de campana que muestra la relacin entre y

3 2 1 1 2 3
2001 Alfaomega Grupo Editor
4-17

Dispersin relativa

El coeficiente de variacin es la razn de


la desviacin estndar a la media
aritmtica, expresada como porcentaje:
s
CV (100%)
X
4-18

Asimetra
Asimetra (sesgo) es la medida de
la falta de simetra en una
distribucin.
El coeficiente de asimetra se
calcula mediante la siguiente
frmula:
Sk =
3(media - mediana)
desviacin estndar
4-19

Amplitud intercuartlica

La amplitud intercuartlica es la
distancia entre el tercer cuartil Q3 y el
primer
cuartil Q1.
Amplitud intercuartlica
= tercer cuartil - primer cuartil
= Q3 - Q1
4-20

Primer cuartil
El primer cuartil es el valor correspondiente
al punto debajo del cual se encuentra el
25% de las observaciones en un conjunto
ordenado de datos.
n
CF
Q1 L 4 (i )
f

donde L = lmite de las clasese que contienen Q1,


CF = frecuencia acumulda que precede a la clase
que contiene a Q1, f = frecuencia de la clase que
contiene Q1, i= tamao de la clase que contiene
Q1 .
4-21

Tercer cuartil

El tercer cuartil es el valor correspondiente


al punto debajo del cual se encuentra 75%
de las observaciones en un conjunto
ordenado de datos:
3n
CF
Q3 = L + 4 (i )
f

donde L = lmite inferior de la clase que contiene


a Q3, CF = frecuencia acumulada precedente a
la clase que contiene a Q3, f = frequencia de la
clase que contiene a Q3, i = tamao de la clase
que contiene a Q3.
4-22

Desviacin cuartlica

La desviacin cuartlica es la mitad de la


distancia entre el tercer cuartil, Q3, y el
primero, Q1.
QD = [Q3 - Q1]/2
4-23

EJEMPLO 5

Si el tercer cuartil = 24 y el primer cuartil


= 10, cul es la desviacin cuartlica?
La amplitud intercuartlica es 24 - 10 =
14;
por lo tanto, la desviacin cuartlica es
14/2 = 7.
4-24

Amplitud cuartlica

Cada conjunto de datos tiene 99


porcentiles, que dividen el conjunto en
100 partes iguales.
La amplitud cuartlica es la distancia
entre dos porcentiles establecidos. La
amplitud cuartlica 10 a 90 es la distancia
entre el 10 y 90 porcentiles.
4-25

Frmula para porcentiles

P
Lp = ( n + 1)
100
4-26

Diagramas de caja

Un diagrama de caja es una ilustracin


grfica, basada en cuartiles, que ayuda a
visualizar un conjunto de datos.
Se requieren cinco tipos de datos para
construir un diagrama de caja: el valor
mnimo, el primer cuartil, la mediana, el
tercer cuartil, y el valor mximo.
4-27

EJEMPLO 6

Con base en una muestra de 20


entregas, Marcos Pizza determin la
siguiente informacin: valor mnimo = 13
minutos,
Q1 = 15 minutos, mediana = 18 minutos,
Q3 = 22 minutos, valor mximo = 30
minutos. Desarrolle un diagrama de caja
para los tiempos de entrega.
4-28

EJEMPLO 6 continuacin

mediana

mn Q1 Q3 mx

12 14 16 18 20 22 24 26 28 30 32