Académique Documents
Professionnel Documents
Culture Documents
ndice
Presentacin 05
Red de contenidos 06
Sesiones de aprendizaje
SEMANA 1 : Definiciones bsicas: Poblacin, marco muestral, 07
muestra, censo y muestreo: Ventajas y desventajas
Diseo de la encuesta por muestreo. Tipos de muestreo
Distribuciones muestrales
SEMANA 2 : Estimacin Puntual. Propiedades de un estimador. 19
Estimacin de intervalos de confianza
Intervalos de confianza para la media con varianza
conocida, muestra grande
Tamao muestral para estimar una media
Intervalo de confianza para la diferencia de medias de
dos distribuciones con ambas desviaciones estndar
conocidas, muestras grandes
SEMANA 3 : Intervalo de confianza para la media con varianza 35
desconocida. Muestra pequea
Intervalo de confianza para la diferencia de medias con
varianzas desconocidas pero iguales, muestras
pequeas
SEMANA 4 : Intervalo de confianza para una proporcin. Muestras 45
grandes
Tamao muestral para estimar una proporcin
Tamao de muestra para poblaciones finitas
Intervalo de confianza para la diferencia de proporciones
SEMANA 5 : Hiptesis estadstica. Tipos de errores I y II, Nivel de 55
significacin, Regin crtica o regin de rechazo. Regin
de aceptacin
Prueba de Hiptesis para medias, muestras grandes.
Prueba bilateral de una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso I,
caso II
Prueba de Hiptesis para la diferencia de medias.
Desviacin estndar conocidas, muestras grandes
SEMANA 6 : Prueba de Hiptesis para medias, muestras pequeas 73
Prueba bilateral de una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso
I, caso II
Prueba de Hiptesis para la diferencia de medias
Desviacin estndar desconocidas, Muestras pequeas
Presentacin
La globalizacin ha creado un campo muy extenso de desarrollo para los
nuevos profesionales, ya sea en servicios o en produccin. Es por esto que
tienen que estar preparados para enfrentar cualquier reto en el campo
laboral. Las comunicaciones y el software han hecho que en la actualidad
todo profesional est en constante contacto con la informacin estadstica.
Ms an, muchas veces es necesario realizar alguna medicin estadstica
para tener una idea acerca de la produccin de una empresa, del mercado
burstil a nivel mundial, del precio de los metales en el mercado Europeo, el
control de epidemias en zonas determinadas, el control de los precios de la
canasta familiar, etc, de manera que se pueda tomar la decisin adecuada
para que dichos estudios sean siempre favorables.
El propsito de este manual es brindar conceptos claros de estadstica
inferencial y sus numerosas aplicaciones en el campo laboral. Por otra parte,
se pretende dar al futuro profesional las herramientas necesarias para
interpretar y evaluar informacin estadstica, para que adquiera destreza en
la interpretacin, y manejo de las definiciones y teoremas.
En una primera etapa se desarrollar el marco terico y prctico de la
Estadstica Inferencial. En la segunda etapa se desarrollar la aplicacin de
Mtodos regresivos para predecir situaciones experimentales basadas en
datos reales.
Finalmente es importante resaltar que este curso es netamente prctico. Por
ello en cada sesin se desarrollar la teora necesaria en forma concreta,
dndole mayor nfasis a la parte prctica y a la interpretacin de resultados.
Red de contenidos
conocida
Intervalos de desconocida
confianza
Proporciones
conocida
Prueba de
hiptesis desconocida
Muestreo
Proporciones
Lineales
Simple
No Lineales
Regresiones
Mltiple
Correlaciones
Serie de
tiempo
SEMANA
1
TEORA DE MUESTREO
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
TEORA DE MUESTREO
La teora de muestreo es un estudio de las relaciones existentes entre una
poblacin y muestras extradas de la misma. Tiene gran inters en muchos
aspectos de la estadstica. Por ejemplo, permite estimar cantidades
desconocidas de la poblacin (tales como la media poblacional, la varianza,
etc.), frecuentemente llamadas parmetros poblacionales o brevemente
parmetros, a partir del conocimiento de las correspondientes cantidades
muestrales (tales como la media muestral, la varianza, etc.), a menudo
llamadas estadsticos muestrales o brevemente estadsticos.
La teora de muestreo es tambin til para determinar si las diferencias que se
puedan observar entre dos muestras son debidas a la aleatoriedad de las
mismas o si por el contrario son realmente significativas. Tales preguntas
surgen, por ejemplo, al ensayar un nuevo suero para el tratamiento de una
enfermedad, o al decidir si un proceso de produccin es mejor que otro. Estas
decisiones envuelven a los llamados ensayos e hiptesis de significacin, que
tienen gran importancia en teora de la decisin.
En general, un estudio de inferencias, realizado sobre una poblacin mediante
muestras extradas de la misma, junto con las indicaciones sobre la exactitud
de tales inferencias aplicadas a la teora de la probabilidad, se conoce como
inferencia estadstica.
DISTRIBUCIONES MUESTRALES
Considrense todas las posibles muestras de tamao n que pueden extraerse
de una poblacin dada (con o sin reemplazo). Para cada muestra se puede
calcular un estadstico, tal como la media, la desviacin estndar, etc., que
variar de una muestra a otra. De esta forma, se obtiene una distribucin del
estadstico que se conoce como distribucin muestral.
Si, por ejemplo, el estadstico de que se trata es la media muestral, la
distribucin se conoce como distribucin muestral de medias Anlogamente se
obtendran las distribuciones mustrales de las desviaciones estndar,
varianzas, medianas, proporciones, etc.
p p = p p = p1 p2
1 2 1 2
p1 (1 p1 ) p2 (1 p2 )
p p = p2 + p2 = +
1 2 1 2
n1 n2
s s = s s
1 2 1 2
s s = + s2
1 2
2
s1 2
ERRORES TPICOS
La desviacin estndar de la distribucin muestral de un estadstico se conoce
tambin como su error estndar. En la tabla se han anotado los errores tpicos
de distribuciones muestrales para diversos estadsticos bajo las condiciones de
muestreo aleatorio sin reemplazo para una poblacin infinita (o muy grande) o
con reemplazo para una poblacin finita. Tambin, se apuntan notas especia-
les que indican las condiciones para las que los resultados son vlidos, as
como otras notas de inters.
Las cantidades , , p, r y x, s, p, x r denotan, respectivamente, las medias,
desviaciones estndar, proporciones y momentos de orden r respecto de la
media en la poblacin y en la muestra.
Es de notar que si el tamao de la muestra n es bastante grande, las
distribuciones muestrales son normales o casi normales. Por esta razn, los
mtodos se conocen como mtodos para grandes muestras. La teora de
pequeas muestras, o teora de muestreo exacto, como a veces se llama, se
usa cuando n<30. Entonces, las muestras se llaman pequeas.
Cuando los parmetros de la poblacin, tales como , p, r se desconocen,
pueden estimarse mediante sus correspondientes estadsticos muestrales:
s, p, xr , si las muestras son suficientemente grandes.
ACTIVIDADES
1. Una poblacin se compone de los cinco nmeros 2, 3, 6, 8, 11. Considere
todas las muestras posibles de tamaos que puedan extraerse con
remplazamiento de esta poblacin. Halle lo siguiente:
5. Los cojinetes de bolas de una determinada casa pesan 0,50 onzas con una
desviacin estndar de 0,02 onzas. Cul es la probabilidad de que dos
lotes de 1000 cojinetes cada uno difieran en un peso superior a 2 onzas?
7. Se pesan tres cantidades dando 20,48; 35,97 y 62,34 libras con desviaciones
estndar de 0,21; 0,46 y 0,54 libras respectivamente. Halle la media y la
desviacin estndar de la suma de las cantidades.
Autoevaluacin
1. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una
desviacin estndar de 0,30 onzas. Halle la probabilidad de que una
muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso
total (a) comprendido entre 496 y 500 onzas, (b) de ms de 510 onzas.
3. Ciertos tubos fabricados por una compaa tienen una duracin media de
800 horas y una desviacin estndar de 60 horas. Halle la probabilidad de
que una muestra al azar de 16 tubos, tomada entre ellos tenga una duracin
media entre 790 y 810 horas.
8. Un cierto tipo de bombilla elctrica tiene una duracin media de 1500 horas
y una desviacin estndar de 150 horas. Se conectan tres bombillas de
forma que cuando una se funde, otra sigue alumbrando. Suponiendo que
las duraciones se distribuyen normalmente. Cul es la probabilidad de que
se tenga luz
8.1 al menos 5000 horas?
8.2 como mucho 4200 horas?
10. Una poblacin est formada por los cuatro nmeros 3, 7, 11, 15. Considere
todas las posibles muestras de tamao dos que pueden extraerse de esta
poblacin con reemplazo. Halle lo siguiente:
10.1 la media poblacional
10.2 la desviacin estndar poblacional
10.3 la media de la distribucin muestral de medias
10.4 la desviacin estndar de la distribucin muestral de medias
11. Ciertos tubos fabricados por una compaa tienen una duracin media de
800 horas y una desviacin estndar de 60 horas. Halle la probabilidad de
que una muestra al azar de 16 tubos, tomada de ellos tenga una duracin
media de:
11.1 entre 790 y 810 horas
11.2 menor de 785 horas
14. De un total de 1 000 muestras de 200 nios cada una, en cuntas cabe
esperar que entre el 40 % y el 60 % sean nias?
15. Una urna contiene 80 bolas de las que 60 % son rojas y 40 % blancas. De
un total de 50 muestras de 20 bolas cada una, sacadas de la urna con
reemplazo, en cuntas cabe esperar 12 bolas rojas y 8 blancas?
16. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la
rotura de 4000 y 4500 libras con desviaciones estndar de 300 y 200 libras,
respectivamente. Si se comprueban 100 cables de A y 50 cables de B,
cul es la probabilidad de que la media de resistencia a la rotura de B sea
(a) al menos 600 libras ms que A, (b) al menos 450 libras ms que A?
18. Los resultados de una eleccin mostraron que un cierto candidato recibi el
65 % de los votos. Halle la probabilidad de que en dos muestras al azar
compuesto cada una de 200 votantes, haya una diferencia superior al 10 %
en las proporciones que votaron a dicho candidato.
Para recordar
En el uso de Distribuciones muestrales se debe tener en cuenta que las
n variables aleatorias independientes a estudiar deben ser continuas.
Para un proceso Normal se debe tener en cuenta la media promedio y
la desviacin estndar comn y finitas.
SEMANA
2
INTERVALOS DE CONFIANZA
TEMAS
Estimacin Puntual. Propiedades de un estimador. Estimacin de intervalos
de confianza
Intervalos de confianza para la media con varianza conocida, muestra
grande
Tamao muestral para estimar una media
Intervalo de confianza para la diferencia de medias de dos distribuciones
con ambas desviaciones estndar conocidas, muestras grandes
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
INTERVALO DE CONFIANZA
ESTIMACIN DE PARMETROS
TIPOS DE ESTIMACIN
a) Estimacin Puntual
LIC LCS
p [L E L + E ] = 1
LIC = L E
LSC = L + E
x Z tab , x + Z tab
n n
) conocida
Desviacin estndar poblacional (
E = Z tab * x
x =
n
Donde:
x : Error estndar de la media para una poblacin
n : tamao de muestra
Ztab : se obtiene a partir del nivel de confianza
) desconocida
Desviacin estndar poblacional (
( X Y ) ( x y )
Z=
x2 y2
+
n m
Luego:
x2 y
2
x2 y
2
p ( X Y ) Z o + 1 2 ( X Y ) + Z o + =1
n m n m
Se obtiene el intervalo aleatorio
x2 y
2
x2 y2
( X Y ) Z o + , (X Y ) + Zo +
n m n m
ACTIVIDADES
3. Para una poblacin con una varianza conocida de 185, una muestra de 64
individuos conduce al valor de 217 como estimacin de la media. Construya
una estimacin de intervalo que incluya a la media de la poblacin 68,3% de
las veces.
9. Una muestra de 150 bombillas del fabricante A dieron una vida media de
1400 horas y una desviacin estndar de 120 horas. Una muestra de 100
bombillas del fabricante B dieron una vida media de 1200 horas y una
desviacin estndar de 80 horas. Halle el intervalo de confianza al 99% para
la diferencia de las vidas medias de las poblaciones A y B.
Autoevaluacin
1. La panificadora Gabino est interesada en adquirir una camioneta usada.
Selecciona al azar 125 ofertas de venta y encuentra que el precio promedio
de una camioneta en esta muestra es de $3250. La empresa sabe que la
desviacin estndar de los precios de las camionetas usadas en la ciudad
es de $615. Construya una estimacin de intervalo para el precio promedio
13. Una compaa tiene 500 cables. Un ensayo con 40 cables elegidos al azar
dieron una media de resistencia a la rotura de 2400 libras y una desviacin
tpica de 150 libras. Con qu grado de confianza cabe decir que la media
de resistencia a la rotura de los 460 cables restantes sea 2400 35 libras?
14. En una granja de 1000 pollos se va a experimentar con una nueva dieta de
engorde. Si se sabe que la desviacin tpica del aumento de peso en un
periodo de un mes es igual a dos onzas. Qu tamao debe tomarse una
muestra que conduzca a una estimacin del aumento de peso de la
totalidad de la parvada, si se quiere que esta estimacin no contenga un
error mayor que 40 lb. (una 1b = 16 oz.) con probabilidad de 0.95?
16. De qu tamao debe ser la muestra para poder tener 95% de confianza en
que el error de estimacin es de 5 o menos. Suponga que la desviacin
estndar poblacional es de 25.
17. La revista Unidos por Siempre dio a conocer el costo promedio de una
boda, que es de s/. 19000 soles. Suponga que la desviacin estndar
poblacional es de s/. 9400 con una confiabilidad del 95%. Qu tamao
debe tener la muestra si el error de estimacin deseado es de s/. 1000
soles?
2000. Suponga que desea una estimacin por intervalo de 95% de nivel de
confianza para la media del sueldo anual inicial. De qu tamao debe
tomarse la muestra, si el error de estimacin deseado es de $ 200.
21. Determine el tamao mnimo de muestra que se debe tomar para estimar
al 85% de confianza el porcentaje de limeos que actualmente utiliza
Internet diariamente. El ao pasado se realiz una investigacin que indic
que el 18% de los limeos utilizaba Internet diariamente. Se desea que el
error al hacer la estimacin no sea mayor que 5%.
25. Una muestra al azar de 200 pilas de la marca A para calculadoras tiene
una vida media de 140 horas y una desviacin estndar de 10 horas. Una
muestra al azar de 120 pilas de la marca B para calculadoras tiene una
vida media de 125 horas y una desviacin estndar de 9 horas. Determine
el intervalo de confianza al 99% para la diferencia de medias de las dos
marcas de pilas para calculadoras
Para recordar
La precisin de una estimacin puntual puede evaluarse en la muestra,
por estimacin de un intervalo junto con una medida de la seguridad
que tal intervalo contenga la parmetro desconocido de la poblacin.
SEMANA
3
INTERVALO DE CONFIANZA
PARA MUESTRAS PEQUEAS
TEMAS
Intervalo de confianza para la media con varianza desconocida. Muestra
pequea.
Intervalo de confianza para la diferencia de medias con varianzas
desconocidas pero iguales. Muestras pequeas.
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
S S
x t tab , x + t tab
n n
p [L E L + E ] = 1
L: Estadstico correspondiente
E: Error estndar de estimacin
1 - : Nivel de confianza
: Parmetro por estimar
E = Ttab * x
S
x =
n
Donde:
S : desviacin estndar de la muestra
: Error estndar de la media para una poblacin
x
n m n+m2
Donde:
S c : es la desviacin estndar combinada de las dos muestras
(n 1) S x2 + (m 1) S y2
Sc =
n+m2
p [LIC 1 2 LSC ]= 1
Luego:
1 1 1 1
p ( X Y ) t o S c + 1 2 ( X Y ) + to S c + =1
n m n m
Se obtiene el intervalo aleatorio
1 1 1 1
( X Y ) t o S c + , ( X Y ) + to S c +
n m n m
ACTIVIDADES
280 295 289 294 308 320 350 300 310 285
302 305 398 397 300 365 380 395 399 360
6,0 7,0 1,2 6,6 6,9 6,7 7,2 7,0 7,0 6,3
5,8 6,7 6,0 7,3 6,6 6,4 7,3 7,2 6,0 6,8
Analista
164,4 165,2 169,2 168,2 167,3 168,2 169,5 167,2 168,1 169,3
01
Analista
163,2 165,3 167,2 168,9 169,9 165,4 167,3 162,3 163,2 165,2
02
TIPO 1 481 506 494 506 661 572 602 487 524 661
TIPO 2 526 511 556 542 491 498 537 582 605 605
8. Dos analistas tomaron lecturas repetidas en la dureza del agua de las napas
freticas a lo largo del valle del Rimac. Determine un intervalo de confianza
Analista A 0,46 0,62 0,37 0,45 0,38 0,37 0,44 0,48 0,53 0,47
Analista B 0,82 0,64 0,54 0,55 0,58 0,42 0,48 0,33 0,32 0,25
Autoevaluacin
1. Se pidi al personal de ventas de la Distribuidora Continental que
presentara informes semanales con los clientes llamados durante la
semana. En una muestra de 18 informes semanales se determin un
promedio de 22,4 llamadas a clientes por semana y una desviacin estndar
de 5 llamadas. Determine el intervalo de confianza al 95% para el nmero
promedio de llamadas semanales a clientes.
4,03 4,05 4,15 4,00 3,99 4,00 3,98 3,97 4,10 4,12
4,08 4,05 4,00 4,04 4,05 4,00 3,99 3,97 4,00 3,98
280 295 298 310 312 297 285 265 279 308 300 290
20,0 21,5 19,7 20,6 19,5 18,4 19,6 20,8 21,9 21,4 20,0 21,5
8,24 8,23 8,20 8,29 8,31 8,25 8,24 8,31 8,29 8,20
8,31 8,26 8,25 8,29 8,27 8,32 8,31 8,21 8,20 8,30
5,0 4,2 4,8 5,2 5,5 5,9 6,1 6,8 5,2 4,2 5,8 4,5
18 22 14 19 21 23 17 26 28 12 14 26
10. Las cajas de un cereal producidos por una fbrica deben tener un
contenido de 16 onzas. Un inspector tom una muestra que arroj los
siguientes pesos en onzas:
12. Una compaa productora de maz hbrido planta dos nuevas hileras de
maz hdrico en 10 granjas diferentes. Las producciones en bushel por acre
fueron las siguientes:
Hdrico I 90 85 94 78 86 85 92 95 95 82
Hdrico II 84 89 87 92 90 91 87 87 81 80
Determine el intervalo de confianza del 95% para la diferencia entre las dos
producciones medias de maz hbrido.
Para recordar
La precisin de una estimacin puntual puede evaluarse en la muestra
menor de 30, por estimacin de un intervalo aplicando la tabla de
distribucin tstudent.
Los datos tienen que ser de muestra, como la media muestral y la
desviacin estndar muestral.
SEMANA
4
INTERVALO DE CONFIANZA
PARA UNA PROPORCIN
TEMAS
Intervalo de confianza para una proporcin. Muestras grandes
Tamao muestral para estimar una proporcin
Tamao de muestra para poblaciones finitas
Intervalo de confianza para diferencia de proporciones
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
Nn
fc =
N 1
El tamao mnimo de muestra para una poblacin finita usa el factor de
correccin para la poblacin
p (1 p ) N n
E 2 = Ztab
2
( )( )
n N 1
n Z p(1 p )
2
= tab
)
N n E 2
( )
N 1
Luego:
p (1 p ) p (1 p ) p (1 p ) p (1 p 2)
p ( p1 p2 ) Zo 1 1
+ 2 2
(1 2 ) ( p1 p2 ) + Zo 1 1
+ 2
=1
n1 n2 n1 n2
( p p ) Z p (1 p ) p (1 p 2)
p1 (1 p1 ) p 2 (1 p 2 )
1 1
+ 2 , ( p1 p2 ) + Ztab +
1 2 tab
n1 n2 n1 n2
ACTIVIDADES
1. Una tienda de computacin, que compra al mayoreo chips sin probar para
computadoras, est considerando cambiar de proveedor por otro que se los
suministre probados y con una garanta a un precio ms alto. Con el fin de
saber si este es un plan costeable, determine la porcin de chips
defectuosos que le suministra su actual proveedor. Se prob una muestra
de 200 chips y de stos, 5% tena defectos.
a) Estime el error estndar de la porcin de chips defectuosos.
b) Construya un intervalo de confianza de 98% para la porcin de chips
defectuosos adquiridos.
3.1 Estime el error estndar de la porcin de personas que tuvo esta grave
interpretacin errnea sobre el postre.
3.2 Construya un intervalo de confianza de 96% para la porcin real de la
poblacin.
8 En una muestra al azar de 400 adultos y 600 adolescentes que vean cierto
programa de televisin, 100 adultos y 300 adolescentes dijeron que les
gustaba. Halle los lmites de confianza al 95% para la diferencia de
proporciones de todos los adultos y adolescentes que ven el programa y les
gusta.
Autoevaluacin
1. Durante un ao y medio las ventas han estado disminuyendo de manera
coherente en las 1500 sucursales de una cadena de comida rpida. Una
empresa de asesores ha determinado que 30% de una muestra de 95
sucursales tienen claros signos de una mala administracin. Construya un
intervalo de confianza de 98% para esta porcin.
13. En una muestra al azar de 600 mujeres, 300 indican que estn a favor
de la ayuda del estado a los colegios privados. En una muestra al azar de
400 hombres, 100 indican que estn a favor del mismo. Determine un
intervalo de confianza (a) del 95%, (b) 90% para la diferencia de
proporciones de todas las mujeres y todos los hombres que favorecen tal
ayuda.
Para recordar
El estimador puntual de la proporcin p en la distribucin binomial se
usa como estimador puntual del parmetro p.
SEMANA
5
HIPTESIS ESTADSTICA
TEMAS
Hiptesis estadstica. Tipos de errores I y II. Nivel de significacin. Regin
crtica o regin de rechazo. Regin de aceptacin
Prueba de Hiptesis para medias, muestras grandes. Prueba bilateral de
una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para diferencia de media. Desviacin estndar
conocidas, Muestras grandes
OBJETIVOS ESPECFICOS
ACTIVIDADES
HIPTESIS ESTADSTICA
DECISIONES ESTADSTICAS
Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe
disearse de forma que minimice los errores de decisin. Esto no es tan
sencillo como pueda parecer, puesto que para un tamao de muestra dado, un
intento de disminuir un tipo de error, va generalmente acompaado por un
incremento en el otro tipo de error. En la prctica, un tipo de error puede tener
ms importancia que el otro, y as se tiende a conseguir poner una limitacin al
error de mayor importancia. La nica forma de reducir al tiempo ambos tipos de
error es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
NIVEL DE SIGNIFICACIN
Crtica o de Rechazo es la regin que contiene los valores para los cuales se
rechaza la hiptesis bajo consideracin.
Regin de aceptacin es la regin que contiene a los valores para los cuales
no se rechaza la hiptesis bajo consideracin.
Caso I
1. Se formula la hiptesis nula y la hiptesis alternativa
H o : = o
H1 : < o
Donde o es el valor de la media poblacional.
2. Se escoge el nivel de significancia .
3. Una estadstica para la media de la poblacin es la media muestral x . Si la
poblacin es normal (o si la muestra es grande n 30 , aun cuando la
poblacin no es normal).
2
La distribucin de x es N ( , ).
n
x o
La variable aleatoria Z = tiene una distribucin normal estndar N
n
(0,1)
4. La regin critica (R.C.) es , Z , donde Z o es tal que P[Z < Z ] =
5. Se calcula x de los datos, luego se obtiene Z
x o
Z=
n
6. Se compara Z con Z.
Si Z < Z Z , Z , se rechaza la hiptesis nula Ho
Si Z > Z Z Z , + , se acepta la hiptesis nula Ho
0 Z 1
o Z / 2 , o + Z /2
n n
5. Se calcula x a partir de la muestra observada,(tambin S si no se conoce la
varianza 2 y la muestra n es grande)
6. Se compara Z con Z /2.
Si Z , Z / 2 0 Z + Z / 2 ,+ , se rechaza la hiptesis nula Ho
Si Z Z / 2 ,+ Z / 2 , se acepta la hiptesis nula Ho
Z / 2 0 Z / 2
Caso I:
1. Considrese la siguiente hiptesis:
Ho : x = y o Ho : x y = 0
H1 : x y H1 : x y 0
+
n m n m
P Z
xc =
x2 y
2
+
n m
x2 y2
Luego: + x c = Z 1
n m
5. Se calcula la diferencia de las medias muestrales ( x y ) y S x y si no se
conoce x , y . Para muestras grandes se utiliza S x y .
2 2
0 Z 1
Caso II:
1. Considrese la siguiente hiptesis:
Ho : x = y o Ho : x y = 0
H1 : x y H 1 : x y 0
2. Se escoge el nivel de significancia .
3. La estadstica para la diferencia de medias poblacionales ( x y ) es la
diferencia de medias muestrales ( x y ) . Si la poblacin tiene una
distribucin normal con desviaciones estndar conocidas x y y
conocidas (o si las muestras son grandes n 30 , , m 30 aun cuando la
poblacin no es normal).
La distribucin de ( x y ) es normal con media ( x y ) y varianza
x2 y2
( + ).
n m
( x y) ( x y )
Por tanto, la variable aleatoria Z=
x2 y2
+
n m
Tiene una distribucin normal estndar.
4. En el supuesto de que Ho es verdadero, es decir, que ( x y ) = 0 . La
[
regin crtica (R.C.) es , xc , tal que P ( x y ) x c = ]
( x y)
P =
xc
x +y x2 y
2 2 2
+
n m n m
P Z
xc =
x2 y
2
+
n m
x2 y2
Luego + x c = Z
n m
5. Se calcula la diferencia de las medias muestrales ( x y ) y S x y si no se
conoce x , y . Para muestras grandes se utiliza S x y .
2 2
Ho : x = y o Ho : x y = 0
H1 : x y H1 : x y 0
2. Se escoge el nivel de significancia .
3. La estadstica para la diferencia de medias poblacionales ( x y ) es la
diferencia de medias muestrales ( x y ) . Si la poblacin tiene una
distribucin normal con desviaciones estndar conocidas x y y
conocidas (o si las muestras son grandes n 30 , , m 30 aun cuando la
poblacin no es normal).
La distribucin de ( x y ) es normal con media ( x y ) y varianza
x2 y2
( + ).
n m
( x y) ( x y )
Por tanto, la variable aleatoria: Z=
x2 y2
+
n m
Tiene una distribucin normal estndar.
4. En el supuesto de que Ho es verdadero, es decir que ( x y ) = 0 . La
[
regin de aceptacin (R.A.) es a, b , tal que P a ( x y ) b = 1 ]
( x y)
P = 1
a b
x +y x2 y x2 y
2 2 2 2
+ +
n m n m n m
P = 1
a b
Z
x +y x2 y
2 2 2
+
n m n m
x2 y2
Luego, a = Z / 2 +
n m
x2 y2
b = +Z / 2
+
n m
5. Calclese la diferencia de las medias muestrales ( x y ) . Tambin S x2 , S y2 si
no se conoce x , y y las muestras son grandes.
2 2
Z / 2 0 Z / 2
ACTIVIDADES
Autoevaluacin
1. La comisin promedio que cargan las compaas de corretaje de tiempo
completo en una venta de valores comunes es de $144 con una desviacin
estndar de $52. Se tom una muestra aleatoria de 121 compras y se
determin que haban pagado una comisin promedio de $151. A un nivel
de significancia de 0,10, puede concluirse que las comisiones son mayores
que el promedio de la industria?
11. En Julio del 2007, el Ministerio de Trabajo consider una propuesta para
exigir a las compaas que informaran del efecto potencial de la existencia
de opciones para los empleados sobre las ganancias por accin (GPA). Una
muestra de 41 empresas de alta tecnologa revel que la nueva propuesta
reducira las GPA en un monto del 13,8 con una desviacin estndar de
18,9%. Otra muestra aleatoria de 35 productores de bienes de consumo
mostr que la propuesta reducira las GPA en 9,1% en promedio, con una
desviacin estndar del 8.7%. Con base en estas muestras, Es razonable
llegar a la conclusin (a un nivel = 0,01) de que la propuesta del Ministerio
de Trabajo ocasionar una mayor reduccin en las GPA para las empresas
de alta tecnologa o para los productores de bienes de consumo?
Para recordar
Para una prueba de hiptesis se debe formular adecuadamente la
hiptesis nula con un nivel de significancia de acuerdo con la realidad
del proceso.
SEMANA
6
HIPTESIS ESTADSTICA
MUESTRAS PEQUEAS
TEMAS
Prueba de Hiptesis para medias. Muestras pequeas
Prueba bilateral de una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para diferencia de media
Desviacin estndar desconocidas. Muestras pequeas
OBJETIVOS ESPECFICOS
ACTIVIDADES
Caso I
1. Se formula la hiptesis nula y la hiptesis alternativa
H o : = o
H1 : < o
Donde o es el valor de la media poblacional.
2. Se escoge el nivel de significancia .
3. Una estadstica de prueba es x , para muestras pequeas se usa la variable
aleatoria.
x o
t=
S
n
Tiene una distribucin t con (n-1) grados de libertad.
[ ]
4. La regin critica (R.C.) es , xc , donde x c es tal que P x < x c =
x xc
p o
=
s s
n n
xc
p T =
s
n
p [T t c ] =
5. Se calcula x de los datos, luego se obtiene t
x o
t =
s
n
6. Se compara t con t
xc
p t =
s
n
p [t t c ]=
x o
t1 =
s
n
6. Se compara t con t1
Si t > t1 t t1 , + , se rechaza la hiptesis nula Ho
Si t < t1 t ,t1 , se acepta la hiptesis nula Ho
0 Z 1
a x b o
p o
= 1
s s s
n n n
Luego, la regin de aceptacin:
s s
o t / 2 , o + t / 2
n n
7. Se calcula x a partir de la muestra observada,(tambin S si no se conoce la
varianza 2 y la muestra n es grande).
t / 2 0 + t / 2
Caso I:
1. Considrese la siguiente hiptesis:
Ho : x = y o Ho : x y = 0
H1 : x y H1 : x y 0
2. En el supuesto de que Ho es verdadero, es decir, que ( x y ) = 0 . Se
calcula t1 , de tal manera que P[t t1 ] = 1 . La regin crtica (R.C.) es
t1 ,+ ,
0 t1
Caso II:
1. Considrese la siguiente hiptesis:
Ho : x = y o Ho : x y = 0
H1 : x y H 1 : x y 0
2. En el supuesto de que Ho es verdadero, es decir que ( x y ) = 0 . Se
calcula t1 , de tal manera que P[t t ] = . La regin crtica (R.C.) es
, t ,
Prueba Bilateral
1. Considrese la siguiente hiptesis:
Ho : x = y o Ho : x y = 0
H1 : x y H1 : x y 0
2. En el supuesto de que Ho es verdadero, es decir que ( x y ) = 0 . Se
calcula t / 2 y + t / 2 , de tal manera que P [ t / 2 t t / 2 ] = 1 . La regin
crtica (R.C.) es ,t / 2 U +t / 2 ,+
t / 2 0 + t / 2
ACTIVIDADES
.
1. Una mquina produce ejes que. segn las especificaciones, deben tener
100 mm de dimetro. Para mantener la calidad requerida, todos los das se
examina una muestra de 16 ejes para determinar si es necesario detener la
produccin y reajustar la mquina. Un da determinado, la muestra da los
siguientes resultados:
4. En el taller mecnico de Jerry utilizan una sierra a motor para cortar el tubo
de metal que se utiliza en la manufactura de dispositivos de medicin de
presin. La longitud de los segmentos de tubo est distribuida normalmente.
Se cortaron 25 piezas de tubo con la sierra calibrada para cortar secciones
de 5,00 pulgadas de longitud. Cuando se midieron estas piezas, se encontr
que su longitud media era de 4,7 pulgadas y con una desviacin estndar
de 0,06 pulgadas. Utilice valores probables para determinar si la mquina
debe ser recalibrada, debido a que la longitud media es significativamente
diferente a 5,00 pulgadas.
Ing.
Ambient 2,86 2,77 3,18 2,80 3,14 2,87 3,19 3,24 2,91 3,00 2,83
al
Ing.
Industri 3,35 3,32 3,36 3,63 3,41 3,37 3,45 3,43 3,44 3,17 3,26
al
Estos datos indican que existe una base fundada para los rumores?
Establezca y pruebe hiptesis apropiadas a un nivel =0,02.
Antes 14 15 18 18 30 10 8 26 13 29 24
Despus 23 14 13 29 33 11 12 25 21 26 24
Archivo 1 2 3 4 5 6 7
UIltima 14,4 Haynes 9,52 10,17 10,33 10,02 10,72 9,62 9,17
PerFAXtion 14,4 Extel 10,92 11,46 11,18 12,21 10,42 11,36 10,47
Autoevaluacin
1. Un documental de televisin acerca de la alimentacin excesiva afirmaba
que los estadounidenses tienen un sobrepeso aproximado de 10 lb en
promedio. Para probar esta afirmacin, se examin a 18 individuos elegidos
aleatoriamente, y se encontr que su sobrepeso promedio era de 12,4 lb,
con una desviacin estndar de muestra de 2,7 lb. A un nivel de
significancia de 0,01; hay alguna razn para dudar de la validez del valor
afirmado de 10 lb?
Ejecutivos de cuenta 13 10 11 12 13 12 10 12 - -
Empresa 1 2 3 4 5 6 7 8 9
2002 1,38 1,26 3,64 3,50 2,47 3,21 1,05 1,98 2,72
2003 2,45 1,50 4,59 3,06 2,11 2,80 1,59 0,92 0,47
Comerciante 1 2 3 4 5 6 7 8 9
Precio Apple $350 419 385 360 405 395 389 409 375
Precio Akita $370 425 369 375 389 385 395 425 400
Para recordar
Para una prueba de hiptesis se deber tener en cuenta en los datos,
que tienen que ser de muestra, como la media muestral y la desviacin
estndar muestral.
SEMANA
8
PRUEBA DE HIPTESIS
PARA LAS PROPORCIONES
TEMAS
OBJETIVOS ESPECFICOS
.
CONTENIDOS
Prueba de Hiptesis para las proporciones, muestras grandes
Prueba bilateral de una hiptesis sobre las proporciones
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para la diferencia entre dos proporciones
.
ACTIVIDADES
Caso I
1. Se formula la hiptesis nula y la hiptesis alternativa
Ho : = o
H1 : < o
2. Se escoge el nivel de significancia .
3. Una estadstica de prueba es una variable aleatoria binomial X que tiene una
distribucin binomial, cuando n es pequeo se utiliza esta distribucin.
p o
Z=
o (1 o )
n
6. Se compara Z con Z
Si Z < Z. Z , Z , se rechaza la hiptesis nula Ho
Si Z > Z. Z Z , + , se acepta la hiptesis nula Ho
Caso II
1. Se formula la hiptesis nula y la hiptesis alternativa
Ho : = o
H 1 : o
2. Se escoge el nivel de significancia
3. Una estadstica de prueba es una variable aleatoria binomial X que tiene
una distribucin binomial, cuando n es pequeo se utiliza esta distribucin.
4. La regin critica (R.C.) es Z + , donde Z o es tal que P[Z > Z 1 ] =
5. Se calcula x de la muestra de tamao n, luego se obtiene Z
x np o
Z=
np o (1 p o )
p o
Z=
o (1 o )
n
6. Se compara Z con Zo
Si Z > Z 1- Z Z 1 + , se rechaza la hiptesis nula Ho
Si Z < Z 1- Z , Z 1 , se acepta la hiptesis nula Ho
0 Z 1
o (1 o ) o (1 o )
o Z / 2 , o + Z /2
n n
5. Se calcula x de la muestra de tamao n; luego, se obtiene Z
x np o
Z=
np o (1 p o )
p o
Z=
o (1 o )
n
5. Se compara Z con Z /2
Si Z , Z / 2 0 Z + Z / 2 ,+ , se rechaza la hiptesis nula Ho
Si Z Z / 2 ,+ Z / 2 , se acepta la hiptesis nula Ho
Z / 2 0 Z / 2
( p1 p 2 )
Z=
1 (1 1 ) 2 (1 2 )
+
n1 n2
( p1 p 2 )
Z=
1 1
1 (1 1 )(
+ )
n1 n 2
Es el valor de la normal estndar cuando Ho es verdadera, siendo n1 y n2
grandes.
Para calcular Z se debe hallar el valor de a partir de su estimador p
x + x2
p = 1
n1 + n 2
Luego, el valor de verdad de la estadstica Z es:
( p1 p 2 )
Z=
1 1
+ )p (1 p )(
n1 n2
Desviaciones Estndar Conocidas, Muestras Grandes
Prueba Unilateral
Caso I:
1. Considrese la siguiente hiptesis:
H o : 1 = 2 o H o : 1 2 = 0
H 1 : 1 2 H 1 : 1 2 0
2. Se escoge el nivel de significancia
3. La estadstica de prueba es la variable aleatoria ( p 1 p 2 ) que tiene una
distribucin aproximadamente normal cuando n1 y n2 grandes. Es decir, la
variable aleatoria:
( p1 p 2 )
Z=
1 (1 1 ) 2 (1 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
0 Z 1
Caso II:
1. Considrese la siguiente hiptesis:
H o : 1 = 2 o H o : 1 2 = 0
H 1 : 1 2 H 1 : 1 2 0
2. Se escoge el nivel de significancia .
3. La estadstica de prueba es la variable aleatoria ( p 1 p 2 ) que tiene una
distribucin
aproximadamente normal cuando n1 y n2 grandes. Es decir, la variable
aleatoria:
( p1 p 2 )
Z=
1 (1 1 ) 2 (1 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
3. La regin crtica (R.C.) es Z Z , para la hiptesis alternativa H 1 : 1 2
x x x + x2
4. Se calcula p 1 = 1 y p 2 = 2 , luego p = 1
n1 n2 n1 + n 2
( p1 p 2 )
Luego, se halla: z =
1 1
p (1 p )( + )
n1 n 2
5. Conclusin: si z se encuentra en la regin crtica , Z , se rechaza Ho,
en caso contrario se acepta.
Prueba Bilateral
1. Considrese la siguiente hiptesis:
H o : 1 = 2 o H o : 1 2 = 0
H1 : 1 2 H1 : 1 2 0
2. Se escoge el nivel de significancia
3. La estadstica de prueba es la variable aleatoria ( p 1 p 2 ) que tiene una
distribucin aproximadamente normal cuando n1 y n2 grandes. Es decir, la
variable aleatoria:
( p1 p 2 )
Z=
1 (1 1 ) 2 (1 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
Z / 2 0 Z / 2
ACTIVIDADES
2. El director de cierto colegio muy famoso cree que, en parte debido al estatus
econmico de los padres, el porcentaje de los que han terminado
secundaria que asisten a este colegio es mayor que el promedio de la
ciudad. En el perodo de los cinco aos precedentes, el 20% de todos los
que terminaron secundaria de la ciudad entraron a la Universidad, mientras
que en el mismo perodo, 350 de los 1500 exalumnos de su colegio entraron
a la Universidad. Se justifica que el director diga que el porcentaje de sus
exalumnos que entraron a la Universidad es significativamente mayor que
20%? Pruebe con el nivel de significacin del 1%.
6. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
habitantes adultos de la ciudad de Lima estn a favor de cierto proyecto
econmico del gobierno. En una muestra aleatoria de 625 adultos se
observ que 540 estn a favor del proyecto. Si usted desea rechazar la
hiptesis verdadera no ms de una en vez de 100. Concluira que la
popularidad del proyecto ha sido exagerada por la autoridad?
8. Una planta de energa elctrica operada con carbn est considerando dos
sistemas diferentes para abatir la contaminacin del aire. El primer sistema
ha reducido la emisin de contaminantes a niveles aceptables 68% del
tiempo segn se determin de 200 muestras de aire. El segundo sistema,
que es ms caro, ha reducido la emisin de contaminantes a niveles
aceptables 76% de las veces, segn qued determinado de 250 muestras
de aire. Si el sistema caro es significativamente ms eficiente en la
reduccin de contaminantes a niveles aceptables que el otro sistema,
entonces el administrador de la planta deber instalar el sistema caro. Cul
sistema ser instalado si la administracin utiliza un nivel de significancia de
0,02 al tomar la decisin?
10. Una muestra aleatoria de 100 hombres fue tomada de la ciudad de Lima y
se encontr que 60 se mostraron a favor sobre una ley del divorcio. Una
muestra al azar de 100 mujeres escogidas de la misma ciudad revel que
40 de ellas estn a favor de dicha ley. Es igual la proporcin de hombres
que de mujeres que favorecen una nueva ley sobre el divorcio? Use un nivel
de significancia de 0,05.
Autoevaluacin
1. De un total de 10200 prstamos otorgados por una cooperativa de crdito
en los ltimos cinco aos, 350 se muestrearon para determinar qu porcin
de prstamos se otorgaron a mujeres. Esta muestra indic que 39% de los
crditos fueron dados a empleadas. Un censo completo de prstamos de
hace cinco aos mostraba que el 41% de los prestatarios eran mujeres. A
un nivel de significancia de 0,02, puede concluir que la porcin de
prstamos otorgados a mujeres ha cambiado significativamente en los
ltimos cinco aos?
3. Algunos tericos financieros cree que los precios diarios del mercado de
valores constituyen un paseo azaroso con rumbo positivo. Si esto es
exacto, entonces el promedio industrial Dow Jones debera mostrar una
ganancia en ms de 50% de todos los das de actividad financiera. Si el
promedio se increment en 101 de 175 das escogidos aleatoriamente,
Qu piensa de la teora sugerida? Use un nivel de significancia de 0,01.
10. Una corredora de bolsa afirma que ella puede predecir, con 85% de certeza,
el ascenso o cada, durante el mes siguiente, de un valor del mercado de
valores. Para probarlo, predice el resultado de 60 valores y acierta en 45 de
sus predicciones. Presentan estos datos evidencia concluyente (con =
0,04) de que la exactitud de sus predicciones es significativamente menor
que el declarado 85%?
12. Se estima que alrededor del 52% de hogares limeos son suscriptores de la
televisin por cable. Los editores de la revista Cable y ms estaban
seguros de que sus lectores tenan suscripcin por cable en un promedio
ms alto que la poblacin en general y queran usar este hecho para
ayudar a vender este espacio de publicidad para los canales de estreno por
cable. Para verificar este parecer, muestrearon a 250 suscriptores de la
revista y encontraron que 146 de ellos tenan suscripcin a televisin por
cable. A un nivel de significancia de 2%. los datos de la encuesta apoyan
el parecer de los editores?
Para recordar
En una prueba de hiptesis de proporciones, se debe tener en claro el
anlisis porcentual del problema.
SEMANA
9
PRUEBA DE BONDAD DE AJUSTE
TEMAS
OBJETIVOS ESPECFICOS
.
CONTENIDOS
Definicin del x
Ensayos de significacin
Prueba de bondad de ajuste. Tablas de contingencia
Correlacin de la continuidad. Coeficientes de contingencias
Prueba de Kolmogorov-Smirnov
ACTIVIDADES
Suceso E1 E2 Es ... Ek
Frecuencia
observada O1 O2 Os ... Ok
Frecuencia
esperada e1 e2 es ... ek
(O1 e1 )
2
(O2 e 2 )
2
(Ok ek )2 K (O ej )
2
= + + ... + =
2 j
e1 e2 ek j =1 ej
= n
2 j
j =1 ej
Si 2 = 0 las frecuencias observadas y tericas concuerdan exactamente;
mientras que si 2 > 0 , no coinciden exactamente. A valores mayores de 2 ,
mayores son las discrepancias entre las frecuencias observadas y esperadas.
La distribucin muestral de 2 se aproxima muy estrechamente a la distribucin
Chi cuadrado
1 1
( 2 ) 2
Y = Yo ( ) 2 2
e 2
1
2
( 2 )
Y = Yo ( ) e 2
ENSAYOS DE SIGNIFICACIN
En la prctica, las frecuencias esperadas se calculan de acuerdo con una
hiptesis Ho. Si bajo esta hiptesis el valor calculado de 2 dado por
K (O ej )
2 K (O ) 2
j =1 ej j =1 ej
como 02,.95 o 02,.99 que son los valores crticos a los niveles de significacin de
0,05 y 0,01 respectivamente), se deduce que las frecuencias observadas
difieren significativamente de las esperadas y se rechaza Ho al nivel de
significacin correspondiente. En caso contrario, se aceptar o al menos no se
rechazar. Este procedimiento se llama ensayo o prueba de chi cuadrado
de la hiptesis.
Debe advertirse que en aquellas circunstancias en que 2 est muy prximo a
cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias
observadas concuerden demasiado bien con las esperadas. Para examinar
tales situaciones, se puede determinar si el valor calculado de 2 es menor que
02, 05 o 02,01 en cuyos casos se decide que la concordancia es bastante buena
a los niveles de significacin de 0,05 a 0,01 respectivamente. .
j =1 ej
5. Regla de rechazo:
Rechazar Ho si 2 > 2
en donde a es el nivel de significancia para la prueba, y los grados de
libertad son (k 1)
TABLAS DE CONTINGENCIA
Las tablas de clasificacin doble o tablas h x k, en las que las frecuencias
observadas ocupan h filas y k columnas. Tales tablas se llaman a menudo
tablas de contingencia.
Suceso E1 E2 Es ... Ek
Frecuencia
observada O1 O2 Os ... Ok
Frecuencia
esperada e1 e2 es ... ek
K (O ej )
2
=2 j
ej j =1
Las frecuencias esperadas son halladas bajo una determinada hiptesis Ho.
Una hiptesis normalmente supuesta es la de que las dos clasificaciones son
independientes entre s.
Tablas 2 x 2
n(a1b2 a 2 b1 ) 2
2 =
n1 n2 na nb
I II Totales
A a1 a2 na
B b1 b2 nb
Totales n1 n2 n
Tablas 2 x 3
I II III Totales
A a1 a2 a3 na
B b1 b2 b3 nb
Totales n1 n2 n3 n
COEFICIENTE DE CONTINGENCIA
CORRELACIN DE ATRIBUTOS
LA PRUEBA DE KOLMOGOROV-SMIRNOV
La prueba de Kolmogorov-Smirnov, bautizada as en honor de los estadsticos
A. N. Kolmogorov y N. V. Smirnov quienes la desarrollaron, se trata de un
mtodo no paramtrico sencillo para probar si existe una diferencia significativa
entre una distribucin de frecuencia observada y otra de frecuencia terica. La
prueba K-S es, por consiguiente, otra medida de la bondad de ajuste de una
distribucin de frecuencia terica, como lo es la prueba Chi cuadrada. Sin
embargo, la prueba K-S tiene varias ventajas sobre la prueba 2 : es una
prueba ms poderosa, y es ms fcil de utilizar, puesto que no requiere que los
datos se agrupen de alguna manera.
La estadstica K-S, Dn, es particularmente til para juzgar qu tan cerca est la
distribucin de frecuencia observada de la distribucin de frecuencia esperada,
Ho: Una distribucin de Poisson con = 8,5 es una buena descripcin del
patrn de uso.
H1: Una distribucin de Poisson con = 8,5 no es una buena descripcin del
patrn de uso.
= 0,01 nivel de significancia para probar estas hiptesis
Una prueba K-S siempre debe ser una prueba de un extremo. Los valores
crticos para Dn se han tabulado y pueden encontrarse en la tabla de Valores
crticos de bondad de ajuste de Kolmogorov-Smirnov. Se busca en la fila de n =
3,754 (el tamao de muestra) y la columna para un nivel de significancia de
0,01, se encontrar que el valor crtico de Dn debe calcularse usando la
frmula:
1,63
Dn =
n
1,63
Dn = = 0,0266
3754
El siguiente paso es comparar el valor calculado de Dn con el valor crtico de Dn
que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia
Frecuencia Frecuencia
Frecuencia
Nmero Frecuencia Acumulativa Acumulativa Desviacin
Acumulativa
ocupado observada Observada Observada absoluta
Observada
relativa esperada
O O O 0,0000 0,0002 0,0002
1 5 5 0,0013 0,0019 0,0006
2 14 19 0,0051 0,0093 0,0042
3 24 43 0,0115 0,0301 0,0186
4 57 100 0,0266 0,0744 0,0478
5 111 211 0,0562 0,1496 0,0934
6 197 408 0,1087 0,2562 0,1475
7 278 686 0,1827 0,3856 0,2029
8 378 1,064 0,2834 0,5231 0,2397
9 418 1,482 0,3948 0,6530 0,2582
10 461 1,943 0,5176 0,7634 0,2458
11 433 2,376 0,6329 0,8487 0,2158
12 413 2,789 0,74*9 0,9091 0,1662
13 358 3,147 0,8383 0,9486 0,1103
14 219 3,366 0,8966 0,9726 0,0760
15 145 3,511 0,9353 0,9862 0,0509
16 109 3,620 0,9643 0,9934 0,0291
17 57 3,677 0,9795 0,9970 0,0175
18 43 3,720 0,9909 0,9987 0,0078
19 16 3,736 0,9952 0,9995 0,0043
20 7 3,743 0,9971 0,9998 0,0027
21 8 3,751 0,9992 0,9999 0,0007
22 3 3,754 1,0000 1,0000 0,0000
ACTIVIDADES
Use = 0,05 para determinar si estos datos respaldan los que public la
empresa.
Industria
Licenciado en Petrleo Qumica Elctrica Computacin
Administracin 30 15 15 40
Ingeniera 30 30 20 20
Tipo de actitud
Tipos de revista Cantidad de anuncios Cantidad de anuncios
con actitudes de culpa con actitudes de
miedo
Noticias y opinin 20 10
Editorial general 15 11
Orientada hacia la 30 19
familia
Comercial o financiera 22 17
Orientada hacia la mujer 16 14
Afroamericana 12 15
Sexo
Ms difcil comprar regalo para Hombres Mujeres
Consorte 37 25
Padres 28 31
Hijos 7 19
Hermanos 8 3
Parientes polticos 4 10
Otros parientes 16 12
Resultados de la prueba
51-60 61-70 71-80 81-90 91-100
Frecuencia
30 100 440 500 130
observada
Frecuencia
40 170 500 390 100
esperada
Autoevaluacin
1. A continuacin, se observa una tabla de contingencias de 3 x 3, con
frecuencias observadas en una muestra de 240. Pruebe la independencia
entre las variables de rengln y de columna usando la prueba x2 con =
0,05.
Variable de columna
Variable de rengln A B C
P 20 30 20
Q 30 60 25
R 10 15 30
2. Una de las preguntas de una encuesta fue la siguiente: Durante los ltimos
12 meses, en viajes de negocios, qu tipo de boleto de avin compr con
ms frecuencia? Las repuestas obtenidas se ven en la siguiente tabla de
contingencias:
Usando = 0,05 pruebe la independencia del tipo de vuelo y tipo de boleto.
Cul es su conclusin?
Tipo de vuelo
Producto
Vendedor A B C
Abanto 14 12 4
Marini 21 16 8
Noel 15 5 10
6. Halley Torres y Aarn Delguiudice son crticos de cine que, con frecuencia,
difieren acerca de las mejores pelculas. En un artculo de una revista
especializada, se mencionan los resultados de 160 pelculas por parte de
ambos crticos. Cada resultado puede ser Buena, Regular o Mala.
Calificacin de Delguiudece
Calificacin de Torres Mala Regular Buena
Mala 24 8 13
Regular 8 13 11
Buena 10 9 64
Cantidad de llamadas
que entran durante Frecuencia observada
un intervalo de un minuto
0 15
1 31
2 20
3 15
4 13
5 4
6 2
Total 100
18 20 22 27 22
25 22 27 25 24
26 23 20 24 26
27 25 19 21 25
26 25 31 29 25
25 28 26 28 24
Cantidad de
Da pasajeros
Lunes 13
Martes 16
Mircoles 28
Jueves 17
Viernes 16
13. Los resultados de una Encuesta Anual de satisfaccin de trabajo indic que
el 28% de los gerentes de sistemas de informacin est muy satisfecho con
su trabajo, el 46% medianamente satisfecho, el 12% no est satisfecho ni
insatisfecho, el 10% est medianamente insatisfecho y el 4% est muy
insatisfecho. Suponga que en una muestra de 500 programadores
obtuvieron los siguientes resultados.
Categora Cantidad
Muy satisfechos 105
Medianamente satisfechos 235
Ni satisfechos ni insatisfechos 55
Medianamente insatisfechos 90
Muy insatisfechos 15
Regin
Clase de empleo Edicin oriental Edicin occidental
Tiempo completo 1105 31
Tiempo parcial 31 15
Independiente / consultor 229 186
Sin empleo 485 344
Nmero de 6o
0 1 2 3 4 5
llegadas por da ms
Nmero de das 6 18 30 24 11 2 9
Ingresos en miles
25-30 31-36 37-42 43-48 49-54 55-60 61-66
Frecuencia
9 22 25 30 21 12 6
observada
Frecuencia
6 17 32 35 18 13 4
esperada
Para recordar
Se deben plantear en forma adecuada la hiptesis nula para una mejor
aplicacin de la prueba de bondad de ajuste.
SEMANA
10
REGRESIN LINEAL SIMPLE
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
n xy x y Sx y
b= b=
n x 2 ( x )
2
S x2
Sx y
( y - y) = ( x x)
S x2
Coeficiente de correlacin r:
n x y x y Sx y
r= r=
n x 2 ( x ) n y 2 ( y ) Sx S y
2 2
SC ( y ) b2 .SC ( x)
S xy = n2
( x ) 2
( y ) 2
SC(x) = x2
n
SC(y) = y2
n
SP(xy) = xy
( x )( y ) b=
SP(xy)
n SC(x)
b 2 .SC(x)
a = y bx r =
2
SC(y)
ACTIVIDADES
Cigeas 27 38 13 24 6 19 15
Bebes 35 46 19 32 15 31 20
Tamao del 7,8 6,9 6,7 6,0 6,9 5,2 6,3 8,4 7,2 10,1 10,8 7,7
aumento
Nmero de 64 73 42 49 71 46 32 88 53 84 85 93
ventas
4.1 Desarrolle una ecuacin de estimacin que mejor describa estos datos.
4.2 Calcule el error estndar de la estimacin de esta relacin.
Ao 1 2 3 4 5 6 7 8 9 10
Extraccin 0,25 0,28 0,38 0,45 0,68 0,78 1,20 1,80 2,15 2,98
Embarque 1 2 3 4 5 6 7 8 9 10
Volumen Exp. 82 102 125 132 147 161
865 915 950 980
5 0 0 5 0 5
Precio
12,00 12,50 13,80 15,40 17,50 18,00 20,00
($)
# Pg. 175 240 280 320 380 420 500
Semana 2 3 4 5 6 7
Tiempo de
10 15 16 18 26 30
propaganda
Venta del producto
3000 3320 - 3850 4000 4200
($)
10. Una empresa que fabrica Plantas de zapatillas quiere estudiar la relacin
entre las edades (en aos) de un tipo de mquinas compradas para la
Aos 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0
No de 453 564 624 679 964 985
-- -- --
Artculos 4 5 8 4 2 5
Autoevaluacin
1. Suponga que usted tiene a su cargo el dinero de la municipalidad de San
Marcos (Ancash). Se le dan los siguientes datos de antecedentes sobre el
suministro de dinero y el producto nacional bruto (ambos en millones de
soles):
Suministro de
2,0 2,5 3,2 3,6 3,3 4,0 4,2 4,6 4,8 5,0
dinero
Producto Nacional
5,0 5,5 6,0 7,0 7,2 7,7 8,4 9,0 9,7 10,0
Bruto
Altura del oponente (H) pies 6,0 5,5 5.2 5.1 5,0
Lanzamientos no regresados(L) 12 9 7 7 3
nmero de veces de
interrupcin al 5 10 10 15 15 20 20 25
trabajador
Calificacin del trabajador
en la prueba de 58 41 45 27 26 12 16 3
hostilidad-9
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38
Nmero del 1 2 3 4 5 6 7 8 9 10
vendedor
Calificacin (T) 2,6 3,7 2,4 4,5 2,6 5,0 2,8 3,0 4,0 3,4
Unidades 95 140 85 180 100 195 115 136 175 150
vendidas (S)
X (juegos de ftbol) 20 30 10 12 15 25 34
Y (accidentes menores) 6 9 4 5 7 8 9
Gastos generales 191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40
Tamao (KB) 200 269 300 358 450 490 500 550
Tiempo (seg.) 10,9 12,1 14,4 17,8 18,9 19,5 21,8 24,9
Para recordar
Se deben identificar adecuadamente la variable independiente y la variable
dependiente.
SEMANA
11
REGRESIN NO LINEAL
TEMAS
Anlisis de Regresin no lineal: Cuadrtica
Anlisis de Regresin no lineal: Potencial
Anlisis de Regresin no lineal: Exponencial
Anlisis de Regresin no lineal Logartmica
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
Regresiones no lineales
En un anlisis de regresin cuando los valores de la variable independiente (X)
y la variable dependiente (Y) no se ajustan a una lnea de regresin, se podr
conseguir una relacin lineal mediante una transformacin de estos valores.
Regresin Potencial
y = Ax B ln y = ln(A) + B.ln(x)
Regresin Exponencial y = Ae Bx ln y = ln(A) + Bx
Regresin Hiperblica y = 1 /( A + Bx) 1/y = A + Bx
y = A + Bx + Cx
2
Regresin Cuadrtica
ACTIVIDADES
X 2 3 5 7 9 11 13 16 21
Y 1 2 5 16 28 38 50 72 90
Aos 1 2 3 4 5 6
10,50
Precio ($) 8,200 6,500 ----- 4,500 3,800
0
Tiempo (Horas) 3 4 5 6 7 8
Volumen (u3) 250 350 700 870 1080 1600
Presin
3 4 5 6 7 8
(Kg./cm.2)
Volumen (cm3) 50 60 70 85 98 110
Uso semanal 13 10 20 28 32 17 24 31 40 38
(horas)
Gastos 17,0 22,0 30,0 37,0 47,0 30,5 32,5 39,0 51,5 40,0
anuales de
mantenimie
nto
10. Los datos siguientes muestran las ventas (en millones) de cajas y los
gastos de publicidad (en miles de soles) para siete marcas de gaseosas.
Autoevaluacin
3. A continuacin, observamos datos sobre el porcentaje de vuelos que llegan
puntuales y la cantidad de quejas por 100 00 pasajeros.
Porcentaje
Aerolnea Quejas
puntual
WAYRA PER 81,8 0,21
L C BUSRE 76,6 0,58
TACA 76,6 0,85
AERO
75,7 0,68
CONDOR
ATSA 73,8 0,74
IBERIA 72,2 0,93
LAN PER 71,2 0,72
STAR PER 70,8 1,22
AERO MXICO 68,5 1,25
4.1 Trace el diagrama de dispersin para estos datos, con las tarifas de
negocios como variable independiente.
Vendedor 1 2 3 4 5 6 7 8 9 10
Aos de
1 3 4 4 6 8 10 10 11 13
Experiencia
Ventas anuales (S/.
80 97 92 102 103 111 119 123 117 136
miles)
6.1 Trace el diagrama de dispersin para estos datos, con los aos de
experiencia como la variable independiente.
6.2 Forme una adecuada ecuacin de regresin con la que se puedan
predecir las ventas anuales, dados los aos de experiencia.
6.3 Use la ecuacin estimada de regresin para predecir las ventas anuales
de un vendedor con 9 aos de experiencia.
Clase
75 82 85 87 88 91 92 93 105
de llanta
Capacidad 1 1 1 1 1 1 1 2
853
de carga 047 135 201 235 356 389 433 039
7.1 Trace un diagrama de dispersin para estos datos, con la clase de llanta
como variable independiente.
7.2 Desarrolle una ecuacin de regresin que mejor se aproxime a la
realidad de los datos observados.
7.3 Estime la capacidad de carga para una llanta cuya clase es 90.
8 Los datos siguientes muestran los ingresos de los casinos y de sus hoteles,
en miles de soles.
8.1 Trace un diagrama de dispersin para estos datos, con los ingresos en
el hotel como variable independiente.
8.2 Desarrolle una ecuacin de regresin que mejor se aproxime a la realidad
de los datos observados.
8.3 Suponga que los ingresos del hotel fueron de s/. 500 millones. Cul es un
estimado de los ingresos del casino?
8.4 Qu tan confiable es dicha ecuacin? Justifique estadsticamente su
respuesta.
Empresa Xi Yi
Wong 72 61
Mc Donalds 47 16
Hiraoka 51 32
Ebel 57 46
Aceros Arequipa 55 36
10 En el pas, las autoridades del gobierno consideran que para que las
deducciones totales sean razonables, es necesario considerar el ingreso
bruto del causante. Las grandes deducciones, que comprenden los pagos a
instituciones de beneficencia y por gastos mdicos, son ms razonables
para causantes con grandes ingresos brutos ajustados. Si un causante pide
deducciones mayores que el promedio para determinado nivel de ingresos,
aumentan las posibilidades de una auditora fiscal. A continuacin vemos
datos sobre el impuesto bruto ajustado y el promedio o cantidad razonable
de deducciones agrupadas. Los datos estn en miles de dlares.
Ingresos Deducciones
brutos ajustadas totales (s/.
ajustados miles)
22 9,6
27 9,6
32 10,1
48 11,1
66 13,5
85 17,7
120 25,5
11 En los siguientes datos, se ven las tasas de ocupacin (%) y las tarifas por
noche ($) en las regiones hoteleras ms importantes de Estados Unidos.
Valuacin de la Cantidad
propiedad vencida
(en miles de soles) (en soles)
18,8 445
24,4 539
20,4 1 212
35,8 2 237
14,8 479
40,4 1 181
49,0 4 187
14,5 409
37,3 1 002
54,7 2 062
Valor de la lnea 20 20 40 30 60 40
Cantidad de partes defectuosas 21 19 15 16 14 17
encontradas
Distancia al trabajo 1 3 4 6 8 10 12 14 14 18
Cantidad de das de ausencia 8 5 8 7 6 3 5 2 4 2
Para recordar
Se deben identificar adecuadamente las ecuaciones de regresin no lineal.
SEMANA
12
REGRESIN LINEAL MLTIPLE
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
.
ACTIVIDADES
Y = na + b X 1
+ c X 2
YX a X
b X1 + c X X
2
1
= 1
+ 1 2
Y X = a X + b X X +c X 2
2
2 2 1 2
Para medir esta variacin, se debe utilizar de nuevo la medida conocida como
error estndar de la estimacin:
Sea el modelo de la forma: Y = a + bX 2 + cX 2
Se =
(Y Y ) 2
n k 1
Donde:
. y = valores de muestra -de la variable dependiente
. Y = valores correspondientes estimados a partir de la ecuacin de
regresin.
n = nmero de puntos de dato de la muestra
. k = nmero de variables independientes
El denominador de esta ecuacin indica que, en la regresin mltiple con k
variables independientes, el error estndar tiene n-k - 1 grados de libertad. Esto
es as debido a que los grados de libertad se ven reducidos de su valor n en los
k + 1 constantes numricas, a, bl, b2, ..., bk, que fueron estimadas de la misma
muestra.
Como fue el caso en la regresin simple, se puede utilizar el error estndar de
la estimacin y la distribucin t para formar un intervalo de confianza
aproximado alrededor de nuestro valor estimado Y. Si se desea construir un
intervalo de confianza del 95% alrededor de esta estimacin de Y con (n-k
1) grados de libertad. Luego de hallar el valor apropiado de t, se puede calcular
los lmites del intervalo de confianza de esta forma:
LSup = Y + tS e Lmite superior
LInf = Y tS e Lmite inferior
ACTIVIDADES
X1 18 19 21 22 23 27 29 21 23
X2 6 9 5 7 8 7 5 6 5
Y 60 69 62 65 69 70 71 65 64
X1 8 9 1 2 3 7 9 1 3
X2 6 9 5 7 8 7 5 6 5
Y 6 6,9 6,2 6,5 7,2 7,0 7,1 6,6 6.8
X1 4 8 12 16 20 24 28 32
X2 3 6 14 18 29 37 38 42
Y 24 21 20 15 14 10 7 5
Ajuste a los datos una curva de regresin lineal mltiple y estime P cuando
X1 es 91, X2 es 80 y X3 es 70
Autoevaluacin
1. Se desea predecir el nmero de solicitudes de reembolso de los impuestos
prediales, en una municipalidad, durante los das hbiles del perodo que va
del 1 de marzo al 15 de abril, de modo que se pueda planearse mejor las
necesidades de personal durante dicho periodo. Se ha hecho la hiptesis de
que varios factores pueden ser tiles en la prediccin. Los datos
correspondientes a estos factores y el nmero de solicitudes de reembolso
de aos anteriores son las siguientes:
X1 X2 X3 Y
ndice Poblacin dentro Ingreso promedio Nmero de
econmico de una milla a la para la solicitudes de
redonda de la municipalidad reembolso, del 1 de
oficina marzo al 15 de abril
99 10 188 21 465 2 306
106 8 566 22 228 1 266
100 10 557 27 665 1 422
129 10 219 25 200 1 721
179 9 662 26 300 2 544
Precio de Pies
Dormitorios Baos Antigedad
venta cuadrados
49,65 8,9 1 1,0 2
67,95 9,5 1 1,0 6
81,15 12,6 2 1,5 11
81,60 12,9 2 1,5 8
91,50 19,0 2 1,0 22
95,25 17,6 1 1,0 17
100,35 20,0 2 1,5 12
104,25 20,6 2 1,5 11
112,65 20,5 1 2,0 9
149,70 25,1 2 2,0 8
160,65 22,7 2 2,0 18
232,50 40,8 3 4,0 12
Ao Y X1 X2 X3
Millones de Tasa de Limitacin Nmero de
tons. inflacin de construcciones
vendidas importacin
1 4,2 3,1 3,10 6,2
999
1 3,1 3,9 5,00 5,1
998
1 4,0 7,5 2,20 5,7
997
1 4,7 10,7 4,50 7,1
996
1 4,3 15,5 4,35 6,5
995
Ventas Ventas
tiempo (miles de tiempo (miles de
dlares) dlares)
1 4 618 7 19746
2 311 8 34215
3 7 119 9 50306
4 4 367 10 65717
5 5 118 11 86434
6 8 887 12 105464
X1 X2 Y
Resultado de la prueba Experiencia en Evaluacin del
sobre aptitudes Trabajos anteriores desempeo
74 5 28
87 11 33
69 4 21
93 9 40
81 7 38
97 10 46
11 El Banco de Lima desea abrir nuevas cuentas de cheques para clientes que
emitirn al menos 30 cheques al mes. Para ayudarse en la seleccin de los
nuevos clientes, el banco ha estudiado la relacin existente entre el nmero
de cheques expedidos, y la edad y el ingreso anual de ocho de sus clientes
actuales. La variable EDAD fue registrada con respecto al ao ms reciente
y la variable INGRESO anual fue registrada en miles de dlares. Los datos
se presentan a continuacin:
Para recordar
Se deben diferencias la variable dependiente de las variables
independientes.
SEMANA
13
CORRELACIN
CORRELACIN ENTRE DOS VARIABLES
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
Anlisis de correlacin
Correlacin entre dos variables, dependiente e independiente
Coeficiente de correlacin lineal (frmula de Pearson)
ACTIVIDADES
n x y x y
r=
n x 2 ( x ) n y 2 ( y )
2 2
Sx y
r=
Sx S y
ACTIVIDADES
Tamao 108,00 4,40 3,50 3,60 39,00 68,40 7,50 5,50 375,00 12,20 4,40
Precio 12,0 4,0 5,0 5,0 13,0 19,0 8,5 5,0 15,0 6,0 12,0
Peso al nacer 3.52 2.95 3.90 4.20 3.85 2.85 3.05 2.95 3.80
Peso de adulto 72.5 85.3 94.2 78.4 65.4 80.4 74.5 60.3 90.5
Semana 2 3 4 5 6 7
Tiempo de propaganda
35 52 62 68 76 80
(minutos/semana)
Venta del producto ( miles $) 30 120 180 100 310 200
.
5. Debido a la demanda de sus publicaciones y del fuerte incremento de la
competencia desleal e informal, la editorial Vinces Vives ha tomado la
decisin de preparar algunos libros de uso popular en la educacin primaria.
Teniendo como nico parmetro la cantidad de pginas de dicho libro. Se
toma una muestra de siete (07) de ellos, y se anota el precio de venta que
debera tener por la cantidad de pginas que tendra dicho libro. En la
siguiente tabla, se recopilan dichos datos.
Precio
12.00 12.50 13.80 15.40 17.50 18.00 20.00
($)
# Pg. 175 140 280 320 280 360 300
7.1 Use estos datos para deducir una ecuacin de regresin con la que se
pueda predecir el costo total para determinado volumen de produccin.
7.2 Cul es el costo variable, o costo adicional, por unidad producida?
7.3 Calcule el coeficiente de determinacin. Qu porcentaje de la
variacin en el costo total puede explicar el volumen de produccin?
7.4 El programa de produccin de la empresa indica que el mes prximo
se deben producir 500 unidades. Cul ser el costo total estimado
para esta operacin?
Autoevaluacin
1. En finanzas, es de inters ver la relacin entre Y, devolucin promedio de
acciones, y X, la devolucin global del mercado. El coeficiente de pendiente
calculado por la regresin lineal es denominada la beta de las acciones por
los analistas de inversiones. Una beta mayor que 1 indica que las acciones
son relativamente sensibles a cambios de mercado, mientras que una beta
menor que 1 indica que las acciones son relativamente insensibles. Para los
datos siguientes, calcule la beta y pruebe si esta es significativamente
menor que1. Use = 0,05.
Y (%) 10 12 8 15 9 11 8 10 13 11
X (%) 11 15 3 18 10 12 6 7 18 13
rea
(mile
s 1,1 1,5 1,6 1,6 1,4 1,3 1,1 1,7 1,9 1,5 1,3
pies
)
Valor
(mile
s de 75 95 110 102 95 87 82 115 122 98 90
dlar
es)
Para recordar
El coeficiente de Pearson define el grado de asociacin entre la variable
independiente y dependiente
Si el coeficiente de Pearson es pequeo entonces no tendr sentido
encontrar la ecuacin de regresin para predecir valores a futuro.
SEMANA
14
CORRELACIN ENTRE DOS VARIABLES
TEMAS
Coeficiente de correlacin generalizado (coeficiente de determinacin)
Coeficiente de correlacin de rango (frmula de Spearman)
OBJETIVOS ESPECFICOS
CONTENIDOS
Coeficiente de Determinacin
Error de estimacin
Pendiente de una recta de poblacin
Coeficiente de correlacin de rango (frmula de Spearman)
ACTIVIDADES
a y + b x y n y 2
r =
2
y 2
ny 2
S 2x y
r = 2 2
2
Sx S y
Se =
n2
2
y y
Se =
n2
Donde:
y = Es el valor de la variable independiente.
Se
Sb =
x 2
nx 2
Donde:
Sb = error estndar del coeficiente de regresin
Se = error estndar de estimacin
x = valor de la variable independiente
x = la media de los valores de la variable independiente
Puesto que la prueba se basa en una distribucin t student con (n-2) grados de
libertad, usamos t para denotar la estadstica estandarizada.
6 d 2
rs = 1
(
n n2 1 )
rs = coeficiente de correlacin de rango
n = nmero de observaciones apareadas
d = diferencia entre rangos para cada pareja de observaciones
Si el valor del coeficiente de rangos es +1 o -1, significa que existe una asociacin
perfecta entre las dos variables.
ACTIVIDADES
2.1 Con estos datos, forme una ecuacin de regresin que relacione la
indicacin de absorbencia de luz con los miligramos de protena de la
muestra.
2.2 Calcule r2. Se sentira cmodo con este modelo de regresin, al estimar la
cantidad de protena de una muestra?
2.3 En una muestra que se acaba de recibir, la indicacin de absorbencia fue
de 0,941. Estime la cantidad de protena en esa muestra.
X 30 17 35 28 42 25 19 29
Y 35 31 43 46 50 32 33 42
Cantidad de horas 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
extra
Aos de empleo 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0
Compaa A B C D E F G H I J K
Gastos 60 37 30 20 24 42 39 54 48 58 26
Accidentes 5 7 6 9 7 4 8 2 4 3 8
Existe una correlacin significativa entre los gastos y los accidentes en las
plantas de las compaas qumicas? Use una correlacin de rango (en la que 1
represente el mayor gasto y tasa de accidentes) para respaldar su conclusin.
Pruebe al nivel de significancia de 1 %.
Autoevaluacin
1. El granjerito trat de determinar la relacin entre el porcentaje de
metionina que se agrega al alimento y el peso corporal de pollos. Con los
datos obtenidos se aplic el anlisis de regresin y se determin la siguiente
lnea de regresin:
y = 0,21 + 0,42 x
En donde:
y = peso corporal estimado en kilogramos
X = porcentaje de metionina adicional en el alimento
El coeficiente de determinacin, r2, fue 78, lo que indica que el ajuste fue
razonablemente bueno para los datos. Suponga que se us una muestra de
( )
2
tamao 30 para el estudio, y y y = 45 . Calcule y y .
2
2. A los directores y principales ejecutivos se les paga de acuerdo con las
ganancias obtenidas por las empresas? La siguiente tabla muestra una lista
de datos corporativos sobre el cambio porcentual en el rendimiento de las
acciones durante un periodo de dos aos, y el cambio porcentual en la
paga a los directores y principales ejecutivos, inmediatamente despus de 2
aos.
Backus 1,2 -2,5 -3,0 2,0 5,0 1,2 3,0 -1,0 0,5 2,5
Brahama -0,7 -2,0 -5,5 4,7 1,8 4,1 2,6 2,0 -1,3 5,5
Aos de experiencia 4 3 4 6 7 5 5 2 1 3
Promedio de
3.4 3.2 3.5 2.9 3.4 3.9 3.6 3.0 2.5 3.0
calificaciones
Rango de xito (10 =
4 2 6 7 9 8 10 3 1 5
tope)
Solicitante 1 2 3 4 5 6 7 8 9 10 11 12 13 1.4
Encuestador 1 1 11 13 2 12 10 3 4 14 5 6 9 7 8
Encuestador 2 4 12 11 2 14 10 1 3 13 8 6 7 9 5
Produccin diaria 7.2 5.5 6.2 8.3 5.2 2.0 3.0 0.5 9.0 6.0
Das trabajados
1 2 3 4 5 6 7 8 9 10
conjuntamente
31 93 135
32 85 143
33 91 118
34 94 147
35 94 138
10. Los siguientes son los salarios y datos de edad de los 10 candidatos a
doctorado que se gradan este ao de la Escuela de Doctorado en
Contabilidad de la Universidad Peruana de Ciencias. Al nivel de significancia
de 0.05, la correlacin de rango de edad y salario sugiere que los
candidatos de mayor edad obtienen salarios iniciales mayores?
Salario en
Edad
dlares
67,000 29
60,000 25
57,500 30
59,500 35
50,000 27
55,000 31
59,500 32
63,000 38
69,500 28
72,000 34
1 1,000 40
2 1,200 54
3 900 41
4 1,450 60
5 2,000 65
6 1,300 50
7 1,650 42
8 1,700 65
9 500 43
10 2,100 66
Para recordar
El coeficiente de Determinacin define el modelo mas confiable para
una acertada prediccin
SEMANA
15
SERIE DE TIEMPO
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
SERIES DE TIEMPO
Las ideas anteriores suministran una posible tcnica para analizar las series de
tiempo. Se supone que en las series de tiempo la variable Y es un producto de
Y = T x C x S x I = TCSI
Ejemplo 1:
Dados los nmeros 2, 6, 1, 5, 3, 7, 2 un movimiento medio de orden 3 est
dado por la sucesin.
ESTIMACIN DE LA TENDENCIA
ACTIVIDADES
Ao 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Produccin
media 50,0 36,5 43,0 44,5 38,9 38,1 32,6 38,7 41,7 41,1
mensual
Produccin
Movimiento total de Movimiento medio de
Aos media
5 aos 5 aos
mensual
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Movimiento
Movimiento total de Movimiento medio
Aos medio de 4
2 aos de la col. 3 centrado de 4 aos
aos
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Movimiento
Movimiento Movimiento
medio
Aos Y total de 4 total de 2 aos
centrado de 4
aos de la col. 3
aos
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2.5 Represente el movimiento medio de (2.1) junto con los datos originales.
2.6 Obtenga los valores de tendencia para los datos de la tabla mediante el
mtodo de semimedias donde la media se toma de (2.1)
Ao 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
2.7 Utilice el mtodo de mnimos cuadrados para ajustar una recta a los
datos de (2.1) y halle los valores de tendencia.
Ao 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
Aos 1 2 3 4 5 6 7 8 9 10
Ventas 400 390 320 340 270 260 300 320 340 370
Ao 1 2 3 4 5 6 7 8 9 10
Rendimiento 0.64 0.73 0.94 1.14 1.33 1.53 1.67 1.68 2.10 2.50
4.1 Emplee una proyeccin de tendencia lineal para pronosticar esta serie de
tiempo en el prximo ao.
4.2 Qu nos dice este anlisis de tendencia temporal acerca de la
Compaa Metalrgica?
4.3 De acuerdo con los datos histricos, es bueno invertir en esta empresa?
Autoevaluacin
1. Identifique con qu movimiento caracterstico de una serie de tiempo se
podra asociar principalmente cada una de los siguientes supuestos:
1.1 Un retroceso
1.2 Un incremento de empleo durante los meses de verano
1.3 La disminucin de mortandad debido al avance de la ciencia
1.4 Una huelga del acero
1.5 Una demanda continuamente creciente de automviles pequeos
Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Consumo
de 656 804 836 765 777 711 755 747 696 677
algodn
4.4 Represente el movimiento medio de los apartados (4.2) y (4.3) junto con
los datos originales y compare los resultados
Ene. Feb Marzo Abril May Jun Jul Ago. Sep Oct Nov Dic
1997 52,6 45,3 56,1 59,8 54,3 58,7 59,9 51,7 47,2 52,8 37,9 38,6
1998 44,6 46,7 53,5 53,7 49,1 50,1 45,7 44,3 30,0 22,2 49,2 66,9
1999 65,5 67,7 79,3 75,4 72,1 64,7 65,7 62,6 46,8 50,2 74,0 69,1
2000 51,0 50,9 58,2 55,9 47,0 44,8 44,0 41,0 20,9 35,1 57,7 61,6
2001 68,0 57,0 58,7 54,7 53,1 49,3 48,7 52,3 31,3 29,1 58,8 55,2
2002 48,4 39,2 35,5 32,5 35,1 34,2 31,4 19,0 10,7 27,2 51,9 60,7
Ao 1 2 3 4 5 6 7
Asistencia 28,000 30,000 31,500 30,400 30,500 32,200 30,800
Ao 1 2 3 4 5 6 7 8
Costo/unidad
20.50 24.50 28.20 27.50 26.60 30.10 31.40 36.50
($)
7.1 Trace la grfica de esta serie de tiempo. Parece haber una tendencia
lineal?
7.2 Determine una ecuacin del componente de tendencia lineal para la serie
de tiempo.
7.3 Cul es el aumento anual promedio de costo que ha tenido la empresa?
8.1 Deduzca una ecuacin de tendencia lineal para esta serie de tiempo.
8.2 Use la ecuacin de la tendencia para estimar el porcentaje de mujeres
gerentes para el 2003 y 2004.
Para recordar
Se deben diferenciar adecuadamente los movimientos de la serie de
tiempo.
SEMANA
16
SERIE DE TIEMPO
TEMAS
Modelos de estimacin
Mtodos de estimacin de la tendencia
Prediccin mediante la serie de tiempo
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
SERIE DE TIEMPO
Varios son los mtodos que se utilizan para el clculo del ndice estacional:
Mtodo del porcentaje medio. En este mtodo los datos de cada mes se
expresan como porcentajes de la media anual. Los porcentajes de meses que
se corresponden en diferentes aos son entonces promediados mediante su
media o mediana. Si se emplea la media, es mejor evitar los valores extremos
que puedan aparecer.
Los 12 porcentajes resultantes dan el ndice estacional. Si su media no es 100
% (es decir, si la suma no es 1200 %) deber ajustarse multiplicando por un
factor adecuado.
Despus de que se haya hecho esto, los datos originales para cada mes se
expresan como porcentajes de los correspondientes al movimiento medio
centrado de 12 meses. Los porcentajes para los meses correspondientes son
DESESTACIONALIZACIN DE DATOS
Despus de que los datos han sido desestacionalizados, pueden tambin ser
ajustados a su tendencia dividiendo los datos por los correspondientes valores
de tendencia. De acuerdo con la Ecuacin TCSI, el proceso de ajuste para la
variacin estacional y los valores de tendencia se consiguen al dividir Y por ST,
que da CI, es decir, variaciones cclicas e irregulares. Un apropiado
movimiento medio de unos pocos meses de duracin (por ejemplo, 3, 5 7
meses, de modo que no es necesaria la sucesin centrada) posteriormente
sirve para suavizar las variaciones irregulares (I) y deja solamente las
variaciones cclicas. Una vez que stas han sido aisladas, pueden ser
estudiadas con detalle. Si aparece una periodicidad (o periodicidad
aproximada) de ciclos, pueden construirse unos ndices cclicos anlogamente
a como se obtuvieron los ndices estacionales.
COMPARACIN DE DATOS
Se debe tener siempre cuidado al comparar datos y que tal comparacin est
correctamente justificada. Por ejemplo, al comparar los datos de marzo con los
de febrero, se debe tener en cuenta que marzo tiene 31 das, mientras que
febrero tiene 28 29. Anlogamente, al comparar los meses de febrero para
diferentes aos, se debe tener presente que en aos bisiestos febrero tiene 29
das en lugar de 28. El nmero de das laborables durante varios meses del
mismo o aos diferentes, puede tambin diferir debido a fiestas, huelgas, paros
temporales, etc.
PREDICCIN
7. Combinando los resultados de los pasos 1-6 y con cualquier otro tipo de
informacin til, hacer una prediccin (si se desea) y si es posible discutir
las fuentes de error y su magnitud
ACTIVIDADES
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991 318 281 278 250 231 216 223 245 269 302 325 347
1992 342 309 299 268 249 236 242 262 288 321 342 364
1993 367 328 320 287 269 251 259 284 309 345 367 394
1994 392 349 342 311 290 273 282 305 328 364 389 417
1995 420 378 370 334 314 296 305 330 356 396 422 452
1996 453 412 398 362 341 322 335 359 392 427 454 483
1997 487 440 429 393 370 347 357 388 415 457 491 516
1998 529 477 463 423 398 380 389 419 448 493 526 560
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Total
Media
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Total
Media
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Autoevaluacin
1. En la siguiente tabla se da el consumo medio mensual, en millares de
fanegas de algodn nacional y de importacin en Estados Unidos durante los
aos 1990-1999.
Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Consumo
de 656 804 836 765 777 711 755 747 696 677
algodn
1.1 Obtenga los valores de tendencia para los datos mediante el mtodo de
semimedias, donde la media se toma como
(a) la media aritmtica
(b) la mediana
Construir un grfico con los resultados obtenidos
1.2 Obtenga los valores de tendencia para los datos mediante
(a) el mtodo libre
(b) un movimiento medio de orden adecuado
Comparar con los resultados
1.3 Emplee el mtodo de mnimos cuadrados para ajustar una recta a los
datos de la tabla
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 85,6 80.9 92,2 101,8 132,6 141,2 130,5 119,0 93,6 86,6 68,4 70,4
1997 78,7 78,8 91,5 102,5 135,0 128,0 117,7 105,7 92,1 87,7 75,9 94,6
1998 103,9 101,9 121,4 133,5 156,0 154,0 135,6 118,7 95,0 91,6 91,3 109,0
1999 118,7 116,6 143,3 142,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 97,0
2000 108,1 104,3 121,1 129,4 157,9 151,9 123,0 102,1 91,9 94,7 92,7 105,8
2001 114,6 114,1 129,6 135,4 151,9 149,0 127,6 109,8 92,4 93,1 92,3 103,4
2002 115,3 110,3 124,6 132,3 159,3 148,1 125,8 106,9 90,1 100,3 94,1 105,7
2003 118,6 113,4 129,5 130,3 150.6 144,7 126,9 97,7 8607 91,9 90,0 107,2
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 12,63 11,72 13,43 12,53 13,29 13,27 12,36 13,27 13,10 13,86 13,39 15,38
1997 11,84 11,74 12,74 13,40 14,85 13,81 13,40 13,45 13,62 14,82 14,01 16,91
1998 13,05 12,33 13,96 14,17 14,66 14,58 14,38 14,18 14,08 14,95 13,96 16,44
1999 12,34 12,06 13,54 14,32 14,25 14,66 14)39 13,90 14,14 14,66 14,53 17,87
2000 13,15 12,64 14,57 15,49 15,33 15,60 15,26 15,48 15,76 15,68 15,75 19,12
2001 13,73 13,55 15,72 14,89 16,11 16,58 15,38 16,19 15,58 16,13 16,49 19,38
2002 14,74 14,06 15,79 16,44 17,20 17,11 16,86 17,49 16,37 16,95 17,13 19,84
2003 15,29 13,78 15,55 16,27 17,36 16,60 16,60 17,00 16,33 17,36 17,04 21,17
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991 316 285 288 253 225 225 223 235 269 302 323 352
1992 338 312 305 274 244 246 242 252 285 321 342 364
1993 363 321 315 294 259 261 259 274 309 345 367 394
1994 389 353 352 320 260 283 282 308 325 364 389 421
1995 425 383 378 324 315 296 305 330 356 396 422 452
1996 454 417 402 356 351 332 335 358 392 427 454 492
1997 488 446 412 398 387 357 357 388 415 457 491 521
1998 519 487 457 425 402 390 389 419 448 493 526 568
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 84,6 87.9 98,2 107,8 132,7 144,2 132,5 120,6 98,6 90,6 78,4 90,4
1997 77,7 76,8 99,5 108,5 135,8 128,0 117,7 105,7 92,1 87,7 75,9 98,6
1998 100,9 105,9 120,4 138,5 156,7 154,0 135,6 118,7 95,0 91,6 91,3 107,0
1999 115,7 120,6 148,3 146,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 99,0
2000 104,1 115,3 134,1 132,4 157,5 151,9 123,0 102,1 91,9 94,7 92,7 109,8
2001 117,6 118,1 134,6 138,4 151,3 149,0 127,6 109,8 92,4 93,1 92,3 106,4
2002 118,3 119,3 144,6 139,3 159,2 148,1 125,8 106,9 90,1 100,3 94,1 108,7
2003 113,6 115,4 139,5 140,3 150,8 144,7 126,9 97,7 8607 91,9 90,0 109,2
Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Media
67.4 81.3 82.5 74.8 79.7 74.3 77.5 73.7 69.6 69.7
Mensual
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 85,6 80.9 92,2 101,8 132,6 141,2 130,5 119,0 93,6 86,6 68,4 70,4
1997 78,7 78,8 91,5 102,5 135,0 128,0 117,7 105,7 92,1 87,7 75,9 94,6
1998 103,9 101,9 121,4 133,5 156,0 154,0 135,6 118,7 95,0 91,6 91,3 109,0
1999 118,7 116,6 143,3 142,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 97,0
2000 108,1 104,3 121,1 129,4 157,9 151,9 123,0 102,1 91,9 94,7 92,7 105,8
2001 114,6 114,1 129,6 135,4 151,9 149,0 127,6 109,8 92,4 93,1 92,3 103,4
2002 115,3 110,3 124,6 132,3 159,3 148,1 125,8 106,9 90,1 100,3 94,1 105,7
2003 118,6 113,4 129,5 130,3 150.6 144,7 126,9 97,7 8607 91,9 90,0 107,2
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
116,3 108,2 121,4 126,8 143,4 135,6 112,5 90,9 82,6 92,1 91,2 108,0
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
2742 2291 2398 2489 3419 2813 2249 2712 2190 2908 2403 2376
Trimestre Ao 1 Ao 2 Ao 3
1 4 6 7
2 2 3 6
3 3 5 6
4 5 7 8
Trimestre Ao 1 Ao 2 Ao 3
1 1690 1800 1850
2 940 900 1100
3 2625 2900 2930
4 2500 2360 2615
12. Identifique los ndices estacinales mensuales de los tres aos de gastos
para un edificio de departamentos en Surco, de acuerdo con la siguiente
tabla. Emplee un clculo de promedios mviles de 12 meses.
Gastos
Mes Ao 1 Ao 2 Ao 3
Enero 170 180 195
Febrero 180 205 210
Marzo 205 215 230
Abril 230 245 280
Mayo 240 265 290
Junio 315 330 390
Julio 360 400 420
Agosto 290 335 330
Septiembre 240 260 290
Octubre 240 270 295
Noviembre 230 255 280
Diciembre 195 220 250
15 de julio 25 28 35 50 60 60 40 35 30 25 25 20
16 de julio 28 30 35 60 65 50 50 40 35 25 20 20
17 de julio 35 42 45 72 75 60 60 45 40 25 25 25
13.1 Identifique los ndices estacionales por hora para las 12 indicaciones
de cada da.
13.2 Con los ndices estacinales determinados en el inciso a, se elimin el
efecto estacional la ecuacin de tendencia para los datos
desestacionalizada fue T=32.983 + 3922 t. Use slo el componente de
tendencia para determinar pronsticos para las 12 horas del 18 de julio.
Ao
1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
%
55 38 54 37 52 40 53 36 50 37 55
Movimientos
Para recordar
Se deben tener en claro los pasos fundamentales de la serie de tiempo.