Académique Documents
Professionnel Documents
Culture Documents
CONTENIDO PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES...... 1 PRCTICA 10: ESTIMACIN PUNTUAL .......................................................... 5 PRCTICA 11: ESTIMACIN POR INTERVALO ............................................ 9 PRCTICA 12: PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS........................................................................... 15 PRCTICA 13: PRUEBA DE HIPOTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA ..................................................................... 26 PRCTICA 14: MUESTREO DE POBLACIONES FINITAS .......................... 32 PRCTICA 15: MODELO DE REGRESIN SIMPLE..................................... 37 PRCTICA 16: MODELO DE REGRESIN MLTIPLE............................... 50 SEGUNDA REVISIN 2005.. 57
2. Entre los estimadores insesgados de hallados, cul es el que tiene la varianza ms pequea? Cules son las eficiencias relativas de los dems estimadores insesgados con respecto al que tiene la varianza ms pequea? EJERCICIO 2 Sea X1, X2,..., Xn una muestra aleatoria simple con reposicin de una cierta poblacin con media y varianza 2. 1. Demostrar que T = a i X i es un estimador insesgado de para cualquier
i =1 i =n
a
i =1
2
i =n
= 1 (i=1,2,..., n).
1 n
a
i =1
i =n
ai =
2
i =1
i =n
1 1 ai + , cuando n n i =1
i=n
a
i =1
i =n
=1
3. Dada X1, X2, X3, X4 MAS c/r de X Fx(x), se define el estadstico: T = (0.2 X 1 + 0.1X 2 + 0.4 X 3 + 0.3 X 4 ) como estimador de . Analizar el ECM(T). 4. Se define otro estimador de , T* = 2, cualquiera sea la muestra. Sabiendo adems que E(X2) = 2 2, comparar el ECM(T) y el ECM(T*). Cul de los dos estimadores elegira Ud., T T*? 1
PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 3 Sea X1, X2,..., Xn MAS c/r de una variable aleatoria X con densidad dada por:
ke x f ( x , ) = 0
Se pide:
x x<
1. Determinar k de modo que sea efectivamente una densidad. 2. Para el k hallado, calcular E(X) y V(X) 3. Hallar la funcin de densidad de Z= mn {X1, X2, ...,Xn} 4. Determinar E(Z) 1 5. Demostrar que * = Z es un estimador insesgado de . n __ 1 6. Sabiendo que V(Z) = 2 , comparar * con ** = X n 1 como estimadores de . n EJERCICIO 4 Sea X U(0,b) con b > 0 y X1, X2,..., Xn una MAS c/r de una variable aleatoria X. Se proponen como estimadores de b:
__
T1 = 2 X n T2 = mx {X1, X2, ...,Xn} Se pide: 1. Comparar el ECM de T1 y T2. 2. Encontrar la distribucin exacta de T2. 3. Para n suficientemente grande encontrar la distribucin aproximada de T1. 4. Comparar los resultados hallados en 2. y 3.
EJERCICIO 5 (Canavos 8.7) Se muestrea una poblacin cuya distribucin es exponencial con una densidad dada por: x 1 x>0 exp( ) f(x,) = x0 0 1. Mediante el uso de la cota de Cramer-Rao determinar la varianza del estimador insesgado de varianza mnima de . 2. Deducir que el estimador eficiente de es la media muestral.
PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 6 Sea una MAS c/r de una variable aleatoria X discreta con funcin de cuanta dada por: 1 2 (1 ) si x = 1 x = 1 pX ( x ) = si x=0 donde [0,1] es un parmetro desconocido. Se considera
* =
1 1 n Yi con Yi = n i =1 0
Xi = 0 Xi 0
Se pide: 1. Mostrar que * es un estimador insesgado para . 2. Mostrar que * es de mnima varianza. 3. Mostrar que * es asintticamente eficiente, asintticamente normal y hallar su media y su varianza asinttica. EJERCICIO 7 (Novales 9.8) Demostrar que la media muestral es un estimador suficiente para el parmetro de la densidad exponencial.
EJERCICIO 8 (Novales 9.9) Demostrar que la media muestral es un estimador suficiente para el parmetro de la distribucin de Poisson.
Se pide: 1. Investigar la eficiencia de X n como estimador de ? 2. Si 2 = 1 Es X n suficiente como estimador de ? 3. Probar que ( X n )3 es suficiente como estimador de , mientras que ( X n )2 no lo es. 4. Si = 0 Es S2 suficiente como estimador de 2?
__ __ __ __
PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 10 (Novales 9.31) Utilice la desigualdad de Chebychev y la descomposicin del ECM en suma de varianza y sesgo al cuadrado para probar que si la varianza de un estimador asintticamente insesgado tiende a cero al aumentar el tamao muestral, dicho estimador es consistente. EJERCICIO 11
__
Demostrar que X n calculado en base a X1, X2,..., Xn, MAS c/r de X es consistente como estimador de E(X) si: a) X Bernoulli (p). b) X Fx(x) con y 2 finitas
Fn* ( a ) =
Se pide:
1 n
i =1
{ X i a}
con a constante.
1. Qu se requiere para que Fn ( a ) sea un estadstico? 2. Calcular su esperanza y varianza en funcin de p = P(X a) 4. Demostrar que dicho estadstico es consistente para estimar p = P(X a)
EJERCICIO 2 Una variable discreta toma los valores 0,1 y 2 con funcin de cuanta: pX(0,p) = p2 pX (1,p) = 2p (1-p) pX (2,p) = (1-p) 2
siendo p, 0<p<1, un parmetro desconocido. Estimar p aplicando mxima verosimilitud y el mtodo de los momentos, a partir de una muestra de tamao 100 en la que se ha presentado 22 veces el 0, 53 veces el 1 y 25 veces el 2. EJERCICIO 3 (Segunda Revisin 1989) Se desea estimar el parmetro en base a una MAS c/r de tamao 3. El espacio paramtrico es = {0,1,2,3}. De la muestra se determin que: 1 / 5 1 / 4 P (X1 = x 1 , X 2 = x 2 , X 3 = x 3 ) = 1 / 3 1 / 2 si si si si =0 =1 =2 =3
Determinar la estimacin mximo verosmil de . Fundamentar. EJERCICIO 4 Sea X una variable aleatoria con densidad dada por: x 2 fX ( x) = 2 x 2 Se pide: 1. Hallar MV para X1 de X (MAS de tamao 1). 2. Hallar MM .
si si
PRCTICA 10: ESTIMACIN PUNTUAL EJERCICIO 5 (Examen de Marzo de 1995) Sea X ~ U(-1/2 , +1/2) y sea X1, X2, ..., Xn una MAS c/r de tamao n de la v.a. X. Sea T = mx {X1, X2, ..., Xn}. Se pide: 1. Hallar la distribucin en el muestreo de T t Rec(T). 2. Probar que: 1 n E( T ) = + 2 n +1 3. Sea T* = T-1/2 un estimador de . Probar que T* es asintticamente insesgado. 4. Sea T** el estimador de por el mtodo de los momentos. Estudiar la eficiencia asinttica de T**. EJERCICIO 6 Sea X una variable aleatoria tal que:
1 p X ( x, ) = 4
si si
x = 2, x = 1, x = 1, x = 2 x=0
Una MAS c/r de X de tamao n=50 arroj estos resultados: 10 observaciones valieron -2 10 observaciones valieron -1 20 observaciones valieron 0 5 observaciones valieron 1 5 observaciones valieron 2 Se pide: 1. Hallar el campo de variacin de , es decir el espacio paramtrico, . 2. Hallar MV . 3. Para calcular el estimador de por el mtodo de los momentos se presenta un problema con el momento de primer orden. Cul es ese problema y cmo podramos calcular una estimacin de por el mtodo de los momentos?. 4. Hallar con el procedimiento propuesto en el punto anterior y para la muestra obtenida, la estimacin por el mtodo de los momentos.
1. Hallar la funcin de verosimilitud L(a) para una MAS c/r de tamao n de X y mostrar que L(a) es decreciente.
4. Demostrar que a MV es sesgado. Hallar su sesgo y mostrar que su ECM es: 2a 2 ECM ( a ) = ( 3n + 1 )( 3n + 2 )
5. Hallar a MM y demostrar que es insesgado. 6. Determinar a partir de qu valor de n se cumple que: ECM ( a MV ) < ECM ( a MM ) 7. Si estuviramos trabajando con una MAS c/r de tamao n =100 qu estimador de los anteriores elegiramos? Justificar.
EJERCICIO 8 (Novales 9.28) Utilizar el mtodo de los momentos para obtener el estimador del parmetro en la funcin de densidad: x 1 si 0 < x < 1 con 0 < < f ( x / ) = en otro caso 0
Se pide: 1. Hallar el estimador de 2 por el mtodo de los momentos. 2. Demostrar que el estimador de 2 por el mtodo de mxima verosimilitud coincide con el de los momentos. 3. Hallar el sesgo y varianza del estimador obtenido (sugerencia: recordar que si 2 X ~ 1 se tiene que V(X) = 2). __ 1 n 4. Dado el estimador alternativo para 2, M 2 = ( X i X n ) 2 , obtener su error n i =1 cuadrtico medio y compararlo con el del estimador estudiado en las partes anteriores. 7
extrae una muestra de tamao n, en la que se obtienen n1 valores de x1, n2 valores de x2, ... nk valores de xk, con
n
i =1
1. Probar que con muestras independientes con reposicin de tamao n1 y n2, el 2 n1 s12 + n2 s2 2 estimador mximo verosmil de la varianza comn es: s = donde n1 + n2
2 s12 y s 2 son las varianzas muestrales de la primera y segunda muestra respectivamente. 2 n1 s12 + n2 s2 es insesgado para 2. n1 + n2 2
EJERCICIO 12 (Segunda Revision 2000) El nivel de las ventas mensuales de un refresco (X) puede modelarse adecuadamente por la funcin de densidad:
2 (x ) f X ( x , ) = 92 0
si x [ ,4 ] en otro caso
donde es un parmetro que mide el gasto en publicidad del refresco (el cual se supone constante mes a mes). SE PIDE: 1. Hallar el estimador de por el mtodo de los momentos para una MAS C/R de tamao n. 2. El estimador obtenido, es insesgado? Fundamentar. 3. Calcular el error cuadrtico medio del estimador.
2. Elegida una muestra, result x n = 20. Determinar un intervalo de confianza al 95% para . 3. Explicar el significado de este intervalo de confianza.
EJERCICIO 2 En una eleccin los votantes deben elegir entre dos candidatos A y B. Un estudio reciente revel que 1400 personas de un total de 2500 seleccionadas aleatoriamente, tienen preferencia por el candidato A.
a) Obtener un intervalo de confianza al 99% para la verdadera proporcin de votantes a favor del candidato A. Con base en este resultado, podra usted afirmar que es probable que A gane la eleccin? Por qu? b) Supngase que se selecciona aleatoriamente una muestra de 225 personas con la misma proporcin muestral a favor del candidato A. Son los resultados diferentes a los del literal a)? c) En este caso, son razonables las suposiciones para los intervalos de confianza aproximados del 99%?
EJERCICIO 3 El precio del refresco mediano en restaurantes es una variable aleatoria normal con desvo estndar igual a $2. Una muestra de precios en 20 restaurantes arroj los siguientes resultados: 30, 30, 30, 25, 35, 25, 35, 30, 40, 35, 40, 37, 28, 30, 30, 25, 28, 28, 30, 29.
a) Construir un intervalo para el parmetro precio promedio del refresco mediano en restaurantes al 90% de confianza. b) Si en realidad se desconoce el valor de , obtener nuevamente un intervalo al 90% para dicho parmetro. Por qu este intervalo tiene mayor amplitud que el que se obtuvo en el punto anterior?
El enunciado anterior puede interpretarse de dos maneras: Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p est en el intervalo ( p-0.01, p+0.01) con una probabilidad mayor o igual a 0.95. Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p est en el intervalo ( p-0.01p, p+0.01p) con una probabilidad mayor o igual a 0.95.
a) Utilizar la desigualdad de Tchebychev para determinar la relacin entre el tamao de muestra (n) y el verdadero valor poblacional (p) para ambas interpretaciones y comparar los resultados graficando n como funcin de p en ambos casos. b) Observar el comportamiento de n cuando p est cercano a 0 y a 1. Cmo cambian los resultados si se utiliza el TCL?
EJERCICIO 5 (Canavos 8.24) Una tienda de donas se interesa en estimar su volumen de ventas diarias. Supngase que el valor de la desviacin estndar es de $50.
a) Si el volumen de ventas se encuentra aproximado por una distribucin normal, cul debe ser el tamao de la muestra para que con una probabilidad de 0.95 la media muestral se encuentre a no ms de $20 del verdadero volumen de ventas promedio? b) Si no es posible suponer que la distribucin es normal, obtener el tamao necesario de la muestra para la pregunta anterior.
EJERCICIO 6 Se desea estimar el parmetro proporcin de fumadores entre los 10.000 estudiantes de una universidad. A esos efectos se selecciona una MAS c/r de 400 alumnos. A la pregunta Es Ud. fumador?, 80 estudiantes responden afirmativamente y 320 por la negativa.
Se pide: a) Construir un intervalo de confianza al 95% para el parmetro a investigar. b) Construir un intervalo de confianza al 95% para el total de fumadores entre los 10.000 estudiantes de la universidad. c) Sabiendo que la proporcin de fumadores nunca podra superar el 30%, calcular el tamao de una MAS c/r para obtener una estimacin de dicho parmetro si la seguridad y la precisin deseadas son 95% y 3% respectivamente.
10
Se pide: a) A partir del intervalo de confianza obtenido y sabiendo que X se distribuye N(,2) y que n=25, deducir la estimacin puntual de y el valor de 2. b) Indicar en cada una de las afirmaciones siguientes cul es verdadera y cul es falsa. En este ltimo caso explicar cul es el error. AFIRMACIN 1: Si se extraen 100 muestras al azar, habr 99 medias muestrales que pertenecern a dicho intervalo. AFIRMACIN 2: Si se extraen muchas muestras, en el 99% de los casos las medias poblacionales pertenecern al intervalo de confianza. AFIRMACIN 3: De cada 100 intervalos correspondientes a otras tantas muestras, promedialmente 99 de ellos contendrn a la media poblacional.
EJERCICIO 8 (Canavos 8.34) Se espera tener una cierta variacin aleatoria nominal en el espesor de las lminas de plstico que una mquina produce. Para determinar cundo la variacin en el espesor se encuentra dentro de ciertos lmites, cada da se seleccionan en forma aleatoria 12 lminas de plstico y se mide en milmetros su espesor. Los datos que se obtuvieron son los siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.3, 12.5, 12.9. Si se supone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos de confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no es aceptable una varianza mayor de 0.9 mm2 existe alguna razn para preocuparse con base en esta evidencia? EJERCICIO 9 (Canavos 8.32) Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 especmenes y cada uno de stos se somete a una tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los especmenes en kilogramos por centmetro cuadrado:
Proceso estndar 428 419 458 439 441 456 463 429 438 445 441 463 Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447
11
EJERCICIO 10 (Canavos 8.38) Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la cra de peces con fines comerciales. Esta agencia se encuentra interesada en comparar la variacin de cierta sustancia txica en dos estuarios cuyas aguas se encuentran contaminadas por desperdicios industriales provenientes de una zona industrial cercana. En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron a un laboratorio para su anlisis. Las mediciones en ppm (partes por milln) que se observaron en cada muestra se exponen en la tabla. Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas normales, obtener un intervalo de confianza estimado del 90% para el cociente de las dos varianzas no conocidas 21/22. Con base en este resultado, se podra concluir que las dos varianzas son diferentes? Por qu? Niveles de una sustancia txica (ppm):
Estuario 1 10 10 12 13 9 8 12 12 10 14 8
Estuario 2 11 8 9 7 10 8 8 10
EJERCICIO 11 (Novales 10.9) Sean X e Y los miligramos de nicotina por cigarrillo con filtro y sin filtro, de una determinada marca. Suponga que ambas cantidades siguen una distribucin Normal. Se analizaron 9 cigarrillos con filtro y 11 sin filtro, con los resultados:
X: 1.1; 0.7; 0.9; 0.1; 0.8; 0.3; 0.9; 0.4; 1.0 Y: 0.9; 1.6; 1.5; 0.5; 1.0; 1.9; 1.4; 1.2; 1.3; 1.6; 2.1; Estimar el cociente de varianzas, y construir un intervalo de confianza del 98% para el mismo.
12
Se desea estudiar el efecto de una nueva vacuna para la gripe. Una MAS con reposicin de 500 personas vacunadas revela que 150 de ellas se engriparon en el ltimo invierno, mientras que en una MAS con reposicin de 1000 personas no vacunadas se engriparon 400. Suponiendo que las poblaciones son independientes, construir un intervalo de confianza al 95% para la diferencia entre las proporciones de personas que se engripan de las dos poblaciones. Qu dira sobre la efectividad de la vacuna?
EJERCICIO 13 (Examen)
Una empresa de la industria manufacturera produce un tubo de imagen para PC, cuya duracin en el tiempo (X) tiene la siguiente distribucin de probabilidad:
f X ( x ) = x2 0 si x en otro caso
donde el parmetro ( > 0) se mide en unidades de tiempo y se interpreta como la duracin mnima garantizada por el fabricante. Se pide: 1. Demostrar que el estimador mximo verosmil de es T = mn{X1, X2, ...,Xn}, a partir de una MAS c/r de X de tamao n. 2. Se observ una MAS c/r de 20 tubos de imagen de PC, vendidos hace 10 aos, de los cuales: 5 de ellos se rompieron a los 2 aos 4 se rompieron a los 3 aos 2 se rompieron a los 4 aos 2 se rompieron a los 5 aos los restantes seguan funcionando luego de 5 aos. Hallar una estimacin de a partir de la muestra observada 3. Hallar la distribucin en el muestreo de T (la funcin de densidad de T). 4. Determinar b (en funcin de y n) tal que P( < T < b) = 0.95 5. A partir del intervalo (, b) hallado: 5.1. Hallar un intervalo aleatorio al 95% para . 5.2. Hallar un intervalo de confianza al 95% para . 5.3. Cul es la diferencia conceptual entre los intervalos hallados en 5.1 y 5.2? 6. Estudiar la consistencia de T como estimador de .
13
Para conocer la proporcin de mujeres adolescentes con hijos se realiz una encuesta a 1.015 mujeres de 14 a 19 aos, mediante muestreo sin reposicin. La precisin en la estimacin del parmetro es muy relevante, porque el objetivo de la investigacin consiste en cuantificar el nmero total de madres adolescentes para proporcionarles ayuda econmica. Un estadstico analiza los resultados de la investigacin y proporciona los siguientes resultados: Estimacin puntual: 0,12 Intervalo de confianza: [0,10 0,14] Un segundo investigador revisa los datos aportados por el estadstico y concluye que los resultados estn equivocados, por los siguientes motivos: a) En primer lugar, las adolescentes con hijos en la muestra son 121, por lo que la estimacin correcta de p es 0,119. b) En segundo lugar, el nivel de confianza utilizado por el primer estadstico parece excesivo, y propone en su lugar un 92%. c) En tercer lugar, al bajar el nivel de confianza se obtiene un intervalo de amplitud ms reducida, lo cual es coherente con el principio de la mnima amplitud esperada para construir intervalos de confianza. SE PIDE: 1. Cul es el nivel de confianza utilizado por el primer estadstico para construir el intervalo [0,10 0,14]? 2. Calcular el intervalo de confianza que propone el segundo investigador (aproximar con 3 decimales). 3. Indicar si la afirmacin c) es correcta, fundamentando la respuesta.
14
1. El gerente de una compaa de mnibus debe decidir sobre la frecuencia diaria entre dos localidades. Tradicionalmente la compaa viaja 4 veces por da y algunas veces se llegan a agotar los boletos. El gerente est pensando en incrementar la frecuencia a 6 viajes diarios para lograr un mayor nmero de boletos vendidos a costa de las compaas competidoras, pero con el riesgo de viajar con muchos asientos vacos en alguna de las frecuencias con la consiguiente prdida de imagen frente a sus clientes habituales (principal preocupacin de la compaa). Cada mnibus carga como mximo 40 pasajeros. El nmero medio de pasajeros transportados hasta la fecha es 150 y se espera que con las nuevas frecuencias dicho nmero ascender a 210. 2. Un fabricante de heladeras las pinta de color blanco o celeste en las proporciones del 60% y del 40% respectivamente. ltimamente se ha notado un aumento en la demanda del color celeste al punto que se han perdido algunas ventas por falta de stock y a la inversa, se nota un incremento del stock de heladeras blancas. El gerente de produccin opina que rpidamente deberan alterarse las proporciones de heladeras que se pintan de blanco y celeste (por ej. 50% y 50%). El gerente de comercializacin no est de acuerdo pues cree que la propensin a demandar el celeste es una moda pasajera. Para tomar la decisin se consultar con una muestra aleatoria de clientes antiguos sobre el color que habrn de elegir cuando decidan cambiar de heladera. Elaborar la regla de decisin del punto de vista del gerente de comercializacin.
EJERCICIO 2 En una prueba se da un cuestionario con 15 preguntas de respuesta VERDADERO o FALSO. Se quiere probar que un estudiante contesta al azar. Para ello se adopta la siguiente regla de decisin: - Si 12 o ms respuestas son correctas el estudiante no est contestando al azar; - Si menos de 12 son correctas el estudiante est contestando al azar.
Se pide: 1. Plantear las hiptesis a comprobar. (El peor error es decir que el estudiante estudi, cuando realmente est adivinando). 2. Con la regla de decisin adoptada, cul es el nivel de significacin de la prueba?
15
H0) = 0 H1) = 1 Se sabe que considerando la regin crtica RC1: P ( Error tipo I) = 0.10 P ( Error tipo II) = 0.30
1. Cul de las regiones crticas utilizar para realizar la prueba? Fundamente. 2. Calcular la potencia de la prueba para la regin crtica elegida.
EJERCICIO 4 (Novales 10.3) Un profesor recrimina sistemticamente a un colega suyo por el nivel de exigencia, por lo que ste ltimo le ofrece corregir por separado los mismos exmenes, que se acaban de celebrar, y comparar los porcentajes de alumnos que aprueban. Tras la correccin, el primer profesor aprueba a 248 de los 400 alumnos mientras que el segundo aprueba a 214. a) Qu concluira usted a un nivel de significacin del 5% ? b) Y al 10%? EJERCICIO 5 Sea X1, X2, ...., Xn una MAS c/r de una variable XBernoulli (p) elegida para probar H0) p=0,49 contra H1) p=0,51. Usando la aproximacin normal, determinar n para que la probabilidad de ambos tipos de error no supere 0,01. EJERCICIO 6 En una poblacin normal con una media desconocida y varianza igual a 25 se desea someter a prueba H0) = 10 contra H1) = 12 a partir de una muestra de tamao n y con un nivel de significacin .
1. Hallar la forma de la RC ptima. 2. Determinar dicha RC y el valor de n para que las probabilidades de ambos tipos de error no superen 0.01.
16
x 1 exp( ) f ( x , ) = 0
x>0 x0
Si el tamao mximo del error de tipo I que puede tolerarse es de 0.15, cul de las siguientes reglas de decisin es la mejor para escoger entre las dos hiptesis? Rechazar H0 si X Rechazar H0 si X Rechazar H0 si X
9 10 11
EJERCICIO 8 (Canavos 9.4 y 9.5) La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma peridica, se escogen al azar 25 recipientes y el contenido de cada uno de stos se pesa. Se juzga al proceso como fuera de control
__
cuando la media muestral X n es menor o igual a 19.8 o mayor o igual a 20.2 onzas. Se supone que la cantidad que se vaca en cada recipiente se encuentra aproximada, en forma adecuada, por una distribucin normal con una desviacin estndar de 0.5 onzas. a) Ennciense las hiptesis nula y alternativa que son propias para esta situacin. b) Obtener la probabilidad del error de tipo I. c) Obtener y graficar la funcin de potencia para los siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5. d) Como una prueba alternativa, considrese el rechazo de H0 cuando
X n 19.5 o cuando X n 20.5 . Si el tamao mximo del error de tipo I es de 0.05, cul de las dos pruebas es la mejor? e) Supngase ahora que el tamao de la muestra se aumenta a 36 recipientes. Dados los mismos tamaos del error de tipo I para las pruebas propuestas, obtener los nuevos valores crticos y comparar las funciones de potencia de las dos pruebas.
EJERCICIO 9 (Novales 10.5) Un analista cree que la cotizacin peseta/dlar USA puede representarse por una distribucin N ( ,16) , pero no est seguro de que haya descendido en el ltimo mes por debajo de su nivel medio, que cree que ha permanecido estable en 82.5 ptas./dlar. Por tanto, se quiere constatar H0) = 82.5 frente a H1) < 82.5, y est dispuesto a rechazar la hiptesis nula de estabilidad en el tipo de cambio, si obtiene una media muestral inferior a 80.5 ptas./dlar. (Suponer que dispone de una muestra con 25 observaciones).
__
__
17
a) No se rechaza H0) porque el valor p es mayor a /2. b) Se rechaza H0) porque el valor p es menor que . c) No tenemos elementos para decidir porque no conocemos el valor de 0 . d) Ninguna de las anteriores. 18
a) No se puede calcular el nivel de significacin de la prueba porque la hiptesis nula es compuesta. b) El valor de la potencia no es nico porque la hiptesis alternativa es compuesta. c) Para calcular el valor p se necesita el valor de k. d) Ninguna de las anteriores. 3. En una prueba de hiptesis en la cual H0) = 5 contra H1) 5, cul los siguientes valores para el tamao de muestra (n) y el nivel de significacin () dar una probabilidad de error II menor? a) n = 100 y = 0.01. b) n = 200 y = 0.02. c) n = 200 y = 0.03. d) Ninguna de las anteriores.
EJERCICIO 15 Una empresa est estudiando comprar los derechos de distribucin de las camisetas de las "Tortillas Nunga". Las utilidades mensuales provenientes de esta concesin estn aproximadamente modeladas por una distribucin normal con media y varianza desconocidas. El problema que se presenta es la variabilidad mensual de las utilidades, dado que dicha variabilidad es una medida del riesgo que se asume en el negocio. La empresa, asesorada por un especialista en inversiones, decide no comprar si la desviacin tpica de las utilidades es de U$S 800 o ms.
Para decidir se toma una MAS c/r de 12 meses, en los cuales se investigan las
__
utilidades en cada uno de ellos y se obtiene que s x = 600 y x = 2.200. Se pide: (Fundamentando sus respuestas) 1. Explicar sucintamente, por qu la desviacin tpica es una medida del riesgo que se asume. 2. Definir el peor error que la empresa puede cometer y en base a ste realice una prueba de hiptesis, con el fin de determinar si la empresa compra o no, los derechos de distribucin. Utilice un nivel de significacin del 5%. 3. Con los resultados utilizados en 2, construir un intervalo de confianza para la varianza de las utilidades de Tortillas Nunga. Mark Eting, tcnico en comercializacin de productos, en un informe elevado a la gerencia, indica que la marca "Tortillas Nunga ya no es tan popular como antes y sugiere como alternativa que se compren los derechos de distribucin del fusil de asalto AK 74 de Pambo, ya que el estreno de "Pambo XXXII - En busca de su bisnieto ha aumentado la popularidad del personaje. La distribucin de las utilidades mensuales se puede modelar adecuadamente.
19
xi = 42.000
i =1
20
x
i =1
20
2 i
= 97.200.000
Construir un intervalo de confianza para la varianza de las utilidades al 95%. 5. Obsrvese que la estimacin del valor de la varianza del producto de Pambo es mayor que la de las Tortillas Nungas; por qu, para un 95% de confianza, el riesgo que se asume, en la peor situacin, es menor?
EJERCICIO 16 (Canavos 9.30) Se cree que el promedio para el nmero de respuestas correctas para la prueba SAT para las mujeres es mayor que el de los hombres por ms de diez puntos. Las muestras aleatorias para ambos sexos arrojaron los siguientes resultados:
Mujeres: n1 = 125; X n1 = 480 y S x1 = 60 . Hombres: n2 = 100; X n 2 = 460 y S x 2 = 52 . a) Si se muestrearon dos poblaciones independientes normales, se encuentra la creencia apoyada por la evidencia muestral con = 0.05? Cul es el valorp? b) Supngase que la verdadera diferencia es de 15 puntos. Cul es la potencia de la prueba anterior?
__
__
EJERCICIO 17 (Canavos 9.33) Se espera que dos operadores produzcan, en promedio, el mismo nmero de unidades terminadas en el mismo tiempo. Los siguientes datos son los nmeros de unidades terminadas para ambos trabajadores en una semana de trabajo:
Operador 1: 12; 11; 18; 16; 13 Operador 2: 14; 18; 18; 17; 16 Si se supone que el nmero de unidades terminadas diariamente por los dos trabajadores son variables aleatorias independientes distribuidas normales con varianzas iguales, se puede discernir alguna diferencia entre las medias a un nivel = 0.1?
EJERCICIO 18 (Canavos 9.46) Para el ejercicio 17 (Canavos 9.33), puede apoyarse la opinin de que la variacin en el nmero de artculos terminados para el operador 2 es menor que para el operador 1 a un nivel = 0.05?
20
37 24
19 42
21 18
35 15
16 0
4 9
0 10
12 20
63 22
25 13
Sean: 1 = promedio anual de das perdidos por enfermedad de trabajadores de 40 aos o ms. 2 = promedio anual de das perdidos por enfermedad de trabajadores de menos de 40 aos. Se pide: 1. Establecer la hiptesis nula y la alternativa para este problema, sabiendo que el peor error es afirmar que los empleados de 40 aos o ms pierden ms das de trabajo por enfermedad que los empleados menores de 40 aos cuando en realidad no es cierto. 2. Proponer un estadstico apropiado para la prueba. 3. Entre la curva normal y la distribucin t, cul es la distribucin en el muestreo adecuada? Fundamente su respuesta. 4. Establecer la regla de decisin con un nivel de significacin del 5%. 5. Cul debe ser la conclusin del jefe de personal? 6. Obtener el valor-p de esta prueba y explicar su significado.
EJERCICIO 20 Una empresa que se dedica a comercializar vlvulas realiza sus ventas en lotes de 10.000 unidades. Los compradores consideran aceptables lotes que no contengan ms de un 10% de defectuosas.
Como norma, cada venta se realiza luego de analizar los lotes a travs del porcentaje de defectuosas existentes en una muestra de tamao n. Solamente en el 2.5% de los casos la empresa est dispuesta a no vender lotes aceptables para los compradores. Al mismo tiempo se tratar de minimizar la probabilidad de que el lote se venda cuando el porcentaje de vlvulas defectuosas supere el 10%. Se pide: 1. Definir el riesgo del comprador y el del vendedor. 2. Plantear una prueba de hiptesis adecuada para decidir si la empresa vende el lote. 3. Encontrar una regin crtica ptima para dicha prueba en base a una muestra de 600 vlvulas con reposicin.
21
Se pide: 1. Qu mtodo estadstico sugerira utilizar? Fundamente su respuesta. 2. Qu informacin necesitara suministrarle la empresa para que Ud. pueda trabajar? 3. Plantear la hiptesis nula y la hiptesis alternativa y la forma de la regin crtica. 4. Si = 0.05 n = 600 X 600 =300/600. Qu canal de distribucin utilizara la empresa? 5. Identifique el peor error que se puede cometer y su probabilidad mxima. 6. Calcular la funcin de potencia para p = 0.7 e interpretar el resultado obtenido.
EJERCICIO 22 Una empresa comercial recibe del fabricante lotes de 10.000 artculos iguales que deben respetar determinadas normas:
a) Cada artculo del lote se clasifica como bueno o defectuoso segn cumpla o no con las normas preestablecidas. b) Un lote es aceptable si tiene un porcentaje de artculos defectuosos que no supera el 10%. Para decidir acerca de la compra de un lote, el comprador elige una muestra (MAS c/r) de 600 artculos del lote y cuenta el nmero de defectuosos. Si al seleccionar la muestra encuentra 66 artculos defectuosos. Se pide: 1. Qu decisin tomara la empresa comercial en base a una prueba de significacin para la proporcin de artculos defectuosos con un nivel de significacin del 1%? 2. Cul sera el riesgo del fabricante? 3. Si el verdadero porcentaje de artculos defectuosos en el lote fuera del 15%: 3.1. Cul sera el riesgo de la empresa comercial al decidir en base a esta prueba? 3.2. Calcular cul debera ser el tamao de la muestra para que el riesgo de la empresa comercial fuera del 5%.
22
EJERCICIO 24 (Novales 10.15) Halle el contraste de razn de verosimilitudes para el contraste de la hiptesis nula: 2 2 , frente a la alternativa compuesta H1) 2 0 en una poblacin, con H0) 2 = 0 asimismo desconocida. Pruebe que este contraste coincide con el contraste habitual basado en el estadstico de la chi-cuadrado.
EJERCICIO 25 (Examen 7/10/96) Las diferentes partes de este ejercicio son independientes entre s.
PARTE I Es comn que los vendedores cometan errores en las facturas, por ejemplo al escribir los precios de los productos, las cantidades vendidas y en las sumas. En una empresa se tiene la poltica de sancionar a un vendedor si este produce ms del 10 % de facturas con errores, porque pasado este lmite se considera que el vendedor trabaja "mal". Una muestra aleatoria simple con reposici6n de 1000 facturas del vendedor Juan contiene 150 facturas con errores y su supervisor decidi sancionarlo. Plantear: 1. La hiptesis nula y la hiptesis alternativa considerando que el "peor error" que se puede cometer es decidir que el vendedor trabaja "mal" cuando en realidad trabaja bien. 2. Plantear el estadstico a utilizar y su distribucin en el muestreo. 3. Hallar la regin crtica si se utiliza un nivel de significacin del 1%. 4. La decisin del supervisor es consistente con el resultado de la muestra? 5. Si en realidad el vendedor confecciona el 12 % de las facturas con error, cul es la probabilidad de error de tipo II?
23
Se desea estimar el consumo medio mensual de cerveza por persona en la poblacin montevideana. Para ello se tom una muestra de tamao 1000 personas (MAS c/r) en 1985 y se obtuvo el siguiente intervalo de confianza al 95%: (1.58; 1.82) litros por persona por mes. Se pide: 1. Probar la hiptesis nula de que el consumo promedio mensual per capita de cerveza en la poblacin de Montevideo es 1.8 litros contra la hiptesis de que es diferente de 1.8 en 1995. Utilice un nivel de significacin de 2%. 2. Probar la hiptesis nula de que el consumo promedio mensual per capita de cerveza en la poblacin de Montevideo es 1.8 litros contra la hiptesis alternativa de que es menor que 1.8 en 1995 para un nivel de significacin del 10%. 3. En su opinin, a qu se debe que ambas pruebas conduzcan a decisiones diferentes?
EJERCICIO 26 (Segunda Revisin 2000)
En una institucin de salud la Direccin Tcnica controla peridicamente la cantidad de medicamentos que se consumen en la consulta en policlnicas. Se considera razonable un consumo promedio de 1,5 medicamentos por consulta. Si en un perodo el promedio excede de 1,5 entonces los mdicos que ms recetaron son sancionados con suspensin. En cada perodo la Direccin Tcnica selecciona al azar por MAS C/R 400 pacientes que consultaron en Policlnicas y analiza el nmero de medicamentos que les fueron recetados en la ltima consulta. La Direccin Tcnica adopta la siguiente regla de decisin: si el promedio de medicamentos por consulta en la muestra es mayor que 1,6 entonces se asumir que en la poblacin de pacientes de Policlnicas el promedio supera 1,5 y se proceder a sancionar con suspensin a los mdicos ms recetadores. Para la Direccin Tcnica el peor error consiste en sancionar a los mdicos cuando en realidad no debera hacerlo. SE PIDE: 1. Plantear las hiptesis nula y alternativa apropiadas para este problema. 2. Se conoce que la varianza del nmero de medicamentos recetados por consulta es 1,44. De acuerdo con la regla de decisin, cul es el nivel de significacin de la prueba? 3. Cul es la probabilidad que con la regla establecida no se sancione a los mdicos ms recetadores si en realidad en el perodo analizado el promedio de recetas por consulta alcanza a 1,7?
24
EJERCICIO 27 (Segunda Revisin 2001) Una prueba de matemtica de mltiple opcin consta de 10 preguntas, con tres opciones de respuesta cada una, una sola correcta. Por cada respuesta correcta se obtienen 4 puntos y por cada respuesta equivocada 2. Es obligatorio responder las 10 preguntas. El puntaje mnimo para aprobar la prueba es 16 puntos. Sean: X = puntaje de la prueba e Y = nmero de respuestas correctas.
1. Hallar la relacin entre X e Y. Hallar el mnimo del Rec(X) e interpretar su significado. 2. Plantear una prueba de hiptesis para el parmetro p = probabilidad de contestar bien, sabiendo que el peor error es que el estudiante aprueba la prueba cuando en realidad est adivinando. Se tiene que indicar: H0), H1), la regin crtica y el nivel de significacin. 3. Plantear, sin calcular, la funcin de potencia de la prueba en funcin del parmetro definido en el punto 2. 4. Un alumno estudioso tiene probabilidad constante e igual a 0.7 de responder correctamente a cada pregunta. Calcular la probabilidad de que un alumno estudioso apruebe la prueba (aproximar con 3 decimales). 5. Si 300 alumnos rinden la prueba y todos ellos son estudiosos y no pueden copiarse, cul es el nmero esperado de alumnos que aprobarn la prueba? Fundamente la respuesta.
25
Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic 95 105 95 105 90 95 105 110 105 100 95 100 Si = 0.01, existe alguna razn para creer que el nmero de nacimientos no se encuentra distribuido en forma uniforme durante todos los meses del ao? Cul es el valor-p?
EJERCICIO 2 (Segunda revisin de 1998) La informacin que a continuacin se presenta es una tabulacin del nmero de goles por partido (en los noventa minutos de juego) que se registraron en el mundial de ftbol de Francia ' 98.
CANTIDAD DE GOLES 0 1 2 3 4 5 6 7 Total NUMERO DE PARTIDOS 5 10 13 19 11 5 0 1 64
1. Con un nivel de significacin del 5%. el nmero de goles por partido podra distribuirse Poisson con parmetro ? (El parmetro se determinar apropiadamente). 2. El valor-p de la prueba es menor o mayor que 0.10? Fundamente su respuesta.
EJERCICIO 3 Someter a prueba la hiptesis de que los puntajes de una prueba se distribuyen aproximadamente normal, con un nivel de significacin del 1% a partir de los datos obtenidos de una muestra de 290 estudiantes
Puntaje 0 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 40 40 - 50 Total Frecuencia 24 49 71 72 37 21 16 290
26
No fumador 12
Total 160
a) Si se supone que al comienzo del estudio haba una cantidad igual de hombres en cada una de las cuatro categoras, existe alguna razn a un nivel de = 0.01 para creer que las proporciones en estas categoras no son las mismas? b) Cmo se podra prevenir al investigador mdico del uso de la prueba de bondad de ajuste chi-cuadrado en esta situacin?
EJERCICIO 5 (Examen Febrero 1999) Un odontlogo atiende sus pacientes de lunes a viernes en jornadas de 6 horas. El odontlogo se queja, ltimamente, de un creciente cansancio, debido a que los jueves y viernes atiende ms pacientes que de lunes a mircoles. La probabilidad de que un paciente que asiste al dentista durante cierta semana, lo haga en cada uno de los das es la siguiente:
Da de la semana Da N Probabilidad Lunes 1 0.16 Martes 2 0.16 Mircoles 3 0.16 Jueves 4 0.26 Viernes 5 0.26 Por consejo de un estadstico, el odontlogo anuncia a sus pacientes que a partir del mes siguiente aumentar el horario de atencin a 7 horas de lunes a mircoles, y lo reducir a 5 horas los jueves y viernes. Transcurridos dos meses de los cambios, se selecciona una semana al azar y se obtienen los siguientes resultados: Da de la semana Da N Pacientes atendidos Lunes 1 10 Martes 2 9 Mircoles 3 11 Jueves 4 14 Viernes 5 16
27
Se pide: 1. Plantear las hiptesis nula y alternativa de los dos problemas siguientes: 1.1. Se desea saber si la distribucin nueva de pacientes es uniforme (discreta). 1.2. Se desea saber si la distribucin nueva de pacientes no cambi. 2. Indicar en el caso de la prueba 1.2 el estadstico de la prueba y su distribucin aproximada en el muestreo bajo H0. 3. Decidir en la prueba 1.2 para un nivel de significacin del 5%. Trabajar con 3 dgitos. 4. Indicar qu significa el concepto de Error Tipo II de la prueba de hiptesis desarrollada.
EJERCICIO 6 (Segunda Revisin 1996) El gerente de produccin de una empresa asegura que la demanda total semanal del producto X se distribuye aleatoriamente con funcin de densidad:
x2 si x [0 ,1 ) 2 7x2 + 10 x 6 si x [1 ,2 ] fX ( x ) = 2 0 en otro caso
donde X se mide en Kg. de producto. Para verificar la afirmacin del Gerente de Produccin, se tom una MAS c/r de la demanda en 400 semanas con el siguiente resultado: Demanda 0.0 0.5 0.5 1.0 1.0 1.5 1.5 2.0 Nmero de semanas 9 61 195 135
Se pide: 1. Para un nivel de significacin del 10% puede afirmarse que la demanda total semanal se distribuye segn la afirmacin del gerente de produccin? (Realizar los clculos con dos decimales). 2. Para un nivel de significacin del 10% y para la misma muestra, se somete a prueba la hiptesis H0) X ~ N ( 0 , 02 ) con 0 y 02 dadas, y resulta que, de acuerdo con los resultados, no se rechaza dicha hiptesis. Es este resultado coherente con el resultado del punto anterior? Fundamentar la respuesta. 28
EJERCICIO 8 Se desea investigar si existe asociacin o independencia entre ciertas categoras de la PEA y la edad de dicha poblacin. A esos efectos se eligi una muestra aleatoria de 1000 personas activas obtenindose los siguientes resultados:
EDAD CATEGORA DE LA PEA Menos de 25 Entre 25 - 60 Ms de 60 Ocupados en industria manufacturera 50 220 40 Ocupados en el comercio 60 150 20 Ocupados en los servicios 50 250 30 Desocupados 40 80 10 Someter a prueba la hiptesis de independencia entre la edad y la categora de la PEA para un nivel de significacin = 3%.
EJERCICIO 9 (Segunda Revisin 1997) Se efectu una encuesta entre 483 amas de casa que compran habitualmente yogur para determinar si existe alguna relacin entre la marca que compran ms frecuentemente y la caracterstica principal que debe tener un "buen yogur". Las marcas de yogur que existen en el mercado son: A, B, C, D y E. Las caractersticas de un "buen yogur" son: buen sabor, nutritivo, barato, sin aditivos y calidad.
Se quiere saber si existe dependencia entre la marca de yogur comprada ms frecuentemente y la caracterstica principal que debe tener un "buen yogur". Con la informacin obtenida en la encuesta se elaboraron los siguientes cuadros de valores observados y esperados.
29
Cuadro de valores observados Caracterstica principal Marca A Marca B Marca C Marca D Marca E Total Sabor Nutritivo Barato 30 28 15 14 16 103 30 28 10 13 12 93 20 18 15 16 25 94 Sin aditivos 15 16 23 27 24 105 Calidad Total 28 26 9 18 7 88 123 116 72 88 84 483
Sabor Nutritivo Barato 24.7 15.4 18.8 17.9 22.3 13.9 16.9 16.2 22.6 14 17.1 16.3
1. Determinar los valores de , y de la tabla de valores esperados. (Aproximar con un decimal). 2. Plantear las hiptesis nula y alternativa para esta prueba. 3. Sabiendo que el valor del estadstico Chi-cuadrado en la muestra es 40.45, qu decisin adoptara para un nivel de significacin del 5%? 4. El valor-p ser mayor, igual o menor que el 5%? Fundamente la respuesta.
30
1. Probar si existe independencia entre los atributos condicin de fumador y causa de fallecimiento, para un nivel de significacin del 1%. Y al 5%? 2. Estimar, a partir de los resultados de la muestra, las probabilidades de morir de cncer de pulmn condicionadas por la condicin de fumador.
EJERCICIO 11 (Canavos 10.22) Se llev a cabo una encuesta con respecto a la preferencia del consumidor para determinar si exista alguna predileccin para tres marcas competitivas (A, B y C) dependiendo de la regin geogrfica en la que habita el consumidor. Con base en una muestra aleatoria de consumidores, se obtuvo la siguiente informacin para tres distintas regiones.
Regin 1 Regin 2 Regin 3 Marca A 40 52 25 Marca B 52 70 35 Marca C 68 78 60 Con base en esta informacin, la preferencia por una determinada marca depende de la regin geogrfica a un nivel = 0.05?
31
Se pide: 1. Cuntas muestras diferentes pueden formarse? 2. Cul es la probabilidad de una muestra cualquiera? 3. Cul es la probabilidad de que w8 pertenezca a la muestra? 4. Cul es la probabilidad de que w7 y w8 pertenezcan a la muestra? 5. Sea X la edad de cada individuo de la poblacin: X(wi) = i i. 5.1. Cul es la media de las edades en la poblacin? 5.2. Cul es la cuasi-varianza de las edades en la poblacin? 6. Se eligi una muestra y result (w3, w5, w7). 6.1. Cul es un estimador insesgado de la media poblacional a partir de dicha muestra? Calcular la estimacin. 6.2. Cul es un estimador insesgado de la cuasi-varianza poblacional a partir de dicha muestra? Calcular la correspondiente estimacin. 7. Supongamos ahora otra variable Y tal que: Y(w1) = 10; Y(w2) = Y(w3) = 11; Y(w4) = 14; Y(w5) = Y(w6) = Y(w7) = 20; Y(w8) = 25 7.1. Calcular media y cuasi-varianza poblacionales. 7.2. Calcular P( |Y - | < ) con = 1, = 3, = 5.
EJERCICIO 2 Considere una poblacin = {w1, w2, w3}. Sean s1 = {w1, w2}, s2 = {w1, w3}, s3 = {w2, w3}, s4 = {w1, w2, w3} las muestras posibles con probabilidades p1 = 0.4, p2 = 0.3, p3 = 0.2, p4 = 0.1.
Se pide: 1. Calcular la probabilidad de que el elemento wi salga en la muestra seleccionada wi . 2. Calcular la probabilidad de que el par (wi , wj) con i j salga seleccionado en la muestra (wi , wj) .
EJERCICIO 3 Anualmente llegan al Balneario Las Caas unos 10.000 turistas provenientes del exterior y del interior del pas. Para conocer el gasto promedio diario de los turistas en 1996 se eligi una MAS S/R de 500 turistas. A cada uno de ellos se le pregunt por el gasto diario y se obtuvieron los siguientes resultados:
Gasto diario 100 - 200 200 - 400 400 - 600 600 - 700 Total N de turistas 100 250 130 20 500
32
EJERCICIO 5 A los efectos de estimar el ingreso medio de los hogares de una regin, se decide seleccionar una MAS S/R de una poblacin de 500.000 hogares.
Se pide: 1. Determinar el tamao de la muestra necesario para una precisin de 50 unidades monetarias y una confianza del 95% (se supone que la varianza del ingreso de los hogares es de aproximadamente 1.0002). 2. Realizada la encuesta con el tamao antes calculado, se obtuvo la siguiente distribucin de la muestra: Ingreso
100 - 200 200 - 500 500 - 1000 1000 - 2000
Frecuencia relativa
0.3 0.4 0.2 0.1
2.1. Estimar el ingreso medio por hogar y el ingreso total de la regin. 2.2. Construir intervalos de confianza para dichos parmetros al 95%.
33
Estrato 1 2 3 4 Se pide:
Varianza de los ingresos (de encuestas anteriores) 2.500 900 225 100
EJERCICIO 7 Se considera una poblacin de 12:500.000 personas activas. Se desea estimar la proporcin de desocupados. La poblacin se clasifica en dos estratos: N1 = 9:000.000 y N2 = 3:500.000 se utilizar MAE para seleccionar una muestra de 12.500 personas activas.
Se pide: 1. Determinar el tamao de muestra en cada estrato, usando asignacin proporcional. 2. Al realizar la encuesta se encontraron las siguientes tasas de desempleo en la muestra: d1 = 5% y d2 = 6%. 3. Estimar el porcentaje de desocupados en la poblacin. 4. Estimar el total de desocupados en cada estrato y en la poblacin. 5. Estimar la varianza del estimador de la proporcin de desocupados. 6. Hallar un intervalo de confianza al 95% para el total de desocupados en la poblacin. 2 7. Sabiendo que '1 = 0.06 y que ' 2 2 = 0.08 , cul debera ser el tamao total de una muestra MAEP para obtener una precisin de medio punto porcentual y una seguridad del 95% en la estimacin de la proporcin de desocupados en la poblacin?
34
DISEO 1: MAS S/R de n = 200 elementos. DISEO 2: MAE de n = 200 elementos, con las siguientes caractersticas: Se divide la poblacin en dos estratos. El estrato 1 tiene N1 = 5.000 elementos, y el estrato 2 tiene N2 = 5.000 elementos. La muestra se distribuye as: n1 = 150 elementos en el estrato 1 y n2 = 50 elementos 2 en el estrato 2. Se sabe que, siendo 12 la varianza poblacional del estrato 1, 2 la del estrato 2 y 2 la varianza total de la poblacin, se cumple la siguiente relacin:
2 12 = 4 2 = 0.9 2
Se pide: 1. Estimar la varianza de la media muestral en ambos diseos y concluir cul de ellos es ms eficiente. (Se supone que los costos no juegan). 2. Calcular la eficiencia relativa estimada del estimador de la media mediante el MAE con respecto al MAS en este caso.
EJERCICIO 9 (Segunda Revisin 1995) Una poblacin de N = 1000 individuos se dividi en dos estratos de tamao N1 = 200 y N2 = 800.
Se pide: 1. Mostrar que si las cuasi-varianzas poblacionales de dichos estratos estn en 8 = 2 , entonces, para una muestra total de tamao n se la relacin, 1 3 verifica que: el tamao de la muestra del estrato 1 (n1) por asignacin ptima resulta el doble del n1 que se obtendra mediante la asignacin proporcional. Calcular ambos ni en funcin de n y verificar la proposicin anterior.
35
Sobre una muestra (MAS s/r) de 1.000 animales no vacunados en ocasin de la epidemia anterior, murieron 250 y, Sobre una muestra (MAS s/r) de 400 animales vacunados murieron slo 40. Se pide: 1. Construir un intervalo de confianza al 95% para el nmero de animales que se espera que mueran: 1.1. Si no hay vacunacin. 1.2. Si se vacuna a toda la poblacin. 2. Plantear la forma del intervalo aleatorio utilizado para construir los intervalos de confianza del punto anterior. 3. El costo de cada animal muerto es de $ 1.000 y el costo de cada vacuna es de $ 100. Hallar el casto total esperado en caso de epidemia: 3.1. Si no hay vacunacin. 3.2. Si se vacuna a toda la poblacin. 4. Un estudio profundo por parte del Organismo de Control Sanitario ha mostrado la existencia de dos zonas de riesgo en caso de epidemia: Zona de alto riesgo: Poblacin: 100.000 animales Una muestra (MAS s/r) de 500 animales vacunados en la ltima epidemia estim la probabilidad de muerte en 0.20. Zona de menor riesgo: Poblacin: 200.000 animales Una muestra (MAS s/r) de 500 animales no vacunados en la ltima epidemia estim la probabilidad de muerte en 0.15. Si se sigue la estrategia de vacunar slo a la poblacin de animales de la zona de alto riesgo: 4.1. Estimar el nmero esperado de animales que habrn de morir en caso de epidemia (con la nueva estrategia). 4.2. Hallar el costo esperado de esta estrategia. Es ms conveniente que las anteriores? 4.3. Hallar el error estndar del estimador de 4.1.
36
1. Las relaciones entre variables explicativas de un modelo pueden ser siempre linealizadas y por lo tanto aplicar las tcnicas de modelos lineales. 2. Los supuestos clsicos en los que se basa la estimacin de modelos lineales son nicamente una primera aproximacin al tema, pues son simplificadores de la realidad. 3. El diagrama de dispersin es una herramienta muy til para ver qu clase de relacin mantienen dos variables. 4. Dado el modelo lineal simple: Yi = 0 + 1 X i + i : 4.1. Los llamados supuestos clsicos son: E( i ) = 0
E( i2 ) = 2
COV ( i , j ) = 0 i j
X i son valores fijos 4.2. Bajo los supuestos clsicos, los estimadores mnimo cuadrticos de 0 y 1 coinciden con los estimadores mximo verosmiles. 5. En el modelo lineal simple y bajo los supuestos clsicos, 0 y 1 son los parmetros del modelo, y:
Y
i =1 n
1 =
___ ___ Y X i X 2
0 = Y 1 X
___
___
___ Xi X i =1 n
son los estimadores que se obtienen por el mtodo de los mnimos cuadrados. 5.1. Los estimadores mnimo cuadrticos son insesgados. 5.2. Los estimadores mnimo cuadrticos son los que tienen menor varianza. 6. Como el modelo de regresin visto en el curso es solamente aplicable a relaciones lineales: 6.1. El modelo Yi = 0 + 1 X i + i no es estimable por mnimos cuadrados. 6.3. El modelo Yi = ( 0 + 1 log( X i ))
1
6.4. El modelo Yi = 0 . X i . i no es estimable por mnimos cuadrados. 6.5. El modelo Yi = 0 .1X i . i no es estimable por mnimos cuadrados. 37
Se pide: Evale de acuerdo a los resultados presentados para cada funcin, cul de ellas se ajusta mejor. Z t = 0 + 1t + t donde Z t es la cotizacin del dlar y t el tiempo en meses (marzo de 1985 = 1). Las estimaciones de los parmetros son 0 = 61,50 , 1 = 6,22 y
^
Se linealiz: Ln( Z t ) = Ln( 0 ) + Ln( t ). 1 + Ln( t ) Se estim el modelo y se lleg a: Ln( 0 ) = 4 ,04 , 1 = 0 ,40 y R 2 = 0,8313 .
a) Obtener el estimador de mnimos cuadrados para b) Determinar si es un estimador no sesgado de , y demostrar que V ( ) =
2 X i2
supngase E( i ) = 0 ,
a) Obtener el estimador de mnimos cuadrados para . b) Analizar las propiedades de como estimador de .
38
X i = 2.500
Yi = 2.000
i =1 i =1 10
10
Yi 2 = 590.000
i =1
i =1 10
10
2 i
= 910.000
X Y
i =1
10
i i
= 312.500
Se supone que el vector (X,Y)' puede modelarse aproximadamente por: X Y ~ N 2 ( , ) SE PIDE: PARTE I: A partir de los resultados de la muestra: 1. Obtener estimaciones de los parmetros de la distribucin de (X,Y)'. 2. Son estas estimaciones consistentes? Fundamentar. 3. Estimar el coeficiente de correlacin de (X,Y). 4. De acuerdo con los resultados obtenidos es vlida la afirmacin de que las buenas automotoras de gasoleros no son tan efectivas vendiendo autos a nafta? Fundamentar. PARTE II: Utilizando las estimaciones obtenidas en PARTE I, calcular: 1. La probabilidad que una automotora venda anualmente ms de 300 automviles a gas oil. 2. La probabilidad que una automotora venda anualmente ms de 300 automviles a gas oil sabiendo que en el ao se vendieron 100 automviles a nafta. 3. El nmero esperado de automviles a gas oil a vender por una automotora sabiendo que en el ao vendi 250 automviles a nafta. PARTE III: Supngase que los datos de la muestra corresponden a 10 automotoras seleccionadas por el nmero de autos vendidos a nafta, siendo aleatorio el nmero de autos vendidos a gas oil. Suponiendo un modelo de la forma: Yi = 0 + 1 X i + i . 1. Establecer los supuestos necesarios (y slo los necesarios) para estimar los parmetros 0 y 1 por mnimos cuadrados. 2. Establecer los supuestos adicionales para probar la significacin del modelo a travs del anlisis de la varianza, indicando el papel que desempean cada uno de los supuestos en dicho anlisis. 3. Estudiar la significacin del modelo para un nivel del 5%.
39
AOS 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
Valores en N$ de 1978 CP PBI 21.972 25.857 22.118 25.888 22.281 25.486 22.382 25.579 21.986 26.383 22.758 27.930 22.239 29.043 22.158 29.384 22.919 30.930 24.163 32.838 26.232 34.808 26.854 35.469 24.257 32.138 21.926 30.257 20.556 29.532 20.764 29.738 Fuente: BCU
Se pide: 1. Establecer los supuestos necesarios para estimar la relacin deseada. 2. Realizar el diagrama de dispersin. 3. Estimar el modelo lineal simple: CPt = 0 + 1 PBI t + t por mnimos cuadrados.
2 ) y la varianza de los estimadores. 4. Estimar la varianza de los residuos ( 5. Calcular e interpretar el coeficiente de determinacin (R2). 6. Observar la siguiente salida de la opcin de regresin del Excel aplicada a este problema particular. Identificar los elementos que se han estudiado en el curso.
40
Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Grados de Libertad Regresin 1 Residuos 14 Total 15 0.7413 0.5495 0.5174 12.047 16 Suma de Cuadrados 247.852 203.173 451.025 Promedio de cuadrados 247.852 14.512 F Valor crtico de F 0.0010
170.787
Coeficien Error tpico tes Intercepcin Variable X 1 110.605 0.4002 28.681 0.0968
EJERCICIO 7 Se plantea un modelo simple Yi = 0 + 1 X i + i y en base a las observaciones del par ( X i ,Yi ) se obtuvieron los siguientes resultados:
X i = 37,20
i =1
10
X i2 = 139,42
i =1
10
Yi = 78,75
i =1
10
Yi2 = 622,64
i =1
10
X Y = 294,05
i =1 i i
10
n = 10
Se pide: 1. Estimar los parmetros explicitando los supuestos utilizados: 1.1. Utilizando las frmulas del modelo lineal simple. 1.2. Utilizando = ( X' X ) X' Y . 2. Determinar las varianzas de los estimadores mnimo cuadrticos. 3. Calcular R2. 4. Construir un intervalo de confianza del 95% para 1 , suponiendo distribucin normal de los residuos i . Analizar la significacin del modelo.
^ 1
41
Se obtuvieron los siguientes datos: Autoimagen 2 3 5 8 Se pide: 1. 2. 3. 4. 5. 6. Determine la media de la variable explicada y la media de la variable explicativa. Estime la recta de regresin lineal. Determine los valores estimados del consumo mensual de cosmticos. Determine los errores estimados. Determine el coeficiente de correlacin lineal. Explique qu dificultad se presenta cuando se intenta probar la significacin del modelo. 7. Explicite para este caso los supuestos del modelo necesarios para probar la significacin del modelo. Consumo mensual de Cosmticos 1 3 7 13
EJERCICIO 9 El gerente de una cadena de heladeras desea usar la temperatura ambiental promedio para predecir las ventas diarias de halados. Para ello recoge datos para una muestra aleatoria de 10 das.
Ventas diarias (en kg.) Yi 110 127 140 151 89 187 205 190 136 165
42
X i = 858
i =1
10
X i2 = 74.740
i =1
10
Yi = 1.500
i =1
10
Yi 2 = 237.366
i =1
10
X Y
i =1 i
10
= 132.369
Se pide: 1. Calcular la ecuacin de regresin lineal. 2. Interpretar el valor obtenido de la pendiente de la recta. 3. Calcular el residuo para el primer da. 4. Calcular el error estndar de estimacin. 5. En el caso de una prueba de hiptesis donde se dice H0) 1 0 contra H1) 1 > 0 5.1. Cul es la regin crtica apropiada? 5.2. Cul sera la conclusin para = 2.5%? 5. 3. Interprete el resultado obtenido. 6. Calcular el R2 e interpretar su valor. 7. Sabiendo que la conversin de grados Fahrenheit a grados Celsius es 5 Grados Celsius = (Grados Fahrenheit - 32) x 9 calcular la temperatura media y la desviacin estndar de la temperatura en los diez das en grados Celsius.
EJERCICIO 10 (Examen Agosto 1999) El Cr. Jota Erre tiene una teora por la cual el tipo de cambio promedio mensual interbancario vendedor (Yt) tiene incrementos fijos e iguales mes a mes, a partir de un cierto valor inicial. En cambio, el Ec. Equis Zeta cree que la variable Yt crece, a partir de un cierto valor inicial, a una tasa constante todos los meses.
Se pide: 1. Plantear un modelo lineal de acuerdo con la teora del Cr. Jota Erre. 2. Plantear un modelo adecuado para el Ec. Equis Zeta y explicar cmo se debe proceder para "linealizar" el modelo. 3. Para comprobar la teora del Cr. Jota Erre se seleccionaron 10 meses consecutivos y se observ el valor de la variable Yt. Para los datos que se presentan a continuacin, estimar el modelo. T 1 2 3 4 5 6 7 8 9 10 Yt 10.4 10.6 10.6 10.7 10.8 10.9 10.9 10.9 11.0 11.2 4. Calcular los 10 residuos o errores de estimacin para la muestra extrada. 5. A partir de los resultados de la parte anterior, estimar la varianza del modelo. 6. Explicar qu supuesto es necesario agregar a los supuestos clsicos para realizar una prueba de significacin del modelo, y explicar cmo interviene dicho supuesto en el desarrollo de la prueba. 7. Probar la significacin del modelo para un nivel del 5%. 8. Realizar una prediccin puntual del valor esperado de Y15. 9. Construir un intervalo de confianza para E(Y/t=15) para una seguridad del 95%. 43
* Hay que seleccionar previamente, y no al azar, los jefes de hogar segn ciertos valores prefijados del ingreso de los hogares. * Hay que seleccionar previamente, y no al azar, los jefes de hogar segn ciertos valores prefijados de los aos de educacin formal. * La seleccin de los hogares debe hacerse de tal forma de evitar que haya correlacin entre los residuos del modelo. * La variabilidad de los ingresos, para cada valor prefijado de los aos de educacin, debe ser constante. * La variabilidad de los ingresos, para cada valor prefijado de los aos de educacin, debe ser proporcional a los aos de educacin. * Los residuos del modelo tienen distribucin normal. * Los residuos del modelo tienen distribucin uniforme continua. * El valor esperado de los errores, para cada valor prefijado de los aos de educacin, es constante. * El valor esperado de los errores, para cada valor prefijado de los aos de educacin, es nulo. Se pide: 1. Establecer cules de los supuestos anteriores son necesarios para estimar los parmetros del modelo. 2. Se dispone de los siguientes datos de 15 hogares: Y = "ingreso promedio mensual (en miles de $) X = "aos de educacin formal"
X
i =1
15
= 151
X
i =1
15
2 i
= 1.747
Y = 167 Y
i =1 i i =1
15
15
= 2.081
X Y = 1.879
i =1 i i
15
Obtener la ecuacin estimada de la recta de regresin (aproximar a 2 decimales). 3. Qu interpretacin tienen los coeficientes estimados en este problema? 4. Calcular las estimaciones de las varianzas de los coeficientes estimados. 5. Obtener un intervalo de confianza al 95% para 1. Explicitar los supuestos necesarios. 6. Es significativa la variable X para explicar la Y para un nivel del 5%? Fundamente la respuesta sin realizar clculos.
44
La representacin grfica de dichos datos y de la recta de regresin lineal aparece en la grfica siguiente (diagrama de dispersin).
r e g r e s i n li n e a l
12 10 8 y 6 4 2 0 0 2 4 x 6 8
El siguiente cuadro presenta parte de la salida de la opcin Regresin de Excel. Resumen Estadsticas de la regresin Coeficiente de determinacin R^2 Error tpico Observaciones ANLISIS DE VARIANZA Grados libertad 1 4 5 de Suma de Promedio de F cuadrados los cuadrados 16.0000 16.0000 7.4074 8.6400 2.1600 24.6400 Estadstico t valor-p 7.9682 0.0013 -2.7217 0.0529
0.649
1.470 6
Intercepcin Variable X 1
45
1. Calcular el coeficiente de correlacin r entre X y Y. 2. Calcular el valor-p asociado al estadstico F=7.4074, fundamentando su respuesta. 3. Qu porcentaje de la variacin total de la variable Y es explicada por el modelo? 4. Someta a prueba la significacin del modelo en su conjunto para un nivel = 7% (s, siete por ciento). 5. Construya un intervalo de confianza al 95% para el parmetro 2 , varianza de los residuos del modelo.
EJERCICIO 13 (Canavos 13.4, 13.6 y 13.8) Una compaa local de energa seleccion una residencia tpica para desarrollar un modelo emprico para consumo de energa (en kilowatts por da) como una funcin de la temperatura promedio diaria durante los meses de invierno. Se obtuvo la siguiente informacin durante un perodo de 15 das.
Temperatura (C) Consumo energtico 0 70 8 57 7.5 60 13.5 14 63 57 8.5 66 4.5 67 -11 -7.5 -8.5 1.5 88 80 0.5 64 2 79 -6 82 -4 97
107 96
Se pide: 1. Graficar los datos. Sugiere la grfica una asociacin lineal? 2. Para un modelo lineal simple, obtngase la ecuacin estimada de regresin y grafquese sobre la grfica de la parte a). 3. Interprtense los coeficientes de regresin estimados. 4. Qu se recomendara a la compaa para mejorar el modelo emprico? 5. Dada la ecuacin de regresin estimada en la parte b) calclense los residuos. 6. Verifquese que se cumplen las propiedades: 7. Obtngase la varianza residual. 8. Calclense los estimadores de las desviaciones estndar de 0 y 1 . 9. Obtngase un intervalo estimado de confianza del 95% para el valor real de la pendiente. 10. Determnese si una relacin lineal entre la temperatura atmosfrica promedio y el consumo de energa es estadsticamente discernible para un nivel = 0.05. 11. Para cada temperatura atmosfrica, calclense los intervalos de confianza del 95% estimados para el uso medio de energa y grafquense stos contra la recta estimada de regresin. 12. Estmense los consumos individuales de energa para las siguientes temperaturas: -10, -8, -5, -2, 1, 4, 7, 10, y 13. Obtnganse intervalos de prediccin del 95% para las estimaciones.
Yi = Y i y
i =1 i =1
X e
i =1
i i
=0
46
i = 36
i = 36
i = 36
i = 36
SE PIDE: 1. Plantear el modelo explicativo de las ventas semanales en funcin de la semana del mes. 2. Estimar 0 y 1. 3. Interpretar el valor estimado de 1 en este problema. 4. Es el modelo significativo para un nivel del 5%?
EJERCICIO 15 (Examen Febrero 2000) (Las distintas partes son independientes entre s.)
PARTE A
Dada Yi / X i = xi ~ Poisson( xi ) i = 1,2,...., n Se pide: 1. Plantear la regresin de Y sobre X. 2. Hallar el estimador por mnimos cuadrados de con los supuestos habituales.
47
Para un modelo lineal simple Se pide: 1. Probar que S ^ = 1 S XY , siendo Y el valor estimado por el modelo para Y.
YY ^ ^
S^
Y
SX
.
2
2 S XY R = 2 2 S X SY
S ^2
hallar la relacin entre R
2
YY
S ^2 S 2
Y Y
PARTE C
Se estiman por mnimos cuadrados y para n = 50 varios modelos: ( i ) Yi = 0 + 1Xi1 + i para el que se obtiene R2 = 0,2527. Se piensa en la especificacin alternativa: ( ii ) Yi = 0 + 1Xi1 + 2Xi2 + i Para tener una idea de qu tan buena es la variable X2 para explicar Y se estiman los modelos: ( iii ) Yi = 0 + 1Xi2 + i para el que se obtiene R2 = 0,4709. ( iv) Xi1 = 0 + 1Xi2 + i para el que se obtiene R2 = 0,0067. SE PIDE: Analizar si son verdaderas o falsas las siguientes afirmaciones. Justificar. 1. Para el modelo ( i ) la variable X1 es significativa al 1%. 2. X1 y X2 son casi incorrelacionadas, mientras que Y y X2 tienen un coeficiente de correlacin muestral de 0,6862. 3. La especificacin ( ii ) tendr un R2 mayor que la ( i ) y la ( iii ).
EJERCICIO 16 (Examen) En la automotora EL AUTO MEDIO, todos los meses se venden de 10 a 20 autos de diferentes marcas y modelos. Todos los meses el dueo de la empresa - egresado de C. Econmicas- calcula el valor promedio de los autos vendidos para comparar con meses anteriores. En los primeros 12 meses observa los valores de la tabla adjunta. En el mes 13 se obtiene un promedio de U$S 10.300. Luego de pensarlo, el dueo afirma que debe haberse cometido un error, porque de acuerdo con el Teorema Central del Lmite, la prediccin ms razonable para el mes 13 es un valor entre U$S 11.600 y U$S 12.400. La informacin recabada se presenta en la siguiente tabla:
1 2 3 4 5 6 7 8 9 10 11 12 11.3 11.2 11.5 11.6 11.8 11.5 11.4 11.6 11.8 11.6 12.0 11.9
X i2 = 650
i =1
12
12
X Y = 912.200
i =1 i i
12
Se pide: 1. Es cierta la afirmacin del dueo de la empresa? Fundamentar la respuesta, explicando el significado del Teorema Central del Lmite. 2. Si se utiliza el mes como variable explicativa, formular un modelo lineal simple para explicar el valor promedio de los autos vendidos y estimar los parmetros 2 del modelo ( 0 ,1 , ) utilizando los datos de los primeros 12 meses. 2 3. Calcular R y comentar el resultado obtenido.
^ ^
4. Calcular Y 13 segn el modelo estimado. La diferencia entre Y 13 y Y13 se debe a que a partir del mes 13 se elimin un impuesto del 20% sobre el valor de venta de los automviles. Se quiere estimar un nuevo modelo para explicar el valor promedio mensual de los autos vendidos sin el impuesto con los primeros 12 datos, utilizando otra vez el mes como variable explicativa. Encontrar la relacin
2 entre las estimaciones de los parmetros del modelo original ( 0 , 1 , ) y los ^ ^ ^
2 del nuevo modelo ( 0 ,1 , ) (sin calcular). ^ * 5. Calcular Y13 a partir del nuevo modelo y hallar un intervalo de confianza al 95% ^ * ). para el parmetro E( Y13
49
1. El modelo lineal general, es decir, aquel que implica considerar ms de una variable explicativa, es ms real en virtud de que pocos fenmenos se explican solamente por una variable como supone el modelo simple. 2. En el modelo Yi = 0 + 1 X i + i probar la significacin del modelo en general 3. implica probar la hiptesis de 1 = 0. En el modelo lineal general Y = X + , explicar la forma que tienen los vectores Y y y la matriz de observaciones X en el caso de tener ms de dos variables explicativas (adems del trmino independiente). Asimismo, explicitar la forma del vector de los coeficientes . El diagrama de dispersin es una herramienta muy til para ver qu clase de relacin mantienen dos variables. El anlisis de la varianza constituye un instrumento para estudiar los efectos parciales que pueden tener una o ms de las variables en la explicacin de la varianza estimada. El coeficiente de determinacin R2 aumenta su valor con el nmero de variables explicativas consideradas, lo que constituye un elemento negativo del indicador. Indique como puede solucionarse este problema.
4. 5.
6.
EJERCICIO 2 Una empresa que vende productos de venta masiva est estudiando el comportamiento de sus ventas en los ltimos 8 aos. Como en el mercado existe nicamente una empresa competidora, con niveles similares de precio y calidad, se observa la relacin entre las ventas anuales (Yi), los gastos en publicidad de la propia empresa (Xi,1) y los gastos en propaganda de la competidora(Xi,2). Se observaron los siguientes datos:
i 1 2 3 4 5 6 7 8
Xi,1 10 15 20 25 30 35 40 45
Xi,2 5 5 8 10 12 15 20 25
50
2. En base a los resultados hallados someter a prueba la hiptesis de significacin del modelo en su conjunto a un nivel de significacin del 5%. 3. Realizar el anlisis de la varianza confeccionando el cuadro correspondiente.
EJERCICIO 3 Una empresa de mnibus utiliza el siguiente modelo lineal para explicar los costos de reparacin y mantenimiento de sus unidades:
COSTOS i = 0 + 1 KMVIAJ i + 2 EDADi + i COSTOS i = total de costos anuales de reparacin y mantenimiento del i-simo vehculo. KMVIAJ i = miles de kilmetros viajados por el i-simo vehculo. EDADi = antigedad en aos del i-simo vehculo. Procesados los datos en Excel se obtiene la siguiente salida: Resumen Estadsticas de la regresin Coeficiente de correlacin 0.901241 mltiple Coeficiente de 0.812237 determinacin R^2 R^2 ajustado 0.780943 Error tpico XXX Observaciones XXX
51
ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total XXX XXX 14 Promedio Suma de de F Cuadrados Cuadrados XXX XXX 25.95512 32785.31 XXX XXX Estadstico t Probabilidad XXX XXX 3.7363434 0.030 0.00 0.003 Valor crtico de F 0.000
Se pide: 1. Completar la salida calculando los datos faltantes. 2. Cmo interpreta el valor de los i obtenidos? 3. Construir intervalos de confianza al 95% para 1 y 2 . 4. Analizar la validez del modelo. 5. El gerente de la empresa afirma que los kilmetros viajados no influyen significativamente en los costos. Qu comentario le merece esta afirmacin? 6. Sera pertinente excluir alguna de las variables incluidas?
EJERCICIO 4 En una empresa se desea explicar el salario actual de sus funcionarios mediante el siguiente modelo de regresin lineal:
SALi = 0 + 1 EDUCi + 2 EDADi + 3 SALINIC + i SALi = Salario actual EDUCi = Nivel educativo EDADi = Edad del funcionario SALINIC = Salario con que ingres en la empresa Para los datos de todos los funcionarios se obtiene el siguiente resultado: Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones 52
ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 3 470 473 Coeficientes 135.90 298.04 -58.95 1.73 Suma de Cuadrados Promedio de F Cuadrados Valor crtico de F 0.000
17685582341 5895194114 632.43 4381056929 9321397.72 22066639270 46652514.3 Error tpico 983.58 67.21 12.53 0.059 Estadstico t 0.138 4.434 4.629 29.331 Probabilidad 0.8902 0.000 0.000 0.000
1. Construir un intervalo de confianza al 95% para el coeficiente de la variable nivel educativo e interpretar sus resultados. 2. Determinar si el modelo es significativo al 5%. 3. Plantear la prueba de hiptesis que permita contrastar si la variable edad influye negativamente en el salario actual. 4. Es correcta la siguiente interpretacin de la salida? En promedio, al aumentar la edad disminuye el salario? Fundamentar la respuesta.
EJERCICIO 5 Se desea estimar el gasto de los hogares montevideanos en funcin de la edad del jefe/a del hogar, la cantidad de integrantes del hogar y la situacin ocupacional del jefe/a. Para ello se definieron las siguientes variables:
GASTO: Gasto del hogar. EDAD: Edad del jefe/a. CANTIDAD: Cantidad de integrantes del hogar. OCUPADO: Variable binaria que vale 1 si el jefe/a esta ocupado y 0 en otro caso. DESOCUPADO: Variable binaria que vale 1 si el jefe/a esta desocupado y 0 en otro caso. Se pide: 1. Indicar qu supuesto del modelo de regresin lineal no se cumple. 2. Indicar cmo debe interpretarse el coeficiente estimado para la variable OCUPADO.
53
MODELO 1 Estadsticas de la regresin Coeficiente de correlacin Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Regresin Residuos Total
0.9525 xxxx 0.9029 32.194 xxxx Grados de Suma de Cuadrados F libertad cuadrados medios 1 38 39 3849.62 393.86 4243.48 3849.62 10.36 371.42 Valor p 0.0000
Intercepcin x1 MODELO 2 Estadsticas de la regresin Coeficiente de correlacin Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Regresin Residuos Total
Inferior 95%
Superior 95%
xxxx 2.83
xxxx 3.49
0.9528 0.9079 xxxx 32.504 40 Grados de Suma de Cuadrados F libertad cuadrados medios 2 37 39 Coeficient 72.649 31.413 0.0870 xxxx 390.92 xxxx Error 0.5142 0.1690 0.1649 xxxx xxxx 182.32 Valor p 0.0000
Intercepcin x1 x2
Inferior 95%
Superior 95%
54
EJERCICO 7 (Examen Marzo 2003) El Gerente General de una empresa que comercializa diversos productos por catlogo est interesado en encontrar la relacin que existe entre las ventas semanales (en U$S) y las siguientes variables:
X1 = Cantidad de catlogos que se imprimen por mes X2 = Cantidad de pginas de los catlogos X3 = Tamao de las pginas de los catlogos (en cm2) X4 = Nmero de lneas telefnicas disponibles para recibir los pedidos X5 = Amplitud del horario de atencin telefnica (en horas semanales). Para estimar un modelo de regresin lineal mltiple, el Gerente General solicita a un estadstico que seleccione una muestra apropiada de semanas que represente adecuadamente las diferentes combinaciones de las variables Xi. Seleccionada la muestra se realizaron diversos clculos, algunos de los cuales se presentan en el siguiente cuadro. Modelo: Yi = 0 + 1 . X i1 + 2 . X i 2 + 3 . X i 3 + 4 . X i 4 + 5 . X i 5 + i Variable R2 = 0,750000 2 R corregido = 0,721591 Intercepto n X1 ( y i y ) 2 = 4.000.000 X 2 i =1 X3 X4 X5 Coeficiente +12.180,0 +1,5 +48,0 -0,8 +60,0 +20,0 p-valor 0,0027 0,0184 0,4132 0,0408 0,0087 0,6600 x1 = 10.000 x 2 = 50 x3 = 600 x4 = 6 x5 = 40
1. Plantear el modelo estimado. 2. Cul fue el tamao de la muestra? Explicite sus clculos. 3. Calcular la Variacin Explicada (SCReg) y estudiar la significacin del modelo al 5%, explicitando las hiptesis, el estadstico y su distribucin y la Regin Crtica. 4. Qu variables son significativas al 5%? Justificar la respuesta.
55
7.4) Sabiendo adems que el estadstico-t para 1 es 9,798, deducir la parte de la variacin total explicada por el nuevo modelo. 7.5) Utilizando el nuevo modelo, realizar una prediccin de las ventas de una semana en que se imprimirn 12.000 catlogos, y construir un intervalo para la prediccin al 95%.
56
e x si x Sea la variable aleatoria X con funcin de densidad fX(x) = si x < 0 Sea (X1, X2,,Xn) una MAS C/R de X. (Observe que Y = X tiene distribucin Exponencial de parmetro = 1).
SE PIDE: 1. Hallar la distribucin del estadstico T = Mx(Xi). ~ ). 2. Hallar el estimador de por el mtodo de los momentos ( ~ ). 3. Calcular ECM( ~ converge en probabilidad al parmetro . 4. Probar que
EJERCICIO 2 (8 puntos) Un camin cargado de 1.200 cajones de naranjas debe atravesar un puesto de control. Las Autoridades slo permiten continuar al camin si la carga no excede las 10 toneladas. La capacidad del camin es de 12 toneladas y las Autoridades entienden que la carga podra exceder del lmite permitido. Como la opcin de pesar toda la carga sera muy complicada, se decide seleccionar una MAS S/R de 100 cajones, resultando un promedio de 8 kilos por cajn, con una cuasi-varianza en la muestra de 3 Kg2.
SE PIDE: 1. Construir un intervalo de confianza al 95% para el peso total de la carga. 2. Cul es la probabilidad aproximada que la carga supere las 10 toneladas?
EJERCICIO 3 (12 puntos) El gerente de marketing realiz una investigacin de mercado para decidir sobre la conveniencia de lanzar un nuevo producto al mercado. La decisin sera afirmativa si ms del 20% de los consumidores consultados se muestra interesado por el nuevo producto. Se seleccion una MAS C/R de tamao n en la que se encontr que el 24% estaba interesado en el producto. Como se defini Xi = 1 si el entrevistado i est interesado en el producto y 0 en caso contrario y se eligi RC = {Muestras: x > 0,2329} con un = 0.05, el gerente decidi rechazar H0) p 0,2.
a) Determinar el tamao de muestra utilizado. b) Cul sera la decisin (lanzar el nuevo producto / no lanzarlo) si fuera = 0.04?
EJERCICIO 4 (15 puntos) El Profesor Teo Primo opina que el puntaje de la Primera Revisin de Estadstica II se puede explicar mediante un modelo lineal exclusivamente con el nivel de asistencia a clase de los alumnos. Para comprobar esta afirmacin Teo seleccion, de la poblacin que rindi la Primera Revisin de Estadstica II, una muestra de 45 alumnos con la siguiente distribucin.
Sean: Yi = Puntaje de la Primera Revisin de Estadstica II del alumno i xi = N de clases del primer semestre a las que asisti el alumno i 57
SEGUNDA REVISIN 2005 EJERCICIO 4 (continuacin) NMERO DE CLASES A LAS QUE ASISTIERON EN EL PRIMER SEMESTRE 40 36 32
= 10 + 0,3. x Y i i
R 2 = 0,72
SE PIDE: 1) Calcular 2) Deducir
(x
i i
(y
y) .
2
58