Vous êtes sur la page 1sur 59

LIBRO DE PRCTICAS DEL SEGUNDO SEMESTRE ESTADISTICA II CURSO 2009

CONTENIDO PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES...... 1 PRCTICA 10: ESTIMACIN PUNTUAL .......................................................... 5 PRCTICA 11: ESTIMACIN POR INTERVALO ............................................ 9 PRCTICA 12: PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS........................................................................... 15 PRCTICA 13: PRUEBA DE HIPOTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA ..................................................................... 26 PRCTICA 14: MUESTREO DE POBLACIONES FINITAS .......................... 32 PRCTICA 15: MODELO DE REGRESIN SIMPLE..................................... 37 PRCTICA 16: MODELO DE REGRESIN MLTIPLE............................... 50 SEGUNDA REVISIN 2005.. 57

PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES

PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES


EJERCICIO 1 Sea X1, X2, X3 y X4 una MAS c/r de tamao cuatro de X ~ FX ( x; ) con E( X ) = desconocida y V ( X ) = 2 < . 1. De las siguientes estadsticas cules son estimadores insesgados de ?
1 (X 1 + X 2 ) + 1 (X 3 + X 4 ) 6 3 1 T2 = ( X 1 + 2 X 2 + 3 X 3 + 4 X 4 ) 5 1 T3 = ( X 1 + X 2 + X 3 + X 4 ) 4 1 T4 = ( X 1 + X 4 ) 2 T1 =

2. Entre los estimadores insesgados de hallados, cul es el que tiene la varianza ms pequea? Cules son las eficiencias relativas de los dems estimadores insesgados con respecto al que tiene la varianza ms pequea? EJERCICIO 2 Sea X1, X2,..., Xn una muestra aleatoria simple con reposicin de una cierta poblacin con media y varianza 2. 1. Demostrar que T = a i X i es un estimador insesgado de para cualquier
i =1 i =n

conjunto de constantes conocidas tales que 2. Si

a
i =1
2

i =n

= 1 (i=1,2,..., n).
1 n

a
i =1

i =n

= 1 , demostrar que V(T) se minimiza si ai =

Sugerencia: observar que

ai =
2
i =1

i =n

1 1 ai + , cuando n n i =1

i=n

a
i =1

i =n

=1

3. Dada X1, X2, X3, X4 MAS c/r de X Fx(x), se define el estadstico: T = (0.2 X 1 + 0.1X 2 + 0.4 X 3 + 0.3 X 4 ) como estimador de . Analizar el ECM(T). 4. Se define otro estimador de , T* = 2, cualquiera sea la muestra. Sabiendo adems que E(X2) = 2 2, comparar el ECM(T) y el ECM(T*). Cul de los dos estimadores elegira Ud., T T*? 1

PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 3 Sea X1, X2,..., Xn MAS c/r de una variable aleatoria X con densidad dada por:

ke x f ( x , ) = 0
Se pide:

x x<

1. Determinar k de modo que sea efectivamente una densidad. 2. Para el k hallado, calcular E(X) y V(X) 3. Hallar la funcin de densidad de Z= mn {X1, X2, ...,Xn} 4. Determinar E(Z) 1 5. Demostrar que * = Z es un estimador insesgado de . n __ 1 6. Sabiendo que V(Z) = 2 , comparar * con ** = X n 1 como estimadores de . n EJERCICIO 4 Sea X U(0,b) con b > 0 y X1, X2,..., Xn una MAS c/r de una variable aleatoria X. Se proponen como estimadores de b:
__

T1 = 2 X n T2 = mx {X1, X2, ...,Xn} Se pide: 1. Comparar el ECM de T1 y T2. 2. Encontrar la distribucin exacta de T2. 3. Para n suficientemente grande encontrar la distribucin aproximada de T1. 4. Comparar los resultados hallados en 2. y 3.

EJERCICIO 5 (Canavos 8.7) Se muestrea una poblacin cuya distribucin es exponencial con una densidad dada por: x 1 x>0 exp( ) f(x,) = x0 0 1. Mediante el uso de la cota de Cramer-Rao determinar la varianza del estimador insesgado de varianza mnima de . 2. Deducir que el estimador eficiente de es la media muestral.

PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 6 Sea una MAS c/r de una variable aleatoria X discreta con funcin de cuanta dada por: 1 2 (1 ) si x = 1 x = 1 pX ( x ) = si x=0 donde [0,1] es un parmetro desconocido. Se considera
* =

1 1 n Yi con Yi = n i =1 0

Xi = 0 Xi 0

Se pide: 1. Mostrar que * es un estimador insesgado para . 2. Mostrar que * es de mnima varianza. 3. Mostrar que * es asintticamente eficiente, asintticamente normal y hallar su media y su varianza asinttica. EJERCICIO 7 (Novales 9.8) Demostrar que la media muestral es un estimador suficiente para el parmetro de la densidad exponencial.

EJERCICIO 8 (Novales 9.9) Demostrar que la media muestral es un estimador suficiente para el parmetro de la distribucin de Poisson.

EJERCICIO 9 Sean X ~ N , 2 y X1, X2,..., Xn MAS c/r de X

Se pide: 1. Investigar la eficiencia de X n como estimador de ? 2. Si 2 = 1 Es X n suficiente como estimador de ? 3. Probar que ( X n )3 es suficiente como estimador de , mientras que ( X n )2 no lo es. 4. Si = 0 Es S2 suficiente como estimador de 2?
__ __ __ __

PRCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 10 (Novales 9.31) Utilice la desigualdad de Chebychev y la descomposicin del ECM en suma de varianza y sesgo al cuadrado para probar que si la varianza de un estimador asintticamente insesgado tiende a cero al aumentar el tamao muestral, dicho estimador es consistente. EJERCICIO 11
__

Demostrar que X n calculado en base a X1, X2,..., Xn, MAS c/r de X es consistente como estimador de E(X) si: a) X Bernoulli (p). b) X Fx(x) con y 2 finitas

EJERCICIO 12 Dada X1, X2,..., Xn MAS c/r de X Fx(x) se define:

Fn* ( a ) =
Se pide:

1 n

i =1

{ X i a}

con a constante.

1. Qu se requiere para que Fn ( a ) sea un estadstico? 2. Calcular su esperanza y varianza en funcin de p = P(X a) 4. Demostrar que dicho estadstico es consistente para estimar p = P(X a)

PRCTICA 10: ESTIMACIN PUNTUAL

PRCTICA 10: ESTIMACIN PUNTUAL


EJERCICIO 1 Determinar los estimadores mximo verosmiles y los estimadores por el mtodo de los momentos de los siguientes parmetros: 1. p en una distribucin B(x,n,p), con n conocido y tamao de muestra m 2. en una distribucin Poisson() 3. en una distribucin Exponencial de media 1/ 4. a en una U(a,1) 5. y 2 en una N , 2 .

EJERCICIO 2 Una variable discreta toma los valores 0,1 y 2 con funcin de cuanta: pX(0,p) = p2 pX (1,p) = 2p (1-p) pX (2,p) = (1-p) 2

siendo p, 0<p<1, un parmetro desconocido. Estimar p aplicando mxima verosimilitud y el mtodo de los momentos, a partir de una muestra de tamao 100 en la que se ha presentado 22 veces el 0, 53 veces el 1 y 25 veces el 2. EJERCICIO 3 (Segunda Revisin 1989) Se desea estimar el parmetro en base a una MAS c/r de tamao 3. El espacio paramtrico es = {0,1,2,3}. De la muestra se determin que: 1 / 5 1 / 4 P (X1 = x 1 , X 2 = x 2 , X 3 = x 3 ) = 1 / 3 1 / 2 si si si si =0 =1 =2 =3

Determinar la estimacin mximo verosmil de . Fundamentar. EJERCICIO 4 Sea X una variable aleatoria con densidad dada por: x 2 fX ( x) = 2 x 2 Se pide: 1. Hallar MV para X1 de X (MAS de tamao 1). 2. Hallar MM .

si si

0< x< con R + x 2

PRCTICA 10: ESTIMACIN PUNTUAL EJERCICIO 5 (Examen de Marzo de 1995) Sea X ~ U(-1/2 , +1/2) y sea X1, X2, ..., Xn una MAS c/r de tamao n de la v.a. X. Sea T = mx {X1, X2, ..., Xn}. Se pide: 1. Hallar la distribucin en el muestreo de T t Rec(T). 2. Probar que: 1 n E( T ) = + 2 n +1 3. Sea T* = T-1/2 un estimador de . Probar que T* es asintticamente insesgado. 4. Sea T** el estimador de por el mtodo de los momentos. Estudiar la eficiencia asinttica de T**. EJERCICIO 6 Sea X una variable aleatoria tal que:

1 p X ( x, ) = 4

si si

x = 2, x = 1, x = 1, x = 2 x=0

Una MAS c/r de X de tamao n=50 arroj estos resultados: 10 observaciones valieron -2 10 observaciones valieron -1 20 observaciones valieron 0 5 observaciones valieron 1 5 observaciones valieron 2 Se pide: 1. Hallar el campo de variacin de , es decir el espacio paramtrico, . 2. Hallar MV . 3. Para calcular el estimador de por el mtodo de los momentos se presenta un problema con el momento de primer orden. Cul es ese problema y cmo podramos calcular una estimacin de por el mtodo de los momentos?. 4. Hallar con el procedimiento propuesto en el punto anterior y para la muestra obtenida, la estimacin por el mtodo de los momentos.

PRCTICA 10: ESTIMACIN PUNTUAL


EJERCICIO 7 Sea X una variable aleatoria con funcin de densidad: 3x 2 0 xa f X ( x) = a 3 0 en otro caso Se pide:

1. Hallar la funcin de verosimilitud L(a) para una MAS c/r de tamao n de X y mostrar que L(a) es decreciente.

2. Probar que el estimador mximo verosmil de a es a MV = mx {X1, X2, ...,Xn}

3. Determinar la funcin de densidad de a MV .

4. Demostrar que a MV es sesgado. Hallar su sesgo y mostrar que su ECM es: 2a 2 ECM ( a ) = ( 3n + 1 )( 3n + 2 )

5. Hallar a MM y demostrar que es insesgado. 6. Determinar a partir de qu valor de n se cumple que: ECM ( a MV ) < ECM ( a MM ) 7. Si estuviramos trabajando con una MAS c/r de tamao n =100 qu estimador de los anteriores elegiramos? Justificar.

EJERCICIO 8 (Novales 9.28) Utilizar el mtodo de los momentos para obtener el estimador del parmetro en la funcin de densidad: x 1 si 0 < x < 1 con 0 < < f ( x / ) = en otro caso 0

EJERCICIO 9 (Segunda Revisin 1998) Sea X ~ N 0, 2 y X1, X2,..., Xn MAS c/r de X

Se pide: 1. Hallar el estimador de 2 por el mtodo de los momentos. 2. Demostrar que el estimador de 2 por el mtodo de mxima verosimilitud coincide con el de los momentos. 3. Hallar el sesgo y varianza del estimador obtenido (sugerencia: recordar que si 2 X ~ 1 se tiene que V(X) = 2). __ 1 n 4. Dado el estimador alternativo para 2, M 2 = ( X i X n ) 2 , obtener su error n i =1 cuadrtico medio y compararlo con el del estimador estudiado en las partes anteriores. 7

PRCTICA 10: ESTIMACIN PUNTUAL


EJERCICIO 10 (Novales 9.9) Sea Xi una variable aleatoria que puede tomar k valores numricos: x1, x2, ..., xk con

probabilidades: p1, p2, ... pk, con

pi = 1. Esta es la distribucin multinomial. Si se


i =1
k

extrae una muestra de tamao n, en la que se obtienen n1 valores de x1, n2 valores de x2, ... nk valores de xk, con

n
i =1

= n , probar que el estimador de mxima

n n n verosimilitud del vector p = ( p1, p2, ... pk ) es p = 1 , 2 , L , k . n n n

EJERCICIO 11 Sean X, Y variables aleatorias normales tales que X ~ N 1 , 2 y Y~ N 2 , 2 .

1. Probar que con muestras independientes con reposicin de tamao n1 y n2, el 2 n1 s12 + n2 s2 2 estimador mximo verosmil de la varianza comn es: s = donde n1 + n2
2 s12 y s 2 son las varianzas muestrales de la primera y segunda muestra respectivamente. 2 n1 s12 + n2 s2 es insesgado para 2. n1 + n2 2

2. Probar que s2 es sesgado y que s * 2 =

EJERCICIO 12 (Segunda Revision 2000) El nivel de las ventas mensuales de un refresco (X) puede modelarse adecuadamente por la funcin de densidad:

2 (x ) f X ( x , ) = 92 0

si x [ ,4 ] en otro caso

donde es un parmetro que mide el gasto en publicidad del refresco (el cual se supone constante mes a mes). SE PIDE: 1. Hallar el estimador de por el mtodo de los momentos para una MAS C/R de tamao n. 2. El estimador obtenido, es insesgado? Fundamentar. 3. Calcular el error cuadrtico medio del estimador.

PRCTICA 11: ESTIMACIN POR INTERVALO

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 1 Sea X ~ N ( ,25) y X1, X2, ..., Xn una MAS c/r de tamao 100 de X.

Se pide: 1. Construir un intervalo aleatorio que contenga a con un 0.95 de probabilidad.


__

2. Elegida una muestra, result x n = 20. Determinar un intervalo de confianza al 95% para . 3. Explicar el significado de este intervalo de confianza.

EJERCICIO 2 En una eleccin los votantes deben elegir entre dos candidatos A y B. Un estudio reciente revel que 1400 personas de un total de 2500 seleccionadas aleatoriamente, tienen preferencia por el candidato A.

a) Obtener un intervalo de confianza al 99% para la verdadera proporcin de votantes a favor del candidato A. Con base en este resultado, podra usted afirmar que es probable que A gane la eleccin? Por qu? b) Supngase que se selecciona aleatoriamente una muestra de 225 personas con la misma proporcin muestral a favor del candidato A. Son los resultados diferentes a los del literal a)? c) En este caso, son razonables las suposiciones para los intervalos de confianza aproximados del 99%?
EJERCICIO 3 El precio del refresco mediano en restaurantes es una variable aleatoria normal con desvo estndar igual a $2. Una muestra de precios en 20 restaurantes arroj los siguientes resultados: 30, 30, 30, 25, 35, 25, 35, 30, 40, 35, 40, 37, 28, 30, 30, 25, 28, 28, 30, 29.

a) Construir un intervalo para el parmetro precio promedio del refresco mediano en restaurantes al 90% de confianza. b) Si en realidad se desconoce el valor de , obtener nuevamente un intervalo al 90% para dicho parmetro. Por qu este intervalo tiene mayor amplitud que el que se obtuvo en el punto anterior?

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 4 En una investigacin de mercado sobre un nuevo producto se quiere seleccionar una MAS c/r de consumidores tal que si tomamos el porcentaje de consumidores que est a favor del producto como estimacin del verdadero porcentaje poblacional no queremos "errar" por ms de un 1% del valor verdadero con una "seguridad" del 95%

El enunciado anterior puede interpretarse de dos maneras: Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p est en el intervalo ( p-0.01, p+0.01) con una probabilidad mayor o igual a 0.95. Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p est en el intervalo ( p-0.01p, p+0.01p) con una probabilidad mayor o igual a 0.95.

a) Utilizar la desigualdad de Tchebychev para determinar la relacin entre el tamao de muestra (n) y el verdadero valor poblacional (p) para ambas interpretaciones y comparar los resultados graficando n como funcin de p en ambos casos. b) Observar el comportamiento de n cuando p est cercano a 0 y a 1. Cmo cambian los resultados si se utiliza el TCL?

EJERCICIO 5 (Canavos 8.24) Una tienda de donas se interesa en estimar su volumen de ventas diarias. Supngase que el valor de la desviacin estndar es de $50.

a) Si el volumen de ventas se encuentra aproximado por una distribucin normal, cul debe ser el tamao de la muestra para que con una probabilidad de 0.95 la media muestral se encuentre a no ms de $20 del verdadero volumen de ventas promedio? b) Si no es posible suponer que la distribucin es normal, obtener el tamao necesario de la muestra para la pregunta anterior.
EJERCICIO 6 Se desea estimar el parmetro proporcin de fumadores entre los 10.000 estudiantes de una universidad. A esos efectos se selecciona una MAS c/r de 400 alumnos. A la pregunta Es Ud. fumador?, 80 estudiantes responden afirmativamente y 320 por la negativa.

Se pide: a) Construir un intervalo de confianza al 95% para el parmetro a investigar. b) Construir un intervalo de confianza al 95% para el total de fumadores entre los 10.000 estudiantes de la universidad. c) Sabiendo que la proporcin de fumadores nunca podra superar el 30%, calcular el tamao de una MAS c/r para obtener una estimacin de dicho parmetro si la seguridad y la precisin deseadas son 95% y 3% respectivamente.

10

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 7 Sea X una variable aleatoria absolutamente continua y X1, X2, ...,Xn una MAS c/r de X. Sabiendo que (20 30) es un intervalo de confianza al 99% para = E(X).

Se pide: a) A partir del intervalo de confianza obtenido y sabiendo que X se distribuye N(,2) y que n=25, deducir la estimacin puntual de y el valor de 2. b) Indicar en cada una de las afirmaciones siguientes cul es verdadera y cul es falsa. En este ltimo caso explicar cul es el error. AFIRMACIN 1: Si se extraen 100 muestras al azar, habr 99 medias muestrales que pertenecern a dicho intervalo. AFIRMACIN 2: Si se extraen muchas muestras, en el 99% de los casos las medias poblacionales pertenecern al intervalo de confianza. AFIRMACIN 3: De cada 100 intervalos correspondientes a otras tantas muestras, promedialmente 99 de ellos contendrn a la media poblacional.
EJERCICIO 8 (Canavos 8.34) Se espera tener una cierta variacin aleatoria nominal en el espesor de las lminas de plstico que una mquina produce. Para determinar cundo la variacin en el espesor se encuentra dentro de ciertos lmites, cada da se seleccionan en forma aleatoria 12 lminas de plstico y se mide en milmetros su espesor. Los datos que se obtuvieron son los siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.3, 12.5, 12.9. Si se supone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos de confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no es aceptable una varianza mayor de 0.9 mm2 existe alguna razn para preocuparse con base en esta evidencia? EJERCICIO 9 (Canavos 8.32) Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 especmenes y cada uno de stos se somete a una tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los especmenes en kilogramos por centmetro cuadrado:

Proceso estndar 428 419 458 439 441 456 463 429 438 445 441 463 Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447

11

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 9 (continuacin) Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes con varianzas iguales, obtener los intervalos de confianza estimados del 90, 95 y 99% para E - N Con base en los resultados, se estara inclinado a concluir que existe una diferencia real entre E y N?

EJERCICIO 10 (Canavos 8.38) Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la cra de peces con fines comerciales. Esta agencia se encuentra interesada en comparar la variacin de cierta sustancia txica en dos estuarios cuyas aguas se encuentran contaminadas por desperdicios industriales provenientes de una zona industrial cercana. En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron a un laboratorio para su anlisis. Las mediciones en ppm (partes por milln) que se observaron en cada muestra se exponen en la tabla. Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas normales, obtener un intervalo de confianza estimado del 90% para el cociente de las dos varianzas no conocidas 21/22. Con base en este resultado, se podra concluir que las dos varianzas son diferentes? Por qu? Niveles de una sustancia txica (ppm):

Estuario 1 10 10 12 13 9 8 12 12 10 14 8

Estuario 2 11 8 9 7 10 8 8 10

EJERCICIO 11 (Novales 10.9) Sean X e Y los miligramos de nicotina por cigarrillo con filtro y sin filtro, de una determinada marca. Suponga que ambas cantidades siguen una distribucin Normal. Se analizaron 9 cigarrillos con filtro y 11 sin filtro, con los resultados:

X: 1.1; 0.7; 0.9; 0.1; 0.8; 0.3; 0.9; 0.4; 1.0 Y: 0.9; 1.6; 1.5; 0.5; 1.0; 1.9; 1.4; 1.2; 1.3; 1.6; 2.1; Estimar el cociente de varianzas, y construir un intervalo de confianza del 98% para el mismo.

12

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 12 (Canavos 8.40)

Se desea estudiar el efecto de una nueva vacuna para la gripe. Una MAS con reposicin de 500 personas vacunadas revela que 150 de ellas se engriparon en el ltimo invierno, mientras que en una MAS con reposicin de 1000 personas no vacunadas se engriparon 400. Suponiendo que las poblaciones son independientes, construir un intervalo de confianza al 95% para la diferencia entre las proporciones de personas que se engripan de las dos poblaciones. Qu dira sobre la efectividad de la vacuna?
EJERCICIO 13 (Examen)

Una empresa de la industria manufacturera produce un tubo de imagen para PC, cuya duracin en el tiempo (X) tiene la siguiente distribucin de probabilidad:
f X ( x ) = x2 0 si x en otro caso

donde el parmetro ( > 0) se mide en unidades de tiempo y se interpreta como la duracin mnima garantizada por el fabricante. Se pide: 1. Demostrar que el estimador mximo verosmil de es T = mn{X1, X2, ...,Xn}, a partir de una MAS c/r de X de tamao n. 2. Se observ una MAS c/r de 20 tubos de imagen de PC, vendidos hace 10 aos, de los cuales: 5 de ellos se rompieron a los 2 aos 4 se rompieron a los 3 aos 2 se rompieron a los 4 aos 2 se rompieron a los 5 aos los restantes seguan funcionando luego de 5 aos. Hallar una estimacin de a partir de la muestra observada 3. Hallar la distribucin en el muestreo de T (la funcin de densidad de T). 4. Determinar b (en funcin de y n) tal que P( < T < b) = 0.95 5. A partir del intervalo (, b) hallado: 5.1. Hallar un intervalo aleatorio al 95% para . 5.2. Hallar un intervalo de confianza al 95% para . 5.3. Cul es la diferencia conceptual entre los intervalos hallados en 5.1 y 5.2? 6. Estudiar la consistencia de T como estimador de .

13

PRCTICA 11: ESTIMACIN POR INTERVALO


EJERCICIO 14 (Segundo Control 2000)

Para conocer la proporcin de mujeres adolescentes con hijos se realiz una encuesta a 1.015 mujeres de 14 a 19 aos, mediante muestreo sin reposicin. La precisin en la estimacin del parmetro es muy relevante, porque el objetivo de la investigacin consiste en cuantificar el nmero total de madres adolescentes para proporcionarles ayuda econmica. Un estadstico analiza los resultados de la investigacin y proporciona los siguientes resultados: Estimacin puntual: 0,12 Intervalo de confianza: [0,10 0,14] Un segundo investigador revisa los datos aportados por el estadstico y concluye que los resultados estn equivocados, por los siguientes motivos: a) En primer lugar, las adolescentes con hijos en la muestra son 121, por lo que la estimacin correcta de p es 0,119. b) En segundo lugar, el nivel de confianza utilizado por el primer estadstico parece excesivo, y propone en su lugar un 92%. c) En tercer lugar, al bajar el nivel de confianza se obtiene un intervalo de amplitud ms reducida, lo cual es coherente con el principio de la mnima amplitud esperada para construir intervalos de confianza. SE PIDE: 1. Cul es el nivel de confianza utilizado por el primer estadstico para construir el intervalo [0,10 0,14]? 2. Calcular el intervalo de confianza que propone el segundo investigador (aproximar con 3 decimales). 3. Indicar si la afirmacin c) es correcta, fundamentando la respuesta.

14

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS

PRCTICA 12: PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 1 Para los siguientes problemas de decisin, definir el Error de tipo I y el Error de tipo II, y en funcin de ello proponer las hiptesis nula y alternativa.

1. El gerente de una compaa de mnibus debe decidir sobre la frecuencia diaria entre dos localidades. Tradicionalmente la compaa viaja 4 veces por da y algunas veces se llegan a agotar los boletos. El gerente est pensando en incrementar la frecuencia a 6 viajes diarios para lograr un mayor nmero de boletos vendidos a costa de las compaas competidoras, pero con el riesgo de viajar con muchos asientos vacos en alguna de las frecuencias con la consiguiente prdida de imagen frente a sus clientes habituales (principal preocupacin de la compaa). Cada mnibus carga como mximo 40 pasajeros. El nmero medio de pasajeros transportados hasta la fecha es 150 y se espera que con las nuevas frecuencias dicho nmero ascender a 210. 2. Un fabricante de heladeras las pinta de color blanco o celeste en las proporciones del 60% y del 40% respectivamente. ltimamente se ha notado un aumento en la demanda del color celeste al punto que se han perdido algunas ventas por falta de stock y a la inversa, se nota un incremento del stock de heladeras blancas. El gerente de produccin opina que rpidamente deberan alterarse las proporciones de heladeras que se pintan de blanco y celeste (por ej. 50% y 50%). El gerente de comercializacin no est de acuerdo pues cree que la propensin a demandar el celeste es una moda pasajera. Para tomar la decisin se consultar con una muestra aleatoria de clientes antiguos sobre el color que habrn de elegir cuando decidan cambiar de heladera. Elaborar la regla de decisin del punto de vista del gerente de comercializacin.
EJERCICIO 2 En una prueba se da un cuestionario con 15 preguntas de respuesta VERDADERO o FALSO. Se quiere probar que un estudiante contesta al azar. Para ello se adopta la siguiente regla de decisin: - Si 12 o ms respuestas son correctas el estudiante no est contestando al azar; - Si menos de 12 son correctas el estudiante est contestando al azar.

Se pide: 1. Plantear las hiptesis a comprobar. (El peor error es decir que el estudiante estudi, cuando realmente est adivinando). 2. Con la regla de decisin adoptada, cul es el nivel de significacin de la prueba?

15

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 3 Para realizar la siguiente prueba:

H0) = 0 H1) = 1 Se sabe que considerando la regin crtica RC1: P ( Error tipo I) = 0.10 P ( Error tipo II) = 0.30

y que considerando la regin crtica RC2: Se pide:

P (Error tipo I) = 0.30 P ( Error tipo II) = 0.10

1. Cul de las regiones crticas utilizar para realizar la prueba? Fundamente. 2. Calcular la potencia de la prueba para la regin crtica elegida.
EJERCICIO 4 (Novales 10.3) Un profesor recrimina sistemticamente a un colega suyo por el nivel de exigencia, por lo que ste ltimo le ofrece corregir por separado los mismos exmenes, que se acaban de celebrar, y comparar los porcentajes de alumnos que aprueban. Tras la correccin, el primer profesor aprueba a 248 de los 400 alumnos mientras que el segundo aprueba a 214. a) Qu concluira usted a un nivel de significacin del 5% ? b) Y al 10%? EJERCICIO 5 Sea X1, X2, ...., Xn una MAS c/r de una variable XBernoulli (p) elegida para probar H0) p=0,49 contra H1) p=0,51. Usando la aproximacin normal, determinar n para que la probabilidad de ambos tipos de error no supere 0,01. EJERCICIO 6 En una poblacin normal con una media desconocida y varianza igual a 25 se desea someter a prueba H0) = 10 contra H1) = 12 a partir de una muestra de tamao n y con un nivel de significacin .

1. Hallar la forma de la RC ptima. 2. Determinar dicha RC y el valor de n para que las probabilidades de ambos tipos de error no superen 0.01.

16

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 7 (Canavos 9.1) Suponga que usted desea probar la hiptesis H0) = 5 contra la alternativa H1) = 8 por medio de un solo valor que se observa en una variable aleatoria con densidad de probabilidad dada por:

x 1 exp( ) f ( x , ) = 0

x>0 x0

Si el tamao mximo del error de tipo I que puede tolerarse es de 0.15, cul de las siguientes reglas de decisin es la mejor para escoger entre las dos hiptesis? Rechazar H0 si X Rechazar H0 si X Rechazar H0 si X

9 10 11

EJERCICIO 8 (Canavos 9.4 y 9.5) La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma peridica, se escogen al azar 25 recipientes y el contenido de cada uno de stos se pesa. Se juzga al proceso como fuera de control
__

cuando la media muestral X n es menor o igual a 19.8 o mayor o igual a 20.2 onzas. Se supone que la cantidad que se vaca en cada recipiente se encuentra aproximada, en forma adecuada, por una distribucin normal con una desviacin estndar de 0.5 onzas. a) Ennciense las hiptesis nula y alternativa que son propias para esta situacin. b) Obtener la probabilidad del error de tipo I. c) Obtener y graficar la funcin de potencia para los siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5. d) Como una prueba alternativa, considrese el rechazo de H0 cuando

X n 19.5 o cuando X n 20.5 . Si el tamao mximo del error de tipo I es de 0.05, cul de las dos pruebas es la mejor? e) Supngase ahora que el tamao de la muestra se aumenta a 36 recipientes. Dados los mismos tamaos del error de tipo I para las pruebas propuestas, obtener los nuevos valores crticos y comparar las funciones de potencia de las dos pruebas.
EJERCICIO 9 (Novales 10.5) Un analista cree que la cotizacin peseta/dlar USA puede representarse por una distribucin N ( ,16) , pero no est seguro de que haya descendido en el ltimo mes por debajo de su nivel medio, que cree que ha permanecido estable en 82.5 ptas./dlar. Por tanto, se quiere constatar H0) = 82.5 frente a H1) < 82.5, y est dispuesto a rechazar la hiptesis nula de estabilidad en el tipo de cambio, si obtiene una media muestral inferior a 80.5 ptas./dlar. (Suponer que dispone de una muestra con 25 observaciones).

__

__

17

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCIO 9 (continuacin) Se pide: a) Cul es el nivel de significacin del contraste? b) Cul es su funcin de potencia? Dibjela. c) Cul debera ser la regin crtica para tener un nivel de significacin del 10%? d) Cul sera la funcin de potencia en tal caso? Dibjela junto con la anterior. EJERCICIO 10 (Canavos 9.8) Sea X1, X2, ..., Xn, una muestra aleatoria de tamao n de una distribucin de Poisson con parmetro desconocido. Obtener la mejor regin crtica de tamao para probar: H0: = 0 H1: = 1< 0 EJERCICIO 11 (Novales 10.12) Hallar la forma de la regin crtica ptima para el contraste de hiptesis nula H0) p = p0, frente a H1) p = p1, en una poblacin B(p). EJERCICIO 12 (Canavos 9.12) Un contratista ordena un gran nmero de vigas de acero con longitud promedio de 5 metros. Se sabe que la longitud de una viga se encuentra normalmente distribuida con una desviacin estndar de 0.02 metros. Despus de recibir el embarque, el contratista selecciona 16 vigas al azar y mide sus longitudes. Si la media muestral tiene un valor ms pequeo que el esperado, se tomar la decisin de enviar el embarque al fabricante. a) Si la probabilidad de rechazar un embarque bueno es de 0.04, cul debe ser el valor de la media muestral para que el embarque sea regresado al fabricante? b) Si la longitud promedio real es de 4.98 metros, cul es la potencia de la prueba en el inciso a)? EJERCICIO 13 (Canavos 9.16) En cierto condado de Iowa, la cosecha promedio de maz por acre fue de 100 toneladas por acre. Para un ao dado en el que el clima fue particularmente bueno, se seleccionaron 12 parcelas en forma aleatoria y stas arrojaron una cosecha promedio de 106 toneladas por acre, para la misma variedad de maz. Si la produccin por acre se modela en forma adecuada por una distribucin normal con una desviacin estndar de 8 toneladas por acre, existe alguna razn para creer que este ao la produccin ser mejor que la produccin promedio normal?. Emplese = 0.01. Para este caso, cul es el valor-p? EJERCICIO 14 (Mltiple Opcin seleccionada de la Segunda Revisin de 2001) 1. Dada la prueba de hiptesis H0) = 0 contra H1) 0 con nivel = 10% en la que se obtiene un valor p de 0.08, entonces la decisin a tomar es:

a) No se rechaza H0) porque el valor p es mayor a /2. b) Se rechaza H0) porque el valor p es menor que . c) No tenemos elementos para decidir porque no conocemos el valor de 0 . d) Ninguna de las anteriores. 18

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 14 (continuacin) 2. Dada la prueba de hiptesis H0) 0 contra H1) > 0 donde la regin crtica es {todas las muestras / x k }

a) No se puede calcular el nivel de significacin de la prueba porque la hiptesis nula es compuesta. b) El valor de la potencia no es nico porque la hiptesis alternativa es compuesta. c) Para calcular el valor p se necesita el valor de k. d) Ninguna de las anteriores. 3. En una prueba de hiptesis en la cual H0) = 5 contra H1) 5, cul los siguientes valores para el tamao de muestra (n) y el nivel de significacin () dar una probabilidad de error II menor? a) n = 100 y = 0.01. b) n = 200 y = 0.02. c) n = 200 y = 0.03. d) Ninguna de las anteriores.
EJERCICIO 15 Una empresa est estudiando comprar los derechos de distribucin de las camisetas de las "Tortillas Nunga". Las utilidades mensuales provenientes de esta concesin estn aproximadamente modeladas por una distribucin normal con media y varianza desconocidas. El problema que se presenta es la variabilidad mensual de las utilidades, dado que dicha variabilidad es una medida del riesgo que se asume en el negocio. La empresa, asesorada por un especialista en inversiones, decide no comprar si la desviacin tpica de las utilidades es de U$S 800 o ms.

Para decidir se toma una MAS c/r de 12 meses, en los cuales se investigan las
__

utilidades en cada uno de ellos y se obtiene que s x = 600 y x = 2.200. Se pide: (Fundamentando sus respuestas) 1. Explicar sucintamente, por qu la desviacin tpica es una medida del riesgo que se asume. 2. Definir el peor error que la empresa puede cometer y en base a ste realice una prueba de hiptesis, con el fin de determinar si la empresa compra o no, los derechos de distribucin. Utilice un nivel de significacin del 5%. 3. Con los resultados utilizados en 2, construir un intervalo de confianza para la varianza de las utilidades de Tortillas Nunga. Mark Eting, tcnico en comercializacin de productos, en un informe elevado a la gerencia, indica que la marca "Tortillas Nunga ya no es tan popular como antes y sugiere como alternativa que se compren los derechos de distribucin del fusil de asalto AK 74 de Pambo, ya que el estreno de "Pambo XXXII - En busca de su bisnieto ha aumentado la popularidad del personaje. La distribucin de las utilidades mensuales se puede modelar adecuadamente.

19

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 15 (continuacin) 4. por una normal de media y varianza desconocida. Para tratar de resolver el problema se toma una muestra al azar de 20 meses donde se encuentra que:

xi = 42.000
i =1

20

x
i =1

20

2 i

= 97.200.000

Construir un intervalo de confianza para la varianza de las utilidades al 95%. 5. Obsrvese que la estimacin del valor de la varianza del producto de Pambo es mayor que la de las Tortillas Nungas; por qu, para un 95% de confianza, el riesgo que se asume, en la peor situacin, es menor?

EJERCICIO 16 (Canavos 9.30) Se cree que el promedio para el nmero de respuestas correctas para la prueba SAT para las mujeres es mayor que el de los hombres por ms de diez puntos. Las muestras aleatorias para ambos sexos arrojaron los siguientes resultados:

Mujeres: n1 = 125; X n1 = 480 y S x1 = 60 . Hombres: n2 = 100; X n 2 = 460 y S x 2 = 52 . a) Si se muestrearon dos poblaciones independientes normales, se encuentra la creencia apoyada por la evidencia muestral con = 0.05? Cul es el valorp? b) Supngase que la verdadera diferencia es de 15 puntos. Cul es la potencia de la prueba anterior?
__

__

EJERCICIO 17 (Canavos 9.33) Se espera que dos operadores produzcan, en promedio, el mismo nmero de unidades terminadas en el mismo tiempo. Los siguientes datos son los nmeros de unidades terminadas para ambos trabajadores en una semana de trabajo:

Operador 1: 12; 11; 18; 16; 13 Operador 2: 14; 18; 18; 17; 16 Si se supone que el nmero de unidades terminadas diariamente por los dos trabajadores son variables aleatorias independientes distribuidas normales con varianzas iguales, se puede discernir alguna diferencia entre las medias a un nivel = 0.1?

EJERCICIO 18 (Canavos 9.46) Para el ejercicio 17 (Canavos 9.33), puede apoyarse la opinin de que la variacin en el nmero de artculos terminados para el operador 2 es menor que para el operador 1 a un nivel = 0.05?

20

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 19 (Examen Setiembre 1997) El jefe de personal de una empresa sospecha que los empleados de ms edad pierden ms das de trabajo al ao por enfermedad que los trabajadores jvenes. Decide probar esta hiptesis y elige al azar los registros de 10 empleados de 40 aos o ms y de 10 empleados de menos de 40 aos. Se sabe que ambas poblaciones tienen una distribucin normal con la misma varianza. Los resultados son:

40 aos o ms Menos de 40 aos

37 24

19 42

21 18

35 15

16 0

4 9

0 10

12 20

63 22

25 13

Sean: 1 = promedio anual de das perdidos por enfermedad de trabajadores de 40 aos o ms. 2 = promedio anual de das perdidos por enfermedad de trabajadores de menos de 40 aos. Se pide: 1. Establecer la hiptesis nula y la alternativa para este problema, sabiendo que el peor error es afirmar que los empleados de 40 aos o ms pierden ms das de trabajo por enfermedad que los empleados menores de 40 aos cuando en realidad no es cierto. 2. Proponer un estadstico apropiado para la prueba. 3. Entre la curva normal y la distribucin t, cul es la distribucin en el muestreo adecuada? Fundamente su respuesta. 4. Establecer la regla de decisin con un nivel de significacin del 5%. 5. Cul debe ser la conclusin del jefe de personal? 6. Obtener el valor-p de esta prueba y explicar su significado.
EJERCICIO 20 Una empresa que se dedica a comercializar vlvulas realiza sus ventas en lotes de 10.000 unidades. Los compradores consideran aceptables lotes que no contengan ms de un 10% de defectuosas.

Como norma, cada venta se realiza luego de analizar los lotes a travs del porcentaje de defectuosas existentes en una muestra de tamao n. Solamente en el 2.5% de los casos la empresa est dispuesta a no vender lotes aceptables para los compradores. Al mismo tiempo se tratar de minimizar la probabilidad de que el lote se venda cuando el porcentaje de vlvulas defectuosas supere el 10%. Se pide: 1. Definir el riesgo del comprador y el del vendedor. 2. Plantear una prueba de hiptesis adecuada para decidir si la empresa vende el lote. 3. Encontrar una regin crtica ptima para dicha prueba en base a una muestra de 600 vlvulas con reposicin.

21

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 20 (continuacin) 4. Si un lote contiene el 13% de vlvulas defectuosas, cul sera el riesgo que correra un determinado comprador? (n = 600). 5. Calcular cul debiera ser el tamao de la muestra para que la potencia de la prueba sea k = 0,95 para el mismo nivel de significacin. EJERCICIO 21 Una empresa desea lanzar un nuevo producto al mercado pero no est segura qu canal de distribucin utilizar: almacenes mayoristas o minoristas. La empresa optar por los minoristas si ms de la mitad de los consumidores potenciales (600.000 personas) conocen la marca del producto.

Se pide: 1. Qu mtodo estadstico sugerira utilizar? Fundamente su respuesta. 2. Qu informacin necesitara suministrarle la empresa para que Ud. pueda trabajar? 3. Plantear la hiptesis nula y la hiptesis alternativa y la forma de la regin crtica. 4. Si = 0.05 n = 600 X 600 =300/600. Qu canal de distribucin utilizara la empresa? 5. Identifique el peor error que se puede cometer y su probabilidad mxima. 6. Calcular la funcin de potencia para p = 0.7 e interpretar el resultado obtenido.
EJERCICIO 22 Una empresa comercial recibe del fabricante lotes de 10.000 artculos iguales que deben respetar determinadas normas:

a) Cada artculo del lote se clasifica como bueno o defectuoso segn cumpla o no con las normas preestablecidas. b) Un lote es aceptable si tiene un porcentaje de artculos defectuosos que no supera el 10%. Para decidir acerca de la compra de un lote, el comprador elige una muestra (MAS c/r) de 600 artculos del lote y cuenta el nmero de defectuosos. Si al seleccionar la muestra encuentra 66 artculos defectuosos. Se pide: 1. Qu decisin tomara la empresa comercial en base a una prueba de significacin para la proporcin de artculos defectuosos con un nivel de significacin del 1%? 2. Cul sera el riesgo del fabricante? 3. Si el verdadero porcentaje de artculos defectuosos en el lote fuera del 15%: 3.1. Cul sera el riesgo de la empresa comercial al decidir en base a esta prueba? 3.2. Calcular cul debera ser el tamao de la muestra para que el riesgo de la empresa comercial fuera del 5%.

22

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 23 (Novales 10.14) Halle el contraste de razn de verosimilitudes para el contraste de la hiptesis nula: H0) = 0, frente a la alternativa compuesta H1) 0 en una poblacin N , 2 , con 2 desconocida. Pruebe que este contraste coincide con el contraste habitual basado en el estadstico de la t de Student.

EJERCICIO 24 (Novales 10.15) Halle el contraste de razn de verosimilitudes para el contraste de la hiptesis nula: 2 2 , frente a la alternativa compuesta H1) 2 0 en una poblacin, con H0) 2 = 0 asimismo desconocida. Pruebe que este contraste coincide con el contraste habitual basado en el estadstico de la chi-cuadrado.

EJERCICIO 25 (Examen 7/10/96) Las diferentes partes de este ejercicio son independientes entre s.

PARTE I Es comn que los vendedores cometan errores en las facturas, por ejemplo al escribir los precios de los productos, las cantidades vendidas y en las sumas. En una empresa se tiene la poltica de sancionar a un vendedor si este produce ms del 10 % de facturas con errores, porque pasado este lmite se considera que el vendedor trabaja "mal". Una muestra aleatoria simple con reposici6n de 1000 facturas del vendedor Juan contiene 150 facturas con errores y su supervisor decidi sancionarlo. Plantear: 1. La hiptesis nula y la hiptesis alternativa considerando que el "peor error" que se puede cometer es decidir que el vendedor trabaja "mal" cuando en realidad trabaja bien. 2. Plantear el estadstico a utilizar y su distribucin en el muestreo. 3. Hallar la regin crtica si se utiliza un nivel de significacin del 1%. 4. La decisin del supervisor es consistente con el resultado de la muestra? 5. Si en realidad el vendedor confecciona el 12 % de las facturas con error, cul es la probabilidad de error de tipo II?

23

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS

EJERCICIO 25 (continuacin) PARTE II

Se desea estimar el consumo medio mensual de cerveza por persona en la poblacin montevideana. Para ello se tom una muestra de tamao 1000 personas (MAS c/r) en 1985 y se obtuvo el siguiente intervalo de confianza al 95%: (1.58; 1.82) litros por persona por mes. Se pide: 1. Probar la hiptesis nula de que el consumo promedio mensual per capita de cerveza en la poblacin de Montevideo es 1.8 litros contra la hiptesis de que es diferente de 1.8 en 1995. Utilice un nivel de significacin de 2%. 2. Probar la hiptesis nula de que el consumo promedio mensual per capita de cerveza en la poblacin de Montevideo es 1.8 litros contra la hiptesis alternativa de que es menor que 1.8 en 1995 para un nivel de significacin del 10%. 3. En su opinin, a qu se debe que ambas pruebas conduzcan a decisiones diferentes?
EJERCICIO 26 (Segunda Revisin 2000)

En una institucin de salud la Direccin Tcnica controla peridicamente la cantidad de medicamentos que se consumen en la consulta en policlnicas. Se considera razonable un consumo promedio de 1,5 medicamentos por consulta. Si en un perodo el promedio excede de 1,5 entonces los mdicos que ms recetaron son sancionados con suspensin. En cada perodo la Direccin Tcnica selecciona al azar por MAS C/R 400 pacientes que consultaron en Policlnicas y analiza el nmero de medicamentos que les fueron recetados en la ltima consulta. La Direccin Tcnica adopta la siguiente regla de decisin: si el promedio de medicamentos por consulta en la muestra es mayor que 1,6 entonces se asumir que en la poblacin de pacientes de Policlnicas el promedio supera 1,5 y se proceder a sancionar con suspensin a los mdicos ms recetadores. Para la Direccin Tcnica el peor error consiste en sancionar a los mdicos cuando en realidad no debera hacerlo. SE PIDE: 1. Plantear las hiptesis nula y alternativa apropiadas para este problema. 2. Se conoce que la varianza del nmero de medicamentos recetados por consulta es 1,44. De acuerdo con la regla de decisin, cul es el nivel de significacin de la prueba? 3. Cul es la probabilidad que con la regla establecida no se sancione a los mdicos ms recetadores si en realidad en el perodo analizado el promedio de recetas por consulta alcanza a 1,7?

24

PRCTICA 12 PRUEBA DE HIPTESIS DE SIGNIFICACIN DE PARMETROS


EJERCICIO 26 (continuacin) 4. Modificar la regla de decisin (con el mismo tamao de muestra) para que la probabilidad de error de tipo I no supere 2,5%. 5. Con esta prueba, es posible realizar afirmaciones acerca de una posible reduccin en el consumo promedio de medicamentos por consulta? Fundamentar la respuesta.

EJERCICIO 27 (Segunda Revisin 2001) Una prueba de matemtica de mltiple opcin consta de 10 preguntas, con tres opciones de respuesta cada una, una sola correcta. Por cada respuesta correcta se obtienen 4 puntos y por cada respuesta equivocada 2. Es obligatorio responder las 10 preguntas. El puntaje mnimo para aprobar la prueba es 16 puntos. Sean: X = puntaje de la prueba e Y = nmero de respuestas correctas.

1. Hallar la relacin entre X e Y. Hallar el mnimo del Rec(X) e interpretar su significado. 2. Plantear una prueba de hiptesis para el parmetro p = probabilidad de contestar bien, sabiendo que el peor error es que el estudiante aprueba la prueba cuando en realidad est adivinando. Se tiene que indicar: H0), H1), la regin crtica y el nivel de significacin. 3. Plantear, sin calcular, la funcin de potencia de la prueba en funcin del parmetro definido en el punto 2. 4. Un alumno estudioso tiene probabilidad constante e igual a 0.7 de responder correctamente a cada pregunta. Calcular la probabilidad de que un alumno estudioso apruebe la prueba (aproximar con 3 decimales). 5. Si 300 alumnos rinden la prueba y todos ellos son estudiosos y no pueden copiarse, cul es el nmero esperado de alumnos que aprobarn la prueba? Fundamente la respuesta.

25

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

PRCTICA 13: PRUEBA DE HIPOTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 1 (Canavos 10.2) El nmero de nacimientos observados por mes en un hospital fue:

Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic 95 105 95 105 90 95 105 110 105 100 95 100 Si = 0.01, existe alguna razn para creer que el nmero de nacimientos no se encuentra distribuido en forma uniforme durante todos los meses del ao? Cul es el valor-p?
EJERCICIO 2 (Segunda revisin de 1998) La informacin que a continuacin se presenta es una tabulacin del nmero de goles por partido (en los noventa minutos de juego) que se registraron en el mundial de ftbol de Francia ' 98.
CANTIDAD DE GOLES 0 1 2 3 4 5 6 7 Total NUMERO DE PARTIDOS 5 10 13 19 11 5 0 1 64

1. Con un nivel de significacin del 5%. el nmero de goles por partido podra distribuirse Poisson con parmetro ? (El parmetro se determinar apropiadamente). 2. El valor-p de la prueba es menor o mayor que 0.10? Fundamente su respuesta.
EJERCICIO 3 Someter a prueba la hiptesis de que los puntajes de una prueba se distribuyen aproximadamente normal, con un nivel de significacin del 1% a partir de los datos obtenidos de una muestra de 290 estudiantes
Puntaje 0 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 40 40 - 50 Total Frecuencia 24 49 71 72 37 21 16 290

26

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 4 (Canavos 10.6) Durante un perodo de 30 aos se llev a cabo un estudio mdico para determinar, entre otras cosas, si los hbitos de fumador pueden influenciar en el desarrollo de la enfermedad cardaca. Durante este perodo, 160 hombres desarrollaron alguna enfermedad cardaca. Estos hombres fueron clasificados como fumadores agudos (ms de dos cajas de cigarros al da), fumadores moderados (una a dos cajas al da), fumadores ocasionales (menos de una caja al da) o no fumadores. El nmero de hombres en cada categora que desarroll alguna enfermedad cardaca es el siguiente:

Fumador Fumador Fumador agudo Moderado Ocasional 58 54 36

No fumador 12

Total 160

a) Si se supone que al comienzo del estudio haba una cantidad igual de hombres en cada una de las cuatro categoras, existe alguna razn a un nivel de = 0.01 para creer que las proporciones en estas categoras no son las mismas? b) Cmo se podra prevenir al investigador mdico del uso de la prueba de bondad de ajuste chi-cuadrado en esta situacin?
EJERCICIO 5 (Examen Febrero 1999) Un odontlogo atiende sus pacientes de lunes a viernes en jornadas de 6 horas. El odontlogo se queja, ltimamente, de un creciente cansancio, debido a que los jueves y viernes atiende ms pacientes que de lunes a mircoles. La probabilidad de que un paciente que asiste al dentista durante cierta semana, lo haga en cada uno de los das es la siguiente:

Da de la semana Da N Probabilidad Lunes 1 0.16 Martes 2 0.16 Mircoles 3 0.16 Jueves 4 0.26 Viernes 5 0.26 Por consejo de un estadstico, el odontlogo anuncia a sus pacientes que a partir del mes siguiente aumentar el horario de atencin a 7 horas de lunes a mircoles, y lo reducir a 5 horas los jueves y viernes. Transcurridos dos meses de los cambios, se selecciona una semana al azar y se obtienen los siguientes resultados: Da de la semana Da N Pacientes atendidos Lunes 1 10 Martes 2 9 Mircoles 3 11 Jueves 4 14 Viernes 5 16

27

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 5 (continuacin)

Se pide: 1. Plantear las hiptesis nula y alternativa de los dos problemas siguientes: 1.1. Se desea saber si la distribucin nueva de pacientes es uniforme (discreta). 1.2. Se desea saber si la distribucin nueva de pacientes no cambi. 2. Indicar en el caso de la prueba 1.2 el estadstico de la prueba y su distribucin aproximada en el muestreo bajo H0. 3. Decidir en la prueba 1.2 para un nivel de significacin del 5%. Trabajar con 3 dgitos. 4. Indicar qu significa el concepto de Error Tipo II de la prueba de hiptesis desarrollada.
EJERCICIO 6 (Segunda Revisin 1996) El gerente de produccin de una empresa asegura que la demanda total semanal del producto X se distribuye aleatoriamente con funcin de densidad:
x2 si x [0 ,1 ) 2 7x2 + 10 x 6 si x [1 ,2 ] fX ( x ) = 2 0 en otro caso

donde X se mide en Kg. de producto. Para verificar la afirmacin del Gerente de Produccin, se tom una MAS c/r de la demanda en 400 semanas con el siguiente resultado: Demanda 0.0 0.5 0.5 1.0 1.0 1.5 1.5 2.0 Nmero de semanas 9 61 195 135

Se pide: 1. Para un nivel de significacin del 10% puede afirmarse que la demanda total semanal se distribuye segn la afirmacin del gerente de produccin? (Realizar los clculos con dos decimales). 2. Para un nivel de significacin del 10% y para la misma muestra, se somete a prueba la hiptesis H0) X ~ N ( 0 , 02 ) con 0 y 02 dadas, y resulta que, de acuerdo con los resultados, no se rechaza dicha hiptesis. Es este resultado coherente con el resultado del punto anterior? Fundamentar la respuesta. 28

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 7 (Canavos 10.14) Se toma una muestra aleatoria de 25 hombres casados y se les pregunta la edad que tenan cuando se casaron. Se obtienen los siguientes datos: 24, 19, 20, 22, 50, 23, 23, 21, 25, 27, 45, 27, 26, 26, 35, 29, 28, 30, 31, 32, 31, 33, 34, 38, 41. sese la estadstica de Kolmogorov-Smirnov para probar la hiptesis nula de que la distribucin de las edades de los hombres cuando contrajeron sus primeras nupcias es una distribucin gama con = 2 y = 16. sese = 0.05. (Sugerencia: para calcular las probabilidades gama, vase una tabla de la funcin gama incompleta determinada por 5.55).

EJERCICIO 8 Se desea investigar si existe asociacin o independencia entre ciertas categoras de la PEA y la edad de dicha poblacin. A esos efectos se eligi una muestra aleatoria de 1000 personas activas obtenindose los siguientes resultados:

EDAD CATEGORA DE LA PEA Menos de 25 Entre 25 - 60 Ms de 60 Ocupados en industria manufacturera 50 220 40 Ocupados en el comercio 60 150 20 Ocupados en los servicios 50 250 30 Desocupados 40 80 10 Someter a prueba la hiptesis de independencia entre la edad y la categora de la PEA para un nivel de significacin = 3%.

EJERCICIO 9 (Segunda Revisin 1997) Se efectu una encuesta entre 483 amas de casa que compran habitualmente yogur para determinar si existe alguna relacin entre la marca que compran ms frecuentemente y la caracterstica principal que debe tener un "buen yogur". Las marcas de yogur que existen en el mercado son: A, B, C, D y E. Las caractersticas de un "buen yogur" son: buen sabor, nutritivo, barato, sin aditivos y calidad.

Se quiere saber si existe dependencia entre la marca de yogur comprada ms frecuentemente y la caracterstica principal que debe tener un "buen yogur". Con la informacin obtenida en la encuesta se elaboraron los siguientes cuadros de valores observados y esperados.

29

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 9 (continuacin)

Cuadro de valores observados Caracterstica principal Marca A Marca B Marca C Marca D Marca E Total Sabor Nutritivo Barato 30 28 15 14 16 103 30 28 10 13 12 93 20 18 15 16 25 94 Sin aditivos 15 16 23 27 24 105 Calidad Total 28 26 9 18 7 88 123 116 72 88 84 483

Cuadro de valores esperados

Caracterstica principal Marca A Marca B Marca C Marca D Marca E Se pide:

Sabor Nutritivo Barato 24.7 15.4 18.8 17.9 22.3 13.9 16.9 16.2 22.6 14 17.1 16.3

Sin aditivos 26.7 25.2 15.7 19.1 18.3

Calidad 22.4 21.1 13.1 16 15.3

1. Determinar los valores de , y de la tabla de valores esperados. (Aproximar con un decimal). 2. Plantear las hiptesis nula y alternativa para esta prueba. 3. Sabiendo que el valor del estadstico Chi-cuadrado en la muestra es 40.45, qu decisin adoptara para un nivel de significacin del 5%? 4. El valor-p ser mayor, igual o menor que el 5%? Fundamente la respuesta.

30

PRCTICA 13: PRUEBA DE HIPTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA


EJERCICIO 10 Para estudiar la posible asociacin o independencia entre la condicin de fumador y el fallecimiento por cncer pulmonar, se seleccion una muestra de 10.000 personas fallecidas en el ltimo ao y se encontraron los siguientes resultados.

CAUSA DEL FALLECIMIENTO Cncer de pulmn Otras causas TOTAL

CONDICIN DE FUMADOR SI NO 200 200 800 8.800 1.000 9.000

TOTAL 400 9.600 10.000

1. Probar si existe independencia entre los atributos condicin de fumador y causa de fallecimiento, para un nivel de significacin del 1%. Y al 5%? 2. Estimar, a partir de los resultados de la muestra, las probabilidades de morir de cncer de pulmn condicionadas por la condicin de fumador.

EJERCICIO 11 (Canavos 10.22) Se llev a cabo una encuesta con respecto a la preferencia del consumidor para determinar si exista alguna predileccin para tres marcas competitivas (A, B y C) dependiendo de la regin geogrfica en la que habita el consumidor. Con base en una muestra aleatoria de consumidores, se obtuvo la siguiente informacin para tres distintas regiones.

Regin 1 Regin 2 Regin 3 Marca A 40 52 25 Marca B 52 70 35 Marca C 68 78 60 Con base en esta informacin, la preferencia por una determinada marca depende de la regin geogrfica a un nivel = 0.05?

31

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS


EJERCICIO 1 Sea = {w1, w2, w3, w4, w5, w6, w7, w8}. Se elige una MAS S/R de tamao 3.

Se pide: 1. Cuntas muestras diferentes pueden formarse? 2. Cul es la probabilidad de una muestra cualquiera? 3. Cul es la probabilidad de que w8 pertenezca a la muestra? 4. Cul es la probabilidad de que w7 y w8 pertenezcan a la muestra? 5. Sea X la edad de cada individuo de la poblacin: X(wi) = i i. 5.1. Cul es la media de las edades en la poblacin? 5.2. Cul es la cuasi-varianza de las edades en la poblacin? 6. Se eligi una muestra y result (w3, w5, w7). 6.1. Cul es un estimador insesgado de la media poblacional a partir de dicha muestra? Calcular la estimacin. 6.2. Cul es un estimador insesgado de la cuasi-varianza poblacional a partir de dicha muestra? Calcular la correspondiente estimacin. 7. Supongamos ahora otra variable Y tal que: Y(w1) = 10; Y(w2) = Y(w3) = 11; Y(w4) = 14; Y(w5) = Y(w6) = Y(w7) = 20; Y(w8) = 25 7.1. Calcular media y cuasi-varianza poblacionales. 7.2. Calcular P( |Y - | < ) con = 1, = 3, = 5.
EJERCICIO 2 Considere una poblacin = {w1, w2, w3}. Sean s1 = {w1, w2}, s2 = {w1, w3}, s3 = {w2, w3}, s4 = {w1, w2, w3} las muestras posibles con probabilidades p1 = 0.4, p2 = 0.3, p3 = 0.2, p4 = 0.1.

Se pide: 1. Calcular la probabilidad de que el elemento wi salga en la muestra seleccionada wi . 2. Calcular la probabilidad de que el par (wi , wj) con i j salga seleccionado en la muestra (wi , wj) .
EJERCICIO 3 Anualmente llegan al Balneario Las Caas unos 10.000 turistas provenientes del exterior y del interior del pas. Para conocer el gasto promedio diario de los turistas en 1996 se eligi una MAS S/R de 500 turistas. A cada uno de ellos se le pregunt por el gasto diario y se obtuvieron los siguientes resultados:
Gasto diario 100 - 200 200 - 400 400 - 600 600 - 700 Total N de turistas 100 250 130 20 500

32

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS


EJERCICIO 3 (continuacin) Se pide: 1. Estimar el gasto promedio diario de los 10.000 turistas. 2. Sabiendo que la estada de todos los turistas en "Las Caas" es de 3 das, estimar el gasto total de los turistas en dicho balneario. 3. Hallar un intervalo de confianza al 95% para el gasto promedio diario de los turistas. 4. Hallar un intervalo de confianza al 90% para el gasto total de los turistas. 5. Utilizando los datos de la muestra para estimar la cuasi-varianza poblacional, cul debi ser el tamao de la muestra (MAS S/R) para estimar el gasto promedio diario de los turistas con una precisin de $20 y una seguridad del 95%? EJERCICIO 4 Para estimar la proporcin de hogares unipersonales en una ciudad de 20.000 hogares, se seleccionar una MAS S/R. Sabiendo que en el ltimo Censo dicha proporcin era del 11%, y que de ninguna manera puede superar el 15%, determinar el tamao de la muestra para tener una precisin del 1% y una seguridad del 99%.

EJERCICIO 5 A los efectos de estimar el ingreso medio de los hogares de una regin, se decide seleccionar una MAS S/R de una poblacin de 500.000 hogares.

Se pide: 1. Determinar el tamao de la muestra necesario para una precisin de 50 unidades monetarias y una confianza del 95% (se supone que la varianza del ingreso de los hogares es de aproximadamente 1.0002). 2. Realizada la encuesta con el tamao antes calculado, se obtuvo la siguiente distribucin de la muestra: Ingreso
100 - 200 200 - 500 500 - 1000 1000 - 2000

Frecuencia relativa
0.3 0.4 0.2 0.1

2.1. Estimar el ingreso medio por hogar y el ingreso total de la regin. 2.2. Construir intervalos de confianza para dichos parmetros al 95%.

33

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS


EJERCICIO 6 Se desea estimar el ingreso medio de los hogares de una ciudad que tiene 4 barrios a partir de una muestra de 1000 hogares. Se dispone adems de la siguiente informacin:

Estrato 1 2 3 4 Se pide:

N de hogares 10.000 20.000 30.000 40.000

Varianza de los ingresos (de encuestas anteriores) 2.500 900 225 100

1. Asignar la muestra por estratos por MAEP y MAEO.

2. Calcular V t YMAE en ambos casos y comparar la eficiencia relativa de ambos


mtodos.

EJERCICIO 7 Se considera una poblacin de 12:500.000 personas activas. Se desea estimar la proporcin de desocupados. La poblacin se clasifica en dos estratos: N1 = 9:000.000 y N2 = 3:500.000 se utilizar MAE para seleccionar una muestra de 12.500 personas activas.

Se pide: 1. Determinar el tamao de muestra en cada estrato, usando asignacin proporcional. 2. Al realizar la encuesta se encontraron las siguientes tasas de desempleo en la muestra: d1 = 5% y d2 = 6%. 3. Estimar el porcentaje de desocupados en la poblacin. 4. Estimar el total de desocupados en cada estrato y en la poblacin. 5. Estimar la varianza del estimador de la proporcin de desocupados. 6. Hallar un intervalo de confianza al 95% para el total de desocupados en la poblacin. 2 7. Sabiendo que '1 = 0.06 y que ' 2 2 = 0.08 , cul debera ser el tamao total de una muestra MAEP para obtener una precisin de medio punto porcentual y una seguridad del 95% en la estimacin de la proporcin de desocupados en la poblacin?

34

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS


EJERCICIO 8 A fin de estimar la media de una cierta variable X, se decide muestrear una poblacin de N = 10.000 elementos, y tomar la media muestral obtenida como estimador de . Para ello, se dispone de dos diseos:

DISEO 1: MAS S/R de n = 200 elementos. DISEO 2: MAE de n = 200 elementos, con las siguientes caractersticas: Se divide la poblacin en dos estratos. El estrato 1 tiene N1 = 5.000 elementos, y el estrato 2 tiene N2 = 5.000 elementos. La muestra se distribuye as: n1 = 150 elementos en el estrato 1 y n2 = 50 elementos 2 en el estrato 2. Se sabe que, siendo 12 la varianza poblacional del estrato 1, 2 la del estrato 2 y 2 la varianza total de la poblacin, se cumple la siguiente relacin:
2 12 = 4 2 = 0.9 2

Se pide: 1. Estimar la varianza de la media muestral en ambos diseos y concluir cul de ellos es ms eficiente. (Se supone que los costos no juegan). 2. Calcular la eficiencia relativa estimada del estimador de la media mediante el MAE con respecto al MAS en este caso.

EJERCICIO 9 (Segunda Revisin 1995) Una poblacin de N = 1000 individuos se dividi en dos estratos de tamao N1 = 200 y N2 = 800.

Se pide: 1. Mostrar que si las cuasi-varianzas poblacionales de dichos estratos estn en 8 = 2 , entonces, para una muestra total de tamao n se la relacin, 1 3 verifica que: el tamao de la muestra del estrato 1 (n1) por asignacin ptima resulta el doble del n1 que se obtendra mediante la asignacin proporcional. Calcular ambos ni en funcin de n y verificar la proposicin anterior.

35

PRCTICA 14: MUESTREO DE POBLACIONES FINITAS


EJERCICIO 10 (Examen Febrero 1992) Una poblacin de 300.000 animales est a punto de entrar en epidemia de una cierta enfermedad. Experiencias realizadas con anterioridad muestran que:

Sobre una muestra (MAS s/r) de 1.000 animales no vacunados en ocasin de la epidemia anterior, murieron 250 y, Sobre una muestra (MAS s/r) de 400 animales vacunados murieron slo 40. Se pide: 1. Construir un intervalo de confianza al 95% para el nmero de animales que se espera que mueran: 1.1. Si no hay vacunacin. 1.2. Si se vacuna a toda la poblacin. 2. Plantear la forma del intervalo aleatorio utilizado para construir los intervalos de confianza del punto anterior. 3. El costo de cada animal muerto es de $ 1.000 y el costo de cada vacuna es de $ 100. Hallar el casto total esperado en caso de epidemia: 3.1. Si no hay vacunacin. 3.2. Si se vacuna a toda la poblacin. 4. Un estudio profundo por parte del Organismo de Control Sanitario ha mostrado la existencia de dos zonas de riesgo en caso de epidemia: Zona de alto riesgo: Poblacin: 100.000 animales Una muestra (MAS s/r) de 500 animales vacunados en la ltima epidemia estim la probabilidad de muerte en 0.20. Zona de menor riesgo: Poblacin: 200.000 animales Una muestra (MAS s/r) de 500 animales no vacunados en la ltima epidemia estim la probabilidad de muerte en 0.15. Si se sigue la estrategia de vacunar slo a la poblacin de animales de la zona de alto riesgo: 4.1. Estimar el nmero esperado de animales que habrn de morir en caso de epidemia (con la nueva estrategia). 4.2. Hallar el costo esperado de esta estrategia. Es ms conveniente que las anteriores? 4.3. Hallar el error estndar del estimador de 4.1.

36

PRCTICA 15: MODELO DE REGRESIN SIMPLE

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 1 A continuacin se realizan una serie de afirmaciones sobre modelos lineales; discutir la validez de las mismas.

1. Las relaciones entre variables explicativas de un modelo pueden ser siempre linealizadas y por lo tanto aplicar las tcnicas de modelos lineales. 2. Los supuestos clsicos en los que se basa la estimacin de modelos lineales son nicamente una primera aproximacin al tema, pues son simplificadores de la realidad. 3. El diagrama de dispersin es una herramienta muy til para ver qu clase de relacin mantienen dos variables. 4. Dado el modelo lineal simple: Yi = 0 + 1 X i + i : 4.1. Los llamados supuestos clsicos son: E( i ) = 0
E( i2 ) = 2

COV ( i , j ) = 0 i j

X i son valores fijos 4.2. Bajo los supuestos clsicos, los estimadores mnimo cuadrticos de 0 y 1 coinciden con los estimadores mximo verosmiles. 5. En el modelo lineal simple y bajo los supuestos clsicos, 0 y 1 son los parmetros del modelo, y:
Y
i =1 n

1 =

___ ___ Y X i X 2

0 = Y 1 X

___

___

___ Xi X i =1 n

son los estimadores que se obtienen por el mtodo de los mnimos cuadrados. 5.1. Los estimadores mnimo cuadrticos son insesgados. 5.2. Los estimadores mnimo cuadrticos son los que tienen menor varianza. 6. Como el modelo de regresin visto en el curso es solamente aplicable a relaciones lineales: 6.1. El modelo Yi = 0 + 1 X i + i no es estimable por mnimos cuadrados. 6.3. El modelo Yi = ( 0 + 1 log( X i ))
1

6.2. El modelo Yi = 0 + 1 X i2 + i no es estimable por mnimos cuadrados.


( 1 / 0 )

+ i no es estimable por mn cuadrados.

6.4. El modelo Yi = 0 . X i . i no es estimable por mnimos cuadrados. 6.5. El modelo Yi = 0 .1X i . i no es estimable por mnimos cuadrados. 37

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 2 Se presentan a continuacin los resultados de distintas especificaciones de modelos lineales simples realizados para ver qu modelo se ajusta mejor para explicar la cotizacin del dlar. Se cont para ello con la serie de cotizaciones al cierre de cada mes del dlar billete, tipo vendedor, en el mercado interbancario desde marzo de 1985 a mayo de 1988.

Se pide: Evale de acuerdo a los resultados presentados para cada funcin, cul de ellas se ajusta mejor. Z t = 0 + 1t + t donde Z t es la cotizacin del dlar y t el tiempo en meses (marzo de 1985 = 1). Las estimaciones de los parmetros son 0 = 61,50 , 1 = 6,22 y
^

R 2 = 0,9582 . Z t = 0 ( 1 )t t (Modelo exponencial)


Se linealiz: Ln( Z t ) = Ln( 0 ) + Ln( 1 ). t + Ln( t ) Se estim el modelo y se lleg a: Ln( 0 ) = 4 ,46 , Ln( 1 ) = 0,034 y R 2 = 0,9973 .
Z t = 0 t 1 t (Modelo potencial)

Se linealiz: Ln( Z t ) = Ln( 0 ) + Ln( t ). 1 + Ln( t ) Se estim el modelo y se lleg a: Ln( 0 ) = 4 ,04 , 1 = 0 ,40 y R 2 = 0,8313 .

EJERCICIO 3 (Canavos 13.3) Dado el modelo lineal Yi = X i + i , i = 1, 2, , n supngase que E( i ) = 0 ,


V ( i ) = 2 i y COV ( i , j ) = 0 i j .

a) Obtener el estimador de mnimos cuadrados para b) Determinar si es un estimador no sesgado de , y demostrar que V ( ) =

2 X i2

EJERCICIO 4 Dado el modelo lineal Yi = + i , i = 1, 2, , n


V ( i ) = i y COV ( i , j ) = 0 i j .
2

supngase E( i ) = 0 ,

a) Obtener el estimador de mnimos cuadrados para . b) Analizar las propiedades de como estimador de .

38

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 5 En una muestra de 10 automotoras se registraron las ventas anuales de automviles que utilizan nafta (X) y de automviles que utilizan gas oil (Y). La muestra arroj los siguientes resultados:

X i = 2.500
Yi = 2.000
i =1 i =1 10

10

Yi 2 = 590.000
i =1

i =1 10

10

2 i

= 910.000

X Y
i =1

10

i i

= 312.500

Se supone que el vector (X,Y)' puede modelarse aproximadamente por: X Y ~ N 2 ( , ) SE PIDE: PARTE I: A partir de los resultados de la muestra: 1. Obtener estimaciones de los parmetros de la distribucin de (X,Y)'. 2. Son estas estimaciones consistentes? Fundamentar. 3. Estimar el coeficiente de correlacin de (X,Y). 4. De acuerdo con los resultados obtenidos es vlida la afirmacin de que las buenas automotoras de gasoleros no son tan efectivas vendiendo autos a nafta? Fundamentar. PARTE II: Utilizando las estimaciones obtenidas en PARTE I, calcular: 1. La probabilidad que una automotora venda anualmente ms de 300 automviles a gas oil. 2. La probabilidad que una automotora venda anualmente ms de 300 automviles a gas oil sabiendo que en el ao se vendieron 100 automviles a nafta. 3. El nmero esperado de automviles a gas oil a vender por una automotora sabiendo que en el ao vendi 250 automviles a nafta. PARTE III: Supngase que los datos de la muestra corresponden a 10 automotoras seleccionadas por el nmero de autos vendidos a nafta, siendo aleatorio el nmero de autos vendidos a gas oil. Suponiendo un modelo de la forma: Yi = 0 + 1 X i + i . 1. Establecer los supuestos necesarios (y slo los necesarios) para estimar los parmetros 0 y 1 por mnimos cuadrados. 2. Establecer los supuestos adicionales para probar la significacin del modelo a travs del anlisis de la varianza, indicando el papel que desempean cada uno de los supuestos en dicho anlisis. 3. Estudiar la significacin del modelo para un nivel del 5%.

39

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 6 Se desea estimar una relacin lineal que vincule el consumo privado (CP) como una funcin del Producto Bruto Interno (PBI) a lo largo del perodo 1970 - 1985. A esos efectos se ha sacado la siguiente informacin del Banco Central del Uruguay:

AOS 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985

Valores en N$ de 1978 CP PBI 21.972 25.857 22.118 25.888 22.281 25.486 22.382 25.579 21.986 26.383 22.758 27.930 22.239 29.043 22.158 29.384 22.919 30.930 24.163 32.838 26.232 34.808 26.854 35.469 24.257 32.138 21.926 30.257 20.556 29.532 20.764 29.738 Fuente: BCU

Se pide: 1. Establecer los supuestos necesarios para estimar la relacin deseada. 2. Realizar el diagrama de dispersin. 3. Estimar el modelo lineal simple: CPt = 0 + 1 PBI t + t por mnimos cuadrados.
2 ) y la varianza de los estimadores. 4. Estimar la varianza de los residuos ( 5. Calcular e interpretar el coeficiente de determinacin (R2). 6. Observar la siguiente salida de la opcin de regresin del Excel aplicada a este problema particular. Identificar los elementos que se han estudiado en el curso.

40

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 6 (continuacin)

Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Grados de Libertad Regresin 1 Residuos 14 Total 15 0.7413 0.5495 0.5174 12.047 16 Suma de Cuadrados 247.852 203.173 451.025 Promedio de cuadrados 247.852 14.512 F Valor crtico de F 0.0010

170.787

Coeficien Error tpico tes Intercepcin Variable X 1 110.605 0.4002 28.681 0.0968

Estadstico t Probabilidad 38.564 41.326 0.0017 0.0010

Inferior 95% 49.090 0.1925

Superior 95% 172.120 0.6079

EJERCICIO 7 Se plantea un modelo simple Yi = 0 + 1 X i + i y en base a las observaciones del par ( X i ,Yi ) se obtuvieron los siguientes resultados:

X i = 37,20
i =1

10

X i2 = 139,42
i =1

10

Yi = 78,75
i =1

10

Yi2 = 622,64
i =1

10

X Y = 294,05
i =1 i i

10

n = 10

Se pide: 1. Estimar los parmetros explicitando los supuestos utilizados: 1.1. Utilizando las frmulas del modelo lineal simple. 1.2. Utilizando = ( X' X ) X' Y . 2. Determinar las varianzas de los estimadores mnimo cuadrticos. 3. Calcular R2. 4. Construir un intervalo de confianza del 95% para 1 , suponiendo distribucin normal de los residuos i . Analizar la significacin del modelo.
^ 1

41

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 8 Al gerente de Marketing de Fascination le interesa explicar el consumo de cosmticos de la gama Fascination Plus con la importancia que las mujeres dan a su imagen. Para conseguir este objetivo, se consulta por el consumo mensual de cosmticos (en unidades) a una muestra de 4 mujeres cuya autoimagen es dada (en una cierta escala ).

Se obtuvieron los siguientes datos: Autoimagen 2 3 5 8 Se pide: 1. 2. 3. 4. 5. 6. Determine la media de la variable explicada y la media de la variable explicativa. Estime la recta de regresin lineal. Determine los valores estimados del consumo mensual de cosmticos. Determine los errores estimados. Determine el coeficiente de correlacin lineal. Explique qu dificultad se presenta cuando se intenta probar la significacin del modelo. 7. Explicite para este caso los supuestos del modelo necesarios para probar la significacin del modelo. Consumo mensual de Cosmticos 1 3 7 13

EJERCICIO 9 El gerente de una cadena de heladeras desea usar la temperatura ambiental promedio para predecir las ventas diarias de halados. Para ello recoge datos para una muestra aleatoria de 10 das.

Da Temperatura promedio (grados Fahrenheit) Xi 1 72 2 79 3 85 4 90 5 66 6 95 7 100 8 98 9 82 10 91

Ventas diarias (en kg.) Yi 110 127 140 151 89 187 205 190 136 165

42

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 9 (continuacin)

X i = 858
i =1

10

X i2 = 74.740
i =1

10

Yi = 1.500
i =1

10

Yi 2 = 237.366
i =1

10

X Y
i =1 i

10

= 132.369

Se pide: 1. Calcular la ecuacin de regresin lineal. 2. Interpretar el valor obtenido de la pendiente de la recta. 3. Calcular el residuo para el primer da. 4. Calcular el error estndar de estimacin. 5. En el caso de una prueba de hiptesis donde se dice H0) 1 0 contra H1) 1 > 0 5.1. Cul es la regin crtica apropiada? 5.2. Cul sera la conclusin para = 2.5%? 5. 3. Interprete el resultado obtenido. 6. Calcular el R2 e interpretar su valor. 7. Sabiendo que la conversin de grados Fahrenheit a grados Celsius es 5 Grados Celsius = (Grados Fahrenheit - 32) x 9 calcular la temperatura media y la desviacin estndar de la temperatura en los diez das en grados Celsius.

EJERCICIO 10 (Examen Agosto 1999) El Cr. Jota Erre tiene una teora por la cual el tipo de cambio promedio mensual interbancario vendedor (Yt) tiene incrementos fijos e iguales mes a mes, a partir de un cierto valor inicial. En cambio, el Ec. Equis Zeta cree que la variable Yt crece, a partir de un cierto valor inicial, a una tasa constante todos los meses.

Se pide: 1. Plantear un modelo lineal de acuerdo con la teora del Cr. Jota Erre. 2. Plantear un modelo adecuado para el Ec. Equis Zeta y explicar cmo se debe proceder para "linealizar" el modelo. 3. Para comprobar la teora del Cr. Jota Erre se seleccionaron 10 meses consecutivos y se observ el valor de la variable Yt. Para los datos que se presentan a continuacin, estimar el modelo. T 1 2 3 4 5 6 7 8 9 10 Yt 10.4 10.6 10.6 10.7 10.8 10.9 10.9 10.9 11.0 11.2 4. Calcular los 10 residuos o errores de estimacin para la muestra extrada. 5. A partir de los resultados de la parte anterior, estimar la varianza del modelo. 6. Explicar qu supuesto es necesario agregar a los supuestos clsicos para realizar una prueba de significacin del modelo, y explicar cmo interviene dicho supuesto en el desarrollo de la prueba. 7. Probar la significacin del modelo para un nivel del 5%. 8. Realizar una prediccin puntual del valor esperado de Y15. 9. Construir un intervalo de confianza para E(Y/t=15) para una seguridad del 95%. 43

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 11 (Examen Febrero 1999) Para explicar el ingreso promedio mensual de los hogares mediante un modelo de regresin lineal simple un especialista propone como variable explicativa los "aos de educacin formal del jefe del hogar". Para realizar las estimaciones de los parmetros del modelo el especialista entiende que deben cumplirse algunos de los siguientes supuestos:

* Hay que seleccionar previamente, y no al azar, los jefes de hogar segn ciertos valores prefijados del ingreso de los hogares. * Hay que seleccionar previamente, y no al azar, los jefes de hogar segn ciertos valores prefijados de los aos de educacin formal. * La seleccin de los hogares debe hacerse de tal forma de evitar que haya correlacin entre los residuos del modelo. * La variabilidad de los ingresos, para cada valor prefijado de los aos de educacin, debe ser constante. * La variabilidad de los ingresos, para cada valor prefijado de los aos de educacin, debe ser proporcional a los aos de educacin. * Los residuos del modelo tienen distribucin normal. * Los residuos del modelo tienen distribucin uniforme continua. * El valor esperado de los errores, para cada valor prefijado de los aos de educacin, es constante. * El valor esperado de los errores, para cada valor prefijado de los aos de educacin, es nulo. Se pide: 1. Establecer cules de los supuestos anteriores son necesarios para estimar los parmetros del modelo. 2. Se dispone de los siguientes datos de 15 hogares: Y = "ingreso promedio mensual (en miles de $) X = "aos de educacin formal"

X
i =1

15

= 151

X
i =1

15

2 i

= 1.747

Y = 167 Y
i =1 i i =1

15

15

= 2.081

X Y = 1.879
i =1 i i

15

Obtener la ecuacin estimada de la recta de regresin (aproximar a 2 decimales). 3. Qu interpretacin tienen los coeficientes estimados en este problema? 4. Calcular las estimaciones de las varianzas de los coeficientes estimados. 5. Obtener un intervalo de confianza al 95% para 1. Explicitar los supuestos necesarios. 6. Es significativa la variable X para explicar la Y para un nivel del 5%? Fundamente la respuesta sin realizar clculos.

44

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 12 (Examen Marzo 2001) Se considera el siguiente conjunto de datos a los efectos de estimar los parmetros del modelo de regresin lineal simple Yi = 0 + 1 xi + i para i = 1, K ,6.
x 1 .0 0 1 .0 0 3 .0 0 3 .0 0 5 .0 0 5 .0 0 Y 1 0 .2 0 7 .8 0 8 .2 0 5 .8 0 6 .2 0 3 .8 0

La representacin grfica de dichos datos y de la recta de regresin lineal aparece en la grfica siguiente (diagrama de dispersin).
r e g r e s i n li n e a l
12 10 8 y 6 4 2 0 0 2 4 x 6 8

El siguiente cuadro presenta parte de la salida de la opcin Regresin de Excel. Resumen Estadsticas de la regresin Coeficiente de determinacin R^2 Error tpico Observaciones ANLISIS DE VARIANZA Grados libertad 1 4 5 de Suma de Promedio de F cuadrados los cuadrados 16.0000 16.0000 7.4074 8.6400 2.1600 24.6400 Estadstico t valor-p 7.9682 0.0013 -2.7217 0.0529

0.649

1.470 6

Regresin Residuos Total

Intercepcin Variable X 1

Coeficientes Error tpico 10.0000 1.2550 -1.0000 0.3674

45

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 12 (continuacin) Se pide (dar las respuestas con al menos 4 decimales):

1. Calcular el coeficiente de correlacin r entre X y Y. 2. Calcular el valor-p asociado al estadstico F=7.4074, fundamentando su respuesta. 3. Qu porcentaje de la variacin total de la variable Y es explicada por el modelo? 4. Someta a prueba la significacin del modelo en su conjunto para un nivel = 7% (s, siete por ciento). 5. Construya un intervalo de confianza al 95% para el parmetro 2 , varianza de los residuos del modelo.

EJERCICIO 13 (Canavos 13.4, 13.6 y 13.8) Una compaa local de energa seleccion una residencia tpica para desarrollar un modelo emprico para consumo de energa (en kilowatts por da) como una funcin de la temperatura promedio diaria durante los meses de invierno. Se obtuvo la siguiente informacin durante un perodo de 15 das.
Temperatura (C) Consumo energtico 0 70 8 57 7.5 60 13.5 14 63 57 8.5 66 4.5 67 -11 -7.5 -8.5 1.5 88 80 0.5 64 2 79 -6 82 -4 97

107 96

Se pide: 1. Graficar los datos. Sugiere la grfica una asociacin lineal? 2. Para un modelo lineal simple, obtngase la ecuacin estimada de regresin y grafquese sobre la grfica de la parte a). 3. Interprtense los coeficientes de regresin estimados. 4. Qu se recomendara a la compaa para mejorar el modelo emprico? 5. Dada la ecuacin de regresin estimada en la parte b) calclense los residuos. 6. Verifquese que se cumplen las propiedades: 7. Obtngase la varianza residual. 8. Calclense los estimadores de las desviaciones estndar de 0 y 1 . 9. Obtngase un intervalo estimado de confianza del 95% para el valor real de la pendiente. 10. Determnese si una relacin lineal entre la temperatura atmosfrica promedio y el consumo de energa es estadsticamente discernible para un nivel = 0.05. 11. Para cada temperatura atmosfrica, calclense los intervalos de confianza del 95% estimados para el uso medio de energa y grafquense stos contra la recta estimada de regresin. 12. Estmense los consumos individuales de energa para las siguientes temperaturas: -10, -8, -5, -2, 1, 4, 7, 10, y 13. Obtnganse intervalos de prediccin del 95% para las estimaciones.

Yi = Y i y
i =1 i =1

X e
i =1

i i

=0

46

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 14 (Segunda Revisin 2000) En un comercio se cree que las ventas semanales son linealmente decrecientes con cada semana del mes. Para comprobarlo, se seleccionaron 36 semanas y se calcularon las ventas por semana. Los datos obtenidos se presentan en el siguiente cuadro. Dato (i) Semana(xi) Ventas (yi) Dato (i) Semana(xi) Ventasi 1 1 10000 19 2 12000 2 2 9000 20 3 10000 3 3 8000 21 4 10000 4 4 8000 22 5 10000 5 1 13000 23 1 13000 6 2 13000 24 2 11000 7 3 11000 25 3 10000 8 4 9000 26 4 9000 9 5 7000 27 1 14000 10 1 14000 28 2 12000 11 2 12000 29 3 11000 12 3 12000 30 4 8000 13 4 10000 31 5 9000 14 1 12000 32 1 12000 15 2 11000 33 2 12000 16 3 10000 34 3 12000 17 4 11000 35 4 11000 18 1 12000 36 5 8000
i = 36 i =1

xi = 100; yi = 386.000; xi2 = 340; yi2 = 4.250 : 000.000; xi yi = 1.010.000.


i =1 i =1 i =1 i =1

i = 36

i = 36

i = 36

i = 36

SE PIDE: 1. Plantear el modelo explicativo de las ventas semanales en funcin de la semana del mes. 2. Estimar 0 y 1. 3. Interpretar el valor estimado de 1 en este problema. 4. Es el modelo significativo para un nivel del 5%?

EJERCICIO 15 (Examen Febrero 2000) (Las distintas partes son independientes entre s.)
PARTE A

Dada Yi / X i = xi ~ Poisson( xi ) i = 1,2,...., n Se pide: 1. Plantear la regresin de Y sobre X. 2. Hallar el estimador por mnimos cuadrados de con los supuestos habituales.

47

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 15 (continuacin)
PARTE B

Para un modelo lineal simple Se pide: 1. Probar que S ^ = 1 S XY , siendo Y el valor estimado por el modelo para Y.
YY ^ ^

2. Probar que 1 = 3. Recordando que

S^
Y

SX

.
2

2 S XY R = 2 2 S X SY

S ^2
hallar la relacin entre R
2

YY

S ^2 S 2
Y Y

PARTE C

Se estiman por mnimos cuadrados y para n = 50 varios modelos: ( i ) Yi = 0 + 1Xi1 + i para el que se obtiene R2 = 0,2527. Se piensa en la especificacin alternativa: ( ii ) Yi = 0 + 1Xi1 + 2Xi2 + i Para tener una idea de qu tan buena es la variable X2 para explicar Y se estiman los modelos: ( iii ) Yi = 0 + 1Xi2 + i para el que se obtiene R2 = 0,4709. ( iv) Xi1 = 0 + 1Xi2 + i para el que se obtiene R2 = 0,0067. SE PIDE: Analizar si son verdaderas o falsas las siguientes afirmaciones. Justificar. 1. Para el modelo ( i ) la variable X1 es significativa al 1%. 2. X1 y X2 son casi incorrelacionadas, mientras que Y y X2 tienen un coeficiente de correlacin muestral de 0,6862. 3. La especificacin ( ii ) tendr un R2 mayor que la ( i ) y la ( iii ).

EJERCICIO 16 (Examen) En la automotora EL AUTO MEDIO, todos los meses se venden de 10 a 20 autos de diferentes marcas y modelos. Todos los meses el dueo de la empresa - egresado de C. Econmicas- calcula el valor promedio de los autos vendidos para comparar con meses anteriores. En los primeros 12 meses observa los valores de la tabla adjunta. En el mes 13 se obtiene un promedio de U$S 10.300. Luego de pensarlo, el dueo afirma que debe haberse cometido un error, porque de acuerdo con el Teorema Central del Lmite, la prediccin ms razonable para el mes 13 es un valor entre U$S 11.600 y U$S 12.400. La informacin recabada se presenta en la siguiente tabla:

MES (X) VPM (Y) 48

1 2 3 4 5 6 7 8 9 10 11 12 11.3 11.2 11.5 11.6 11.8 11.5 11.4 11.6 11.8 11.6 12.0 11.9

PRCTICA 15: MODELO DE REGRESIN SIMPLE


EJERCICIO 16 (continuacin)

VPM - Valor Promedio Mensual en miles

X i2 = 650
i =1

12

Yi2 = 1.615: 360.000


i =1

12

X Y = 912.200
i =1 i i

12

Se pide: 1. Es cierta la afirmacin del dueo de la empresa? Fundamentar la respuesta, explicando el significado del Teorema Central del Lmite. 2. Si se utiliza el mes como variable explicativa, formular un modelo lineal simple para explicar el valor promedio de los autos vendidos y estimar los parmetros 2 del modelo ( 0 ,1 , ) utilizando los datos de los primeros 12 meses. 2 3. Calcular R y comentar el resultado obtenido.
^ ^

4. Calcular Y 13 segn el modelo estimado. La diferencia entre Y 13 y Y13 se debe a que a partir del mes 13 se elimin un impuesto del 20% sobre el valor de venta de los automviles. Se quiere estimar un nuevo modelo para explicar el valor promedio mensual de los autos vendidos sin el impuesto con los primeros 12 datos, utilizando otra vez el mes como variable explicativa. Encontrar la relacin
2 entre las estimaciones de los parmetros del modelo original ( 0 , 1 , ) y los ^ ^ ^

2 del nuevo modelo ( 0 ,1 , ) (sin calcular). ^ * 5. Calcular Y13 a partir del nuevo modelo y hallar un intervalo de confianza al 95% ^ * ). para el parmetro E( Y13

49

PRCTICA 16: MODELO DE REGRESIN MULTIPLE

PRCTICA 16: MODELO DE REGRESIN MLTIPLE


EJERCICIO 1 A continuacin se realizan una serie de afirmaciones sobre modelos lineales; discutir la validez de las mismas.

1. El modelo lineal general, es decir, aquel que implica considerar ms de una variable explicativa, es ms real en virtud de que pocos fenmenos se explican solamente por una variable como supone el modelo simple. 2. En el modelo Yi = 0 + 1 X i + i probar la significacin del modelo en general 3. implica probar la hiptesis de 1 = 0. En el modelo lineal general Y = X + , explicar la forma que tienen los vectores Y y y la matriz de observaciones X en el caso de tener ms de dos variables explicativas (adems del trmino independiente). Asimismo, explicitar la forma del vector de los coeficientes . El diagrama de dispersin es una herramienta muy til para ver qu clase de relacin mantienen dos variables. El anlisis de la varianza constituye un instrumento para estudiar los efectos parciales que pueden tener una o ms de las variables en la explicacin de la varianza estimada. El coeficiente de determinacin R2 aumenta su valor con el nmero de variables explicativas consideradas, lo que constituye un elemento negativo del indicador. Indique como puede solucionarse este problema.

4. 5.

6.

EJERCICIO 2 Una empresa que vende productos de venta masiva est estudiando el comportamiento de sus ventas en los ltimos 8 aos. Como en el mercado existe nicamente una empresa competidora, con niveles similares de precio y calidad, se observa la relacin entre las ventas anuales (Yi), los gastos en publicidad de la propia empresa (Xi,1) y los gastos en propaganda de la competidora(Xi,2). Se observaron los siguientes datos:

i 1 2 3 4 5 6 7 8

Yi 30 50 60 70 90 100 110 120

Xi,1 10 15 20 25 30 35 40 45

Xi,2 5 5 8 10 12 15 20 25

50

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 2 (continuacin) Se pide: 1. Plantear un modelo lineal para explicar las ventas anuales de la empresa, explicitar los supuestos y estimarlo por MCO usando la notacin matricial sabiendo que: 1.302 0.110 0.148 1 (X X ) = 0.016 0.027 0.048

2. En base a los resultados hallados someter a prueba la hiptesis de significacin del modelo en su conjunto a un nivel de significacin del 5%. 3. Realizar el anlisis de la varianza confeccionando el cuadro correspondiente.

EJERCICIO 3 Una empresa de mnibus utiliza el siguiente modelo lineal para explicar los costos de reparacin y mantenimiento de sus unidades:

COSTOS i = 0 + 1 KMVIAJ i + 2 EDADi + i COSTOS i = total de costos anuales de reparacin y mantenimiento del i-simo vehculo. KMVIAJ i = miles de kilmetros viajados por el i-simo vehculo. EDADi = antigedad en aos del i-simo vehculo. Procesados los datos en Excel se obtiene la siguiente salida: Resumen Estadsticas de la regresin Coeficiente de correlacin 0.901241 mltiple Coeficiente de 0.812237 determinacin R^2 R^2 ajustado 0.780943 Error tpico XXX Observaciones XXX

51

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 3 (continuacin)

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total XXX XXX 14 Promedio Suma de de F Cuadrados Cuadrados XXX XXX 25.95512 32785.31 XXX XXX Estadstico t Probabilidad XXX XXX 3.7363434 0.030 0.00 0.003 Valor crtico de F 0.000

Intercepcin Variable X 1 Variable X 2

Coeficientes Error tpico 108.91501 73.270750 26.678791 3.7041353 71.130916 XXX

Se pide: 1. Completar la salida calculando los datos faltantes. 2. Cmo interpreta el valor de los i obtenidos? 3. Construir intervalos de confianza al 95% para 1 y 2 . 4. Analizar la validez del modelo. 5. El gerente de la empresa afirma que los kilmetros viajados no influyen significativamente en los costos. Qu comentario le merece esta afirmacin? 6. Sera pertinente excluir alguna de las variables incluidas?
EJERCICIO 4 En una empresa se desea explicar el salario actual de sus funcionarios mediante el siguiente modelo de regresin lineal:

SALi = 0 + 1 EDUCi + 2 EDADi + 3 SALINIC + i SALi = Salario actual EDUCi = Nivel educativo EDADi = Edad del funcionario SALINIC = Salario con que ingres en la empresa Para los datos de todos los funcionarios se obtiene el siguiente resultado: Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones 52

0.89524 0.80146 0.80020 3053.09 474

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 4 (continuacin)

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 3 470 473 Coeficientes 135.90 298.04 -58.95 1.73 Suma de Cuadrados Promedio de F Cuadrados Valor crtico de F 0.000

17685582341 5895194114 632.43 4381056929 9321397.72 22066639270 46652514.3 Error tpico 983.58 67.21 12.53 0.059 Estadstico t 0.138 4.434 4.629 29.331 Probabilidad 0.8902 0.000 0.000 0.000

Intercepcin Variable X 1 Variable X 2 Variable X 3 Se pide:

1. Construir un intervalo de confianza al 95% para el coeficiente de la variable nivel educativo e interpretar sus resultados. 2. Determinar si el modelo es significativo al 5%. 3. Plantear la prueba de hiptesis que permita contrastar si la variable edad influye negativamente en el salario actual. 4. Es correcta la siguiente interpretacin de la salida? En promedio, al aumentar la edad disminuye el salario? Fundamentar la respuesta.

EJERCICIO 5 Se desea estimar el gasto de los hogares montevideanos en funcin de la edad del jefe/a del hogar, la cantidad de integrantes del hogar y la situacin ocupacional del jefe/a. Para ello se definieron las siguientes variables:

GASTO: Gasto del hogar. EDAD: Edad del jefe/a. CANTIDAD: Cantidad de integrantes del hogar. OCUPADO: Variable binaria que vale 1 si el jefe/a esta ocupado y 0 en otro caso. DESOCUPADO: Variable binaria que vale 1 si el jefe/a esta desocupado y 0 en otro caso. Se pide: 1. Indicar qu supuesto del modelo de regresin lineal no se cumple. 2. Indicar cmo debe interpretarse el coeficiente estimado para la variable OCUPADO.

53

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 6 (Segunda Revisin 2000) A continuacin se presentan los resultados de la estimacin de dos modelos de regresin lineal que buscan explicar a la variable dependiente, Y. El modelo 1 incorpora una constante y la variable explicativa X1, mientras que en el modelo 2 se incorpora, adems, otra variable explicativa, X2.

MODELO 1 Estadsticas de la regresin Coeficiente de correlacin Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Regresin Residuos Total

0.9525 xxxx 0.9029 32.194 xxxx Grados de Suma de Cuadrados F libertad cuadrados medios 1 38 39 3849.62 393.86 4243.48 3849.62 10.36 371.42 Valor p 0.0000

Intercepcin x1 MODELO 2 Estadsticas de la regresin Coeficiente de correlacin Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Regresin Residuos Total

Coeficient Error t i 72.568 xxxx 31.593 0.1639

Estadstico Probabilida t d 142.556 0.0000 192.722 0.0000

Inferior 95%

Superior 95%

xxxx 2.83

xxxx 3.49

0.9528 0.9079 xxxx 32.504 40 Grados de Suma de Cuadrados F libertad cuadrados medios 2 37 39 Coeficient 72.649 31.413 0.0870 xxxx 390.92 xxxx Error 0.5142 0.1690 0.1649 xxxx xxxx 182.32 Valor p 0.0000

Intercepcin x1 x2

Estadstico 141.290 185.908 0.5273

Probabilida 0.0000 0.0000 0.6011

Inferior 95%

Superior 95%

6.22 2.80 -0.25

8.31 3.48 0.42

54

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 6 (continuacin) SE PIDE: 1. Completar las celdas con xxxx. 2. Realizar la prueba de significacin conjunta del MODELO 2. Interpretar el significado de cada una de las hiptesis. 3. Interpretar el valor 3.1413 del coeficiente estimado para X1 en el MODELO 2. 4. Determinar si es significativa la variable X2 en el MODELO 2, para un nivel del 5%. 5. Determinar el nmero de filas y columnas de la matriz P que permite proyectar ortogonalmente el vector y sobre el S.E.V. que generan las columnas de la matriz X.

EJERCICO 7 (Examen Marzo 2003) El Gerente General de una empresa que comercializa diversos productos por catlogo est interesado en encontrar la relacin que existe entre las ventas semanales (en U$S) y las siguientes variables:

X1 = Cantidad de catlogos que se imprimen por mes X2 = Cantidad de pginas de los catlogos X3 = Tamao de las pginas de los catlogos (en cm2) X4 = Nmero de lneas telefnicas disponibles para recibir los pedidos X5 = Amplitud del horario de atencin telefnica (en horas semanales). Para estimar un modelo de regresin lineal mltiple, el Gerente General solicita a un estadstico que seleccione una muestra apropiada de semanas que represente adecuadamente las diferentes combinaciones de las variables Xi. Seleccionada la muestra se realizaron diversos clculos, algunos de los cuales se presentan en el siguiente cuadro. Modelo: Yi = 0 + 1 . X i1 + 2 . X i 2 + 3 . X i 3 + 4 . X i 4 + 5 . X i 5 + i Variable R2 = 0,750000 2 R corregido = 0,721591 Intercepto n X1 ( y i y ) 2 = 4.000.000 X 2 i =1 X3 X4 X5 Coeficiente +12.180,0 +1,5 +48,0 -0,8 +60,0 +20,0 p-valor 0,0027 0,0184 0,4132 0,0408 0,0087 0,6600 x1 = 10.000 x 2 = 50 x3 = 600 x4 = 6 x5 = 40

1. Plantear el modelo estimado. 2. Cul fue el tamao de la muestra? Explicite sus clculos. 3. Calcular la Variacin Explicada (SCReg) y estudiar la significacin del modelo al 5%, explicitando las hiptesis, el estadstico y su distribucin y la Regin Crtica. 4. Qu variables son significativas al 5%? Justificar la respuesta.

55

PRCTICA 16: MODELO DE REGRESIN MULTIPLE


EJERCICIO 7 (continuacin) 5. Cul es el resultado esperado estimado en las ventas semanales de una reduccin de 2 pginas en los catlogos a imprimir?, considerando que las otras variables no cambian. 6. Para bajar los costos, el Gerente General se ve en la necesidad de reducir alguna de las 5 variables Xi. Qu recomendacin le formulara Ud.? Fundamentar la respuesta. 7. Suponga que se quiere elaborar un modelo ms sencillo donde las ventas semanales se expliquen exclusivamente con la cantidad de catlogos a imprimir por mes: Yi = 0 + 1 . X 1i + i . Si se utilizan los mismos datos que permitieron estimar el modelo anterior: 7.1) Cmo es el nuevo R2 respecto al del modelo anterior? Fundamentar la respuesta. 7.2) Cmo es el nuevo R2 corregido respecto al del modelo anterior? Fundamentar. 0 = 11.260,0 , cul es la estimacin de 1 ? 7.3) Sabiendo que

7.4) Sabiendo adems que el estadstico-t para 1 es 9,798, deducir la parte de la variacin total explicada por el nuevo modelo. 7.5) Utilizando el nuevo modelo, realizar una prediccin de las ventas de una semana en que se imprimirn 12.000 catlogos, y construir un intervalo para la prediccin al 95%.

56

SEGUNDA REVISIN 2005 SEGUNDA REVISIN 2005


EJERCICIO 1 (15 puntos)

e x si x Sea la variable aleatoria X con funcin de densidad fX(x) = si x < 0 Sea (X1, X2,,Xn) una MAS C/R de X. (Observe que Y = X tiene distribucin Exponencial de parmetro = 1).
SE PIDE: 1. Hallar la distribucin del estadstico T = Mx(Xi). ~ ). 2. Hallar el estimador de por el mtodo de los momentos ( ~ ). 3. Calcular ECM( ~ converge en probabilidad al parmetro . 4. Probar que
EJERCICIO 2 (8 puntos) Un camin cargado de 1.200 cajones de naranjas debe atravesar un puesto de control. Las Autoridades slo permiten continuar al camin si la carga no excede las 10 toneladas. La capacidad del camin es de 12 toneladas y las Autoridades entienden que la carga podra exceder del lmite permitido. Como la opcin de pesar toda la carga sera muy complicada, se decide seleccionar una MAS S/R de 100 cajones, resultando un promedio de 8 kilos por cajn, con una cuasi-varianza en la muestra de 3 Kg2.

SE PIDE: 1. Construir un intervalo de confianza al 95% para el peso total de la carga. 2. Cul es la probabilidad aproximada que la carga supere las 10 toneladas?
EJERCICIO 3 (12 puntos) El gerente de marketing realiz una investigacin de mercado para decidir sobre la conveniencia de lanzar un nuevo producto al mercado. La decisin sera afirmativa si ms del 20% de los consumidores consultados se muestra interesado por el nuevo producto. Se seleccion una MAS C/R de tamao n en la que se encontr que el 24% estaba interesado en el producto. Como se defini Xi = 1 si el entrevistado i est interesado en el producto y 0 en caso contrario y se eligi RC = {Muestras: x > 0,2329} con un = 0.05, el gerente decidi rechazar H0) p 0,2.

a) Determinar el tamao de muestra utilizado. b) Cul sera la decisin (lanzar el nuevo producto / no lanzarlo) si fuera = 0.04?
EJERCICIO 4 (15 puntos) El Profesor Teo Primo opina que el puntaje de la Primera Revisin de Estadstica II se puede explicar mediante un modelo lineal exclusivamente con el nivel de asistencia a clase de los alumnos. Para comprobar esta afirmacin Teo seleccion, de la poblacin que rindi la Primera Revisin de Estadstica II, una muestra de 45 alumnos con la siguiente distribucin.

Sean: Yi = Puntaje de la Primera Revisin de Estadstica II del alumno i xi = N de clases del primer semestre a las que asisti el alumno i 57

SEGUNDA REVISIN 2005 EJERCICIO 4 (continuacin) NMERO DE CLASES A LAS QUE ASISTIERON EN EL PRIMER SEMESTRE 40 36 32

CANTIDAD DE ALUMNOS 15 15 15 Resultados del Modelo de Teo Primo

= 10 + 0,3. x Y i i

R 2 = 0,72
SE PIDE: 1) Calcular 2) Deducir

(x
i i

x ) a partir de los datos de la muestra.


2

(y

y) .
2

3) Construir un intervalo de confianza al 95% para 1. 4) Estudiar la significacin del modelo.

58

Vous aimerez peut-être aussi