Vous êtes sur la page 1sur 14

Universidad de Oviedo

EPI
GIJN

ESTAD ISTICA - 19 de mayo de 2011 MODELO 1 PREGUNTAS DE LOS TEMAS 1 Y 2

1. Acerca de las medidas de dispersi on se puede asegurar que: a) b) c) d) La varianza nunca puede ser un n umero negativo. El recorrido intercuart lico es siempre menor que el rango. La desviaci on t pica nunca puede ser mayor que 1. El rango nunca puede ser un n umero negativo.

2. A partir del siguiente diagrama de barras de una muestra, se puede asegurar que:
6 Frecuencia 0 1 1 2 3 4 5

4 X

a) b) c) d)

La moda es 3. El rango es 7. La mediana es 4. La media es 2.

3. Para una variable aleatoria X con distribuci on N (10, 3) se tiene que: a ) La probabilidad de que X tome un valor mayor que 10 es 0 5. b ) La probabilidad de que X tome un valor mayor que 16 es la misma que la probabilidad de que una variable Z con distribuci on N (0, 1) tome un valor mayor que 2. c ) La probabilidad de que X tome exactamente el valor 10 es cero. d ) Su funci on de distribuci on para el valor 10 es 0 5. 4. Si la probabilidad de que una pieza sea defectuosa es 0 01, la probabilidad de que no haya piezas defectuosas en un lote de 20 piezas seleccionadas aleatoriamente es aproximadamente igual a: a) b) c) d) 0 82. 0 5. 0. 0 18.

PREGUNTAS DE LOS TEMAS 3 Y 4


5. Para una muestra aleatoria de tama no 100, se ha obtenido, mediante el m etodo habitual, que (0 149, 0 311) es un intervalo de conanza al 95 % para la proporci on poblacional p. a ) A partir de esos datos, (0 17, 0 29) ser a un intervalo de conanza para p al 97 %. b ) A partir de esos datos, (0 19, 0 28) ser a un intervalo de conanza para p al 98 %. c ) Una estimaci on puntual de p viene dada por el valor 0 23. d ) Si se consideran otros 100 datos distintos, el intervalo de conanza al 95 % para p obtenido a partir de ellos es seguro que tiene alg un punto en com un con el intervalo (0 149, 0 311). 6. En una empresa quieren contrastar si el porcentaje de piezas defectuosas es mayor o igual del 3 % frente a la alternativa de que es inferior al 3 %. Para ello se considera una muestra aleatoria de 1000 piezas y con ella se obtienen las siguientes salidas de R: 1-sample proportions test without continuity correction data: rbind(.Table), null probability 0.03 X-squared = 1.6838, df = 1, p-value = 0.9028 alternative hypothesis: true p is less than 0.03 95 percent confidence interval: 0.00000000 0.04813371 sample estimates: p 0.037 a ) Si en la muestra hubiese habido 55 piezas defectuosas, el p-valor ser a menor. b ) En la muestra se han obtenido 37 piezas defectuosas. c ) Si en la muestra hubiese habido 25 piezas defectuosas, el p-valor ser a mayor. d ) No hay evidencias estad sticas, al nivel de signicaci on = 0 05, de que el porcentaje de defectuosas sea menor del 3 %. 7. Se tiene una muestra de 80 componentes electr onicos, para los que se estudia el tipo de fallo que pueden tener (A, B, C) y la posici on de montaje del dispositivo (I, II). Se realiza un test de independencia chi-cuadrado, obteni endose los resultados: Pearsons Chi-squared test data: .Table X-squared = 187, df = 2, p-value = 0.021 a ) No hay evidencias estad sticas para armar que el tipo de fallo depende de la posici on de montaje, a un nivel de signicaci on 0 01. b ) Hay evidencias estad sticas para armar que el tipo de fallo depende de la posici on de montaje, a un nivel de signicaci on 0 01. c ) Hay evidencias estad sticas para armar que el tipo de fallo depende de la posici on de montaje, a un nivel de signicaci on 0 05.

d ) El coeciente de independencia chi-cuadrado para esta muestra vale 18 7. 8. Supongamos que el alargamiento (Y , en mm.) de un cable est a relacionado linealmente con la intensidad (x) de la fuerza aplicada. Se sabe que: De acuerdo con el modelo lineal, si se aumenta la intensidad de la fuerza en una unidad, el cable se alarga en 2 03mm. De acuerdo con el modelo lineal, si se aplica una fuerza de 2 unidades, se espera que el cable se alargue en 4 3mm. El coeciente de determinaci on correspondiente al ajuste lineal es 0 97. Entonces, se puede armar que: a ) La recta de regresi on es y = 4 3 + 2 03x. b ) El modelo lineal considerado es bueno. c ) El coeciente de correlaci on lineal de Pearson es aproximadamente 0 985. d ) El porcentaje de variabilidad del alargamiento explicado por la regresi on es del 985 %.

PREGUNTAS DEL TEMA 5


9. Un sistema est a formado por dos componentes independientes C1 y C2 . La probabilidad de que funcione C1 es 0 95 y la de que funcione C2 es 0 99. Entonces la probabilidad de que funcione alguno de los componentes es: a ) 0 9995. b ) 0 9405. c ) 0 0005. d ) 0 0595. 10. La vida de los componentes electr onicos de un cierto tipo C1 sigue una distribuci on exponencial de media 2 a nos. La vida de los componentes de otro tipo C2 sigue una distribuci on exponencial de media 4 a nos. Suponiendo que las duraciones de ambos tipos de componentes son independientes: a ) La abilidad de un componente C1 a los 2 a nos es e1 . b ) La abilidad de un componente C2 a los 2 a nos es e2 . c ) La probabilidad de que un componente C2 dure como mucho 2 a nos es 1 e2 . d ) La probabilidad de que ambos tipos de componentes duren m as de 2 a nos es e3/2 .

SOLUCIONES PROVISIONALES DEL EXAMEN DE ESTAD ISTICA 19 de mayo de 2011- TEST MODELO 1

Pregunta 1 2 3 4 5 6 7 8 9 10

a) X X X X

b) X X

c) X X X

d) X X

X X X X X X

X X

SOLUCIONES PROVISIONALES DEL EXAMEN DE ESTAD ISTICA 19 de mayo de 2011- TEST MODELO 2

Pregunta 1 2 3 4 5 6 7 8 9 10

a)

b) X

c)

X X X X X

X X

d) X X X X

X X X

X X X X

SOLUCIONES PROVISIONALES DEL EXAMEN DE ESTAD ISTICA 19 de mayo de 2011- TEST MODELO 3

Pregunta 1 2 3 4 5 6 7 8 9 10

a) X X X

b) X

X X X X

c) X X X X X

d) X

X X X X

SOLUCIONES PROVISIONALES DEL EXAMEN DE ESTAD ISTICA 19 de mayo de 2011- TEST MODELO 4

Pregunta 1 2 3 4 5 6 7 8 9 10

a) X X

b) X X X X

c) X X X X X

d) X X

X X X

X X

Universidad de Oviedo

EPI
GIJN

ESTAD ISTICA - 19 de mayo de 2011 EJERCICIOS

1. En cierta localidad, se han recogido los datos del n umero mensual de horas de sol en los u ltimos 12 a nos. Los diagramas de caja de la gura representan los datos correspondientes a los meses de invierno y verano, respectivamente.

Horas de sol

100

150

200

250

300

invierno

verano

Estacin
a ) (025 puntos) En cu al de las dos muestras (invierno o verano) se observa mayor dispersi on en el n umero mensual de horas de sol? Justica tu respuesta. b ) (05 puntos) En cu al de las dos estaciones ha sido m as alto, en promedio, el n umero mensual de horas de sol en los u ltimos 12 a nos? En que medida de tendencia central te has basado para contestar a la pregunta anterior? Hay observaciones at picas en alguna de las dos muestras? c ) (025 puntos) En la muestra de los meses de verano, a partir de qu e valor (n umero de horas), aproximadamente, se sit ua el 25 % de los meses con m as horas de sol? Por qu e? Con el n de estudiar la distribuci on del n umero de horas de sol en ambas estaciones, se realizan los siguiente an alisis con el paquete R: INVIERNO: Shapiro-Wilk normality test data: invierno$Horas W = 0.939, p-value = 0.04731 ------------------------------95 percent confidence interval: 172.8746 202.3920

VERANO: Shapiro-Wilk normality test data: verano$Horas W = 0.9522, p-value = 0.1230 ------------------------------95 percent confidence interval: 195.2743 242.3646 d ) (025 puntos) Se puede considerar (con un nivel de signicaci on = 0,05) que el n umero mensual de horas de sol en invierno se ajusta a una distribuci on normal? Y en verano? Por qu e? e ) (025 puntos) Entre qu e dos valores se puede asegurar, con un nivel de conanza del 95 %, que est a el verdadero valor del n umero media horas de sol en los meses de invierno? C omo cambiar a el intervalo de conanza para la media en los meses de invierno si se pidiese una conanza del 99 % a partir de la misma muestra? Justica tu respuesta. Finalmente se realiza una comparaci on, en promedio, del n umero mensual de horas de sol en ambas estaciones. f ) (025 puntos) Se desea saber si se puede asumir que el n umero mensual de horas de sol es igual en ambas estaciones, en promedio. Cu ales ser an las hip otesis que habr a que plantear? Qu e test habr a que utilizar para resolver el contraste? Por qu e? g ) (025 puntos) Seleccionando, de entre las salidas de R que se presentan a continuaci on, la que se ajuste al contraste del apartado anterior, al nivel = 0 05 Se puede considerar que hay diferencias signicativas, entre el n umero de horas de sol en invierno y verano, en promedio? Y al nivel = 0 1? Justica ambas respuestas. Two Sample t-test data: Horas by Estacion t = -2.2783, df = 70, p-value = 0.02576 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -58.486239 -3.885983 sample estimates: mean in group invierno mean in group verano 187.6333 218.8194 ------------------------------------------------------------Wilcoxon rank sum test with continuity correction data: Horas by Estacion W = 486, p-value = 0.06893 alternative hypothesis: true location shift is not equal to 0 -------------------------------------------------------------

Wilcoxon rank sum test with continuity correction data: Horas by Estacion W = 486, p-value = 0.03447 alternative hypothesis: true location shift is less than 0 h ) (025 puntos) Seleccionando la salida adecuada de entre las 3 anteriores, existen evidencias signicativas, al nivel = 0 05, de que el n umero mensual de horas de sol es menor en invierno que en verano, en promedio? Justica tu respuesta. 2. Las componentes electr onicas de cierto tipo tienen una duraci on (en horas) que puede considerarse conforme a una distribuci on normal de media 120 y desviaci on t pica 20. Se consideran 5 componentes de este tipo, todas ellas con comportamiento independiente. a ) (05 puntos) Considera una componente cualquiera de las anteriores, cu al es la probabilidad de que dure exactamente 118 horas? Y la probabilidad de que dure m as de 120 horas? b ) (05 puntos) Si se consideran las 5 componentes, cu al es la probabilidad de que como mucho una de ellas dure m as de 120 horas? c ) (05 puntos) Si las 5 componentes se disponen formando un sistema tal como se indica en la gura adjunta,

expresa el suceso FS =el sistema dura m as de 120 horas como funci on de los cinco sucesos del tipo Fi =la componente Ci dura m as de 120 horas con i = 1, 2, . . . , 5; calcula la probabilidad de que dicho sistema dure m as de 120 horas. 3. Se desea estudiar la relaci on existente entre el precio por kg (en euros) y la cantidad vendida (en kg.) de cierto producto. Para ello se ha tomado una muestra de 25 jornadas, en las que se han observado ambas variables. A partir de los datos muestrales, se realizan los siguiente an alisis con el paquete R: Call: lm(formula = ventas ~ precio, data = Datos) Residuals: Min 1Q Median -0.56126 -0.11279 -0.05455

3Q 0.20065

Max 0.91874

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 320.39215 0.57964 552.75 < 2e-16 *** precio -0.54480 0.04797 -11.36 6.58e-11 *** --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 0.3392 on 23 degrees of freedom Multiple R-squared: 0.8487,Adjusted R-squared: 0.8421 F-statistic: 129 on 1 and 23 DF, p-value: 6.582e-11

> predict(RegModel.1,data.frame(precio=c(10)),interval=prediction) fit lwr upr 1 315.1528 312.9457 317.3598 > predict(RegModel.1,data.frame(precio=c(10)),interval=confidence) fit lwr upr 1 315.1528 314.4303 315.8752

a ) (025 puntos) Determina la ecuaci on de la recta de regresi on de la cantidad vendida (Y ) en funci on del precio (x). b ) (025 puntos) Determina los valores de los siguientes coecientes: el coeciente de correlaci on lineal, el coeciente de determinaci on y el coeciente de determinaci on ajustado, especicando cu al es cada uno de ellos. c ) (025 puntos) Puede considerarse, al nivel de signicaci on = 0 05, que la cantidad vendida est a relacionada linealmente con el precio? d ) (025 puntos) A partir del modelo lineal obtenido, determina, por medio de un intervalo de conanza, la cantidad media vendida en las jornadas en que el precio es de 10 euros por kg. e ) (025 puntos) A partir del modelo lineal obtenido, determina el residuo correspondiente a una jornada en la que el precio del kg de producto ha sido de 10 euros y la cantidad vendida ha sido de 317 kg.

Universidad de Oviedo

EPI
GIJN

SOLUCIONES PROVISIONALES DEL EXAMEN DE ESTAD ISTICA - 19 de mayo de 2011

1.

a ) Las dos medidas de dispersi on que se pueden obtener del diagrama de cajas con el rango y el recorrido intercuart lico. En este caso, dichos valores son aproximadamente: Invierno Verano Rango 150 240 Recorrido intercuart lico 65 120 De acuerdo con las dos medidas e incluso con un simple vistazo a las dos gr acas se observa que la dispersi on del n umero de horas de sol es mayor en los meses de verano que en los de invierno. b ) La u nica medida promedio que puede obtenerse directamente del diagrama de cajas es la mediana. De acuerdo con ella la mediana aproximada en los dos casos analizados es aproximadamente: Invierno Verano Mediana 195 210 Por lo tanto, seg un dicha medida de tendencia central, el n umero mensual de horas de sol ha sido mayor en los meses de verano que en los de invierno, en promedio, durante los meses analizados (muestra). No existen observaciones at picas, puesto que estas deber an venir reejadas en los diagramas de caja mediante puntos o c rculos exteriores a las l neas (bigotes) de los gr acos y no es as . c ) El valor que sit ua el 25 % de los meses por encima es el percentil 75 o tercer cuartil. En base a dichos gr acos, dicho valor es aproximadamente: Invierno Verano Tercer cuartil 220 290 con lo cual se puede contestar que el valor aproximado que sit ua a partir de el el 25 % de los meses de verano con m as horas de sol es unas 290 horas de sol. d ) Puesto que las hip otesis contrastadas por el test de Shapiro-Wilk son: H0 : H1 : los datos provienen de una poblaci on normal los datos NO provienen de una poblaci on normal

y el p-valor asociado a este test a partir de los datos recogidos para los meses de invierno (0 04731) es menor que el nivel de signicaci on = 0 05, se rechaza la hip otesis nula, es decir, existen evidencias estad sticas de que la distribuci on del n umero de horas de sol en los meses de invierno no es normal. Sin embargo, en el caso de los datos relativos a los meses de verano, el p-valor asociado es 0 1230, con lo que no se rechaza, a ese nivel, la hip otesis nula, es decir, no existen evidencias estad sticas de que la distribuci on del n umero de horas de sol en los meses de verano no sea normal.

e ) Seg un se puede observar en las salidas de R, un intervalo de conanza, al 95 % de conanza, del n umero medio de horas de sol en los meses de invierno es (172 8746, 202 3920). Con los mismos datos, si quisi esemos obtener un intervalo de conanza al 99 % en lugar de al 95 %, el intervalo tendr a que ser de mayor amplitud, para tener m as seguridad de que el verdadero valor de la media poblacional est a ah dentro. f ) Si se quiere contrastar si el n umero mensual de horas de sol es igual en ambas estaciones, en promedio, las hip otesis que habr a que plantear ser an: H0 : H1 : las horas mensuales de sol son iguales en verano e invierno, en promedio las horas mensuales de sol son distintas en verano e invierno, en promedio

Puesto que no se verica la normalidad de ambas variables, seg un lo visto en clase se utilizar a el test de Wilcoxon para comparar ambas variables, en promedio. Dada la naturaleza de los datos, el test adecuado es el test de Wilcoxon para dos muestras y, por tanto, las hip otesis a contrastar se pueden reescribir como: H0 : M eXI XV = 0 H1 : M eXI XV = 0 donde XI representa el n umero de horas de sol en un mes de invierno y XV en uno de verano. g ) Seg un acabamos de ver, la salida adecuada es la segunda, puesto que se trata del test de Wilcoxon para dos muestras con hip otesis alternativa de tipo distinto. Como el p-valor para este contraste es 0 06893, es mayor del nivel de signicaci on = 0 05 con lo que a ese nivel no se rechaza la hip otesis nula, es decir, no existen evidencia estad sticas de que el n umero mensual de horas de sol sea distinto, en promedio, entre los meses de verano e invierno. Sin embargo, si aumentamos el nivel de signicaci on (probabilidad de error de tipo I) hasta = 0 1, el p-valor es menor y al permitirnos un mayor grado de error, si estamos en disposici on de armar que existen evidencia estad sticas, al nivel = 0 1 de que el n umero mensual de horas de sol sea distinto, en promedio, entre los meses de verano e invierno. h ) En este caso las hip otesis a contrastar son: H0 : M eXI XV 0 H1 : M eXI XV < 0 y, por tanto, la salida de ordenador adecuada es la tercera (hip otesis alternativa tipo menor). Como en este caso el p-valor asociado es 0 03447, menor que el nivel de signicaci on elegido = 0 05, se puede concluir que existen evidencias estad sticas de que el n umero de horas de sol es menor en invierno que en verano, en promedio. Justica tu respuesta. 2. Si denotamos por Xi la duraci on, en horas, de la componente i, se tiene, seg un los datos del enunciado, que Xi N (120, 20), i = 1, 2, 3, 4, 5 y que estas cinco variables son independientes. a ) Puesto que Xi es una variable con distribuci on normal, es continua, con lo que la probabilidad de que tome un valor concreto es siempre cero. As pues, en particular la probabilidad de que dure exactamente 118 horas es P (Xi = 118) = 0. Por otro lado, como la normal es sim etrica respecto a su media, se tiene que la probabilidad de que dure m as de 120 horas es P (Xi > 120) = 0 5.

b ) Si denotamos por Y la variable no de componentes que duran m as de 120 horas de las 5 componentes independientes se tiene que Y sigue una distribuci on binomial B (5, 0 5) y, por tanto, la probabilidad de que como mucho una de ellas dure m as de 120 horas es: P (Y 1) = P (Y = 0) + P (Y = 1) = 5 5 (0 5)0 (1 0 5)5 + (0 5)1 (1 0 5)4 = 0 1875. 0 1

c ) Si denotamos por FS el suceso el sistema dura m as de 120 horas y por Fi los cinco sucesos la componente Ci dura m as de 120 horas con i = 1, 2, . . . , 5, se tiene que FS = (F1 F2 ) F3 (F4 F5 ) y, por tanto, la probabilidad de que dicho sistema dure m as de 120 horas es: indep. P (FS ) = P ((F1 F2 ) F3 (F4 F5 )) = P (F1 F2 ) P (F3 ) P (F4 F5 ). Ahora bien, como indep. P (F1 F2 ) = P (F1 ) + P (F2 ) P (F1 F2 ) = P (F1 ) + P (F2 ) P (F1 ) P (F2 ) = 0 5 + 0 5 0 5 0 5 = 0 75 y an alogamente P (F4 F5 ) = 0 75, se tiene que: P (FS ) = P (F1 F2 ) P (F3 ) P (F4 F5 ) = 0 75 0 5 0 75 = 0 28125. 3. En funci on de estas salidas se tiene que: a ) La ecuaci on de la recta de regresi on de la cantidad vendida (Y ) en funci on del precio (x) es y = 320 39215 0 54480x. b ) El coeciente de determinaci on es R2 = 0 8487, con lo que el coeciente de correlaci on z cuadrada negativa, lineal es R = 0 8487 = 0 9214, donde sabemos que es la ra puesto que el signo del coeciente de correlaci on es el mismo que el de la pendiente de la 2 recta de regresi on. Por u ltimo, el coeciente de determinaci on ajustado es Ra = 0 8421. c ) El p-valor asociado al contraste H0 : 1 = 0 H1 : 1 = 0 es 6 58 1011 con lo que claramente es menor que el nivel de signicaci on = 0 05, es decir, estos datos aportan evidencias estad sticas de que la cantidad vendida est a relacionada linealmente con el precio. d ) Nos piden el intervalo de conanza de la cantidad media vendida en las jornadas en que el precio es de 10 euros por kg. Seg un los datos de las salidas de R dicho intervalo, al 95 % de conanza, es (314 4303, 315 8752). e ) Para una jornada en la que el precio del kg de producto ha sido de 10 euros, el modelo de regresi on propuesto predice un venta de 315 1528, como las ventas reales han sido de 317 kg., el residuo es: ei = yi y i = 317 315 1528 = 1 8472.

Vous aimerez peut-être aussi