Académique Documents
Professionnel Documents
Culture Documents
(1) En este caso es preferible usar las fórmulas desarrolladas en el Tema 12 para calcular y n.
(2) Como es desconocido podemos:
(a) Estimarla a partir de la muestra: ˆ S . Si aún no se tiene, se necesita una muestra piloto.
(b) Expresar las alternativas en función de . P. ej. hallar para 0=1,5 (es decir d=1.5).
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 235
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un producto limpiador debe contener 25 gr. de un determinado componente para ser
eficaz, pero se sospecha por las muchas quejas de los consumidores que el proceso de fabricación no 11
funciona bien y que esa cantidad es menor. Para ello se toma una muestra de 15 productos y en cada
uno se mide la cantidad del componente obteniendo: X 24.1 gr. y S=0.6gr.
El contraste que hay que plantear es H 0 : 25 contra H 1 : 25 pues queremos que los
consumidores tengan que “demostrar” que el contenido medio está por debajo de los 25 gr.
Supongamos que se hace un test a nivel habitual .
X 0 X 0 24.1 25
C tn 1, 5.81 1.761 t14, 0.05
S n S n 0.6 15
11
El p-valor que corresponde al valor observado t= -5.81 es Pt14 5.81 0.0005 por lo que rechazamos
Ho a cualquier nivel de significación habitual.
Si además queremos calcular el tamaño muestral necesario para que la probabilidad de NO detectar
un contenido medio ineficaz de sea menor de 0.10 ((24.75)<0.10), utilizamos las curvas CO
correspondientes a un test con distribución t y de nivel 0.05 entrando con
0 0.25
d 0.41
0 .6
y obtenemos que, aproximadamente, debe ser n = 50.
Con la muestra de tamaño 15 que hemos usado, la probabilidad de cometer Error de tipo II si la
muestra nos hubiese conducido a No Rechazar H0 habría sido mucho mayor que 0.10. En las curvas
CO obtenemos aproximadamente =0.55.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 236
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Para esmerilar discos de silicio al grueso apropiado se utiliza un cierto proceso de
bruñido. Para dar sensación de homogeneidad en el producto, interesa que la variable "X=grosor de
los discos" tenga una desviación típica lo menor posible, considerando satisfactorio el proceso si
dicha desviación no supera los 0.5 mm. Se realiza un estudio sobre una muestra de 15 discos y se
obtiene S=0.64 mm. ¿Hay evidencias de que el proceso no sea satisfactorio al nivel .
Para saber si tenemos evidencias suficientes de que el proceso no funciona bien al nivel fijado
debemos colocar esta situación en de modo que tendremos evidencias suficientes de ello si somos
capaces de rechazar .
H 0 : 2 0.5 2
n 1S 2 n 1S 2 14 0.64 2
C n 1,
2
22.904 23.68 142 ,0.05
H 1 : 0.5
2 2
0
2
0 2
0. 5 2
Ejemplo: Un artículo publicado en la revista Materials Engineering (1989, Vol. II, No. 4, págs. 275-
281) describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación
U-700. La carga para la que cada espécimen falla es la siguiente (en MPa):
19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9, 7.9, 17.6, 13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9,
15.8, 11.4, 15.4, 11.4
¿Hay evidencias empíricas de que >10 Mpa con un nivel de significación =0.01?
¿Se puede descartar que =4 Mpa al nivel =0.01?
¿Es asumible la hipótesis de normalidad?(Plot de Normalidad visto en prácticas)
percentage
80
50
20
5
1
0,1
7 8 9 10 11 12 13 14 15 16 17 18 19 20 7 10 13 16 19 22
Resistencia Resistencia
CONCLUSIONES:
1. La media es significativamente superior a 10 Mpa.
2. No hay evidencias de que la desviación típica sea distinta de 4 Mpa.
3. La hipótesis de normalidad parece asumible. (Plot)
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 239
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
S n S n
2 2
S1
S 2 t0>t, 2
1 1
2 2
2 2
2 15
Behrens-Fisher H1: 12< n1 n2 t0<t, n1 1 n2 1
solución aproximada
H1: 12 S 2 F F n1 1, n2 1, 2 F F n1 1, n2 1,1 2 Solo para n1=n2=n o, p
H0: 1=2 F0 1 0 0
16
H1: 1>2 S 2
2
F0 Fn1 1, n2 1, =1/2 q, r
Muy frecuentemente la diferencia a contrastar es
(2) Como es desconocido se adoptan las mismas soluciones (a) y (b) del caso de una muestra.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 240
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: En una investigación industrial se está buscando reducir el tiempo de secado de una
pintura de imprimación. Se ponen a prueba dos formulaciones de la pintura; la formulación 1 es la
estándar, y la formulación 2 tiene un nuevo ingrediente pensado para reducir el tiempo de secado.
Por experiencia, se sabe que la desviación típica del tiempo de secado es de 8 minutos, y que esta
variabilidad natural no se verá afectada por la adición del nuevo ingrediente. Se pintan 20
ejemplares en orden aleatorio, diez con cada una de las formulaciones. El promedio de los tiempos
de secado de las muestras en minutos son X 1 121 min. y X 2 112 min.
a) ¿Qué conclusiones se pueden extraer sobre la efectividad del ingrediente nuevo, usando =0.05?
b) Si la verdadera diferencia entre los tiempos medios de secado fuera de 10 minutos, hallar la
potencia de la prueba realizada en a) para detectar esta diferencia.
c) Si se quiere que dicha potencia sea al menos 0.95, hallar los tamaños muestrales necesarios.
d) ¿Se puede afirmar a partir de la muestra, con un nivel de significación =0.05, que el tiempo
medio de secado se reduce en más de 5 minutos?.
Solución:
a) Las hipótesis a contrastar son
H 0: 1 2 X X2
C 1
z z0
X1 X 2
121 112
2.52 1.645 z 0.05
H 1: 1 2 1 2
2 2 2 2 2 2
8 8
n
1
2
1 n2 n1 n2 10 10
b) Para calcular la potencia pedida, utilizamos las Curvas CO, Carta VI (c), con las entradas
1 2 10
d 0.88 n n1 n2 10
2
1
2
2 8 8
2 2
y obtenemos 0.85.
c) El tamaño muestral necesario para que el test de a) tenga una potencia de 0.95 (es decir cometa
un error de tipo II con una probabilidad <0.05) si falla H0 y ocurre que se obtiene
también utilizando las curvas CO, la misma carta que en el apartado b):
n n1 n2 14.
d) Las hipótesis a contrastar son
H 0: 1 2 5 X
C 1
X 2
z z0
X1 X 2 5
121 112 5
1.12 1.645 z 0.05
H 1: 1 2 5 1 2
2 2 2 2 2 2
8 8
n
1
2
1 n2 n1 n2 10 10
Entonces, no rechazamos H0 y no queda probado que la nueva formulación reduce el tiempo de
secado en más de 5 minutos.
El p-valor sería Pz 1.12 1 (1.12) 0.1314 y no rechazamos H0 a los niveles habituales.
Ejemplo: La presencia de arsénico en el agua para consumo humano es un riesgo potencial para la
salud. Un artículo publicado en Arizona Republic (Sunday, May 27, 2001) informó de las
concentraciones de arsénico en el suministro de agua, en partes por billón (PPB), en 10 áreas
metropolitanas de Phoenix y en 10 áreas rurales de Arizona. Los datos obtenidos fueron:
Metro Phoenix Rural Arizona
Phoenix, 3 Rimrock, 48
Chandler, 7 Goodyear, 44
Gilbert, 25 New River, 40
Glendale, 10 Apachie Junction, 38
Mesa, 15 Buckeye, 33
Paradise Valley, 6 Nogales, 21
Peoria, 12 Black Canyon City, 20
Scottsdale, 25 Sedona, 12
Tempe, 15 Payson, 1
Sun City, 7 Casa Grande, 18
Procesando las muestras obtenemos:
Metro Phoenix: X 1 12 .5 S 1 7.63 Rural Arizona: X 2 27 .5 S 2 15 .35 .
Se quiere determinar si hay diferencias entre las concentraciones medias de arsénico en el agua en
ambas zonas para . Se supone normalidad para la distribución de ambas variables.
Solución:
Vamos a hacer en primer lugar un test de comparación de varianzas, por ejemplo, con :
H 0: 1 2
C F0 Fn1 1, n2 1, 2 F0 Fn1 1, n2 1,1 2 F
S12 7.632
; 0 S 2 15.32 0.2473
1
F9,9,0.95
H 1: 1 2 2 3.18
Luego rechazamos la igualdad de varianzas. El p-valor sería 2 P F0 0,2473 2 0,02468 0,04936 .
Así pues, para comparar las medias hay que trabajar con el test para varianzas distintas:
H0: 1 2 0 X1 X 2 X1 X 2 12.5 27.5
C t , / 2 t0 2.77 2.16 t13, 0.025
H1: 1 2 0 S1 S 2
2 2 2 2 2 2
S S 7.63 15.3
n n
1 2
1 2 n1 n 2 10 10
Luego rechazamos la igualdad de medias y las concentraciones medias de arsénico en ambas zonas
son diferentes para el nivel de significación usado.
S 1
2
n1 S 22 n2
2
2 13.2 13
Nota: S 1
2
n1
S n2
2 2
2
2
n1 1 n2 1
En este problema no podríamos abordar el cálculo de la potencia y el tamaño muestral.
Ejemplo: Se analizan dos catalizadores para ver la forma en que afectan al rendimiento promedio de
un proceso químico. El Catalizador 1 es el que se está empleando en este momento, pero el
Catalizador 2 también es aceptable y más económico. Por tanto, podría adoptarse éste siempre que
no haya evidencias de que cambia el rendimiento medio del proceso. Se hace una prueba en una
planta piloto y los resultados son:
Catalizador 1 Catalizador II
91,50 89,19
94,18 90,95 a) ¿Existen diferencias entre los rendimientos promedio? =0.05
92,18 90,46 b) ¿Se pueden considerar iguales las varianzas? =0.05 (verlo antes)
95,39 93,21 c) ¿Los rendimientos siguen leyes normales?
91,79 97,19
89,07 97,04
94,72 91,07
89,91 92,75
Solución con STATGRAPHICS:
Summary Statistics
Catalizador 1 Catalizador 2
----------------------------------------------
Count 8 8
Average 92,3425 92,7325 Catalizador 1
Variance 5,14056 8,90099
Standard dev. 2,26728 2,98345
Minimum 89,07 89,19
Maximum 95,39 97,19 Catalizador 2
Skewness -0,0370055 0,732691
Kurtosis -1,26841 -0,827821
89 90 91 92 93 94 95 96 97 98
Comparison of Means
99,9
95,0% confidence interval for mean of Catalizador 1: 99
92,3425 +/- 1,8955 [90,447,94,238] 95
percentage
95,0% confidence interval for mean of Catalizador 2:
80
92,7325 +/- 2,49424 [90,2383,95,2267]
95,0% confidence interval for the differ. between the means 50
assuming equal variances: -0,39 +/- 2,8415 [-3,2315,2,4515] 20
5
t test to compare means
1
Null hypothesis: mean1 = mean2 0,1
Alt. hypothesis: mean1 NE mean2 89 91 93 95 97
assuming equal variances: t = -0,294376 P-value = 0,77279 Catalizador 1
Comparison of Standard Deviations
99,9
95,0% Confidence Intervals
Standard deviation of Catalizador 1: [1,49907;4,61453] 99
Standard deviation of Catalizador 2: [1,97258;6,07214] 95
percentage
Ratio of Variances: [0,115623;2,8847]
80
F-test to Compare Standard Deviations
50
Null hypothesis: sigma1 = sigma2 20
Alt. hypothesis: sigma1 NE sigma2
F = 0,577527 P-value = 0,485992 5
1
CONCLUSIONES: 0,1
a) Las varianzas se pueden considerar iguales. 89 91 93 95 97 99
b) No hay evidencias de que cambie el rendimiento medio. Catalizador 2
c) La hipótesis de normalidad se puede asumir.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 246
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
X1 X 2 X1 X 2 D
S D2 S12 S 22 2 S X1 X 2 S12 S 22 t0INDRP
2 2
2
t0PARES
S S S SD n
1
2 D
n n n
(la asociación entre variables cuantitativas se estudiará en el próximo tema).
Por tanto, una determinada diferencia observada entre las medias muestrales resulta mucho más
significativa estadísticamente en el caso de muestras pareadas.
Cuanto mayores son los vínculos en el apareamiento, mayor es la ganancia de potencia y la ventaja
del diseño por pares. Éste consigue eliminar la variabilidad debida a otros factores que no están en
estudio.
Una vez realizado el diseño y obtenidas las muestras, el análisis de los datos sólo se puede realizar
mediante la técnica correspondiente al diseño utilizado. Es decir, si las muestras son
independientes no se pueden analizar como apareadas y si son apareadas no se pueden analizar como
independientes.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 250
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un artículo publicado en Journal of Strain Analysis (1983, Vol. 18, No. 2) compara dos
métodos, Karlsruhe y Lehigh, para predecir la resistencia al corte de vigas de placa de acero. Se
aplican ambos métodos a una muestra de nueve vigas y se obtienen los siguientes resultados:
Viga S1/1 S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4
Karlsruhe Method 1.180 1.151 1.322 1.339 1.203 1.402 1.365 1.537 1.559
Lehigh Method 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Diferencias 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507
a) Determinar si hay alguna diferencia de medias entre los dos métodos para =0.05.
H0 : D 0 D D 0.2736
C t n 1, / 2 t 6.05 2.306 t 8, 0.025
H1: D 0
0
S D n S D n 0.1356 9
D 0.2736; S D 0.1356
Rechazamos la hipótesis nula. Los datos parecen indicar concretamente una mayor resistencia del
Método Karlsruhe. El p-valor es prácticamente nulo.
b) Determinar si la media con el Método Karlsruhe es superior en más de 0.2 para =0.05.
H0 : D 0.2 D 0 D 0 0.2736 0.2
C t n 1, t 1.63 1.86 t 8, 0.05 . p-valor=0.070.
0
1 D
H : 0.2 D
S n S D n 0 . 1356 9
No se rechaza H0 ,y por tanto, no queda “probada” H1.
c) Hallar el tamaño muestral necesario para que la prueba realizada en b) detecte una diferencia de
0.25 favorable a Karlsruhe con una potencia de 0.9.
d) Curvas CO, Carta VI (g) D 0 0.25 0.20
d 0.37, 0.1 entre n 50 y n 75 pares.
D 0.1356
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 251
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un Laboratorio lanza un producto dietético y anuncia en su publicidad que el uso del
producto durante un mes conduce a una pérdida de peso promedio de al menos 2 kg. Ocho sujetos
utilizan el producto durante un mes, y los datos de peso como resultado la pérdida se presentan a
continuación.
a) ¿Los datos apoyan la afirmación del productor de los productos dietéticos con ?
b) En un esfuerzo por mejorar las ventas, el Laboratorio está considerando cambiar su eslogan de
"al menos 2 kg." por "al menos 3 kg."
Sujeto 1 2 3 4 5 6 7 8
Peso Antes 75.6 83.1 98,4 67.9 102.6 88.3 72.5 97.9
Peso Después 70.3 82.2 92.3 66.1 100.2 82.7 68.6 91.4
Solución con STATGRAPHICS
Resumen Estadístico para ANTES - DESPUES
Recuento 8
Promedio 4,0625
Desviación Estándar 2,1347
Mínimo 0,9
Máximo 6,5
Cuartil Inferior 2,1
Cuartil Superior 5,85
Sesgo -0,378689
Curtosis -1,69135 0 2 4 6 8
ANTES - DESPUES
99
Estadístico t = 2,73276 95
Valor-P = 0,014611 80
porcentaje
Se rechaza la hipótesis nula para alfa = 0,05.
50
20
Prueba de Hipótesis para ANTES - DESPUES 5
Media Muestral = 4,0625
1
Mediana Muestral = 4,6
0,1
Desviación Estándar de la Muestra = 2,1347 0 2 4 6 8
ANTES - DESPUES
Prueba t
Hipótesis Nula: media = 3,0
Alternativa: mayor que
Estadístico t = 1,40778
Valor-P = 0,10101
No se rechaza la hipótesis nula para alfa = 0,05.
Ejemplo: Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante
aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la superficie está
significativamente por debajo del 2%. Se toma una muestra aleatoria de 250 lentes y se encuentra
que 6 de ellos tienen defectos.
¿Qué decisión debe tomar el fabricante a nivel =0.05?
pˆ p0
C z0 z z0 z
La región crítica para =0.05 es: p 0 (1 p0 )
n
pˆ p 0 0.024 0.02
0.45 1.645 z 0.05
Con los datos de la muestra tenemos: p 0 (1 p 0 ) 0.02 0.98
n 250
Ejemplo: Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas
de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se
toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15 piezas defectuosas en la
muestra de la Máquina 1 y 8 piezas defectuosas en la muestra de la Máquina 2. ¿Queda con ello
probado que existen diferencias entre las máquinas a nivel a nivel =0.05?
pˆ 1 pˆ 2 0.05 0.0266
Es decir: 1.49 1.96 z 0.025
1 1 2
pˆ (1 pˆ ) 0.0383 0.9617
1
n n 2 300
De manera análoga, los test unitaterales son duales de las cotas de confianza.