Vous êtes sur la page 1sur 12

Dr.

Hctor Quevedo Uras

Prueba de hiptesis para un solo promedio poblacional con varianza 2


conocida usando la distribucin normal
Una hiptesis estadstica es una aseveracin o conjetura con respecto a una o ms
poblaciones. En estadstica, una hiptesis es un enunciado de que algo es verdadero.
En la verdad o falsedad de una hiptesis estadstica siempre hay una incertidumbre,
porque no se puede muestrear toda la poblacin (esto sera imposible). En lugar de
esto, se toma una muestra aleatoria de la poblacin de inters y se usan los datos para
proporcionar evidencia (en trminos de la probabilidad p) para apoyar o refutar la
hiptesis. Por ejemplo, la aceptacin de una hiptesis nula implica que no hay
suficiente evidencia para poder rechazar la hiptesis. No obstante, si se rechaza una
hiptesis hay una evidencia ms fuerte e implica un diseo experimental fuerte,
preciso y conciso. Contrariamente, el no rechazo de una hiptesis implica un diseo
experimental dbil, con una muestra de insuficiente tamao o tcnicas de laboratorio
defectuosas que conllevan mucha variacin.
La estadstica que se usa para hacer pruebas de hiptesis para un solo promedio
poblacional , con varianza conocida usando la distribucin normal, a sabiendas de
que la poblacin muestreada es normal o que n > 30 casos, es:
z = ( X o) / / n (5-31)
Donde:
z = variable aleatoria normal estndar
X = promedio estadstico
o = valor esperado del promedio
= desviacin estndar conocida
n = tamao de la muestra
La tabla de abajo muestra los clculos de las regiones crticas usando diferentes

5-55
Dr. Hctor Quevedo Uras

niveles de significancia.
TABLA 5.5. Tabla mostrando las regiones crticas de acuerdo al valor del nivel de
confianza usado, es decir, si la prueba de hiptesis es bilateral, unilateral derecha o
unilateral izquierda. (Elaboracin propia)
Nivel de confianza (%) 90% 95% 99% 99.5%
Valores crticos de z
para pruebas unilaterales 1.28 1.645 2.33 2.58
(derecha o izquierda) o -1.28 o -1.645 o -2.33 o -2.58
___________________________________________________________________
Valores crticos de z para 1.645 1.96 2.58 2.81
pruebas bilaterales

Por ejemplo si usamos un nivel de confianza de 95%, es decir, un nivel de


significancia de = 0.05, para una prueba de hiptesis unilateral izquierda, entonces,
bajo estas condiciones, el valor crtico de z es -1.645. Similarmente, si se usa el nivel
de significancia de = 0.10, para una prueba de hiptesis unilateral derecha,
entonces, el valor crtico de z es de +1.28.
Cabe notar qu, para las pruebas de hiptesis, los valores de los niveles de
significancia ms comunes son los de = 0.05 y de = 0.01. Por ejemplo, para una
prueba bilateral con = 0.05, los valores crticos de z son de 1.96. No obstante, para
una prueba unilateral izquierda con = 0.05, el valor crtico de z sera de de -1.645 y
as sucesivamente.
Ejemplos de pruebas de hiptesis usando la distribucin normal
Ejemplo #36. Se saca una muestra de 36 anlisis de nitratos (NO3-) para el diseo de
una planta de tratamiento de aguas industriales. Para esto, se calcula un promedio

5-56
Dr. Hctor Quevedo Uras

estadstico de X = 92 mg/L. Estudios previos indican una desviacin estndar


conocida de = 9 mg/L. Probar la hiptesis de que el valor esperado de o es 100
mg/L. Asumir = 0.05 y calcular el valor de la probabilidad p.
Solucin:
1. La hiptesis nula es Ho: = 100.
2. Las hiptesis alternativas son H1:o 100, H2:o > 100, H3:o < 100.
3. Las suposiciones son que la poblacional muestreada es normal, es conocida y, la
muestra es aleatoria.
4. Con el nivel de significancia de = 0.05 (nivel de confianza 95%), las regiones
crticas y los coeficientes crticos son de 1.96.
5. La estadstica usada es la de la distribucin z , z = ( X o) / / n
6. Sustituyendo los valores de X = 92, o = 100, = 9 y n = 36 en la frmula de
arriba da:
z = (92 100) / 9/ 36
= - 5.3
7. Ahora comparando la zcalc. = 5.3 con la z tabulada ztab. Igual a -1.96, se rechaza la
hiptesis y nos inclinamos por H3:o < 100.
8. El valor de la probabilidad p se calcula buscando el valor de 5.3 en la tabla de la
distribucin normal, pero como no est tomamos el valor de .0003. Adems, como la
prueba es bilateral, entonces, multiplicamos .0003 por 2, es decir, (2)(.0003) = .0006.
Este valor es mucho muy significante y da mucha evidencia para apoyar el rechazo de
la hiptesis.
Ejemplo #37. Una muestra aleatoria de 36 concentraciones atmosfricas de xidos de
nitrgeno (NOx), en mg/L, mostr un promedio estadstico o de la muestra de X =

5-57
Dr. Hctor Quevedo Uras

74.0 mg/L. Suponiendo que 2 = 81.0 mg/L, indicara esto que un lmite de
concentraciones de NOx est arriba de 70 mg/L? Usar = 0.05.
Solucin:
1. La prueba de hiptesis nula debe ser Ho: 70, porque la hiptesis alternativa,
dada por el problema, es H1: > 70.
2. Por lo tanto, la prueba de hiptesis es una prueba unilateral derecha.
3. La regin crtica es z = z0.05 = 1.645
4. La estadstica usada es z = ( X o) / / n
Sustituyendo los valores del promedio X = 74, de la desviacin estndar = 9, n =
36 y o = 70 en la funcin estadstica z da:
z = (74 70) / 9/ 36 = 2.66
5. Al comparar el valor de zcalc. = 2.66, con ztab. = 1.645, se rechaza la hiptesis nula y
se dice que, H1: > 70, con un valor de p = 1 - .9961 = .0039, de haber hecho la
decisin equivocada. Aqu, ntese que el valor de p no se multiplica por 2, porque la
prueba es unilateral derecha. Como resultado, la evidencia a favor de H1: es ms
fuerte que la sugerida por un nivel de significancia de 0.05 (porque .0039 <<< 0.05).
Ejemplo #38. En un estudio de la ingeniera ambiental atmosfrica, para evitar la
contaminacin ambiental producida por el consumo excesivo e innecesario de
gasolina, en el diseo de un motor de combustin interna, el departamento de
ingeniera de un constructor de autos, de cierto modelo, afirma que el rendimiento del
millaje de este modelo de auto es de cuando menos 35 millas por galn. El
departamento de control de calidad sugiere que el valor de la desviacin estndar es
de = 4 millas. La Environmental Protection Agency de Estados Unidos de Amrica
quiere probar esta afirmacin para ver si la figura afirmada debera ser ms alta o ms
baja que 35 millas por galn. Para esto, se saca una muestra aleatoria de 50 modelos

5-58
Dr. Hctor Quevedo Uras

de este tipo y se prueban bajo circunstancias iguales. Los resultados dan un promedio
muestral de 33.6 millas por galn. Probar el reclamo del departamento de ingeniera
usando un nivel de significancia de 0.05. Calcular el valor de p.
Solucin:
1. La prueba es bilateral, porque un promedio muestral significantemente, ms alto
que 35 (cola derecha) o menos que 35 (cola izquierda) es una fuerte evidencia contra
la hiptesis nula de = 35.
2. Las regiones crticas son distribuyendo = 0.05 igualmente entre las dos colas para
obtener 0.025 en cada una, con esto, los valores crticos son de 1.96.
3. Usamos la funcin estadstica y sustituimos los valores y da:
z = ( X o) / / n
z = (33.6 35) / 4 50 = -2.47
4. En conclusin, debido a que el valor de -2.47 se introduce en el extremo izquierdo
de la distribucin normal, se rechaza la hiptesis. El valor de p es de .0068, pero
como son dos colas, entonces, este valor se multiplica por 2 y da .0136. Ver figura de
abajo.

X = 33.6
z = -2.47
Figura 5.14. Grfica mostrando los valores crticos para el problema de arriba.

5-59
Dr. Hctor Quevedo Uras

(Elaboracin propia)
Ejemplo #39. El estndar qumico para el agua potable, en cuanto a slidos disueltos
totales (SDT) es de 500 mg/L. Para probar esta aseveracin se saca una muestra
aleatoria de 144 casos y da un promedio aritmtico estadstico de 503 mg/L, con una
desviacin estndar de 15 mg/L. Probar la hiptesis de que el estndar qumico, para
el agua potable es de no ms de 500 mg/L. Para esto, usar = 0.05 y calcular el valor
de p.
Solucin:
1. La prueba de la hiptesis nula es Ho: 500. Esto quiere decir que, la prueba es
unilateral derecha.
2. La hiptesis alternativa es H1: > 500.
3. La regin crtica es unilateral derecha, esto es, z = z0.05 = 1.645.
4. Ahora, sustituyendo los valores correspondientes de X = 503, = s = 15, n = 144 y
o = 500, en la funcin de z nos da:
zcalc. = (503 500) / 15/ 144 = 2.4
5. En conclusin, debido a que el valor de la estadstica se introduce en el extremo
derecho de la distribucin, se rechaza la hiptesis nula y se inclina por la hiptesis
alternativa.
6. El valor de la probabilidad p se calcula buscando el valor de 2.4 en la tabla de la
distribucin normal y da .9918, pero como queremos nicamente el valor de p, le
restamos 1 y nos da p = 1 - .9918 = .0082. Este valor es muy significante.
Ejemplo #40. Se calcula el promedio muestral de 5 ppm de cadmio (Cd), para medir
la calidad del aire, de cierta regin industrial. Esto se hace sacando una muestra de 36
observaciones de Cd atmosfrico. Hacer lo siguiente:
(a) Una prueba de hiptesis con o = 4.85 ppm, con = 0.05 y = 0.01

5-60
Dr. Hctor Quevedo Uras

(b) Adems, calcular el valor de la probabilidad p e interpretarlo acordemente. Otros,


encontrar los intervalos de confianza con los mismos valores de de arriba, para el
promedio poblacional .
Asumir que la desviacin estndar poblacional es de 0.3.
Solucin:
(a) La prueba de hiptesis nula es Ho: = 4.85. Las pruebas alternativas son de H1:
4.85, H2: < 4.85 y H3: > 4.85.
Las regiones crticas con = 0.05 y = 0.01, para una prueba de hiptesis bilateral
son, respectivamente, 1.96 y 2.58.
Usando la estadstica z = ( X o) / / n con X = 5 ppm, o = 4.85, = 0.3 y n = 36
y sustituyendo todos estos valores en la estadstica de arriba nos da:

z = (5.0 4.85) / 0.3/ 36 = 3.0

En conclusin, debido a que el valor de zcalc. = 3.00 es mayor que el valor crtico de
1.96 se rechaza Ho: y nos inclinamos por la hiptesis alternativa de H3: > 3.85. Cosa
similar ocurre con el nivel de significancia de = 0.01, porque el valor de 3.00 es
mayor que el valor crtico de 2.58.
Por otra parte, con respecto a la estimacin del intervalo de confianza del 95%,
que corresponde a un nivel de significancia de = 0.05, los valores crticos son de
1.96. La estimacin puntual de es X = 5.0. Para calcular el intervalo de confianza
de 95%, se sustituyen los valores en ecuacin (5-24) de abajo para dar:
X z/2 / n < < X + z/2 / n

5.0 (1.96)(0.3)/ 36 ) < < 5.0 + (1.96)(0.3/ 36 )


El cual se simplifica a:

5-61
Dr. Hctor Quevedo Uras

4.902 < < 5.098


Por otra parte, el valor correspondiente a un intervalo de confianza del 99%, es
decir, con un nivel de significancia de = 0.01, en este caso los valores crticos son
de 2.575. La estimacin puntual de es X = 5.0. De aqu que el intervalo de
confianza del 99%, es:
5.0 (2.58)(0.3/ 36 ) < < 5.0 + (2.58)(0.3/ 36 )
El cual se simplifica a:
4.871 < < 5.129
Ejemplo #41. En un estudio de higiene industrial y seguridad, las temperaturas del
cuerpo de un grupo de 100 trabajadores industriales, que laboran un frigorfico, se
analizaron. La temperatura promedio fue de 98.2 oF con una desviacin estndar de
0.62 oF. Encontrar el mejor punto estimador del parmetro poblacional de todas las
temperaturas del cuerpo. Para un nivel de confianza de 95%, encontrar, ambos, el
margen de error E y el intervalo de confianza para .
Solucin:
Usando la funcin:
X z/2( n ) < < E + z/2(/ n ) (5-32)
Donde: E = margen de error = z/2(/ n). Ahora, sustituyendo los valores apropiados,
con z/2 = 1.96, = s = 0.62 (porque n > 30), X = 98.2 y n = 100, obtenemos:
98.2 1.96(0.62)/( 100 ) < < 98.2 + 1.96(0.62)/ 100 )
98.2 0.12 < < 98.2 + 0.12
98.08 < < 98.32
El valor del margen de error es E = 1.96(0.62)/( 100 ) = 0.1215.
Este intervalo 98.08 < < 98.32 dice que si furamos a seleccionar muchas muestras

5-62
Dr. Hctor Quevedo Uras

de un tamao de 100 y construyramos un intervalo de confianza, el 95% de estas


muestras contendran el promedio poblacional . Aqu, ntese que el intervalo de
confianza no contiene el valor de 98.6 oF, la cual es la temperatura normal del cuerpo.
Ejemplo #42. Se saca una muestra aleatoria de una poblacin normal. Los valores de
las observaciones son: 22, 24, 22, 25, 30, 28, 29, 28, 24, 23, 25, 27, 26, 23, 24, 21, 22,
21, 25, 21, 23, 24, 21, 20, 21, 20, 22, 28, 27. Hacer los siguientes clculos usando el
programa Minitab.
(a) Calcular la estadstica descriptiva y determinar el 95% del intervalo de confianza
para el promedio poblacional .
(b) Determinar el 95% del intervalo de confianza para la desviacin estndar , y la
mediana.
(c) Hacer una prueba de normalidad usando la estadstica de Kolmogorov-Smirnov.
Solucin:
Para estimar los incisos (a) y (b) usar el programa Minitab de la siguiente manera:
Stat > Basic statistics > Graphical Summary
Esto genera la Figura 5.15 de abajo, la cual incluye histograma con curva normal
sobrepuesta, los intervalos de confianza para el promedio poblacional, la mediana, la
desviacin estndar, la estadstica descriptiva, la prueba de Anderson-Darling, los
cuartiles, etc..

5-63
Dr. Hctor Quevedo Uras

S umma r y for V a lor e s de la s obs e r v a cione s


A n d e rs o n -D a rlin g N o rm a lity T e s t
A -S q u a re d 0 .6 4
P -V a lu e 0 .0 8 5
M ean 2 4 .0 0 0
S tD e v 2 .8 6 6
V a ria n ce 8 .2 1 4
S k e w ness 0.488813
K u rto s is -0 . 8 2 2 3 1 6
N 29
M in im u m 2 0 .0 0 0
1 s t Q u a rtile 2 1 .5 0 0
M e d ia n 2 4 .0 0 0
3 rd Q u a rtile 2 6 .5 0 0
20 22 24 26 28 30 M a xim u m 3 0 .0 0 0
9 5 % C o n f id e n ce I n te rv a l fo r M e a n
2 2 .9 1 0 2 5 .0 9 0
9 5 % C o n f id e n ce I n te rv a l fo r M e d ia n
2 2 .0 0 0 2 5 .0 0 0
9 5 % C o n fid e n c e I n te rv a l f o r S tD e v
9 5 % C o n f id e n c e I n te r v a ls
2 .2 7 4 3 .8 7 6
M e an

M edian

22.0 22.5 23.0 23.5 24.0 24.5 25.0

Figura 5.15. Figura mostrando el histograma de los datos con curva normal
sobrepuesta, los intervalos de confianza para el promedio y la mediana y la estadstica
descriptiva.
Para el inciso (c), es decir, para la prueba de normalidad de los datos esto se hace
usando la estadstica de Kolmogorov-Smirnov, del programa Minitab. Siendo as, se
procede de la siguiente manera:
Basic Statistics Normality Test
En la ventanilla del recuadro de Normality Test introducir las variables y puntear
Kolmogorov-Smirnov. Esto genera la figura de abajo.

5-64
Dr. Hctor Quevedo Uras

Figura mostrando la grafica de los valores.


Normal
99
Mean 24
StDev 2.866
95 N 29
KS 0.085
90
P-Value >0.150
80
70
Percent

60
50
40
30
20

10

1
16 18 20 22 24 26 28 30 32
C1

Figura 5.16. Grfica mostrando la prueba de normalidad usando la funcin de


Kolmogorov-Smirnov.

Como se ve en la Figura 5.16, las probabilidades (o porcentajes en este caso) se


grafican en funcin de los valores estipulados por el problema. Luego el programa
traza una lnea de los cuadrados mnimos, con el objeto de verificar si los puntos estn
dentro de las bandas de confianza. Sin embargo, es de notarse que, en comparacin
con la funcin de Anderson-Darling o de Lilliefors, la prueba de Kolmogorov es
menos precisa que la funcin de Anderson-Darling. Sin embargo, la funcin de
Kolmogorov-Smirnov se sigue usando, tradicionalmente, por muchos investigadores
estadsticos.
Ejemplo #43. Un fabricante de sistemas de aspersin contra incendios, que se instalan
dentro de casas y edificios, argumenta que el promedio poblacional de temperatura de
sus sistemas de aspersin contra incendios es de 54.4 oC. Para esto se saca una
muestra aleatoria de 16 unidades, las cuales, al probarse dan un promedio estadstico

5-65
Dr. Hctor Quevedo Uras

de 55.0 oC, con una desviacin estndar de 1.0 oC. Si se sabe que la distribucin de
los tiempos de activacin de los sistemas de aspersin, contra los incendios, de este
fabricante, es normal, se refutara el argumento del fabricante de que el verdadero
promedio es el que se menciona arriba? Asumir un nivel de significancia de 0.05.
1. Aqu la prueba de hiptesis es Ho: = 54.4 contra la prueba de hiptesis alternativa
de H1: 54.4.
2. Debido a que la prueba de hiptesis llena la condicin de igualdad, la prueba es
bilateral, es decir, z z.025 y z z.025, esto es, z 1.96 o z -1.96.
3. Usamos la distribucin de z, aunque el tamao de la muestra no sea de n > 30
casos. Esto es as, porque sabemos de antemano que la poblacin muestreada es
normal. Tambin se pudiera usar la distribucin de t de estudiante, pero en este caso
es mejor usar la distribucin z porque es mas precisa.
4. Siendo as, el valor de la prueba estadstica es:
z = (55.0 54.4) / 1.0/ 16
= 2.4
5. De acuerdo al inciso (4) el promedio muestral observado se encuentra a 2.4
desviaciones estndar arriba de lo que se hubiera esperado, si Ho: fuera verdadera.
6. En conclusin, debido a que el valor calculado de z cae en la regin crtica derecha,
se rechaza la prueba de hiptesis tradicional.
7. Ahora, para hacer la prueba de hiptesis no tradicional, es decir, calculando el valor
de p, buscamos en la tabla de la distribucin normal el valor de 2.4 y vemos que el
valor de la probabilidad p es p = 2(1 0.9918) = 0.0164.
8. El valor de p = 0.0164 contradice la afirmacin del fabricante de que el verdadero
promedio de sus productos contra incendios es de 54.4 oC.

5-66

Vous aimerez peut-être aussi