Académique Documents
Professionnel Documents
Culture Documents
Unidad IV
PRUEBA DE HIPTESIS
Otra manera de hacer inferencia es haciendo una afirmacin acerca del valor que el
parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en
alguna creencia o experiencia pasada que ser contrastada con la evidencia que nosotros
obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que llamamos Prueba
de Hiptesis
Hiptesis: Es una suposicin acerca del valor de un parmetro de una poblacin con el propsito
de discutir su validez.
Ejemplo de hiptesis acerca de un parmetro de una poblacin son:
El sueldo promedio de un profesional asciende a $2,625.
El veinte por ciento de los consumidores utiliza aceite de oliva
Prueba de hiptesis: es un procedimiento, basado en la evidencia de la muestra y en la
teora de las probabilidades, usado para determinar si la hiptesis es una afirmacin razonable y
debera no ser rechazada o si no es razonable debera ser rechazada.
Una prueba de hiptesis comprende cuatro elementos principales:
1.
2.
3.
4.
Hiptesis Nula
Hiptesis Alternativa
Estadstica de Prueba
Regin de Rechazo
La Estadstica de Prueba es una estadstica que se deriva del estimador puntual del parmetro
que estemos probando y en ella basamos nuestra decisin acerca de si rechazar o no rechazar la
Hiptesis Nula.
El Estadstico de prueba: Es un valor, determinado a partir de la informacin de la muestra, usado
para decidir si rechazar o no la hiptesis nula.
La Regin de Rechazo: es el conjunto de valores tales que si la prueba estadstica cae dentro de
este rango, decidimos rechazar la Hiptesis Nula
El valor crtico: Es el punto que divide la regin entre el lugar en el que la hiptesis nula es
rechazada y la regin donde la hiptesis nula es no rechazada.
Ejemplo:
Establezca las dos hiptesis para cada una de las situaciones siguientes:
1. Un fabricante, utiliza lminas de aluminio para la elaboracin de la latas pararefrescos
asegura que stas tienen 1 milmetro de espesor en promedio.
Solucin:
2. Un fabricante de varillas de acero especial que son utilizadas en la construccin de edificios
muy altos asegura que stas poseen una resistencia promedio a la traccin de al menos
2000 libras.
Solucin:
Etapas bsicas en pruebas de hiptesis
1.
2.
3.
4.
Prueba bilateral
As, si la afirmacin de H0 contiene el smbolo , entonces la prueba se llama prueba
direccional o unilateral de cola derecha y puede ser til cuando estndares mximos no deben
ser rebasados. Por ejemplo, la cantidad de grasa permitida en la leche descremada, la radiacin
emitida por estaciones nucleares, el nmero de artculos defectuosos en embarque y el grado de
contaminacin producido por una chimenea.
Cola derecha
Por el contrario Si la afirmacin de H0tiene el smbolo , entonces la prueba se denomina
prueba direccional o unilateral de cola izquierda y es til cuando se quiere observar si se ha
cumplido un estndar mnimo. Algunos ejemplos: mnimo de grasa en la leche entera, el peso neto
de productos empacados, la tensin de los cinturones de seguridad, la vida til de un producto,
segn lo especificado por la garanta.
Cola izquierda
Una hiptesis alternativa o de investigacin, denotada con H1, es un enunciado acerca de
la poblacin. La hiptesis nula, denotada con H0, es la negacin de la hiptesis alternativa H1. La
(letra
La probabilidad de
aumenta o disminuye a medida que aumenta o disminuye el tamao
de la regin de rechazo. Entonces, por qu no se disminuye el tamao de la regin de rechazo
para hacer tan pequea como sea posible?
Desgraciadamente, al disminuir el valor de aumenta la probabilidad de no rechazar la
hiptesis nula cuando sta es falsa y alguna hiptesis alternativa es verdadera.
Aumenta entonces la probabilidad de cometer el llamado error de tipo II, el cual ser
explicado ms adelante, para una prueba estadstica.
Ejemplo:
Un fabricante de varillas de acero especial que son utilizadas en la construccin de edificios muy
altos ha contratado a un estadista para que pruebe si sus varillas ciertamente tienen un promedio
de resistencia a la tensin de al menos 2000 libras Cules son las implicaciones si el nivel de
significancia de la prueba de hiptesis se fija en: = 0.08?
Solucin:
Dadas las hiptesis:
El procedimiento asegura aunque cuando las varillas tengan un promedio deresistencia a la
tensin de 2000 libras o ms, en el 8% de todas las pruebas laconclusin ser lo contrario.
Error tipo II
En una prueba estadstica, aceptar la hiptesis nula cuando sta es falsa se denomina error
tipo II. A la probabilidad de cometer un error de tipo II se le asigna el smbolo
Rechazamos H0
No rechazamos H0
H0 Verdadera
Error tipo I
P(error tipo I) =
Desicin correcta
H0 Falsa
Desicin correcta
Error tipo II
P(error tipo II) =
tenemos:
P(no rechazar H0 cuando es verdadera) = 1Note que la probabilidad de no rechazar H0 cuando es verdadera es el nivel de confianza 1-
tenemos:
P(rechazar H0 cuando es falsa) = 1La probabilidad de rechazar la hiptesis nula H0 cuando es falsa se llamapotencia de la
prueba.
Probabilidades asociadas con los cuatro resultados posibles de unaprueba de hiptesis.
Smbolo de la
probabilidad
Definicin
Nivel de significancia. Error tipo I.
Probabilidad de un error tipo II.
11-
es diferente de 10 con un
Observemos que, dado que aparece el signo de igualdad en la hiptesis nula, entonces la prueba es
de dos colas (no direccional) y la regin de rechazo consiste de los valores en las colas izquierda y
derecha de la distribucin. Como la probabilidad de cometer un error tipo I, (rechazar H0 cuando
10
Paso 3.
Derivar una regla de decisin; rechazar H0, si z z0.025 z z0.025 resulta claro al utilizar una tabla
de la distribucin normal estndar en la que los valores crticos son:
z0.025 = 1.96, tal y como se muestra en lasiguiente figura:
Nivel de confianza
0.90
0.95
0.98
0.99
11
Calificacin z
0.05
0.025
0.01
0.005
1.645
1.96
2.33
2.575
Paso 4.
Toma de la muestra, clculo del estadstico de prueba y confrontacin del mismo con la regla de
decisin:
Para este caso, tenemos que los datos son:
Para finalmente al realizar operaciones obtenemos el valor: z = 1.43 y al confrontarlo con la regla de
decisin finalmente vemos que:
Curva de la distribucin normal estndar
12
y teniendo en cuenta que el valor crtico es: z0.025=1.96, que n=100 y que es desconocida, s
proporciona un buen estimado de . En consecuencia los lmites son:
supuesto 10 est contenido en el intervalo no podemos concluir que 10 (Nota: este resultado
da la misma conclusin a la quellegamos usando el procedimiento de prueba de hiptesis).
Como podemos observar, un intervalo de confianza proporciona msinformacin que una prueba
de hiptesis; con base en los datos, pudimosrechazar la hiptesis nula y encontrar que el resultado
13
Ejemplo 2:
En una muestra aleatoria de 30 viajes en bus entre la ciudad A y la ciudad B, se obtuvo un tiempo
promedio de viaje de 105 minutos. La desviacin estndar de la poblacin se ha estimado en 8
minutos. Obtener un intervalo de confianza para el verdadero tiempo promedio de viaje. Utilice un
nivel de confianza del 95%.
Para este caso, tenemos que los datos son:
y teniendo en cuenta que el valor crtico es: z0.025=1.96, que n=36 y que es desconocida, s
proporciona un buen estimado de . En consecuencia los lmites son:
14
es (102.14, 107.86).
Resumiendo:
1. Una prueba de hiptesis puede producir resultados significativos, pero que no tengan
importancia prctica.
2. Un tamao de muestra grande aumenta la posibilidad de rechazar la hiptesis nula.
3. Un procedimiento de prueba se considera como bueno cuando tanto las probabilidades
de suceso del error tipo I como del tipo II son pequeas.
a. Pruebas de hiptesis (muestras pequeas)
En las pruebas de hiptesis que hemos realizando, se utiliz la distribucin normal
estndar, que es la distribucin z, como estadstico de prueba. Para emplear la distribucin z
es necesario conocer la desviacin estndar ( sigma) de la poblacin o tener una muestra grande
(de 30 observaciones por lo menos).
Sin embargo, en muchas situaciones no se conoce
sigma y el nmero de observaciones
en la muestra es menor de 30. En estos casos, se puede utilizar la desviacin estndar de la
muestra s como una estimacin de alfa; pero no es posible usar la distribucin z como
estadstico de prueba. El estadstico de prueba adecuado es la t de Studento simplemente
distribucin t. Cuando se utiliza la t de Student se supone que la poblacin tiene una distribucin
normal.
ACTIVIDAD DE APRENDIZAJE.
1. La duracin media de una muestra de 100 tubos fluorescentes producidospor una
compaa resulta ser de 1570 horas, con una desviacin tpica de 120 horas. Si
es la
duracin media de todos los tubos producidos por la compaa. Comprobar la hiptesis
=1600 contra la hiptesis alternativa
15
entonces:
, si
entonces.
Ejemplo:
Un investigador afirma que al menos el 10% de los cascos para motocicleta marca FASTtienen
defectos de fabricacin que pueden provocar daos a quien lo usa. Una muestra aleatoria de200
cascos revela que 16 de ellos contienen tales defectos.
a) Cul es valor P de la prueba?
b) Hay evidencia que respalde la afirmacin del investigador con a =0.05?
c) Determine las regiones de aceptacin y rechazo con a =0.05.
a) Cul es valor P de la prueba?
Sea p el porcentaje de cascos FAST con defectos.
El valor observado es
16
. El valor P es:
Valor
Valor P =
b)
La duracin media de una muestra de 100 tubos fluorescentes producidos por una
compaa resulta ser de 1570 horas, con una desviacin tpica de 120 horas. Si es
la duracin media de todos los tubos producidos por la compaa.Comprobar la
hiptesis =1600 contra la hiptesis alternativa
significacin de 0.05.
Paso 1.
Establecemos las dos hiptesis opuestas y dado que se supone que la duracin de los tubos
fluorescentes es de 1600 entonces:
17
Observemos que, dado que aparece el signo de igualdad en la hiptesis nula, entonces la prueba es
de dos colas (no direccional) y la regin de rechazo consiste de los valores en las colas izquierda y
derecha de la distribucin. Como la probabilidad de cometer un error tipo I, (rechazar H0 cuando
es cierta) es 0.05 y la regin de rechazo se ubica en ambas colas, colocamos
de la
distribucin en cada una de las regiones de las colas, tal y como se indica en la siguiente figura:
Curva de la distribucin normal estndar.
Paso 3.
Derivar una regla de decisin; rechazar H0, si z z0.025 z z0.025 resulta claro al utilizar una
tabla de la distribucin normal estndar en la que los valores crticos son:
z0.025 = 1.96, tal y como se muestra en la siguiente figura:
Nivel de confianza
0.90
0.95
0.98
0.99
18
Calificacin z
0.05
0.025
0.01
0.005
1.645
1.96
2.33
2.575
Paso 4.
Toma de la muestra, clculo del estadstico de prueba y confrontacin del mismo con la regla de
decisin:
Para este caso, tenemos que los datos son:
Para finalmente al realizar operaciones obtenemos el valor: z= -2.5 y al confrontarlo con la regla de
decisin finalmente vemos que:
Curva de la distribucin normal estndar
El valor de z cae fuera de la zona de aceptacin, por lo tanto, rechazamos la hiptesis nula H 0, con
lo cual concluimos que hay evidencia estadstica de que es diferente de 1600.Luego la duracin
media de lostubos es significativamente menor que 1600 horas. Como se puede apreciar en
elgrfico, la media muestral cae fuera de la zona de aceptacin:
Solucin utilizando intervalos de confianza.Si ahora construimos un intervalo de confianza del
95% de confianza para el promedio del contenido de aspirina, tenemos que recordar que los lmites
del intervalo de confianza se encuentran usando:
y teniendo en cuenta que el valor crtico es: z0.025=1.96, que n=100 y que es desconocida, s
proporciona un buen estimado de . En consecuencia los lmites son:
valor supuesto de 1600 no est contenido en el intervalo podemos concluir que 1600 (Nota:
este resultado da la misma conclusin a la que llegamos usando el procedimiento de prueba de
hiptesis).
Como podemos observar, un intervalo de confianza proporciona ms informacin que una prueba
de hiptesis; con base en los datos, pudimos rechazar la hiptesis nula y encontrar que el resultado
no tena importancia prctica, pero si usamos el intervalo de confianza correspondiente y un poco
de sentido comn podemos determinar si los resultados de la prueba de hiptesis son de
importancia prctica.
ACTIVIDAD DE APRENDIZAJE. (4.3)
En una muestra aleatoria de 50 tuercas, se obtuvo una longitud promedio de 5mm. La
desviacin estndar de la poblacin se ha estimado en 0.02mm. Obtener un intervalo de
confianza para la longitud promedio de las tuercas. Utilice un nivel de confianza del 95%.
Para este caso, tenemos que los datos son:
20
y teniendo en cuenta que el valor crtico es: z0.025=1.96, que n=36 y que es desconocida, s
proporciona un buen estimado de . En consecuencia los lmites son:
21
es (4.9945, 5.0055).