Vous êtes sur la page 1sur 25

Prueba de hipótesis

Las secciones anteriores han mostrado cómo puede estimarse un parámetro a


partir de los datos contenidos en una muestra. Puede encontrarse ya sea un sólo
número (estimador puntual) o un intervalo de valores posibles (intervalo de
confianza). Sin embargo, muchos problemas de ingeniería, ciencia,
administración, etc. requieren que se tome una decisión entre aceptar o rechazar
una proposición sobre algún parámetro. Esta proposición recibe el nombre de
hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniería, pueden formularse como problemas
de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros


de una o más poblaciones.

Es importante recordar que las hipótesis siempre son proposiciones sobre la


población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del


proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con
el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis
es verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas,
tales como las especificaciones de diseño o ingeniería, o de obligaciones
contractuales. En esta situación, el objetivo usual de la prueba de
hipótesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular


recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de
hipótesis dependen del empleo de la información contenida en la muestra
aleatoria de la población de interés. Si esta información es consistente con la
hipótesis, se concluye que ésta es verdadera; sin embargo si esta información
es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse
hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede
conocerse con certidumbre, a menos que pueda examinarse a toda la población.
Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hipótesis teniendo en
cuenta la probabilidad de llegar a una conclusión equivocada.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más


características de poblaciones que al inicio se supone cierta (es decir, la
"creencia a priori").

La hipótesis alternativa, representada por H1, es la afirmación contradictoria a


Ho, y ésta es la hipótesis del investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la
evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis
son rechazar Ho o no rechazar Ho.

Tipos de errores

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es


verdadera. También es conocido como αo nivel de significancia.

Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia


sería del 5%. Análogamente si se tiene un nivel de confianza del 90% entonces
el nivel de significancia sería del 10%.

El error tipo II ó error β se define como la aceptación de la hipótesis nula


cuando ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones


diferentes que determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa


Aceptar Ho No hay Error Error tipo II o β
Rechazar Ho Error tipo I o α No hay Error

Tipos de prueba de hipótesis

Bilateral o de dos colas

Ho: µ = µo

H1: µ ≠ µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-1.960 0 1.960
X
Unilateral a la derecha

Ho: µ ≤ µo

H1: µ > µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.645
X

Unilateral a la izquierda

Ho: µ ≥ µo

H1: µ < µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
-1.645 0
X
Pasos para la prueba de hipótesis
1.- Contraste de hipótesis (plantear la Ho y la H1)
2.- Elegir un nivel de significancia α
3.- Elección del estadístico de prueba (estadístico Z o t)
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
5.- Cálculo del estadístico de prueba
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
7.- Conclusión

Ejemplos resueltos
1.- Según experiencias pasadas, se sabe que en una compañía el retardo
promedio por mes de sus obreros es de 64 minutos con una desviación estándar
de 8 minutos. El gerente de la compañía considera que éste promedio ha
aumentado sensiblemente en los últimos meses, por lo cual ordena efectuar la
investigación correspondiente. Para tal fin, se toma una muestra aleatoria de
n=64 obreros y se encuentra que la misma presenta una media de 𝑋̅ = 68
minutos. Se pide comprobar si el gerente tiene o no la razón con un nivel de
significación de 0.05.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H1)
Ho: µ ≤ 64
H1: µ > 64

2.- Elegir un nivel de significancia: α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)


Se conoce la desviación estándar de la población (σ), además que el tamaño de
muestra es lo suficientemente grande

𝑋̅− µ
Z= 𝜎
√𝑛
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H1: µ > 64) en este caso es unilateral
derecha

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.645
X

5.- Cálculo del estadístico de prueba

𝑋̅− µ 68− 64
Z= 𝜎 = 8 =4
√𝑛 √64
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
Como 4.0 que es el valor de Z calculado, es mayor que el valor de Z según el
criterio de decisión, entonces 4.0 se encuentra en la zona de rechazo, por lo
cual debemos rechazar la hipótesis nula de que el promedio de retardos sigue
siendo de 64 minutos. Por lo tanto, el gerente tiene la razón con un nivel de
significación del 5%.

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4
El valor de Z
calculado es igual
0.3 a 4, cae en la
región de
Densidad

0.2 rechazo de Ho

0.1

0.05
0.0
0 1.645
X
7.- Conclusión
Con un 95% de confianza se puede concluir que el retardo promedio de los
obreros de la compañía es mayor a 64 minutos.
En Minitab
Estadísticas Estadística básica  Z de 1 Muestra

Seleccionamos datos resumidos

Datos resumidos
Escribimos los datos del problema y después, seleccionamos opciones.

Escribimos los valores del


tamaño de muestra, la media
de la muestra y la desviación
estándar conocida

Aquí escribimos el valor de la


media hipotética, en nuestro
ejemplo 64

Después de escribir los


valores, seleccionamos
opciones

Aquí escribimos el nivel de


confianza

En este recuadro vamos a


poner lo de la hipótesis
alternativa (En nuestro
ejercicio es >)

Nivel de confianza, 95%

Hipótesis alterna, Media >


media hipotética

Le damos clic en aceptar y


aceptar
El valor de Z=4, es
igual al que
calculamos en
Excel

Para tomar una decisión con


respecto a Ho es, si p ≤ α, se
rechaza la Ho, con este
valor de p, realizamos la
misma decisión que con el
valor crítica de Z

2.- Una muestra aleatoria de 20 bandas para motores de ciertas sierras


circulares presentaron un promedio de duración de 1.08 años con una desviación
estándar de 0.5 años. Se sabe por experiencia que dichas bandas han durado
en promedio 1.28 años y que la duración de las bandas se distribuye
normalmente. ¿Existe razón para considerar tal disminución, como una pérdida
de calidad en la fabricación? Nivel de significación 5%.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H1)
Ho: µ ≥ 1.28
H1: µ < 1.28
2.- Elegir un nivel de significancia α = 0.05
3.- Elección del estadístico de prueba (estadístico Z o t)
No se conoce la desviación estándar de la población (σ), además que el tamaño
de muestra es pequeño

𝑋̅− µ
t= 𝑠
√𝑛
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H1: µ < 1.28) en este caso es unilateral
izquierda. Usamos la distribución t con v grados de libertan (n-1= 20 -1=19) y
α(0.05)

Gráfica de distribución
T, df=19
0.4

0.3
Densidad

0.2

0.1

0.05
0.0
-1.729 0
X

5.- Cálculo del estadístico de prueba

𝑋̅− µ 1.08− 1.28


t= 𝑠 = .05 = -1.79
√𝑛 √20
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
Como -1.79 que es el valor de t calculado, es menor que el valor de t según el
criterio de decisión, entonces -1.79 se encuentra en la zona de rechazo, por lo
cual debemos rechazar la hipótesis nula de que el promedio es mayor o igual a
1.28 y se acepta la hipótesis alternativa de que la calidad de en la fabricación si
disminuyó.
7.- Conclusión
Con un 95% de confianza se puede concluir que el promedio de duración de las
bandas es menor a 1.28 años.
En Minitab
Estadísticas Estadística básica  t de 1 Muestra
Datos resumidos
Escribimos los valores del
tamaño de muestra, la media
de la muestra y la desviación
estándar conocida

Aquí escribimos el valor de la


media hipotética, en nuestro
ejemplo 1.28

Después de escribir los


valores, seleccionamos
opciones

Aquí escribimos el nivel de


confianza

En este recuadro vamos a


poner lo de la hipótesis
alternativa (En nuestro
ejercicio es <)

El valor de t=-1.79, es
igual al que
calculamos en Excel

Para tomar una decisión con


respecto a Ho es, si p ≤ α, se
rechaza la Ho, con este
valor de p, realizamos la
misma decisión que con el
valor crítica de Z
PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS

En la práctica, se presenta una diversidad de problemas en la industria y


en las ciencias sociales que nos sugieren confrontar cual de dos procesos es
mejor que el otro a la luz de la media que arroja cada uno de ellos. Se nos podría
ocurrir por ejemplo: a) verificar si el consumo de gasolina entre dos marcas de
vehículos se puede considerar idéntico o por el contrario una marca es más
económica que otra, b) Verificar si los salarios de la industria metalúrgica se
pueden considerar o no superiores a los salarios de la industria textil en una
región, c) Verificar si el contenido de determinada sustancia en un artículo
fabricado por una compañía A es inferior o no al contenido de dicha
sustancia en el mismo artículo fabricado por una compañía B de la
competencia. etc.

Con el fin de resolver las pruebas de hipótesis para la diferencia de medias,


debemos tener en cuenta el mismo procedimiento y las mismas reglas que
seguimos para las pruebas de hipótesis para la media.

Las fórmulas para el cálculo de los estadísticos “z” y “t”, son las mismas
empleadas en el cálculo de los intervalos de confianza para la diferencia de
medias en el capítulo anterior.

En cuanto a la distribución en el muestreo de la diferencia de medias,


recordemos los siguientes tres casos:

1) Si las dos poblaciones son normales, las diferencias de las medias muestrales
también se distribuirán normalmente cualquiera sea el tamaño de las muestras.
No obstante, si no se conocen las desviaciones estándar poblacionales (σ1 y σ2),
éstas pueden ser reemplazadas por la desviaciones estándar de las muestras
(S1 y S2), si los tamaños de las muestras son mayores que 30 (n1>30 y n2>30 o
n1+n2>60).

2) Según el teorema central del límite, si las dos poblaciones no son


normales o no sabemos si se cumple o no éste comportamiento, las
diferencias de las medias muestrales se distribuirán aproximadamente
como una distribución normal, si los tamaños de las muestras son mayores
que 30 (n1>30 y n2>30 o n1+n2>60)
3) Si las dos poblaciones son normales o están muy cerca de éste
comportamiento y por otra parte no conocemos la desviaciones estándar
poblacionales y además los tamaños de las muestras son menores que 30
(n1<30 y n2<30 o n1+n2<60), entonces, las diferencias de las medias muestrales
se distribuirán de acuerdo a la ley t-student.

Por ejemplo una hipótesis nula podría plantearse como sigue: Ho: µ 1 - µ2 = 0 ó
Ho: µ1 = µ2 y en ambos casos la hipótesis alternativa podría ser µ1 - µ2 ≠ 0 ó µ1
- µ2 > 0 o µ1 - µ2 < 0. Si la hipótesis nula se plantea como µ1 - µ2 = A (siendo A
un valor cualquiera), entonces, las hipótesis alternativas serían las mismas que
las anteriores pero cambiando el valor de cero por el valor de A.

PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON


VARIANZA CONOCIDA.

Ejemplo

Un equipo de investigadores desea saber si los datos que han recolectado


proporcionan la evidencia suficiente para indicar una diferencia entre las
concentraciones medias de ácido úrico en el suero de individuos normales e
individuos con síndrome de Down. Los datos consisten en las lecturas de ácido
úrico en el suero de 12 individuos con síndrome de Down y 15 individuos sanos.
Las medias son 𝑋̅1 = 4.5 mg /100 ml y 𝑋̅2 =3.4 mg/ml.

Los datos corresponden a dos muestras aleatorias simples e independientes,


cada una extraída de una población que sigue una distribución normal, con una
varianza (𝜎12 ) igual a 1 para la población con síndrome de Down, y de (𝜎22 ) 1.5
para la población sana.

Se podrá decir que los datos ofrecen evidencia de que las medias poblacionales
son diferentes.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H1)
Ho :µ1 = µ2
H1 :µ1 ≠ µ2
2.- Elegir un nivel de significancia α = 0.05
3.- Elección del estadístico de prueba (estadístico Z o t)

(𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0


Z=
𝜎2 𝜎2
√ + 2
1
𝑛 1 𝑛2

4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral


izquierda)
El tipo de prueba no lo indica la H1: (H1: µ ≠ 1.28) en este caso es bilateral.
Usamos la distribución Z y α(0.05)

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-1.960 0 1.960
X

5.- Cálculo del estadístico de prueba

(𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0 (4.5−3.4)−0


Z= =Z= 2.57
1 1.5
𝜎2 𝜎2 √ +
√ + 2
1 12 15
𝑛 1 𝑛2
En Excel

6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)


Se rechaza Ho porque 2.57 > 1.96.
7.- Conclusión
Con un 95% de confianza se concluye que, de acuerdo con estos datos, hay
indicios de que las medias de las poblaciones son diferentes.

PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON


VARIANZAS DESCONOCIDAS E IGUALES.

Ejemplo

Un estudio de los investigadores Eidelman et al. tiene como objetivo examinar


las características de destrucción pulmonar en personas que fuman cigarros
antes de desarrollar un marcado enfisema pulmonar. Se practicaron mediciones
de tres índices de destrucción pulmonar en los pulmones de personas longevas
que no fumaban y en personas con tabaquismo que murieron repentinamente
fuera del hospital por causas no respiratorias. Una calificación alta indica un
mayor daño pulmonar. En la tabla se muestran las calificaciones producidas para
uno de los índices de destrucción pulmonar de una muestra de nueve personas
que no fuman y 16 fumadores. Se pretende saber si es posible concluir, con base
en los datos, que las personas que sí fuman, en general, tienen los pulmones
más dañados que las personas no fumadoras, como lo indican las mediciones.
Los datos corresponden a dos muestras aleatorias simples e independientes;
una muestra corresponde a la población de personas que no fuman (NF), y la
otra a la población de fumadores (F). Las calificaciones para los índices de
destrucción pulmonar en ambas poblaciones siguen una distribución
aproximadamente normal. No se conocen las varianzas poblacionales, pero se
supone que son iguales.

No fumadores 18.1 6 10.8 11 7.7 17.9 8.5 13 18.9


16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6
Fumadores
12 24.1 16.5 21.8 16.3 23.4 18.8

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H1)
Ho :µF ≤ µNF
H1 :µF > µNF

2.- Elegir un nivel de significancia α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)

(𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0


t= 1 1
𝑆𝑝 √ +
𝑛1 𝑛2

(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22


𝑠𝑝 =
𝑛1 +𝑛2 −2
ν = n1 + n2 – 2 (grados de libertad)
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H1: µF > µNF) en este caso es unilateral
derecha. Como estamos usando el estadístico t, usamos un α = 0.05 y con n1 +
n2 -2 grados de libertad; en este ejemplo sería, 16 + 9 – 2 = 23
Gráfica de distribución
T, df=23
0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.714
X

5.- Cálculo del estadístico de prueba

(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22


𝑠𝑝 = √
𝑛1 +𝑛2 −2

(16−1)4.47522 +(9−1)4.84922
𝑠𝑝 = √ = 4.6088
16+9−2
( 𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0 (17.538−12.433)−0
t= 1 1
= 1 1
2.66
𝑆𝑝 √ + 4.6088 √ +
𝑛1 𝑛2 16 9

6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)


Se rechaza Ho porque 2.66 > 1.714, es decir, 2.66 está dentro de la región de
rechazo
7.- Conclusión
Con base en estos resultados, se puede concluir que las dos medias
poblacionales son diferentes, es decir, se concluye que, según indican los
índices del estudio, las personas que sí fuman tienen los pulmones más dañados
que las personas que no fuman, a un nivel de confianza de 95%
En Minitab
1.- Estadística  Estadística básica  t de 2 muestras
Copiamos los valores en el orden
que queremos la prueba de
hipótesis

Seleccionamos la opción, Cada


muestra está en su columna
Le damos clic en el
primer cuadro, (Muestra
1) y la damos doble clic
en F y repetimos, pero
ahora en Muestra 2

Enseguida
seleccionamos Opciones

Ponemos el Nivel de
confianza

La diferencia hipotética,
en este ejemplo es cero

En Hipótesis alterna, en este


ejemplo es, Diferencia > Diferencia
hipotética

Seleccionamos Asumir
varianzas iguales

Y le damos clic en aceptar y de nuevo aceptar, y el programa nos arroja los


resultados

Observamos que los


valores que sean
coherentes

Aquí está el valor de T,


que es igual al que se
calculó antes, y los
grados de libertad

Para tomar una decisión con respecto a Ho


es, si p ≤ α, se rechaza la Ho, con este
valor de p, realizamos la misma
decisión que con el valor crítica de Z
PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON
VARIANZAS DESCONOCIDAS Y DIFERENTES.

Ejemplo

Un grupo de investigadores quiere saber si las poblaciones difieren con respecto


al valor medio de la actividad del complemento del suero total (C H50). Los datos
se componen de las mediciones de CH50 en n1 = 10 individuos aparentemente
sanos y n2 = 20 individuos enfermos. Las medias de las muestras y desviaciones
estándar son:
𝑋̅1 = 62.6, S1 = 33.8
𝑋̅2 = 47.2, S2 = 10.1
Los datos corresponden a dos muestras aleatorias independientes; una extraída
de una población de sujetos aparentemente normales, y la otra seleccionada de
una población de individuos enfermos. Se supone que los valores de CH50 siguen
una distribución aproximadamente normal en ambas poblaciones. Las varianzas
de las poblaciones se desconocen y son diferentes.
Pasos para la prueba de hipótesis
1.- Contraste de hipótesis (plantear la Ho y la H1)
1.- Contraste de hipótesis (plantear la Ho y la H1)
Ho :µ1 = µ2
H1 :µ1 ≠ µ2

2.- Elegir un nivel de significancia α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)

(𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0


t=
𝑆2 𝑆2
√ + 2
1
𝑛1 𝑛2

2
𝑠2
1 𝑠2
2
( + )
𝑛1 𝑛2
ν= 2 2 2
Redondeo hacía abajo al entero más cercano
𝑠2 𝑠
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 −1 𝑛2 −1
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1 (H1: µ1 ≠ µ2 ) en este caso es bilateral.
Usamos la distribución t con ν grados de libertad y α(0.05).
2
33.82 10.12
( + )
10 20
ν= 2 2 = 9.81≈ 9
33.82 10.12
( 10 ) ( 20 )
+
10−1 20−1

Gráfica de distribución
T, df=9
0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-2.262 0 2.262
X
5.- Cálculo del estadístico de prueba

(𝑋̅1 −𝑋̅2 )−(µ1 −µ2 )0 (62.6−47.2)−0


t= = 2 2
= 1.41
𝑆2 𝑆2 √33.8 +10.1
√ + 2
1 10 20
𝑛1 𝑛2

6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)


Puesto que -2.262 < 1.41 < 2.262, no es posible rechazar H
7.- Conclusión
Con base en estos resultados, no se puede concluir que las dos medias de las
poblaciones son diferentes a un nivel de significancia α = 0.05
En Minitab
1.- Estadística  Estadística básica  t de 2 muestras
Seleccionamos
Datos resumidos

Escribimos los
valores
correspondientes
en cada recuadro

Seleccionamos
opciones

Seleccionamos el
Nivel de confianza

En hipótesis alterna
seleccionamos
Diferencia ≠ diferencia
hipotética

No se asumen
varianzas iguales

Le damos clic en aceptar y de nuevo clic en aceptar, y el programa nos


presenta los resultados
Observamos que los
valores sean iguales

Aquí está el valor de T,


que es igual al que se
calculó antes, y los
grados de libertad

Para tomar una decisión con respecto a Ho


es, si p ≤ α, se rechaza la Ho, con este
valor de p, realizamos la misma
decisión que con el valor crítica de Z,
no se rechaza la Ho

Vous aimerez peut-être aussi