Vous êtes sur la page 1sur 18

PRUEBA DE HIPÓTESIS

Dos problemas de la inferencia estadística:


La estimación de parámetros y la prueba de hipótesis.
 En el problema de estimación se intenta indagar por el valor de un parámetro poblacional
hasta donde sea posible.
 En el problema de prueba de hipótesis se pone a prueba una hipótesis sobre un parámetro,
si se tiene una idea preconcebida de su valor.
El propósito de la prueba de hipótesis es ayudar al investigador a tomar decisiones acerca de
los parámetros de una población, mediante el examen de una muestra tomada de ella.
HIPÓTESIS:
Una hipótesis se define como una proposición acerca de uno o más parámetros de una población.
En general, la hipótesis se refiere a los parámetros de las poblaciones sobre los cuales se hacen las
proposiciones.

Ejemplos de hipótesis:
 Una dietista sostiene que cierta dieta reduce el peso promedio de las personas que siguen la
dieta.
 Un funcionario del estado afirma que más del 80% de los trabajadores textiles están
satisfechos con la atención que brinda la empresa.
 Un comerciante mayorista puede afirmar que la varianza de los contenidos de arroz que se
comercializa en bolsas de un kilogramo es de 0.360 gramos2.
 El administrador de una fábrica puede afirmar que el tiempo promedio de entrenamiento
del personal para dominar cierta actividad, es de más de cinco días.
 Una enfermera del área de salud pública, puede suponer que un determinado programa
educativo mejora la comunicación entre enfermera y paciente.
 Un gerente puede suponer que cierta estrategia de producción será eficaz en más del 90 por
ciento de los casos en que se utilice.
Por medio de la prueba de hipótesis se determina si tales proposiciones son compatibles o no con los
datos disponibles.

TIPOS DE HIPÓTESIS ESTADÍSTICA.


En todo estudio estadístico participan dos hipótesis:
 La hipótesis de investigación o hipótesis alternativa:
Es la conjetura o suposición que motiva la investigación (La que propone el experimentador)
Es la que se detecta o sustenta, la que implica lo nuevo, el cambio.
Se denota con H1 o Ha.
 La hipótesis nula.
Es la negación de la hipótesis alternativa.
La que nulifica a la hipótesis alternativa.
Incluye a la igualdad.
Es denotada con H0.

PASOS PARA LA PRUEBA DE HIPÓTESIS.


Por conveniencia, la prueba de hipótesis se presenta como un procedimiento de los siguientes pasos.
1. Hipótesis que se plantea el investigador.
HI: Un ingeniero afirma que más del 50% de los automóviles en circulación tiene faros mal
alineados.
2. Formulación de la hipótesis Estadística.
Previamente se decide sobre el parámetro ó parámetros que se van a considerar en la
formulación de la hipótesis estadística (Según la escala de medida de la variable ó variables
contenidas en la hipótesis que plantea el investigador). Así:
 Si las variables se miden con escala cualitativa se elige la proporción poblacional
 Si las variables se miden con escala numérica ó cuantitativa se elige la media, la
varianza poblacional.

La hipótesis Estadística consta de dos hipótesis que deben enunciarse ó formularse


explícitamente :
 La hipótesis nula :
- Designada por el símbolo H0.
- La hipótesis nula a veces se conoce como hipótesis de no diferencia, ya que es una
proposición de conformidad con las condiciones que se suponen ciertas en la
población de interés.
- En general, la hipótesis nula se establece con el propósito expreso de ser
rechazada. En consecuencia, el complemento de la conclusión que el investigador
desea alcanzar se convierte en el enunciado de la hipótesis nula.
- En el proceso de prueba, la hipótesis nula se rechaza o no se rechaza. Si el
procedimiento de prueba conduce al rechazo, se concluye que los datos
disponibles no son compatibles con la hipótesis nula, y entonces, sirve de apoyo a
la otra hipótesis.
- La hipótesis nula se expresa con un indicador de igualdad (= , ≤, ≥)
 La hipótesis alternativa:
- Identificada mediante el símbolo H1,
- Es una proposición que se cree cierta si los datos de la muestra llevan al rechazo
de la hipótesis nula.
- La hipótesis alternativa, se expresa con indicadores de desigualdad ( ≠, >, < )
- Ejemplo:
Si la hipótesis alternativa fuera: el ingreso promedio de los trabajadores de
Sedalib es mayor de 3,500 nuevos soles,
HI: “el ingreso promedio de los trabajadores de Sedalib es mayor de 3,500 nuevos
soles “
Hipótesis Estadística:
Ho : µ≤ 3500 nuevos soles
H1 : µ >3500 nuevos soles (HI)

3. Establecer el nivel de significación(margen de error ó nivel de significancia)


Cuando se rechaza o no rechaza una hipótesis nula, como la decisión se toma mediante una
sola muestra, puede cometerse dos tipos de errores:
Tipos de errores.
Condición de H0
Acción posible ó Decisión posible
Verdadera Falsa
No rechazar H0 Acción Correcta Error de Tipo II
Rechazar H0 Error de Tipo I Acción Correcta

 Error tipo I:
- Error que se comete cuando se rechaza una hipótesis verdadera.
- La probabilidad de cometer este tipo de error se designa por α.
- Siempre que se rechaza una hipótesis nula se tiene el riesgo de cometer un error
de tipo I, al rechazar una hipótesis nula verdadera.
 Error tipo II:
- Error que se comete cuando no se rechaza una hipótesis nula falsa.
- La probabilidad de cometer un error del tipo II se designa por  .
- Siempre que no se rechaza una hipótesis nula, existe el riesgo de no rechazar una
hipótesis nula falsa.

En general, cuando se busca reducir α se incrementa el valor β o cuando se busca reducir β


se incrementa α, lo ideal sería reducir los valores de cometer ambos tipos de errores. Sin
embargo, esto sólo puede conseguirse aumentando el tamaño de la muestra aunque genere el
incremento del costo de la investigación.
Para superar este impase, se fija el valor de α, siendo los valores más utilizados:
0.10, 0.05, 0.01 y 0.001, conocidos como niveles de significación-
4. Elegir la Estadística de Prueba U.
La Estadística de prueba es alguna estadística con distribución conocida, utilizada en la
construcción de intervalos de confianza de los parámetros, cuyo valor se puede calcular a
partir de los datos de la muestra.
Una estadística de prueba puede asumir muchos valores posibles, y el valor particular
observado depende de la muestra particular extraída.
La estadística de prueba sirve como productor de decisiones, ya que la decisión de rechazar
o no la hipótesis nula, depende de la magnitud de la estadística de prueba.

5. Determina la región crítica ó región de rechazo de Ho:


Determinar el valor o los valores críticos considerando el nivel de significación, la
distribución de la estadística de prueba y la hipótesis alternativa.
Es el valor o son los valores que separan la región de rechazo o de no rechazo de 𝑯𝟎 .
𝑯𝟏 : ≠

α/2 1-α α/2


RR de Ho RA de Ho RR de Ho
U Prueba bilateral ó de dos colas
Uα/2 U1-α/2

𝑯𝟏 : >
1-α α
RA de Ho RR de Ho
U Prueba unilateral hacia la derecha
U1-α

𝑯𝟏 : <

α 1-α
RR de Ho RA de Ho
U Prueba unilateral hacia la izquierda

6. Valor observado ó valor experimental de U:
Obtener el valor de la Estadística de Prueba Uo.
Una estadística de prueba puede asumir muchos valores posibles, pero el valor particular
observado depende de la muestra particular extraída.
Se reemplaza los resultados de la muestra y lo que afirma la hipótesis nula.
El valor de la estadística de la prueba se puede calcular a partir de los datos de la muestra.

7. Decisión estadística: Comparar el valor de la estadística de prueba con el valor o valores


críticos y tomar la decisión estadística correspondiente.
Si Uo ∈ RA de Ho no se rechaza Ho
Si Uo ∉ RA de Ho se rechaza Ho
8. Conclusión: Según la hipótesis que se plantea el investigador.

PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL

Las parejas de hipótesis pueden ser:


1. H0: µ ≤ µ𝟎 2. H0: µ ≥ µ𝟎 3. H0: µ = µ𝟎
H1 : µ > µ 𝟎 H1 : µ < µ 𝟎 H1 : µ ≠ µ 𝟎

Casos que se presentan:


Caso 1. Se conoce la varianza de la población: 𝝈𝟐
La estadística de prueba es:
̅ −µ
𝑿
𝒁= 𝝈 que tiene distribución normal estándar .
√𝒏

Caso 2. No se conoce la varianza de la población-


La estadística de prueba es:

̅ −µ
𝑿
𝑻= 𝑺 que tiene distribución t con n-1 grados de libertad.
√𝒏

Si los grados de libertad son mayores de 30 ; la v.a T tiene distribución aproximadamente normal
estándar.
Ejemplo 01:
La directora de la sección de maternidad de un hospital afirma que el peso promedio de los
bebés nacidos en el primer semestre del año en el hospital está por debajo de los 3 kgs.
Una enfermera desea probar la afirmación de la directora. Obtiene una muestra al azar de 36
niños y registra sus pesos, en kgs.
3.2 2.8 3.0 2.7 2.6 2.8 3.0 2.9 2.8 3.0 3.1 2.6
3.3 2.7 2.8 3.0 2.6 2.7 3.1 2.8 3.0 2.9 2.8 3.2
2.7 2.9 3.1 3.2 2.7 2.8 3.0 2.7 2.7 2.6 2.8 3.0
Elegir como nivel de significación: α = 0.05.
Los pasos que sigue son:
1) Formulación de la hipótesis a investigar
HI: “el peso promedio de los bebés nacidos en el primer semestre del año en el hospital, está
por debajo de los 3 kgs “.
2) Formulación de la hipótesis Estadística:
Ho: μ ≥ 3.0 kg
Ha: μ < 30 kg (HI)
3) Nivel de significación: α = 0.05
4) Estadística de prueba:
No se conoce la varianza poblacional
Estadística de prueba:
̅−𝝁
𝒙
T= 𝑺 tiene distribución t (n-1)
√𝒏

5) Punto crítico:
t(35)0.05 = -1.69
Si los grados de libertad son mayores de 30 ; la v.a T tiene distribución aproximadamente
normal estándar.
t(35)0.05 = ¿???
t(35)0.05 ≈ Z0.05 = -1.645
¡GRAFICA!!!
6) Valor observado de la estadística de prueba T(valor experimental)
De la muestra obtiene:
̅= 2.88
Media muestral 𝒙 varianza muestral S2 = 0.0361 DE muestral S = 0.19
𝟐.𝟖𝟖−𝟑.𝟎 𝟐.𝟖𝟖−𝟑.𝟎
To = 𝟎.𝟏𝟗 = 𝟎.𝟏𝟗 = -3.75
√𝟑𝟔 𝟔

7) Decisión: Como -3.75 < -1.69 , es decir -3.75 cae en la región de rechazo. Se rechaza Ho.
8) Concluye que la directora tiene razón.
Ejemplo 02:
Las siguientes son las lecturas del aumento de la temperatura en un contenedor que
transporta verduras para exportación:
6.9 4.8 6.2 5.4 7.0 6.4 6.9 5.6
El fabricante afirma que sus contenedores están bajo control, por lo que la temperatura
media del agua no es mayor que 6 grados centígrados. Con un nivel de significación de 5%,
¿es posible que los datos contradigan la información del fabricante?
1. Hipótesis a Investigar:
HI: Sus contenedores están bajo control, por lo que la temperatura media del agua no es
mayor que 6 grados centígrados
2. Hipótesis Estadística
H0: µ ≤ 𝟔 (HI)
H1 : µ > 6
3. Nivel de significación: α = 0.05
4. La estadística de prueba:
̅ −µ
𝑿
𝑻= 𝑺 que tiene distribución t con 7 grados de libertad.
√𝒏

5. Región crítica:
El punto crítico es: 1.895
¡GRÁFICA!!!!!!
6. El valor de la estadística de prueba:
𝟔.𝟏𝟓−𝟔
𝑻𝟎 = 𝟎.𝟖𝟏 = 0.52
√𝟖

̅ = 𝟔. 𝟏𝟓 y S = 0.81
Siendo 𝑿
7. Decisión estadística: Se acepta H0
8. Los datos no contradicen la información del fabricante es decir sus contenedores
están bajo control.

PRUEBA DE HIPÓTESIS PARA LA VARIANZA DE UNA POBLACIÓN NORMAL

Las parejas de hipótesis que puede formularse son:

1. H0: 𝝈𝟐 ≤ 𝝈𝟐𝟎 2. H0: 𝝈𝟐 ≥ 𝝈𝟐𝟎 3. H0: 𝝈𝟐 = 𝝈𝟐𝟎


H1: 𝝈𝟐 > 𝝈𝟐𝟎 H1: 𝝈𝟐 < 𝝈𝟐𝟎 H1: 𝝈𝟐 ≠ 𝝈𝟐𝟎
La estadística de prueba es:
(𝒏−𝟏)𝑺𝟐
𝝌𝟐 = que tiene distribución ji cuadrada con n-1 grados de libertad
𝝈𝟐

Ejemplo 03:
Para evaluar la homogeneidad de la fertilidad de un suelo se tomaron alícuotas de 20 extracciones
de suelo y se midió su contenido de nitrógeno. Los resultados, en ppm, fueron:

0.50 0.48 0.39 0.41 0.43 0.49 0.54 0.48 0.52 0.51
0.49 0.47 0.44 0.45 0.40 0.38 0.50 0.51 0.52 0.45

Se acepta que un suelo es homogéneo en fertilidad, si el contenido de nitrógeno presenta una


varianza de a lo sumo 0.005. Considere un nivel de significación de 0.05.

Solución:
1. Hipótesis a investigar:
HI: “El Suelo es homogéneo en fertilidad ” (equivale a decir “ el contenido de nitrógeno
presenta una varianza de a lo sumo 0.005 “ ).
2. Hipótesis estadística:
Ho : 𝝈𝟐 ≤ 𝟎. 𝟎𝟎𝟓 ( HI )
H1 : 𝝈𝟐 > 0.005
3. Nivel de significación: 0.05
4. Estadística de prueba:
(𝒏−𝟏)𝑺𝟐
𝝌𝟐. = que tiene distribución Ji-cuadrada con 19 grados de libertad.
𝝈𝟐

5. Región Crítica ó región de rechazo de H0


Punto crítico: 30.14
¡GRAFICA!!!
6. Valor experimental ó valor observado de la estadística de prueba:
Varianza de la muestra S2 = 0.00438
𝟏𝟗(𝟎.𝟎𝟎𝟒𝟑𝟖)
𝝌𝟐𝟎 = = 16. 644
𝟎.𝟎𝟎𝟓

7. Decisión Estadística: Como este valor cae en la región de no rechazo de H0, no existe
evidencia para rechazar H0.
8. Conclusión: Se concluye que el suelo es homogéneo en fertilidad.
Ejemplo 04:
Para evaluar la homogeneidad de la fertilidad de un suelo se tomaron alícuotas de 20 extracciones
de suelo y se midió su contenido de nitrógeno. Los resultados, en ppm, fueron:
0.50 0.48 0.39 0.41 0.43 0.49 0.54 0.48 0.52 0.51
0.49 0.47 0.44 0.45 0.40 0.38 0.50 0.51 0.52 0.45
Se acepta que un suelo es homogéneo en fertilidad, si el contenido de nitrógeno presenta una
varianza de a lo sumo 0.005. Considere un nivel de significación de 0.05.
Solución:
1. Hipótesis a Investigar
2. Hipótesis Estadística:
H0: 𝝈𝟐 ≤ 𝟎. 𝟎𝟎𝟓
H1: 𝝈𝟐 > 0.005
3. Nivel de significación: 0.05
4. Estadística de prueba:
(𝒏−𝟏)𝑺𝟐
𝝌𝟐 = tiene distribución Ji-cuadrada con 19 grados de libertad.
𝝈𝟐

5. Punto crítico: 30.14


¡ GRÁFICAR ¡!!!!
6. Valor de la estadística de prueba:
S2 = 0.00438
𝟏𝟗(𝟎.𝟎𝟎𝟒𝟑𝟖)
𝝌𝟐𝟎 = = 16. 644
𝟎.𝟎𝟎𝟓

7. Como este valor cae en la región de no rechazo de H0, no existe evidencia para rechazar
H0 .
8. Se concluye que el suelo es homogéneo en fertilidad.

Ejemplo 05:
El plástico que produce una máquina se revisa periódicamente para ver si fluctúa su grosor.
Si la verdadera varianza del grosor es de más de 2.25 milímetros cuadrados, hay motivos
para preocuparse por la calidad del producto. Se realizan mediciones del grosor de una
muestra aleatoria de 10 rollos de plástico producidos en un turno y se obtienen los siguientes
resultados (en milímetros):

226 226 232 227 225 228 225 228 229 230
Contraste al nivel de significación del 5% la hipótesis nula que la varianza poblacional es
2.25 como máximo.
1. Hipótesis a investigar:
HI:
2. Hipótesis Estadística
. H0: 𝝈𝟐 ≤ 𝟐. 𝟐𝟓
H1: 𝝈𝟐 > 2.25
3. Nivel de significación: 0.05
4. Estadística de prueba:
(𝒏−𝟏)𝑺𝟐
𝝌𝟐 = que tiene distribución ji cuadrada con 9 grados de libertad.
𝝈𝟐

5. Valor que cae en la región de rechazo de H0.


Punto crítico: 16.92
¡GRAFICA!!!

6. Valor de la estadística de prueba:


𝟗 (𝟓.𝟏𝟓𝟔)
𝝌𝟐𝟎 = = 20.624
𝟐.𝟐𝟓

7. Decisión estadística
Valor que cae en la región de rechazo de H0.
8. Conclusión: La varianza poblacional es mayor que 2.25

PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL


Las parejas de hipótesis que pueden formularse son:

1. H0: 𝒑 ≤ 𝒑𝟎 2. H0: 𝒑 ≥ 𝒑𝟎 3. H0: 𝒑 = 𝒑𝟎


H1: p > p0 H1: 𝒑 < 𝒑𝟎 H1: 𝒑 ≠ 𝒑𝟎

Estadística de prueba:
̂−𝒑
𝒑
Z= 𝒑𝒒
tiene distribución normal estándar
√𝒏

Ejemplo 06 :
Un ingeniero afirma que más del 50% de los automóviles en circulación tiene faros mal alineados.
Si esta afirmación puede sustentarse estadísticamente, y p es la proporción de automóviles en
circulación que tiene faros mal alineados, p > 0.50 se considera como la hipótesis de investigación o
alternativa, H1.
La hipótesis nula es automáticamente la negación de H1, es decir de p ≤ 𝟎. 𝟓𝟎, y se denota 𝑯𝟎 . Así,
las hipótesis son:
H0: p ≤ 0.50
H1: p > 0.50
Ejemplo 07:
El gerente del Hospital Santo Tomas de la ciudad de los Pinos sospecha que más del 35% de las
mujeres dieron a luz mediante cesárea durante el último semestre. Una estudiante de
enfermería desea probar la sospecha. Se fija un nivel de significación de 0.05 y extrae una
muestra aleatoria de 140 de las mujeres que dieron a luz el último semestre en dicho hospital,
de las cuales el 63 dieron a luz por cesárea.
1) Formula sus hipótesis
Ho: p ≤ 0.35
Ha: p > 0.35
2) Nivel de significación: α = 0.05
3) Estadística de prueba:
̂ −𝒑
𝒑
Z= 𝒑𝒒
que tiene una distribución normal estándar.
√𝒏

4) Punto crítico: 1.645


¡GRAFICA!!!

5) Valor de la estadística de prueba:


En la muestra de 140 mujeres encuentra que 50 han dado a luz con cesárea:
𝟔𝟑
̂=
𝒑 = 𝟎. 𝟒𝟓
𝟏𝟒𝟎
Siendo el valor de la estadística de prueba:
𝟎.𝟒𝟓−𝟎.𝟑𝟓
Z0 = 𝟎.𝟑𝟓𝒙𝟎.𝟔𝟓
= 2.48

𝟏𝟒𝟎

6) Como 2.48 es mayor que 1.645 no se acepta la hipótesis nula.


Se concluye que el gerente del hospital tiene razón; es decir que más del 35% de las
mujeres del hospital dieron a luz vía cesárea.

PRUEBA PARA LA COMPARACIÓN DE VARIANZAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES
Hipótesis que pueden formularse:
1. H0: 𝜎12 ≥ 𝜎22 2. H0: 𝜎12 ≤ 𝜎22 3. H0: 𝜎12 = 𝜎22
H1: 𝜎12 < 𝜎22 H1: 𝜎12 > 𝜎22 H1: 𝜎12 ≠ 𝜎22
Estadística de prueba:
𝑺𝟐 𝝈𝟐
F = 𝑺𝟏𝟐 𝝈𝟐𝟐 ~𝑭(𝑛1 −𝟏,𝑛2−𝟏)
𝟐 𝟏

La estadística de prueba tiene distribución F con 𝑛1 − 1 y 𝑛2 − 1 grados de libertad.


En teoría, las pruebas de la relación entre dos varianzas pueden asumir cualquiera de las tres formas
usuales. En la práctica, sólo se necesitan dos que son, la primera y la tercera, donde 𝜎12 denota, en el caso
de la primera, la varianza poblacional considerada como la mayor de las dos.

Ejemplo 08:
Una compañía dedicada a la comercialización de semillas de sorgo granífero sostiene que el híbrido A
tiene menor dispersión en rendimiento que el híbrido B. Para contrastar esta afirmación se toma una
muestra al azar del híbrido A y otra del híbrido B. Los resultados, en qq/ha fueron:
Híbrido A:
110 112 135 140 128 132 123 125 140 142
112 128 152 136 152 139 142 129 150 135 151
Hibrido B:
115 158 139 143 151 152 148 139 153 125 136 125 130
140 149 150 139 142 138 129 126 137 151 154 139 132
129 146 136 140 150
Efectuar la contrastación a un nivel de significación de 0.05
Hipótesis del investigador: “El híbrido A tiene menor dispersión en rendimiento que el híbrido B”
1. Hipótesis del investigador:
HI:“El híbrido A tiene menor dispersión en rendimiento que el híbrido B”
2. Hipótesis Estadística
H0: 𝜎𝐴2 ≥ 𝜎𝐵2
H1: 𝜎𝐴2 < 𝜎𝐵2
3. Nivel de significación: α = 0.05
4. Estadística de prueba:
𝑺𝟐 𝝈𝟐
F = 𝑺𝟏𝟐 𝝈𝟐𝟐 ~𝑭(20 ,30)
𝟐 𝟏
Puesto que (n1 − 1) = 21 − 1 = 20
(n2 − 1) = 31 − 1 = 30
La estadística de la prueba tiene distribución F con 20 y 30 grados de libertad.

1 1
5. Punto crítico: F(0.05,20,30)=𝐹 = 2.04 = 0.49
(0.95;30,20)

Fα con (n1-1,n2-1) grados de libertad es igual al valor inverso de F(1- α) con (n2-1, n1-1) grados de
libertad
¡GRAFICA!!!

6. Valor de la estadística de prueba:


12.79
F0 = 10.32 = 1.24

Cae en la región de no rechazo de H0.

7. Decisión estadística:
F0 = 1.24 Cae en la región de no rechazo de H0. Por tanto H0 no se rechaza.
8. Conclusión:
No hay evidencia suficiente para sostener que el híbrido A tenga menos dispersión que el hibrido B

Ejemplo 09:
Se realiza un estudio para determinar si el chocolate semidulce se disuelve más rápidamente que el de
leche. Ocho personas disolvieron una pieza de chocolate semidulce, mientras que siete disolvieron una
pieza de chocolate de leche. Los tiempos de disolución, en segundos, fueron:
Semidulce: 30 55 50 22 46 45 40 44
De leche. 45 58 23 64 105 93 28
¿Puede concluir que la varianza poblacional de los tiempos de disolución del chocolate de leche es
diferente a la del chocolate semidulce?. Use un nivel de significación del 2%.
1. Hipótesis a Investigar:
2. Hipótesis Estadística
H0: 𝝈𝟐𝟏 = 𝝈𝟐𝟐 Ó H0: 𝝈𝟐𝟏 /𝝈𝟐𝟐 = 1
H1: 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 ó H1: 𝝈𝟐𝟏 /𝝈𝟐𝟐 ≠ 𝟏
3. Nivel de significación: α = 0.02
4. Estadística de prueba:
𝑺𝟐 𝝈𝟐
F = 𝑺𝟏𝟐 𝝈𝟐𝟐 ~𝑭(𝑛1 −𝟏,𝑛2−𝟏)
𝟐 𝟏
tiene distribución F con 7 y 6 grados de libertad
𝑆2
F0 = 𝑆12 que
2

5. Puntos críticos: con 𝑛1 − 𝟏, 𝑛2 − 𝟏 grados de libertad Fα/2 y F(1-α/2)


α = 0.02 α/2= 0.02/2 = 0.01
F(0.01,7,6) =0.258 y F(0.99,7,6) = 8.26

¡GRAFICA!!!

6. Valor de la estadística de prueba:


𝑆2 115.43
F0 = 𝑆12 𝐹0 = 958.29 = 0.1204
2

7. Decisión Estadística: El valor 𝐹0 = 0.1204 cae en la región de rechazo de H0,por


tanto no se acepta H0
8. Conclusión: Se puede concluir que las varianzas son desiguales.

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES
Hipótesis que pueden formularse:
1. H0: µ1 − µ2 ≥ 𝛿 2. H0: µ1 − µ2 ≤ 𝛿 3. H0: µ1 − µ2 = 𝛿
H1: µ1 − µ2 < 𝛿 H1: µ1 − µ2 > 𝛿 H1: µ1 − µ2 ≠ 𝛿
Estadística de prueba: Pueden presentarse 3 casos:
Caso 1. Varianzas de las poblaciones son conocidas:
𝑋̅1 −𝑋̅2 −𝛿
Z= que tiene distribución normal estándar
𝜎 2 𝜎2
√ 1+ 2
𝑛1 𝑛2

Caso 2. Varianzas de las poblaciones no conocidas pero iguales


𝑋̅1 −𝑋̅2 −𝛿
T= 1 1
que tiene distribución t con n1 + n2 – 2
𝑆𝑝 √ +
𝑛1 𝑛2

Siendo:
(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
𝑆𝑝2 = 𝑛1 +𝑛2 −2

Caso 3. Varianzas de las poblaciones no conocidas pero desiguales


𝑋̅1 −𝑋̅2 −𝛿
T= que tiene distribución t con ν grados de libertad
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

Donde los grados de libertad lo obtenemos con la fórmula de Satterwaite


𝑆2 𝑆 2
( 1 + 2 )2
𝑛1 𝑛2
ν= 𝑆2 𝑆2
( )2 ( 2 )2
1
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

Ejemplo 10:
Se realiza un estudio para determinar si el chocolate semidulce se disuelve más rápidamente que
el de leche. Ocho personas disolvieron una pieza de chocolate semidulce, mientras que siete
disolvieron una pieza de chocolate de leche. Los tiempos de disolución, en segundos, fueron:
Semidulce: 30 55 50 22 46 45 40 44
De leche: 45 58 23 64 105 93 28
¿Puede concluir que la media de los tiempos de disolución del chocolate de leche es diferente a la
del chocolate semidulce?. Use un nivel de significación del 2%.
Habrá que efectuar una prueba de hipótesis:
1. Hipótesis a Investigar:
HI:
2. Hipótesis Estadística
H0: µ1 − µ2 = 0 o H0: µ1 = µ2
H1:µ1 − µ2 ≠ 0 o H1: µ1 ≠ µ2
3. Nivel de significación: α = 0.02
4. Estadística de prueba:
Depende de cómo son las varianzas de las poblaciones. En este caso no se conocen así que
realizamos previamente la prueba de comparación de varianzas. ( H0: 𝜎12 = 𝜎22 H1: 𝜎12 ≠ 𝜎22 )
Previamente se probó que las varianzas son desiguales.
La estadística de prueba para comparar las dos medias poblacionales es entones:
𝑋̅1 −𝑋̅2 −𝛿
T= que tiene distribución t con ν grados de libertad
𝑆 2
𝑆 2
√ 1+ 2
𝑛1 𝑛2

Donde
𝑆2 𝑆 2
115.43 958.29 2
( 1 + 2 )2 ( + ) 22900.769
𝑛1 𝑛2
ν= 𝑆2 𝑆2
= 8
115.43 2
7
958 2 = 3123.5365 ~ 7 grados de libertad
( ) ( )
( )2 ( 2 )2
1 8 + 7
𝑛1 𝑛2
+ 7 6
𝑛1 −1 𝑛2 −1

5. Puntos críticos: con 𝑣 grados de libertad tα/2 y t(1-α/2)


α = 0.02 α/2 = 0.02 / 2 = 0.01 1- α/2 = 0.99
t(0.01,7) = -2.998 y t(0.99,7) = 2.998
GRÁFICA!!!!
6. Valor de la estadística de prueba:
41.5−59.43−0 −17.93
𝑇0 = 115.43 958.29
= 12.302
√ +
8 7

T0 = 1.46
7. T0 = 1.46 cae en la región de no rechazo de H0.
8. No se puede concluir que la media de los tiempos de disolución del chocolate de leche es
diferente a la del chocolate semidulce.

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES


Las parejas de hipótesis
1.𝐻0 : 𝑝1 − 𝑝2 ≥ δ 2. 𝐻0 : 𝑝1 − 𝑝2 ≤δ 3. 𝐻0 : 𝑝1 − 𝑝2 = δ
𝐻1 : 𝑝1 − 𝑝2 < δ 𝐻1 : 𝑝1 − 𝑝2 > δ 𝐻1 : 𝑝1 − 𝑝2 ≠ δ
La estadística de prueba:
𝑝̂1 −𝑝̂2 −𝛿
𝑍= ̂ 𝑞
𝑝 ̂ ̂ 𝑞
𝑝 ̂
que tiene distribución normal estándar.
√ 1 1+ 2 2
𝑛1 𝑛2

Ejemplo 11:
En una muestra aleatoria de 1,200 Trujillanos, 480 tenían una actitud positiva hacia los vendedores de
viviendas. En una muestra aleatoria 1,000 chiclayanos, 700 tenían una actitud positiva hacia los
vendedores de viviendas. Contraste al nivel del 5% la hipótesis nula de que las proporciones poblaciones
son iguales frente a la hipótesis alternativa de que la proporción de chiclayanos que tiene que tienen una
actitud positiva hacia los vendedores de viviendas es mayor.
Sea 𝑝1 la proporción poblacional de trujillanos que tiene actitud positiva hacia los vendedores de
viviendas, 𝑝2 la proporción poblacional de chiclayanos que tienen actitud positiva hacia los vendedores
de viviendas.
1. Hipótesis a Investigar :
HI:
2. Hipótesis Estadística
H0: 𝑝1 = 𝑝2 H1: 𝑝1 < 𝑝2
3. Nivel de significación: α = 0.05P
4. Estadística de prueba:
𝑝̂1 −𝑝̂2 − 0
𝑍 ̂ 𝑞
𝑝 ̂ ̂ 𝑞
𝑝 ̂
que tiene distribución normal estándar.
√ 1 1+ 2 2
𝑛1 𝑛2

5. Punto crítico: Zα para α = 0.05 Z 0.05 = -1.645


6. Valor de la estadística de prueba:
0.4−0.70 −0.30 −0.30
𝑍0 = = = = −14.82

0.4𝑥𝑜.6𝑜 0.70𝑥0.30
+ √0.0002+0.00021 0.020248
1200 1000
7. El valor 𝑍0 = −14.82 cae en la región de no aceptación de H0. Por tanto no se acepta H0
8. Conclusión: La proporción de chiclayanos que tiene una actitud positiva hacia los vendedores de
viviendas es mayor que la proporción de los trujillanos.

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES


DEPENDIENTES Ó CORRELACIONADAS. Datos pareados.

Parejas de hipótesis:
1. H0: µ𝐷 ≥0 2. H0: µ𝐷 ≤0 3. H0: µ𝐷 = 0
H1: µ𝐷 <0 H1: µ𝐷 >0 H1: µ𝐷 ≠0

Estadística de prueba:
𝑑̅ −µ𝐷
T= 𝑆𝐷 que tiene distribución t con n-1 grados de libertad.
√𝑛

Siendo:
2
2 (∑ 𝑑𝑖 )
∑𝑛 ∑ 𝑑𝑖 −
𝑑̅ = 𝑖=1 𝑑𝑖
𝑆𝐷 = √ 𝑛−1 𝑛
𝑛

Ejemplo 12:
Un aspecto importante en computación es el tiempo de CPU necesario para que un algoritmo particular
resuelva un problema. Se desarrolla un nuevo algoritmo para solucionar problemas en programación
lineal. Se piensa que este nuevo algoritmo soluciona los problemas con mayor rapidez que el algoritmo
en uso. Se seleccionan diversos problemas al azar para obtener datos estadísticos que sustenten la
hipótesis de investigación. Cada problema se resuelve dos veces, uno con el algoritmo actual y otro con
el nuevo algoritmo. Los datos se presentan en la tabla:
Tiempo de CPU (S)
Programa A. antiguo (X) A. nuevo (Y) Diferencia (D)
1 8.05 0.71 7.34
2 24.74 0.74 24.00
3 28.33 0.74 27.59
4 8.45 0.77 7.68
5 9.19 0.80 8.39
6 25.20 0.83 24.37
7 14.05 0.82 13.23
8 20.33 0.77 19.56
9 4.82 0.71 4.11
10 8.54 0.72 7.82
Con un nivel de significación del 5% pruebe la hipótesis que el algoritmo nuevo es más rápido que el
antiguo.

1. Hipótesis a Investigar:
2. Hipótesis Estadística
H0: µ𝐷 ≤ 0
H1:µ𝐷 > 0
3. α = 0.05
4. Estadística de prueba:
𝑑̅ −µ𝐷
T= 𝑆𝐷 tiene distribución t con 9 grados de libertad.
√𝑛

5. Punto crítico: t(0.95,9)=1.833

¡GRAFICA!!!

7. Valor de la estadística de prueba:


𝑑̅ = 14.409 y 𝑆𝑑 = 8.65
14.409
T0 = 8.65
√10

T0 = 5.27
7. Decisión Estadística: T0 = 5.27Cae en la región de no aceptación de H0.
8. Concluimos que el nuevo algoritmo reduce con mayor rapidez. Es más rápido que el algoritmo
en vigencia.

Vous aimerez peut-être aussi