Académique Documents
Professionnel Documents
Culture Documents
6.1. INTRODUCCION
6.1.1. CONCEPTOS BASICOS
En los Test de Hipótesis se utiliza una muestra de la población para obtener información
sobre la población. A diferencia de la Estimación, ahora no queremos estimar el valor de
un parámetro poblacional, sino establecer si la población, o uno de sus parámetros,
cumple ciertas condiciones.
Por ejemplo, { “ la media de la población es 10 “ }.
Una Hipótesis Estadística es una afirmación o conjetura sobre una población.
Las técnicas que describimos en este tema tienen como objeto validar o rechazar la
Hipótesis Estadística, realizada sobre la población, en base a la información obtenida
de una muestra de esa población.
La hipótesis que se establece sobre una población recibe el nombre de Hipótesis Nula y
se representa por H0.
Al obtener conclusiones sobre la población serán de dos tipos:
• Aceptación de la Hipótesis Nula: cuando la observación de los valores muestrales
concuerde con el enunciado de la Hipótesis; es decir, lo que observamos en la
muestra nos induce a pensar que la hipótesis es cierta. También aceptaremos la
Hipótesis si lo que se deduce de la información de la muestra es más favorable para
nosotros que lo que indica el enunciado de la Hipótesis.
• Rechazo de la Hipótesis Nula: cuando la observación de los valores muestrales no
concuerde con el enunciado de la Hipótesis; es decir, lo que observamos en la
muestra nos induce a pensar que la hipótesis es falsa.
Ejemplo 6.1-1
De un gran lote, se analiza una muestra de 100 unidades de las que resultan 12
defectuosas.
Cuales de las siguientes Hipótesis aceptarías como verdaderas:
a) {“ el 10% de las piezas del lote son defectuosas”}
b) {“ el 5% de las piezas del lote son defectuosas”}
c) {“ el 1% de las piezas del lote son defectuosas”}
Ejemplo 6.1-2
6.1.2. ERRORES.
En el último caso del ejemplo anterior hemos podido observar como es grande la
probabilidad de obtener una conclusión equivocada sobre la población.
Cuando se evalúa cierta hipótesis sobre una población, H0, a partir de los datos de una
muestra de la misma, pueden cometerse dos tipos de errores.
a) error tipo I, su valor es la probabilidad de Rechazar la hipótesis nula, H0, cuando la
Hipótesis Nula es realmente es verdadera.
A la probabilidad de cometer une error tipo I se le denomina también nivel de
significación, y también, tamaño de la región crítica. Se representa por α . A 1 -
α se le denomina Coeficiente de Confianza.
TEMA 6: TEST DE HIPOTESIS 3
b) error tipo II, su valor es la probabilidad de Aceptar la hipótesis nula, H0, cuando la
Hipótesis Alternativa es realmente es verdadera, siendo falsa la Hipótesis Nula.
La probabilidad de cometer un error tipo II sólo puede calcularse si se dispone de
una hipótesis alternativa H1 ; se representa por β . Se denomina Potencia del Test
al valor 1− β .
Observemos en el esquema siguiente los casos posibles en la validación de una test de
VERACIDAD O FALSEDAD DE H0
H0 ES VERDADERA H0 ES FALSA
hipótesis:
Para seguir adelante no tenemos que confundir:
La veracidad o falsedad de la Hipótesis Nula que hace referencia a la naturaleza de la
población que será desconocida, ya que sólo la conocemos parcialmente a través de una
muestra.
El ejemplo siguiente nos puede aclarar esta idea.
Ejemplo 6.1-3
Ahora vamos a calcular los errores que se pueden cometer al validar un test.
4 TEMA 6: TEST DE HIPOTESIS
Ejemplo 6.1-5
6.1-4
Para contrastar las hipótesis del ejemplo anterior utilizaremos el siguiente test:
1. Pediremos a nuestro amigo que lance el dado 10 veces (tamaño de la muestra)
2. Contaremos el número de veces que aparece el 6 (estadístico de prueba)
3. Si el número de veces que aparece el 6 es menor o igual que 2, aceptaremos la
Hipótesis Nula (Región de Aceptación), en caso contrario Rechazaremos la Hipótesis
Nula y aceptaremos la Hipótesis alternativa (Región de Rechazo o Región Crítica)
Determinemos, para este test, la magnitud de los errores que podemos cometer:
• Error Tipo I:
Recordemos que el Error Tipo I es la probabilidad de rechazar la Hipótesis Nula
cuando es verdadera. En este caso sería la probabilidad de obtener tres o más veces el
6 en los diez lanzamientos (Rechazamos H0) cuando el “dado es legal” ( se satisface la
Hipótesis Nula).
El número de veces que se obtendrá el número 6 al realizar 10 lanzamiento se distribuirá
como una variable binomial de 10 intentos y probabilidad de éxito 1 / 6.
P (B (10 ; 3 / 8) ≤ 2 ) = 21,10%
6.1.3. CUESTIONES
¿qué se debería hacer para reducir el error tipo I?
TEMA 6: TEST DE HIPOTESIS 5
¿qué se debería hacer para reducir el error tipo II?
6.1.4. DEFINICIONES
Vamos a efectuar algunas aclaraciones sobre el diseño del test anterior.
R aceptación R. Crítica
0 1 2 3 4 5 6 7 8 9 10
6 TEMA 6: TEST DE HIPOTESIS
σ
La distribución de la media de la muestra (media muestral) es: x = N m ; . Donde:
n
• m es la media de la población (se tomará el valor indicado en la hipótesis que se
suponga verdadera).
• σ es la desviación tipo de la población, que en este caso es conocida
• n es el tamaño de la muestra, que se determinará posteriormente.
TEMA 6: TEST DE HIPOTESIS 7
45 50
x
R. CRITICA R. ACEPTACION
La Región de Aceptación serán todos los valores del estadístico de prueba más próximos
al valor de la media poblacional que indica la Hipótesis Nula ( H 0 = { m = 50} ). Y la
Región Crítica serán todos los valores más próximos al valor de la media poblacional que
indica la Hipótesis alternativa ( H 1 = { m = 45} ).
45 K 50
x
R. CRITICA R. ACEPTACION
6.2.4. Cálculos.
El Error I será: P (rechazar H 0 cuandoH 0 es cierta ) = P ( x < K / m = 50) =
4 k − 50
= P N 50 ; < K = P z < = 10%
n 4
n
buscando en las tablas de la Normal Tipificada podemos encontrar el Valor Crítico que
corresponde a la probabilidad del 10%. Es –1,2816 ; por lo que se obtendrá la siguiente
ecuación:
K − 50 4
= −1,2816 ⇒ K − 50 = −1,2816
4 n
n
4 k − 45
= P N 45 ; > K = P z > = 15%
n 4
n
buscando en las tablas de la Normal Tipificada podemos encontrar el Valor Crítico que
corresponde a la probabilidad del 85% (1-15%). Es 1,0364 ; por lo que se obtendrá la
siguiente ecuación:
K − 45 4
= 1,0364 ⇒ K − 45 = 1,0364
4 n
n
4 2,3181 · 4
5 = 2,3184 ⇒ n= = 1,8547 ⇒ n = 3,4400
n 5
4
K = 45 + 1,0364 = 47,2360
1,8547
5, 67 k − 40 k − 40
P x < k / x = N 40 ; = P z < ) = 0,05 ⇒ =
n 5.67 5,67
n n
= -1,2816
Error tipo II =
P x > k / x = N (34 ; 5,67 = P z > k − 34 = 0,10 ⇒ k − 34 = 1,6449
n 5,67 5,67
n n
N (m, 3.4 / 20 )
Si la hipótesis nula es cierta, la media de la población m = 25. Entonces, la probabilidad
de que la media de la muestra esté en la región crítica será:
x − 25
P ( N (25, 3.4 / 20 ) < x) = P( z < ) = 0.05
3.4 / 20
Consultando las tablas, para una probabilidad de 0.05 se obtiene una abscisa de –1.645 .
x − 25 3.4
= 0.1645 ⇒ x = 25 + 1.645 = 26.25
3.4 / 20 20
x
25 30
R. ACEPTACION R. CRITICA
x−m k −m k − 25
Error I = P = 0,05
s n > s n / m = 25 = P t n −1 > s n
x−m k −m
Error II = P < / m = 30 = P t n −1 < k − 30 = 0,10
s n s n s n
Por lo que en la muestra utilizada para contrastar las hipótesis se tendrá que calcular
también s .
Dado que la distribución de una t de Studen, y también sus valores críticos, dependen
de los grados de libertad, y estos a su vez del tamaño de la muestra, no es posible
resolver directamente el sistema de ecuaciones que se deriva de desarrollar las
condiciones de los errores.
k − 25
El valor crítico de una t que verifica la condición P t n −1 > = 0,05 es
1,40 10
2,2622
Como el tamaño de la muestra ya está fijado, el error tipo I tendrá que ser igual o menor
k − 25
(nunca mayor) que el 5%, por lo que ≥ 2,2622
1,40 10
k − 30
El valor de una t que verifica la condición P t n −1 < = 0,10 es -1,8331
1,40 10
12 TEMA 6: TEST DE HIPOTESIS
Como el tamaño de la muestra ya está fijado, el error tipo II tendrá que ser igual o menor
k − 30
(nunca mayor) que el 10%, por lo que ≤ −1,8331
1,40 10
Con esto se obtiene un sistema con dos inecuaciones y una sola incógnita: k
1,40
k ≥ 25 + · 2,2622 = 26,001 ; y k ≤ 30 −
1,40
· 1,8331 = 29,1884
10 10
6.3.5. Cálculos.
Si el tamaño de la muestra no fuese suficiente, para determinar cual es el tamaño de la
muestra debemos tantear con un valor superior a 10;
tamaño
muestra k ≥ 25 + 1,25 · t n , 0.05 k ≤ 30 - 1,25 · t n ,010
10 25 + 1,25 · 2,2622 = 27,8278 30 - 1,25 · -1,8331 = 27,7086
11 25 + 1,25 · 2,2281 = 27,7851 30 - 1,25 · -1,8125 = 27,7344
12 25 + 1,25 · 2,2010 = 27,7513 30 - 1,25 · -1,7959 = 27,7551
13 25 + 1,25 · 2,1788 = 27,7235 30 - 1,25 · -1,7823 = 27,7721
14 25 + 1,25 · 2,1604 = 27,7005 30 - 1,25 · -1,7709 = 27,7864
15 25 + 1,25 · 2,1448 = 27,6810 30 - 1,25 · -1,7613 = 27,7984
El primer valor que cumple las condiciones la muestra de 13 unidades.
Pero hay que observar que la desviación tipo de la muestra puede varias, así que si las
desv tipo es mayor es bnecesario comprabar que la muestra de tamaño 13 sigue siendo
válida.
σ 12 σ 22
El estadístico de prueba se distribuirá: x1 − x = N m1 − m2 ; +
n1 n 2
x1 − x 2
0 10
R. ACEPTACION R. CRITICA
Error I =
5,24 6,17 k
P ( x1 − x 2 > k / m1 = m2 ) = P N 0 ;
+ > k = P z >
= 10%
n n 5,24 6,17
+
n n
Error II =
5,24 6,17
P ( x1 − x 2 < k / m1 − m2 = 10) = P N 10 ; + > k =
n n
k − 10 = 15%
P z>
5,24 6,17
+
n n
k k − 10
= 1,2816 y = −1,0364
11,41 11,41
n n
d − (m1 − m2)
El estadístico de prueba será: = t n −1
sd
n
El test se diseña igual que el que sirve para contrastar hipótesis sobre la media con
variancia poblacional desconocida.
6.5.2. Ejemplo.
Diseñar un test para contrastar la hipótesis H 0 = {p = 0,25} frente a la hipótesis
alternativa H 1 = {p = 0,20} con un nivel de significación del 5% y una potencia del 90%
16 TEMA 6: TEST DE HIPOTESIS
p
0,20 0,25
R. CRITICA R. ACEPTACION
6.5.4. Cálculos.
Los cálculos los realizaremos a partir de las condiciones de los errores:
v 0,25· 0,75
P( p < k / p = 25%) = P N (0,25 ; < k = 0,05
Error I = n
v 0,20 · 0,80
Error II = P ( p > k / p = 20% ) = P N (0,20 ; < k = 0,10
n
6.6.2. Ejemplo.
{
Diseñar un test de hipótesis para contrastar la hipótesis nula H 0 = s = 2,1 frente a la
2
}
{ }
hipótesis alternativa H 1 = s = 3,9 con un error I del 10% y un error II del 20%. Se
2
s2
2,1 3,9
R. ACEPTACION R. CRITICA
6.6.4. Cálculos.
Como siempre partiremos de las condiciones de los errores.
Error I = ( )
P s 2 > k / σ 2 = 2,1 = P χ n2−1
2,1
n −1
> k ≤ 10%
Error II = ( )
P s 2 < k / σ 2 = 3,9 = P χ n2−1
3,9
n −1
< k ≤ 20%
2,1 14 k 14 k
P χ 142 > k ≤ 10% ⇒ P χ 142 > < 10% ⇒ ≥ 21,0641 ⇒
14 2,1 2,1
(1)
21,0641· 2,1
k≥ = 3,1596
14
3,9 14 k 14 k
P χ 142 < k ≤ 20% ⇒ P χ 142 < ≤ 20% ⇒ ≤ 9,4673 ⇒
14 3,9 3,9
(2)
9,4673 · 3,9
k≤ = 2,6373
14
Como no hay ningún valor de k que satisfaga simultáneamente las desigualdades (1) y
(2), se concluye que la muestra previa de 15 unidades no es suficiente para contrastar las
hipótesis. Se requiere una muestra mayor.
Se debe utilizar un test para contrastar las hipótesis sobre las variancias o las
desviaciones tipo de la población.
Error tipo I = P( rechazar H 0 cuando es cierta H 0 ) =
2 k · 20
P (s 2 > k / σ 2 = 0,7 2 ) = P χ 20 > ≤ 0,20
0,7 2
Error tipo II = P( aceptar H 0 cuando es cierta H 1 ) =
2 k · 20
P (s 2 < k / σ 2 = 1,0 2 ) = P χ 20 < ≤ 0,10
1,0 2
0,7 2
k > 25,04 = 0,6134
20
Luego k tendrá que verificar: 2 como hay valores de k que
k < 1,0
12,44 = 0,6221
20
verifiquen estas condiciones simultáneamente, concluimos que una muestra de 21
unidades es suficiente para contrastar el test con los errores indicados. Se tomaría
0,6134 + 0,6221
k= = 0,6178
2
20 TEMA 6: TEST DE HIPOTESIS
{
La región de aceptación será: x ∈ R / x > k
+
}
Error I = P (rechazar H 0 cuando es cierta)
2,3 2 k · 19
= P s > k
2
/ s 2 = χ 192 = P χ 19 > ≤ 0,10
19 2,3
27,2036 · 2,3
Entonces, se tendrá que cumplir que k> = 3,2931
19
Error II = P (aceptar H 0 cuando es falsa)
2,1 2 k · 19
= P s
2
<k / s 2 = χ 192 = P χ 19 < ≤ 0,20
19 2,1
13,7158 · 2,1
Entonces, se tendrá que cumplir que k< = 1,5160
19
Como NO hay valores de k que satisfagan simultáneamente ambas condiciones, se
concluye que con una muestra de 20 unidades NO se pueden contrastar ambas hipótesis
con los errores indicados.
σ σ
H 0 = σ 1 = σ 2 ⇔ 1 = 1 frente a H 1 = σ 1 = 2 ·σ 2 ⇔ 1 = 2 con errores del
σ2 σ2
1% y del 5% respectivamente.
s12
1,0 2,0
s 22
R. ACEPTACION R. CRITICA
6.7.3. Cálculos.
Error I =
s2 σ2 σ 2 σ2
P 12 > k / 12 = 1 = P 12 Fn1−1;n 2−1 > k / 12 = 1 = P (Fn1−1;n 2−1 > k ) ≤ 1% (1)
s2 σ2 σ2 σ2
Error II =
s2 σ2 σ 2 σ2 k
P 12 < k / 12 = 4 = P 12 Fn1−1;n 2−1 < k / 12 = 4 = P Fn1−1;n 2−1 < ≤ 5% ⇔
s2 σ2 σ2 σ2 4
(2)
k
⇔ P Fn1−1;n 2−1 > ≥ 95%
4
Para simplificar el problema podemos considerar que las muestras de ambas poblaciones
tienen el mismo tamaño, es decir, n1 = n 2 .
Para ello buscaremos en la tabla de la F el primer valor de n para el que existan valores
4
de k que verifiquen: f n −1,n −1;1% ≤ k ≤
f n −1,n −1;5%
22 TEMA 6: TEST DE HIPOTESIS
4
n f n −1,n −1;1% f n −1,n −1;5%
20 2,938 1,883
21 2,857 1,919
22 2,785 1,953
23 2,719 1,986
24 2,659 2,016
25 2,604 2,046
26 2,554 2,073
27 2,507 2,100
28 2,464 2,125
29 2,423 2,150
30 2,386 2,173
31 2,351 2,195
32 2,318 2,217
33 2,287 2,237
34 2,258 2,257
35 2,231 2,276
36 2,205 2,295
37 2,181 2,313
38 2,157 2,330
39 2,135 2,347
40 2,114 2,363
El primer valor de n para el que existen valores de k es n = 35 ; tomado como
2,231 + 2,276
k= = 2,254
2
s12
2) calcular la relación entre las cuasivariancias muestrales:
s22
s12
3) si < 2,254 aceptaremos la hipótesis nula que afirma que las variancias de las dos
s 22
poblaciones son iguales, y en caso contrario aceptaremos la hipótesis alternativa que
σ1 σ 12
afirma que: =2 o su equivalente =4
σ2 σ 22
frecuencias
se considere. 100
80
Si las frecuencias observadas son similares 60
a las esperadas, entonces concluiremos 40
que la variable se distribuye según la 20
distribución teórica con la que se ha 0
comparado. 1 2 3 4 5 6 7 8 9 10
clase
100
comparado. 80
60
40
20
Para medir la diferencia entre dos 0
distribuciones se utiliza el estadístico: 1 2 3 4 5 6 7 8 9 10
k
(o i − e i ) 2 clase
∑
i =1 ei
Donde oi y ei son las frecuencias observadas en la muestra y las esperadas según la
distribución teórica, en los k intervalos en los que hemos agrupado las observaciones.
Si este estadístico es pequeño, indicará que las frecuencias observadas y esperadas son
similares en todos los intervalos estudiados, por lo que supondremos que la frecuencia
observada se comporta aproximadamente como la esperada.
Si el valor de este estadístico es grande, entonces habrá diferencias importantes entre
las frecuencias observadas y las esperadas en algún intervalo por lo menos; por lo que
concluiremos que las frecuencias observadas son diferentes de las esperadas.
La dificultad que se plantea ahora es determinar qué valores del estadístico
consideraremos grandes y cuales consideraremos pequeños. Es decir, para qué valores
del estadístico aceptaremos la hipótesis nula, y para que valores del estadístico
rechazaremos la hipótesis nula.
k
( o i − ei ) 2
El estadístico ∑
i =1 ei
se distribuye aproximadamente como una variable χ2
con k-1 grados de libertad, por lo que si α es el nivel de significación o Error Tipo I
(probabilidad de rechazar la hipótesis nula cuando es cierta), el valor crítico χ α nos
2
delimitará la región crítica. χ α2 es el valor crítico de una Chi cuadrado de k-1 grados de
libertad, que deja a su derecha una probabilidad α.
• Si el valor del estadístico es menor que χ α2 aceptaremos la hipótesis nula
24 TEMA 6: TEST DE HIPOTESIS
Se desea saber si un dado es legal (todas las caras del dado tienen la misma
probabilidad de salir, distribución uniforme de los resultados) con un nivel de
significación del 5%. Para ello se lanza un dado 120 veces, los resultados
obtenidos son:
Puntuación 1 2 3 4 5 6 Total
Frecuencia observada 18 21 22 18 24 17 120
Construiremos una tabla en la que podamos comparar la frecuencia observada al alanzar
el dado con la frecuencia esperada si se cumple la hipótesis nula, en este caso que “el
dado sea legal”.
Puntuación 1 2 3 4 5 6 Total
Frecuencia observada 18 21 22 18 24 17 120
Frecuencia esperada (*) 20 20 20 20 20 20 120
(*) ya que si el dado es legal cabe esperar todos los resultados con la misma frecuencia.
Utilizando el estadístico indicado para los 6 intervalos en los que comparamos la
frecuencia observada y la esperada:
6
(oi − ei ) 2 (18 − 20)2 (21 − 20)2 (22 − 20)2 (18 − 20 )2 (24 − 20)2
∑
i =1 ei
=
20
+
20
+
20
+
20
+
20
+
+
(17 − 20)2 = 0,2 + 0,05 + 0,2 + 0,2 + 0,8 + 0,45 = 1,9
20
De otro lado, el valor de una variable χ 02, 05 y 5 grados de libertad (6 intervalos menos
uno) fija el valor crítico que es 11,070.
En este caso como el valor del estadístico (1,9) es menor que el valor crítico (11,070) se
acepta la Hipótesis Nula de que el dado es legal.
Si el valor del estadístico de prueba fuese superior a 11,070, se rechazaría la Hipótesis
Nula de que el dado es legal.
Repetimos el test anterior con otro dado. Los resultados obtenidos al lanzar el
dado se indican el la tabla siguien. ¿podremos considerar que este dado es legal
con un nivel de significación del 5%?:
Puntuación 1 2 3 4 5 6
Frecuencia observada 15 23 22 16 27 17
Atención: Las conclusiones que se deriven del análisis del valor del estadístico sólo
pueden ser válidas en el caso de que todas y cada una de las comparaciones que se
( o i − ei ) 2
realizan, sean significativas. Esto sólo se puede garantizar si las frecuencias
ei
esperadas, ei, de todos los intervalos sean mayores o iguales a 5.
En el caso que alguno de los intervalos que se están comparando tenga una frecuencia
esperada inferior a 5, se agrupará con un intervalo vecino. Realizar este agrupamiento
hasta que todos los intervalos finales tengan una frecuencia esperada superior a 5. El
número de grados de libertad se determinará a partir del número final de intervalos.
2.005 ENE ADE 11.- Indicar, con un nivel de significación del 5%, si los datos
siguientes se ajustan a una distribución de Poisson de parámetro 2,5
TEMA 6: TEST DE HIPOTESIS 25
4 4 2 2 1 2 3 3 2 2 2 4 5 2 2
2 0 5 3 3 2 2 3 2 2 0 2 4 3 2
3 0 4 5 4 2 2 0 6 3 1 0 4 1 4
El valor del estadístico de prueba es: 4,84 ; el valor crítico de una chi de 3 grados de libertad y nivel
de significación del 5% es 7,8147, por lo que se acepta que los datos de la tabla se ajustan a una
distribución de Poisson de parámetro 2,5.
Atención: si a partir de los datos se tiene que estimar algún parámetro de la distribución que
queremos ajustar, el número de grados de libertad de la variable χ2 se reducirá en una unidad por
cada parámetro estimado. Veamos el siguiente ejemplo.
2.005 JUN ADE Indicar, con un nivel de significación del 5%, si los datos siguientes se ajustan
a una distribución de Poisson.
4 5 2 3 1 2 3 3 4 2 4 4 5 2 2
2 0 7 3 4 2 4 3 2 4 0 2 5 3 5
3 2 4 5 4 2 2 0 6 3 3 0 4 1 4
Valor 0 1 2 3 4 5 6 7 8 9 suma
Frec obser 4 2 12 9 11 5 1 1 0 0 45
Frec espe 2,24 6,721 10,08 10,08 7,561 4,537 2,268 0,972 0,365 0,171 45
Frec obser 6 12 9 11 7 45
e
(ei − oi )2
El estadístico que evalúa el error es ∑
i =1 ei
= 3,231 ; que compararemos con el valor crítico
2.000 JUN ADE Indicar justificadamente si los datos de la tabla adjunta se ajustan
a una distribución uniforme U[ 0, 2 ] con un nivel de significación del 90%.
0,27 0,45 1,56 1,86 0,74 1,03 0,47 1,39 1,10 1,73
0,75 1,53 0,59 0,65 1,45 0,17 1,73 0,94 0,14 0,38
Dividiremos el intervalo en el que está definida la variable en 4 partes (la frecuencia
esperada en cada una de ellas debe ser igual o superior a 5)
Intervalo Frecuencia Frecuencia
Observada esperada
[ 0 ; 0,5 ] 6 5
] 0,5 ; 1 ] 5 5
] 1 ; 1,5 ] 4 5
] 1,5 ; 2 ] 5 5
4
(oi − ei )2
El estadístico para contrastar esta hipótesis es: ∑
i =1 ei
= 0,2 + 0 + 0,2 + 0 = 0,4
Que se debe comparar con el valor de una variable χ 02,9 y 3 grados de libertad, que es
:1,0052
TEMA 6: TEST DE HIPOTESIS 27
Como el valor del estadístico ( 0,4 ) es menor que el valor de la χ 02,9 se acepta que la
distribución de los datos de la tabla se comporta como una variable uniforme [ 0 ; 2 ] con
un nivel de significación del 90%
1.997 ENE IND En la tabla adjunta se recogen los datos de una encuesta sobre las
preferencias de dos actividades de ocio. Si les gusta o no viajar, y si gusta o no
hacer deporte. ¿Puede suponerse que ambas preferencias son independientes con
un nivel de significación del 5%?. Indicar el valor del estadístico que nos permite
contestar a la pregunta anterior.
viajar SI viajar NO
deporte SI 57 80
deporte NO 40 65
probabilidad del 5% que es 9,488. Por lo que se considerará que las productividades son
homogéneas en las tres factorías con un nivel de significación del 5%.
y11 y 21
y12 y 22
M M
y1n y2n
Total T1. T2. T..
Media y1. y 2. y..
m1 + m2
Si m = , cada una de las medias poblacionales se podría poner como:
2
mi = m + α i , verificándose que α 1 + α 2 = 0
Cada observación se puede interpretar como: y ij = mi + ε ij = m + α i + ε ij
H 0 = {α 1 = α 2 =} frente a H 1 = {α 1 ≠ 0 ≠ α 2 }
Estas hipótesis se contrastarán comparando dos estimaciones diferentes de la variancia
poblacional común σ 2 . Para ello descompondremos la variancia total en dos sumandos:
2
i =1 j =1 i =1 i =1 j =1
Donde SST es la suma total de las diferencias al cuadrado, SSA es la suma de las
diferencias al cuadrado para cada población, y SSE es la suma de los cuadrados de las
diferencias en una población o la suma de los cuadrados de los errores.
Si el experimento se repite varias veces, los valores obtenidos de SST , SSA y SSE
serían diferentes cada vez, por lo que pueden ser consideradas como variables
aleatorias.
2 2
Se tiene: E ( SSA) = 2σ
2
− σ 2 + n∑ α i2 = σ 2 + n∑ α i2
i =1 i =1
Si la hipótesis nula es falsa el numerador sobreestima σ 2 se tiene una región crítica con
una sola cola en la zona derecha de la distribución.
La hipótesis nula se rechazará con un nivel de significación a si f > f a ;1; 2 ( n −1) , donde
f a ;1; 2 ( n −1) es el valor crítico de una distribución F.
(
Otro enfoque sería calcular la probabilidad P F1; 2 ( n −1) > f = a)
RESUMEN
Grupos Cuenta Suma Promedio Varianza
214,93676
Población 1 21 1 10,2350839 1,49523551
204,47234
Población 2 21 7 9,73677842 1,03740905
ANÁLISIS DE VARIANZA
Promedio
Origen de Suma de Grados de de Probabilida Valor crítico
variaciones cuadrados libertad cuadrados F d para F
2,6072372
Entre grupos 7 1 2,60723727 2,05890499 0,15909205 4,08474565
Dentro de los 50,652891
grupos 2 40 1,26632228
53,260128
Total 5 41
6.07 Diseñar un test para contrastar las hipótesis siguientes sobre la proporción de una
población H 0 = { p = 20%} H1 = { p > 20%} con un Error Tipo I del 10%.
6.08 Diseñar un test para contrastar las hipótesis siguientes sobre la proporción de una
población H 0 = { p = 20%} H1 = { p = 30%} con un Error Tipo I del 10% y un Eroro
Tipo II del 15%.
6.09 Se realiza una prueba sobre las preferencias de los consumidores sobre una marca
de refrescos. Se realiza una encuesta a 250 personas, de las que 83 revelan su
preferencia por dicho refresco. Determinar la amplitud del intervalo de confianza, con un
nivel de confianza del 95%, para estimar la proporción de la población que prefiere ese
refresco. (Ene 97)
6.10 Las estaturas de un grupo de personas se indican en la tabla siguiente:
Estaturas frecuencias absolutas
1.51 - 1.55 1
1.56 - 1.60 3
1.61 - 1.65 10
1.66 - 1.70 29
1.71 - 1.75 43
1.76 - 1.80 36
TEMA 6: TEST DE HIPOTESIS 33
1.81 - 1.85 12
1.86 - 1.90 3
1.91 - 1.95 1
1.96 - 2.00 1
Indicar si estos datos se pueden ajustar a una distribución normal con un nivel de
significación del 10%.
5, 67 k − 40 k − 40
P x < k / x = N 40 ; = P z < ) = 0,05 ⇒ =
n 5 . 67 5, 67
n n
-1,2816
Error tipo II =
k − 34 k − 34
P x > k / x = N (34 ; 5,67
= P z > 5,67 = 0,10 ⇒ = 1,6449
n 5,67
n n
2.005 ENE IND En una población normal cuya variancia es 3,9, diseñar un test para
contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,0"} con un
error I del 10% y un error tipo II del 5%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =
34 TEMA 6: TEST DE HIPOTESIS
3,9 k − 10,5 k − 10,5
P x < k / x = N 10,5 ;
= P z < ) = 0,10 ⇒ = −1,2816
n 3,9 3,9
n n
Error tipo II =
3,9 k − 10,0 k − 10,0
P x > k / x = N (10,0 ; = P z > = 0,05 ⇒ = 1,6449
n 3,9 3,9
n n
Resolviendo el sistema queda, k = 10,281 ; n = 11,5585 ⇒ n = 134
Diseño del Test:
• Tendremos que tomar una muestra de 134 unidades,
• Calcular la media de esa muestra
• si la media de esa muestra es superior a 10,281 aceptaremos la hipótesis de que la
media de la población es 10,5 ; en caso contrario consideraremos que la media de la
población es 10,0.
2.003 ENE IND En una población normal cuya varianza es 2,14, diseñar un test para
contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,9"} con un
error I del 4,5% y un error tipo II del 8,5%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =
2,14 k − 10,5 k − 10,5
P x > k / x = N 10,5 ;
=P z> ) = 0,045 ⇒ =
n 2,14 2,14
n n
Error tipo II =
2,14 k − 10,9 k − 10,9
P x < k / x = N (10,9 ; =P z< = 0,085 ⇒ =−
n 2,14 2,14
n n
Resolviendo el sistema queda,
k − 0,12
= P(x > k / m = 0,12) = P N 0,12 ; 0, 02
> k = P z > = 0,05 ⇒
n 0,02
n
k − 0,12
⇒ = 1,6449
0,02
n
Error II =
k − 0,14
= P(x < k / m = 0,14) = P N 0,14 ; 0, 02
< k = P z < = 0,10 ⇒
n 0,02
n
k − 0,14
⇒ = −1,2816
0,02
n
36 TEMA 6: TEST DE HIPOTESIS
7.2 k − 25
decir: P ( x > k / m = 25) = P( N 25, > k ) = P z > = 0.07
n 7.2 / n
Buscando en las tablas el valor crítico correspondiente a ese nivel de probabilidad, se
k − 25
tiene: = 1.4758
7.2 / n
El error tipo II es la probabilidad de aceptar la hipótesis nula, H 0 , cuando es falsa. Es
7 .2 k − 27.5
decir: P ( x < k / m = 27.5) = P( N 27.5, < k ) = P( z < ) = 0.14
n 7.2 / n
Buscando en las tablas el valor crítico correspondiente a ese nivel de probabilidad, se
k − 27.5
tiene: = −1.0803
7.2 / n
7.2
k − 25 = 1.4758
Con lo que queda el sistema
n
7.2
k − 27.5 = −1.0803
n
7.2
Restando ambas ecuaciones, se tiene: 2.5 = 2.5561 , con lo que
n
7.2 2.5
= = 0,9781
n 2.5561
1.999 JUN IND En una población normal, cuya desviación típica es 12.5, se pide
diseñar un Test de Hipótesis para contrastar, en dicha población, la Hipótesis Nula
{m = 125.3} contra la Hipótesis Alternativa { m = 128 } de modo que la probabilidad
de cometer el Error I sea de 10% y la de cometer el Error II sea del 5%.
Si representamos por n el tamaño de la muestra y por k la frontera entre la zona de
aceptación y la de rechazo.
El error tipo I es la probabilidad de rechazar la hipótesis nula cuando es cierta:
12.5 k − 125.3
P ( N (125.3, ) > K ) = 0.10 y por lo tanto = 1.281
n 12.5
n
El error tipo II es la probabilidad de aceptar la hipótesis nula cuando es cierta la hipótesis
alternativa:
12.5 k − 128
P ( N (128, ) < K ) = 0.05 y por lo tanto = −1.645
n 12.5
n
Planteando el sistema de ecuaciones con las incógnitas n k, se tiene:
12.5
k − 125.3 = 1.281·
n
12.5
k − 128 = −1.645·
n
2.000 JUN Diseñar un test para contrastar la hipótesis nula H 0 = {m = 25} frente a
la hipótesis alternativa H 1 = {m = 27.5} con un error tipo I del 7%, y un error tipo II
del 14%. Se considera que la población se distribuye normalmente con desviación
típica 7.3 .
El estadístico a escoger es la media de la muestra.
7 .3 7 .3 k − 25
Error I : P x > k / x = N ( 25 ; ) = P N (25 ; ) > k = P z > = 0.07
n n 7 . 3
n
Error II :
38 TEMA 6: TEST DE HIPOTESIS
7 .3 7 .3 k − 27.5
P x < k / x = N (27.5 ; ) = P N (27.5 ; ) < k = P z < = 0.14
n n 7 . 3
n
k − 27.5 k − 25
= −1,0803 = 1,4757
7 .3 7 .3
n n
Resolviendo estas ecuaciones, se obtiene k = 26,4430 n = 55,6736 ; y se tomará
n = 56
En consecuencia se tomará una muestra de 56 unidades. Se calculará su media. Y si la
media es superior a 26,4430 se rechazará la hipótesis nula:_ H 0 = {m = 25} .
1.996 ENE IND Mediante un test de hipótesis se desea contrastar la hipótesis nula
H :={ la variable se distribuye normalmente N(14, 0'5 )}, contra la hipótesis
0
alternativa H := { la variable se distribuye como una N(16, 0'5) }.
1
Si se toma una muestra de 10 unidades, cual debe ser la región de aceptación de la
hipótesis nula de tal modo que la probabilidad de cometer un error tipo II sea del
5%.
Tomaremos como estadístico la media muestral para contrastar ambas hipótesis.
2.005 ENE ADE 10.- Sean H 0 = {m = 35} H 1 = {m = 34}. Diseñar un test para
contrastar estas hipótesis en una población normal con error I del 5% y error II del
10%. La varianza de la población es 25,67 .
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =
25,67 k − 35 k − 35
P x < k / x = N 35 ; = P z <
) = 0,05 ⇒ =
n 25,67 25,67
n n
-1,6448
Error tipo II =
TEMA 6: TEST DE HIPOTESIS 39
25,67 k − 34 k − 34
P x > k / x = N (34 ; = P z > = 0,10 ⇒ = 1,282
n 25,67 25,67
n n
Resolviendo el sistema queda,
2.004 ENE ADE 12.- Sean H 0 = {m = 35} H 1 = {m = 34}. Diseñar un test para
contrastar estas hipótesis en una población normal con error I del 5% y error II del
10%. La varianza de la población es 25,67 .
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =
25,67 k − 35 k − 35
P x < k / x = N 35 ; = P z <
) = 0,05 ⇒ =
n 25,67 25,67
n n
-1,6448
Error tipo II =
25,67 k − 34 k − 34
P x > k / x = N (34 ; = P z > = 0,10 ⇒ = 1,282
n 25,67 25,67
n n
Resolviendo el sistema queda,
2.003 ENE ADE 7.- En una población normal cuya varianza es 2,14, diseñar un test
para contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,9"} con
un error I del 5% y un error tipo II del 10%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
40 TEMA 6: TEST DE HIPOTESIS
Error tipo I =
2,14 k − 10,5 k − 10,5
P x > k / x = N 10,5 ; = P z > ) = 0,05 ⇒ = 1,6448
n 2,14 2,14
n n
Error tipo II =
2,14 k − 10,9 k − 10,9
P x < k / x = N (10,9 ; = P z < = 0,10 ⇒ = −1,2816
n 2,14 2,14
n n
Resolviendo el sistema queda,
2.002 ENE ADE Diseñar un test para contrastar, en una población normal con
varianza 5, la hipótesis H 0 = {" m ≤ 12"} frente a la hipótesis alternativa
H 1 = {" m ≥ 12.5"} , con error tipo I del 10% y error tipo II del 15%.
El estadístico que utilizaremos parta contrastar la hipótesis es la media muestral, x ; el
tamaño n de la muestra se determinará en el proceso siguiente ; y la forma de la región
crítica es {x ∈ R / x > k } . Las ecuaciones para determinar n y k se obtendrán a partir
de los errores.
Error I =
k − 12
( ( ) )
P( x > k / m = 12) = P N 12 ; 5 n > k = P z >
5 n
= 0,10 ⇒
k − 12
5n
= 1,2816
Error II =
k − 12,5
( ( ) )
P( x < k / m = 12,5) = P N 12,5 ; 5 n < k = P z <
5 n
= 0,15 ⇒
k − 12,5
5n
= −1,0364
1,5 2 k · 19
= P s > k
2
/ s 2 = χ 192 = P χ 19 > ≤ 0,20
19 1,5
23,9004 · 1,5
Entonces, se tendrá que cumplir que k > = 1,8869
19
Error II = P (aceptar H 0 cuando es falsa) =
2,9 k · 19
P s 2 < k / s 2 = χ 192 = P χ 192 < ≤ 0,10
19 2,9
11,6509 · 2,9
Entonces, se tendrá que cumplir que k < = 1,7783
19
Como no hay ningún valor de k que satisfaga simultáneamente ambas condiciones, se
concluye que con una muestra de 20 unidades no se pueden contrastar ambas hipótesis.
1,5 2 k · 19
= P s > k
2
/ s 2 = χ 192 = P χ 19 > ≤ 0,20
19 1,5
23,9004 · 1.5
Entonces, se tendrá que cumplir que k > = 1,8869
19
Error II = P (aceptar H 0 cuando es falsa) =
1,9 2 k · 19
= P s < k
2
/ s 2 = χ 192 = P χ 19 < ≤ 0,10
19 1,9
13,7158 · 1,9
Entonces, se tendrá que cumplir que k < = 1,3716
19
42 TEMA 6: TEST DE HIPOTESIS
n −1
(
Error I = P s > k / σ
2 2
)
= 0,02 = P χ 2
0,02
n −1
> k = P χ 2 > k = 0,20
0,02
n −1
(
Error II = P s < k / σ
2 2
)
= 0,04 = P χ 2
0,04
n −1
< k = P χ 2 < k = 0,10
0,04
El valor de k tendrá que verificar simultáneamente las condiciones:
0,02 0,04
k > χ n2−1;0 , 05 y k < χ n2−1;0,9
n n
Resolvamos este sistema de ecuaciones asignando un valor arbitrario de n = 10 ,
tendremos:
0,02 0,04
k > χ 92;0, 20 = 0,0272 y k < χ 92;0,9
= 0,0185 ; como no hay ningún valor de
9 9
k que satisfaga estas condiciones buscaremos un valor de n mayor que 10. Por ejemplo
n = 20 ; y tendremos
0,02 0,04
k > χ 192 ;0, 20 = 0,0252 y k < χ 192 ;0,9
= 0,0245 ; como no hay ningún valor
19 19
de k que satisfaga estas condiciones buscaremos un valor de n mayor que 10. Por
ejemplo n = 22 ; y tendremos
0,02 0,04
k > χ 21
2
; 0 , 20 = 0,0249 y k < χ 21
= 0,0252 ;como hay varios valores de
2
; 0,9
21 21
k que satisfacen ambas condiciones, probaremos con un valor de n menor; por ejemplo
n = 21
0,02 0,04
k > χ 20
2
; 0 , 20 = 0,0250 y k < χ 20
= 0,0249 ; como no hay ningún valor
2
;0,9
20 20
de k que satisfaga estas condiciones nos quedaremos con el valor de n = 22 y el valor
0,0249 + 0,0252
de k = = 0,0250
2
Conclusión: tomaríamos una muestra de 22 elementos, calcularíamos su cuasivarianza,
s 2 ; si ésta es mayor que 0,0250 , entonces rechazaremos la hipótesis nula.
k ·9
( )
P s 2 > k / σ 2 = 0,7 2 = P χ 92 > ≤ 0,10
0,7 2
Error tipo II = P( aceptar H 0 cuando es cierta H 1 ) =
k ·9
( )
P s 2 < k / σ 2 = 1,0 2 = P χ 92 < ≤ 0,20
1,0 2
0,7 2
k > 14,684 = 0,7994
Luego k tendrá que verificar: 9 como no hay ningún valor de
2
k < 1,0
5,3801 = 0,5978
9
k que verifique estas condiciones simultáneamente, concluimos que una muestra de 10
unidades es insuficiente para contrastar
2.000 ENE ADE Diseñar un test de Hipótesis para contratar la hipótesis nula H0 = {p
= 10% } contra la hipótesis alternativa H1 = { p = 14%} con un error tipo I del 5% y
un error del tipo II del 10%. Se ha tomado una muestra inicial de 50 unidades y el
valor de la proporción muestral es del 12%.
El estadístico a utilizar será el número de unidades de una muestra que tengan la
propiedad a la que hace referencia la proporción, q.
Tendremos que determinar el tamaño de la muestra, n, y la región crítica, q > Q.
La probabilidad de rechazar la hipótesis nula cuando es cierta ( Error tipo I ) es:
( )
P N (0,10 n ; n 0,10 0,9 ) > Q + 0,5 = 0,05
Tipificando y buscando en tablas, se tiene:
Q + 0,5 − 0,10 n
= 1,6458
n 0,10 0,90
La probabilidad de aceptar la hipótesis nula cuando es falsa ( Error tipo II ) es:
(
P N (0,14 n ; n 0,14 0,86 ) ≤ Q + 0,5 = 0,10 )
Tipificando y buscando en tablas, se tiene:
Q + 0,5 − 0,14 n
= −1,2808
n 0,14 0,86
Con lo que se puede plantear el sistema:
2.001 ENE ADE Diseñar un test para contrastar la hipótesis nula de que la
proporción de una población es 25% contra la hipótesis alternativa de que la
proporción sea inferior a 22%. Tomar como error tipo I el 5% y como error tipo II el
10%
k − 0,5 − 0,25 * m
(( )
P(B(m ;0,25) < k ) ≈ P N 0,25 * m ; 0,25 * 0,75 * m < k − 0,5 = P z < ) = 0,0
0,25 * 0,75 * m
Error II =
TEMA 6: TEST DE HIPOTESIS 45
( ( )
P (B(m ;0,22 ) ≥ k ) ≈ P N 0,22 * m ; 0,22 * 0,78 * m > k − 0,5 = )
k − 0,5 − 0,22 * m
= P z > = 0,10
0, 22 * 0, 78 * m
Se tiene :
k − 0,5 − 0,25 * m
= −1,6449 ⇒ k − 0,5 − 0,25 * m = −1,6449 * 0,25 * 0,75 * m
0,25 * 0,75 * m
k − 0,5 − 0,22 * m
y = 1,2816 ⇒ k − 0,5 − 0,22 * m = 1,2816 * 0,22 * 0,78 * m
0,22 * 0,78 * m
1,2432
0,03 * m = 1,2432 m ⇒ m= = 41,44 ⇒ m = 1.717,2736 ⇒
0.03
⇒ m = 1.718 unidades
El valor de k es 400,30 ( 23, 31%) Por lo que tomaríamos una muestra de 1.718
unidades y si el número de unidades que cumple la propiedad es menor o igual que 400
rechazaríamos la hipótesis nula.
2.003 JUN ADE Diseñar un test de hipótesis para contrastar las siguientes
hipótesis sobre la proporción de personas que consumen cierto producto:
H 0 = {p > 16%} frente a H 1 = {p < 12%}, con un error tipo I del 7% y un error
tipo II del 8%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p < k }. Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.
0,16 · 0,84 k − 0,16
Error I = P ( p < k / p = 16% ) ≈ P N 0,16 ;
< k = P z <
= 0,07 ⇒
n 0,16 · 0,84
n
0,12 · 0,88 k − 0,12
Error II = P( p > k / p = 12% ) ≈ P N 0,12 ; > k =
P z > = 0,05 ⇒
n
0,12 · 0,88
n
k − 0,18 k − 0,12
Error I ⇒ = −1,2816 ; Error II ⇒ = 1,6449
0,18 · 0,82 0,12 · 0,88
n n
Despejando n y k se tiene : n = 17,1150 ; k = 0,1512 ; n = 293
Diseño del Test:
• tomaremos una muestra de 293 elementos,
• contaremos el número de elementos que cumplen la propiedad
si el número de elementos que cumplen la propiedad es superior a 0,1512 · 293 = 44,30,
entonces aceptamos la hipótesis nula.
46 TEMA 6: TEST DE HIPOTESIS
2.002 JUN ADE Diseñar un test para contrastar la hipótesis siguiente sobre la
proporción de una población, H 0 = {" p = 18%"} frente a la hipótesis alternativa
H 1 = {" p = 12%"} , con error tipo I del 10% y error tipo II del 5%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p < k }. Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.
0,18 · 0,82
Error I = P( p < k / p = 18% ) ≈ P N 0,18 ; < k =
n
k − 0,18 k − 0,18
= P z < = 0,10 ⇒ = −1,2816
0,18 · 0,82 0,18 · 0,82
n n
0,12 · 0,88
Error II = P( p > k / p = 12% ) ≈ P N 0,12 ; > k =
n
k − 0,12 k − 0,12
= P z > = 0,05 ⇒ = 1,6449
0,12 · 0,88 0,12 · 0,88
n n
2.002 ENE ADE Diseñar un test para contrastar la hipótesis siguiente sobre la
proporción de una población, H 0 = {" p = 12%"} frente a la hipótesis alternativa
H 1 = {" p = 18%"} , con error tipo I del 5% y error tipo II del 10%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p > k } . Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.
TEMA 6: TEST DE HIPOTESIS 47
0,12 · 0,88
Error I = P( p > k / p = 12% ) ≈ P N 0,12 ; > k =
n
k − 0,12 k − 0,12
= P z > = 0,05 ⇒ = 1,6449
0,12 · 0,88 0,12 · 0,88
n n
0,18 · 0,82
Error II = P( p < k / p = 18% ) ≈ P N 0,18 ; < k =
n
k − 0,18 k − 0,18
= P z < = 0,10 ⇒ = −1,2816
0,18 · 0,82 0,18 · 0,82
n n
2.001 JUN ADE Diseñar un test para contrastar la hipótesis nula: “La proporción
de fruta de pequeño calibre es del 50%” ; frente a la hipótesis alternativa: “La
proporción de fruta de pequeño calibre es del 80%”. Se establece el error I en el
10% y el error tipo II en el 15%.
Tomaríamos una muestra de N 1 = 20 unidades (puede ser otra cantidad pero tienen que
ser suficientemente grande para que la distribución binomial pueda aproximarse a una
normal);
n1
ˆ1 =
En esta muestra se cuentan las unidades defectuosas n1 , y se calcula p , el
N1
estimador previo de la proporción.
n2
ˆ2 =
Utilizamos la magnitud de los errores para calcular los valores de N 2 y k 2 . ; p ;
N2
k2
q2 = :
N2
Error I =
( (
Error I = P N 0,5 N 2 ; )
)k + 0,5 − 0,5 N 2
0,5 0,5 N 2 > k 2 + 0,5 = P z > 2
0,5 0,5 N 2
= 0,10
( (
Error II = P N 0,8 N 2 ; )
)k + 0,5 − 0,8 N 2
0,8 0,2 N 2 < k 2 + 0,5 = P z < 2
0,8 0,2 N 2
= 0,15
5) Se plantea el sistema de ecuaciones:
k 2 + 0,5 − 0,5 N 2
= 1,2816 ⇔ k 2 + 0,5 − 0,5 N 2 = 1,2816 0,5 0,5 N 2
0,5 0,5 N 2
k 2 + 0,5 − 0,8 N 2
= −1,0364 ⇔ k 2 + 0,5 − 0,8 N 2 = −1,0364 0,8 0,2 N 2
0,8 0,2 N 2
Restando ambas ecuaciones, se tiene:
1,0554
0,3 N 2 = 1,0554 N 2 ⇔ N2 = ⇔ N 2 = 12,38
0,3
Por lo que necesitamos una muestra de 13 unidades, pero para asumir la hipótesis de
normalidad se requiere que el tamaño de la muestra sea superior a 30 unidades.
2.001 JUN IND Indicar con un nivel de significación del 5% si los datos observados
y recogidos en la tabla corresponden a una distribución de Poisson de parámetro
4:
Valor 0 1 2 3 4 5 6 7
Frecuencia 13 17 25 23 11 5 4 1
La frecuencia esperada para una variable de Poisson de parámetro 4 es:
Valor 1 2 3 4 5 6 7
Frec.
30 25 23 11 5 4 1
Observada
Frec.
Esperada 9,0662 14,5059 19,3413 19,3413 15,4731 10,3153 5,8945
(ei − oi )2 / ei
48,3356 7,5916 0,6921 3,5973 7,0888 3,8665 4,0641
7
∑ (e − oi ) / ei = 75,2371
2
El estadístico de prueba es i
i =0
TEMA 6: TEST DE HIPOTESIS 49
(o i − e ) 2
Calculando el estadístico ∑ ei
= 8.6472
Frecuencia 0,905 3,170 5,548 6,473 5,664 3,965 2,313 1,156 0,506 0,196
Esperada 9 7 8 6 4 1 0 5 0 8
Agrupamos los intervalos de forma que en todos ellos la frecuencia esperada sea igual o
superior a 5
Frecuencia Observada 9 8 6 7
50 TEMA 6: TEST DE HIPOTESIS
Comparamos el valor de este estadístico con el valor crítico de una variable χ de (4-1-
2
1) grados de libertad y nivel de significación del 10%, ya que a partir de los datos se ha
estimado un parámetro y esto reduce en una unidad el número de grados de libertad. En
tablas 4,6052.
para el nivel de significación pedido ( 4,6052 ), se acepta la hipótesis de que los datos
observados se ajustan a una distribución de Poisson de parámetro 3,5.
2.004 JUN ADE La frecuencia de los ingresos, en euros, durante las últimas
semanas se indican en la tabla siguiente:
< 1600 1900 - 2200 2200 - 2500 2500 - 2800 2800 - 3100 > 3400
8 18 25 30 14 5
Se pide indicar justificadamente si estos datos se ajustan a una variable normal de
media 2.500 y desviación tipo 400, con un nivel de significación del 10%
Compararemos la frecuencia esperada con la realmente observada:
intervalo < 1600 1900 - 2200 - 2500 - 2800 - > 3400 total
2200 2500 2800 3100
f. Esperada 6,6807 15,9820 27,3373 27,3373 15,9820 6,6807 100
f. Observada 8 18 25 30 14 5 100
ei
9,2363, y el valor del estadístico de prueba es 1,6431, se acepta la Hipótesis de que los
datos se distribuyen según la variable indicada.
2.004 ENE ADE 6.- Indicar si los datos de la tabla siguiente se ajustan a una
distribución de Poisson de parámetro 5, con un nivel de significación del 5%
3 7 2 3 6 3 9 5 4 5
6 3 5 5 3 4 4 2 2 7
6 4 5 9 4 4 9 4 4 7
6 6 3 5 6 3 6 4 3 7
Compararemos la frecuencia observada con la frecuencia esperada según una
distribución de Poisson:
Valor 0 1 2 3 4 5 6 7 8 9 10 suma
Frec.Observ. 0 0 3 8 9 6 7 4 0 3 0 40
Frec. Esper. 0,2695 1,3476 3,369 5,615 7,0187 7,0187 5,8489 4,1778 2,6111 1,4506 1,2731 40
Frec.Observ. 3 8 9 6 7 7 40
Frec. Esper. 4,9861 5,615 7,0187 7,0187 5,8489 9,5127 40
TEMA 6: TEST DE HIPOTESIS 51
2.003 ENE ADE 3.- En la tabla siguiente se indica el número de clientes que acude
diariamente a un establecimiento. Se pide indicar si los datos observados se
pueden ajustar a una distribución de Poisson de parámetro 5 con un nivel de
significación del 5%
5 3 2 6 6 7 3 3 6 7 7 9 7 5 3 12 6 10 7 2
6 8 0 7 4 6 5 6 3 5 5 9 3 9 5 3 5 3 7 3
4 3 1 2 2 5 5 6 4 7 5 6 7 8 7 5 7 8 4 3
oi 1 1 4 11 4 11 9 11 3 3 1 0 1 60
ei 0,40 2,02 5,05 8,42 10,53 10,53 8,77 6,27 3,92 2,18 1,09 0,49 0,21 59,88
oi 6 11 4 11 9 11 8
(ei − oi )2 (7,479 − 6 )
2
(8,42 − 11)
2
(10,53 − 4 )
2
(10,53 − 11)
2
(8,77 − 9 )
2
∑ ei
=
7,479
+ +
8,42
+
10,53
+
10,53 8,77
+
+
(6,27 − 11)2 + (7,881 − 8)2 = 8,773
6,27 7,881
Como el valor de este estadístico es menor que el valor de una χ de 6 (7-1) grados de
2
libertad y nivel de significación del 5% ( 12,5916), aceptaremos que los datos observados
corresponden a una variable de Poisson de parámetro 5.
2.002 JUN ADE 6.- En la tabla siguiente se indica el número de clientes que piden
langosta en un restaurante.
5 4 3 10 8 5 2 6 9 6 9 7
6 12 9 11 10 9 7 7 6 9 9 3
7 11 5 11 7 6 4 10 7 3 5 6
52 TEMA 6: TEST DE HIPOTESIS
Se pide indicar si estos datos se ajustan, con un nivel de significación del 10%, a
una distribución Binomial de 12 intentos.
Primero calcularemos la probabilidad de la variable binomial
exitos 254
= = 0,588
int entos 36 · 12
Como se utilizan los datos de la muestra para calcular un parámetro, los grados de
libertad se reducen en una unidad.
Luego, construiremos la tabla de frecuencia observada y de frecuencia esperada para
una distribución Binomial de 12 intentos con probabilidad de éxito de 0,588
nº
clientes 0 1 2 3 4 5 6 7 8 9 10 11 12
frec 0,000 0,014 0,115 0,551 1,769 4,039 6,725 8,225 7,335 4,652 1,991 0,516 0,061
esperada 9 8 9 1 3 5 0 4 9 5 7 7 4
6,491 6,725 8,225 7,335 7,222
4 0 4 9 3
10 6 6 1 13
frec
observada 0 0 1 3 2 4 6 6 1 6 3 3 1
Hay cinco intervalos en los que la frecuencia esperada es superior a 5, calcularemos el
estadístico:
+
(7,2223 − 13)
2
= 12,671
7,2223
Como el valor de este estadístico es mayor que el valor de una χ de 3 (5-1-1) grados de
2
libertad y nivel de significación del 10% (6,2514), rechazaremos que los datos
observados corresponden a una variable de Binomial de 12 intentos (con probabilidad
del 58,8%).
2.002 ENE ADE 8.- En la tabla siguiente se indica el número de clientes que piden
langosta en un restaurante.
5 4 3 10 8 5 2 6 9 6 9 7
6 12 9 11 10 9 7 7 6 9 9 3
7 11 5 11 7 6 4 10 7 3 5 6
Se pide indicar si estos datos se ajustan a una distribución de Poisson de
parámetro 8 con un nivel de significación del 10%
Primero construiremos la tabla de frecuencia observada y de frecuencia esperada para
una distribución de Poisson de parámetro 8:
nº clientes 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Frec esperada 0,01 0,10 0,39 1,03 2,06 3,30 4,40 5,03 5,03 4,47 3,57 2,60 1,73 1,07 0,61 0,32 0,16
frec observada 0 0 1 3 2 4 6 6 1 6 3 3 1 0 0 0 0
10 12 1 9 4
(ei − oi )2 (6,88 − 10)2 + (9,42 − 12)2 + (5,03 − 1)2 + (8,04 − 9)2 + (6,49 − 4)2
∑ ei
=
6,88 9,42 5,03 8,04 6,49
= 6,4203
Como el valor de este estadístico es menor que el valor de una χ de 4 (5-1) grados de
2
libertad y nivel de significación del 10% ( 7,7794), aceptaremos que los datos observados
corresponden a una variable de Poisson de parámetro 8.
NOTA: pueden haber otras formas de agrupar los intervalos.
2.001 JUN ADE Indicar si los datos recogidos en la tabla siguiente se ajustan a una
distribución uniforme con un nivel de significación del 10%:
Intervalo 0.01-10 10.01- 20.01- 30.01- 40.01- 50.01- 60.01- 70.01-
20 30 40 50 60 70 80
Frecuencia 11 12 4 10 8 12 7 6
( ei − o i ) 2 /
0,57857 1,20714 2,57857 0,17857 0,06429 1,20714 0,35 0,86429 7,02857
El valor crítico de una χ 2 de 7 grados de libertad con un nivel de significación del 10% es
12,0170
Como el estadístico de prueba ( 7,0286 ) es inferior al valor crítico ( 12,0170 ), entonces
consideramos que los datos se ajustan a una distribución uniforme.
2.001 ENE ADE 8.- Indicar con un nivel de significación del 5% si los datos
observados y recogidos en la tabla corresponden a una distribución de Poisson:
Valor 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 2 19 21 22 14 9 6 4 2
Primero calcularemos el parámetro de la distribución de Poisson. Se han observado 407
incidentes en 100 intervalos, el número medio de incidentes de Poisson es 4,07 .
Calcularemos la frecuencia esperada.
Valor 0 1 2 3 4 5 6 7 8 9
Frec.
1 2 19 21 22 14 9 6 4 2
Observada
Frec.
70774 9505 ,1443 9,189 ,5249 ,8932 ,7809 26833 18901 44214
Esperada
Agruparemos los intervalos en los que la frecuencia esperada sea menor que 5.
Frecuencia
3 19 21 22 14 9 12
Observada
Frecuencia
8,65824 14,1443 19,189 19,5249 15,8932 10,7809 10,8995
Esperada
54 TEMA 6: TEST DE HIPOTESIS
(ei − oi )2
3,69771 1,66698 0,17091 0,31377 0,22553 0,29419 0,11112
ei
(ei − oi )2
El valor del estadístico es = ∑i ei
= 6,4802
Como el valor crítico de una χ de (7-1) grados de libertad y nivel de significación del
2
2.001 JUN IND Diseñar un test para contrastar la hipótesis “A = N( 27 ; 2)” contra la
hipótesis alternativa “A = N(27,5 ; 2,5)” con un nivel de significación del 10% y una
potencia del 95%.
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =
k − 27 k − 27
P( x > k / x = N (27 ; 2 ) = P( z > ) = 0,10 ⇒ = 1,2816
n 2 2
n n
Error tipo II =
k − 27,5 k − 27,5
P( x < k / x = N (27,5 ; 2,5 ) = P( z < ) = 0,05 ⇒ = −1,6449
n 2,5 2,5
n n
Resolviendo el sistema queda,
2.000 JUN 1.- Indicar el esquema a seguir para la Validación de Test de Hipótesis
• Especificar la Hipótesis Nula y, si procede, la hipótesis alternativa.
• Indicar los errores Tipo I y Tipo II
• Escoger el estadístico para contrastar la Hipótesis Nula
• Indicar la forma de la Región Crítica
• Determinar el tamaño de la muestra
TEMA 6: TEST DE HIPOTESIS 55
• Indicar la Región Crítica, como criterio para contrastar la hipótesis nula
• Tomar la Muestra del tamaño indicado
• Aceptar o Rechazar la Hipótesis Nula según el valor del estadístico de la muestra
1.997 ENE IND El número de llamadas que se reciben en una centralita en periodos
de 5 minutos se recoge en la tabla siguiente:
llamadas en 5 0 1 2 3 4 5 6 7
minutos
frecuencia 169 134 74 32 11 2 0 1
2.000 JUN ADE 5.- Diseñar un test de hipótesis, con error tipo I =5% y error tipo II =
10%, que nos permita diferenciar dos partidas de bolas de billar, unas de plástico,
cuyo peso se distribuye según una N ( 225 gr, 10 gr ), y otras de marfil, cuyo peso
se distribuye según una N( 230 gr, 12 gr)
Tomaremos como hipótesis nula que “las bolas son de plástico.
Si representamos por n el tamaño de la muestra y por k la frontera entre la zona de
aceptación y la de rechazo, el error tipo I (la probabilidad de rechazar la hipótesis nula
cuando es cierta) es :
k − 225
P( N (225, 10) > k ) = 0,05 y por lo tanto = 1,645
10 n
Y el error tipo II (la probabilidad de aceptar la hipótesis nula cuando es falsa) será:
k − 230
P( N (230, 12) < k ) = 0,10 y por lo tanto = −1,281
12 n
Planteando el sistema de ecuaciones con las incógnitas n y k, se tiene:
10
k − 225 = 1,645 n
12
k − 230 = −1,281
n
2.001 ENE ADE Diseñar un test para contrastar la hipótesis nula: “El número medio
de llamadas que se reciben durante 10 minutos es 5” ; frente a la hipótesis
alternativa: “El número medio de llamadas que se reciben durante 10 minutos es
6”. Se establece el error I en el 10% y el error tipo II en el 15%.
Error I =
5 *T
k − 0,5 −
5 *T 5 *T 5 *T
P p > k ≈ P N ; > k + 0,5 = P z > 10 = 0,10
10 10 10
5*T
10
Error II =
6 *T
k − 0,5 −
6 *T 6 *T 6 * T
P p ≤ k ≈ P N ; < k + 0,5 = P z < 10 = 0,15
10 10 10
6 *T
10
5 *T
k − 0,5 −
Se tiene :
10 = 1,2816 ⇒ k − 0,5 − 5 * T = 1,2816 * 5 * T
5 *T 10 10
10
6 *T
k − 0,5 −
y
10 = −1.0364 ⇒ k − 0,5 − 6 * T = −1.0364 * 6 * T
6 *T 10 10
10
T 5*T 6 *T
= 1,2816 * + 1,0364 * ⇒ T = 17,0902 ⇒ T = 292,0709
10 10 10
El valor de k es 158,62 . Por lo que contaríamos las llamadas recibidas durante 292,07
minutos y si el número de llamadas recibidas es menor o igual que 158 aceptaríamos la
hipótesis nula.
TEMA 6: TEST DE HIPOTESIS 57