Vous êtes sur la page 1sur 57

TEMA

6.- TEST DE HIPOTESIS

6.1. INTRODUCCION
6.1.1. CONCEPTOS BASICOS
En los Test de Hipótesis se utiliza una muestra de la población para obtener información
sobre la población. A diferencia de la Estimación, ahora no queremos estimar el valor de
un parámetro poblacional, sino establecer si la población, o uno de sus parámetros,
cumple ciertas condiciones.
Por ejemplo, { “ la media de la población es 10 “ }.
Una Hipótesis Estadística es una afirmación o conjetura sobre una población.
Las técnicas que describimos en este tema tienen como objeto validar o rechazar la
Hipótesis Estadística, realizada sobre la población, en base a la información obtenida
de una muestra de esa población.
La hipótesis que se establece sobre una población recibe el nombre de Hipótesis Nula y
se representa por H0.
Al obtener conclusiones sobre la población serán de dos tipos:
• Aceptación de la Hipótesis Nula: cuando la observación de los valores muestrales
concuerde con el enunciado de la Hipótesis; es decir, lo que observamos en la
muestra nos induce a pensar que la hipótesis es cierta. También aceptaremos la
Hipótesis si lo que se deduce de la información de la muestra es más favorable para
nosotros que lo que indica el enunciado de la Hipótesis.
• Rechazo de la Hipótesis Nula: cuando la observación de los valores muestrales no
concuerde con el enunciado de la Hipótesis; es decir, lo que observamos en la
muestra nos induce a pensar que la hipótesis es falsa.

Ejemplo 6.1-1

De un gran lote, se analiza una muestra de 100 unidades de las que resultan 12
defectuosas.
Cuales de las siguientes Hipótesis aceptarías como verdaderas:
a) {“ el 10% de las piezas del lote son defectuosas”}
b) {“ el 5% de las piezas del lote son defectuosas”}
c) {“ el 1% de las piezas del lote son defectuosas”}

En ocasiones se establece una Hipótesis Alternativa a la Hipótesis Nula. En este caso,


el Test de Hipótesis tiene que aceptar una de ambas:
• Si se Acepta la Hipótesis Nula se rechaza la Hipótesis Alternativa.
• Si se Rechaza la Hipótesis Nula se Acepta la Hipótesis Alternativa.
La Hipótesis Alternativa se representa por H1.
2 TEMA 6: TEST DE HIPOTESIS
Aceptación de la Hipótesis Nula: cuando la observación de los valores muestrales
concuerde con el enunciado de la Hipótesis; es decir, lo que observamos en la como En
los capítulos siguientes se continuará con el estudio de diversas distribuciones de
probabilidad. Con ellas podremos representar cuantitativamente la incertidumbre de una
variable o de un resultado.
El rechazo de la hipótesis nula da como consecuencia la aceptación de una Hipótesis
Alternativa, que se representa por H1.

Ejemplo 6.1-2

Sobre un lote de piezas se establecen las siguientes hipótesis:


• Hipótesis Nula, H0 = {“ el 5% de las piezas del lote son defectuosas”}
• Hipótesis Alternativa, H1 = {“ el 10% de las piezas del lote son defectuosas”}
Para contrastarlas, del lote se toma una muestra de 100 unidades; según el resultado
obtenido se aceptará la Hipótesis Nula o la Hipótesis Alternativa.
Indicar en siguientes casos si aceptarías la Hipótesis Nula (rechazar la Alternativa) o
Aceptarías la Hipótesis Alternativa (rechazar la Hipótesis Nula).
a) En la muestra se obtienen 12 unidades defectuosas.
b) En la muestra se obtienen 9 unidades defectuosas.
c) En la muestra se obtienen 6 unidades defectuosas.
d) En la muestra se obtienen 8 unidades defectuosas.

En el ejemplo anterior la decisión hubiese sido la siguiente:


a) rechazar la Hipótesis Nula, ya que resulta mucho más factible obtener 12 piezas
defectuosas de un lote que tiene el 10% de defectuosas que obtenerlas de un lote que
sólo tiene el 5% de defectuosas.
b) rechazar la Hipótesis Nula, ya que resulta más factible obtener 9 piezas defectuosas
de un lote que tiene el 10% de defectuosas que obtenerlas de un lote que sólo tiene el
5% de defectuosas.
c) aceptar la Hipótesis Nula, ya que resulta mucho más factible obtener 6 piezas
defectuosas de un lote que tiene el 5% de defectuosas que obtenerlas de un lote que
sólo tiene el 10% de defectuosas.
d) rechazar la Hipótesis Nula, sería una respuesta precipitada, ya que aunque resulta
más factible obtener 8 piezas defectuosas de un lote que tiene el 10% de defectuosas
que obtenerlas de un lote que sólo tiene el 5% de defectuosas, también es muy probable
obtener ese resultado muestral si el lote tiene el 5% de unidades defectuosas.
En este último caso podríamos pensar en tomar una muestra mayor para reducir el
riesgo de equivocarnos en nuestras conjeturas sobre el lote.

6.1.2. ERRORES.
En el último caso del ejemplo anterior hemos podido observar como es grande la
probabilidad de obtener una conclusión equivocada sobre la población.
Cuando se evalúa cierta hipótesis sobre una población, H0, a partir de los datos de una
muestra de la misma, pueden cometerse dos tipos de errores.
a) error tipo I, su valor es la probabilidad de Rechazar la hipótesis nula, H0, cuando la
Hipótesis Nula es realmente es verdadera.
A la probabilidad de cometer une error tipo I se le denomina también nivel de
significación, y también, tamaño de la región crítica. Se representa por α . A 1 -
α se le denomina Coeficiente de Confianza.
TEMA 6: TEST DE HIPOTESIS 3
b) error tipo II, su valor es la probabilidad de Aceptar la hipótesis nula, H0, cuando la
Hipótesis Alternativa es realmente es verdadera, siendo falsa la Hipótesis Nula.
La probabilidad de cometer un error tipo II sólo puede calcularse si se dispone de
una hipótesis alternativa H1 ; se representa por β . Se denomina Potencia del Test
al valor 1− β .
Observemos en el esquema siguiente los casos posibles en la validación de una test de

Tabla 6.1.2-1 : Clasificación de los errores

VERACIDAD O FALSEDAD DE H0
H0 ES VERDADERA H0 ES FALSA

NUESTRA ACEPTAR H0 Decisión Correcta ERROR II


DECISION
SOBRE LA
HIPOTESIS RECHAZAR H0 ERROR I Decisión Correcta

hipótesis:
Para seguir adelante no tenemos que confundir:
La veracidad o falsedad de la Hipótesis Nula que hace referencia a la naturaleza de la
población que será desconocida, ya que sólo la conocemos parcialmente a través de una
muestra.
El ejemplo siguiente nos puede aclarar esta idea.

Ejemplo 6.1-3

Consideremos las siguientes hipótesis sobre el tiempo que hará mañana:


• Hipótesis Nula, H0 = {“ Mañana lloverá”}
• Hipótesis Alternativa, H1 = {“ Mañana NO lloverá”}
Queda claro que nosotros no podemos influir sobre la veracidad de estas hipótesis.
En base a la información meteorológica (actuaría como una muestra) podemos tomar la
decisión:
• Aceptar la Hipótesis Nula, y coger el paraguas
• Rechazar la Hipótesis Nula y aceptar Hipótesis Alternativa, y no coger el
paraguas.
Los resultados que pueden darse son:
• Decidir coger el paraguas y que llueva (H0 Cierta). Decisión correcta.
• Decidir coger el paraguas y que no llueva (H0 Falsa). Decisión equivocada, que
correspondería al Error II.
• Decidir NO coger el paraguas y que no llueva (H0 Falsa). Decisión correcta.
• Decidir NO coger el paraguas y que llueva (H0 Cierta). Decisión equivocada, que
correspondería al Error I.

Ahora vamos a calcular los errores que se pueden cometer al validar un test.
4 TEMA 6: TEST DE HIPOTESIS

Ejemplo 6.1-5
6.1-4

Un amigo nos invita a participar en una partida de parchís. Estamos considerando la


posibilidad de que nuestro amigo para jugar utilice un dado trucado en el que el 6
salga con mayor frecuencia. Para ello vamos a considerar dos hipótesis sobre el dado
que utiliza nuestro amigo::
• Hipótesis Nula, H0 = {“ El dado es legal”}
• Hipótesis Alternativa, H1 = {“ El 6 tiene triple probabilidad que cada uno de los
otros resultados”}
Queda claro que nosotros no podemos influir sobre la naturaleza del dado de nuestro
amigo. Lo único que podemos hacer es aceptar jugar (cuando consideremos que el dado
es legal) o indicarle a nuestro amigo que es un tramposo (cuando consideremos que el
dado esté trucado como indica la Hipótesis alternativa). Los errores serían:
• Error tipo I Rechazar la Hipótesis Nula (decirle a nuestro amigo que es un
tramposo) cuando nuestro amigo va a jugar legalmente (Hipótesis Nula cierta).
Nuestra actitud disgustará a nuestro amigo.
• Error Tipo II Aceptar la Hipótesis Nula (jugamos la partida) cuando nuestro
amigo va a utilizar un dado trucado (Hipótesis Alternativa cierta), Seguramente
perderemos la partida.

Para contrastar las hipótesis del ejemplo anterior utilizaremos el siguiente test:
1. Pediremos a nuestro amigo que lance el dado 10 veces (tamaño de la muestra)
2. Contaremos el número de veces que aparece el 6 (estadístico de prueba)
3. Si el número de veces que aparece el 6 es menor o igual que 2, aceptaremos la
Hipótesis Nula (Región de Aceptación), en caso contrario Rechazaremos la Hipótesis
Nula y aceptaremos la Hipótesis alternativa (Región de Rechazo o Región Crítica)
Determinemos, para este test, la magnitud de los errores que podemos cometer:
• Error Tipo I:
Recordemos que el Error Tipo I es la probabilidad de rechazar la Hipótesis Nula
cuando es verdadera. En este caso sería la probabilidad de obtener tres o más veces el
6 en los diez lanzamientos (Rechazamos H0) cuando el “dado es legal” ( se satisface la
Hipótesis Nula).
El número de veces que se obtendrá el número 6 al realizar 10 lanzamiento se distribuirá
como una variable binomial de 10 intentos y probabilidad de éxito 1 / 6.

P(B(10 ; 1 / 6) > 2 ) = 1 − P(B(10 ; 1 / 6) ≤ 2 ) = 22,85%


• Error Tipo II:
Recordemos que el Error Tipo II es la probabilidad de aceptar la Hipótesis Nula
cuando es falsa, o cuando la Hipótesis Alternativa es verdadera. En este caso sería la
probabilidad de obtener dos o menos veces el 6 en los 10 lanzamientos del dado, cuando
el dado esta trucado de modo que el 6 tiene probabilidad triple que los demás
resultados.:
El número de veces que se obtendrá el número 6 al realizar 10 lanzamiento se distribuirá,
ahora, como una variable binomial de 10 intentos y probabilidad de éxito 3 / 8.

P (B (10 ; 3 / 8) ≤ 2 ) = 21,10%

6.1.3. CUESTIONES
¿qué se debería hacer para reducir el error tipo I?
TEMA 6: TEST DE HIPOTESIS 5
¿qué se debería hacer para reducir el error tipo II?

¿qué se debería hacer para reducir ambos errores?

6.1.4. DEFINICIONES
Vamos a efectuar algunas aclaraciones sobre el diseño del test anterior.

Definición 6.1.4-2 :: Tamaño de la muestra

Es número de unidades que integra la muestra o el número de veces que se repite el


experimento.
En el ejemplo anterior se ha fijado arbitrariamente en 10 lanzamientos, Si en el test
anterior quisiésemos reducir los errores obtenidos, deberíamos aumentar el número de
lanzamientos que vamos a observar. De este modo “conoceremos” mejor el dado y se
reducirá la probabilidad de tomar una decisión equivocada

Definición 6.1.4-1 :: Región de Aceptación / Región Crítica

es el conjunto de valores del estadístico de prueba para los que aceptaremos la


Hipótesis Nula
Si se amplía la Región de Aceptación (y se reduce consecuentemente la Región
Crítica) el Error I se reducirá y el Error II aumentará.
Si se reduce la Región de Aceptación (y se amplía en consecuencia la Región Crítica)
el Error II se reducirá y el Error I aumentará
Es decir, desplazando la frontera entre la Región Crítica y la Región de Aceptación
balancearemos el valor de ambos errores

Definición 6.1.4-3 : Estadístico de prueba:

Se trata de un parámetro de la muestra que está íntimamente relacionado con las


hipótesis que se van a contrastar. Se puede considerar como una variable aleatoria, ya
que su valor dependerá de la muestra y los elementos de la jçmuestra son escogido
aleatoriamente.
En el ejemplo hemos utilizado, como estadístico de prueba, el número de veces que
sale el 6. Las hipótesis hacen referencia en este caso a la frecuencia con la que cabe
esperar el resultado 6.
Como puede observarse en el desarrollo del ejemplo, para calcular la magnitud de los
errores es necesario conocer la distribución del estadístico de prueba.

Es conveniente representar ambas regiones para facilitar el planteamiento del problema.

R aceptación R. Crítica

0 1 2 3 4 5 6 7 8 9 10
6 TEMA 6: TEST DE HIPOTESIS

6.1.5. Diseño de un Test de Hipótesis.


En el ejemplo anterior hemos calculado los errores que se cometen al aplicar un test
preestablecido.
El objeto de este tema es diseñar test para contrastar hipótesis de modo que los errores
que se cometan sean tan pequeños como se quiera.
Los pasos a seguir para diseñar el Test de Hipótesis son:
• Establecer la Hipótesis Nula
• Establecer la Hipótesis Alternativa
• Fijar el Error I (Nivel de Significación)
• Fijar el Error II ( 1 – Potencia del Test)
• Escoger el Estadístico de Prueba, según la naturaleza de las Hipótesis
• Indicar la Forma de la Región de Aceptación y de la Región Crítica
• Determinar el Tamaño de la Muestra
• Determinar la Frontera entre la Región Crítica y la Región de Aceptación
• Aplicar el Test

6.2. TEST SOBRE LA MEDIA. VARIANCIA CONOCIDA.


6.2.1. Planteamiento del Problema.
Diseñar un Test de Hipótesis para contrastar las siguientes hipótesis:

• Hipótesis Nula, H 0 = { m = 50}

• Hipótesis Alternativa, H 1 = { m = 45}

En una población normal, con desviación tipo conocida e igual a 4


Admitiendo un riesgo de equivocarnos dado por:
• Error I del 10%
• Error II del 15%
Hay que señalar que este test tiene un aspecto fundamentalmente docente, ya que en la
práctica será difícil encontrar un caso en el que la media de la población sea desconocida
y la variancia sea conocida. Pero esta simplificación nos permitirá introducirnos en el
funcionamiento de los test de hipótesis.

6.2.2. Estadístico de Prueba.


El Estadístico de Prueba que se debe escoger es la Media de la Muestra.

 σ 
La distribución de la media de la muestra (media muestral) es: x = N  m ;  . Donde:
 n
• m es la media de la población (se tomará el valor indicado en la hipótesis que se
suponga verdadera).
• σ es la desviación tipo de la población, que en este caso es conocida
• n es el tamaño de la muestra, que se determinará posteriormente.
TEMA 6: TEST DE HIPOTESIS 7

6.2.3. Región de Aceptación y Región Crítica.


Una vez definido el estadístico de prueba, debemos establecer cual es la forma de la
Región Crítica y de la Región de Aceptación. Para ello representaremos todos los valores
posibles del Estadístico de Prueba, en este caso x . Y señalaremos los valores que
hacen referencia a las hipótesis:

45 50
x
R. CRITICA R. ACEPTACION

La Región de Aceptación serán todos los valores del estadístico de prueba más próximos
al valor de la media poblacional que indica la Hipótesis Nula ( H 0 = { m = 50} ). Y la
Región Crítica serán todos los valores más próximos al valor de la media poblacional que
indica la Hipótesis alternativa ( H 1 = { m = 45} ).

Recordar que la Región de Aceptación es el conjunto de valores del Estadístico de


Prueba para los que aceptaremos la Hipótesis Nula, Y la Región Crítica son todos los
valores del Estadístico de Prueba para los que rechazaremos la Hipótesis Nula y
aceptaremos la Hipótesis alternativa.
Estableceremos la posición del punto K que separa ambas regiones:

45 K 50
x
R. CRITICA R. ACEPTACION

El valor concreto de K se determinará luego


Y finalmente formalizaremos las condiciones de Aceptación y Rechazo en función de k .

6.2.4. Cálculos.
El Error I será: P (rechazar H 0 cuandoH 0 es cierta ) = P ( x < K / m = 50) =

Teniendo en cuenta la distribución del Estadístico de Prueba x , cuando es cierta la


Hipótesis nula ( m = 50) , se tendrá:

 
  4    k − 50 
= P N  50 ;  < K  = P z <  = 10%
  n    4 
 n 

buscando en las tablas de la Normal Tipificada podemos encontrar el Valor Crítico que
corresponde a la probabilidad del 10%. Es –1,2816 ; por lo que se obtendrá la siguiente
ecuación:

K − 50 4
= −1,2816 ⇒ K − 50 = −1,2816
4 n
n

La otra ecuación la obtendremos al desarrollar el Error II:


8 TEMA 6: TEST DE HIPOTESIS

P(aceptar H 0 cuando H 0 es falsa ) = P(aceptar H 0 cuando H 1 es cierta ) =


= P( x > K / m = 45) =

Teniendo en cuenta la distribución del Estadístico de Prueba x , cuando es cierta la


Hipótesis Alternativa ( m = 45) , se tendrá:

 
  4    k − 45 
= P N  45 ;  > K  = P z >  = 15%
  n    4 
 n 

buscando en las tablas de la Normal Tipificada podemos encontrar el Valor Crítico que
corresponde a la probabilidad del 85% (1-15%). Es 1,0364 ; por lo que se obtendrá la
siguiente ecuación:

K − 45 4
= 1,0364 ⇒ K − 45 = 1,0364
4 n
n

Se resuelve el sistema, restando ambas ecuaciones se despeja n

4 2,3181 · 4
5 = 2,3184 ⇒ n= = 1,8547 ⇒ n = 3,4400
n 5

en cualquiera de las ecuaciones iniciales se despeja K:

4
K = 45 + 1,0364 = 47,2360
1,8547

6.2.5. Diseño del Test


• Tomar una muestra de 4 unidades. El valor obtenido de n se redondea al entero
inmediatamente superior, si no los errores cometidos serían mayores que los
indicados en el Planteamiento del Problema.
• Calcular la media de la muestra x , ya que este es el Estadístico de prueba.
• Si el valor de x es superior a 47,2360 tomaremos como cierta la Hipótesis Nula en la
que se considera que la media de la población es 50; en caso contrario tomaremos
como cierta la Hipótesis Alternativa y consideraremos que la media de la población es
45

6.2.6. Comentario Final


En el diseño del Test no pretendemos concluir si es cierta la Hipótesis Nula o si lo es la
Hipótesis Alternativa, lo que se pretende es indicar el procedimiento sistemático que hay
que seguir para, que posteriormente y una vez recogida la muestra, se pueda establecer
la Veracidad o falsedad de la Hipótesis Nula.

6.2.7. Ejemplos resueltos.


2.001 ENE IND Diseñar un test de hipótesis para contrastar la hipótesis nula de que
una población normal con desviación típica 6, tiene su media igual a 15, contra la
TEMA 6: TEST DE HIPOTESIS 9
hipótesis alternativa de que su media es superior a 17. Tomar como error tipo I el
10% y como error tipo II el 5%
Tomaremos com estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =
k − 15 k − 15
P( x > k / x = N (15 ; 6 ) = P( z > ) = 0,10 ⇒ = 1,2816
n 6 6
n n
Error tipo II =
k − 17 k − 17
P( x < k / x = N (17 ; 6 ) = P( z < ) = 0,05 ⇒ = −1,6449
n 6 6
n n

Resolviendo el sistema queda, n = 8,7792 ; k = 15,8759 ; n = 78


Diseño del Test:
• Tendremos que tomar una muestra de 78 unidades,
• Calcular la media de esas 78 unidades
• Si la media de esa muestra es inferior a 15,8759 aceptaremos la hipótesis de que la
media de la población es igual a 15; en caso contrario la rechazaremos y
aceptaremos la hipótesis alternativa.

2.005 JUN ADE Sean H 0 = {m = 40} H 1 = {m = 34} . Diseñar un test para


contrastar estas hipótesis en una población normal con error I del 10% y error II
del 5%. La desviación tipo de la población es 5,67 .

Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la


hipótesis nula si x > k .
Error tipo I =

 
  5, 67    k − 40  k − 40
P x < k / x = N  40 ;   = P z < )  = 0,05 ⇒ =
  n   5.67  5,67
 n  n
= -1,2816
Error tipo II =

 
P x > k / x = N (34 ; 5,67  = P z > k − 34  = 0,10 ⇒ k − 34 = 1,6449
  
 n  5,67  5,67
 n n

Resolviendo el sistema queda, k = 37,3724 ; n = 2,7655 ⇒ n = 8


Diseño del Test:
• Tendremos que tomar una muestra de 8 unidades,
• Calcular la media de la muestra
• Si la media de esa muestra es superior a 37,3724 aceptaremos la hipótesis de que la
media de la población es 40 ; en caso contrario consideraremos que la media de la
población es 34.
10 TEMA 6: TEST DE HIPOTESIS
1.998 ENE IND Sobre una población normal, cuya desviación típica es 3.4, se desea
verificar la hipótesis de que la “media de dicha población es igual o inferior a 25”.
Si se toma una muestra de 20 unidades, cual debe ser el punto que separa la
región crítica de la región de aceptación para que el error de tipo I sea de 0.05.
El error tipo I indica la probabilidad de rechazar la hipótesis nula cuando esta es cierta. La
[ [ ] [
región de rechazo será x, ∞ , y la región de aceptación será − ∞, x . Donde x se tiene
que determinar para que se satisfaga la condición indicada en el enunciado.
Si m es la media de la población, la media de la muestra se distribuirá según

N (m, 3.4 / 20 )
Si la hipótesis nula es cierta, la media de la población m = 25. Entonces, la probabilidad
de que la media de la muestra esté en la región crítica será:
x − 25
P ( N (25, 3.4 / 20 ) < x) = P( z < ) = 0.05
3.4 / 20
Consultando las tablas, para una probabilidad de 0.05 se obtiene una abscisa de –1.645 .
x − 25 3.4
= 0.1645 ⇒ x = 25 + 1.645 = 26.25
3.4 / 20 20

6.3. TEST SOBRE LA MEDIA. VARIANCIA DESCONOCIDA.


6.3.1. Planteamiento del problema.
Este es el caso real, ya que si la media de la población es desconocida (ya que
queremos contrastar diversas hipótesis sobre el valor de la media de la población), la
variancia de la población será también desconocida. Veamos como interviene en el
ejemplo siguiente:

Diseñar un test de hipótesis para validar la hipótesis nula H 0 = {m = 25} , frente a la


hipótesis alternativa H 1 = {m = 30}; con un error tipo I del 5%, y un error tipo II del 10%.

6.3.2. Estadístico de Prueba y Región de Aceptación y Región Crítica.


En principio, tomaríamos como estadístico de prueba la media de la muestra, x . La
región crítica tendría la forma siguiente:

x
25 30

R. ACEPTACION R. CRITICA

Como la variancia de la población es desconocida , σ , la media de la muestra no


2

seguirá una distribución normal como sucedía en el apartado anterior.


TEMA 6: TEST DE HIPOTESIS 11
x−m
En este caso se cumple: = t n −1 ; donde s es la cuasi desviación tipo de la
s n
muestra y t n −1 es una variable t de Studen de n-1 grados de libertad.

Por lo que las condiciones de Error serían:

x−m k −m   k − 25 
Error I = P    = 0,05
 s n > s n / m = 25  = P t n −1 > s n 
   

x−m k −m   
Error II = P < / m = 30  = P t n −1 < k − 30  = 0,10
s n s n   s n 
   

Por lo que en la muestra utilizada para contrastar las hipótesis se tendrá que calcular
también s .

Dado que la distribución de una t de Studen, y también sus valores críticos, dependen
de los grados de libertad, y estos a su vez del tamaño de la muestra, no es posible
resolver directamente el sistema de ecuaciones que se deriva de desarrollar las
condiciones de los errores.

6.3.3. Muestra Previa.


Para poder contrastar este test debemos partir de una muestra inicial, de la que
tendremos una estimación inicial de la media y de la desviación tipo.

Supongamos que la muestra inicial es de 10 unidades, y en ella los valores muestrales


son: x = 26,23 y s = 1,40 .

6.3.4. Suficiencia de la muestra previa.


El primer paso será comprobar si con la información de la muestra previa se pueden
contrastar ambas hipótesis con errores menores o iguales a los admisibles en este caso
(5% y 10%).

Como la muestra es de 10 unidades, la variable t tendrá 9 grados de libertad.

 k − 25 
El valor crítico de una t que verifica la condición P t n −1 >  = 0,05 es
 1,40 10 

2,2622

Como el tamaño de la muestra ya está fijado, el error tipo I tendrá que ser igual o menor
k − 25
(nunca mayor) que el 5%, por lo que ≥ 2,2622
1,40 10

 k − 30 
El valor de una t que verifica la condición P t n −1 <  = 0,10 es -1,8331
 1,40 10 

12 TEMA 6: TEST DE HIPOTESIS
Como el tamaño de la muestra ya está fijado, el error tipo II tendrá que ser igual o menor
k − 30
(nunca mayor) que el 10%, por lo que ≤ −1,8331
1,40 10

Con esto se obtiene un sistema con dos inecuaciones y una sola incógnita: k

1,40
k ≥ 25 + · 2,2622 = 26,001 ; y k ≤ 30 −
1,40
· 1,8331 = 29,1884
10 10

Como si hay valores de k que satisfacen simultáneamente ambas condiciones


k ≥ 26,001 y k ≤ 29,1884 concluimos que una muestra de 10 unidades es suficiente
para contratar esas hipótesis. El valor k se calculará como promedio de los dos valores
26,001 + 29,1884
anteriores: k = = 27,5947 .
2

Como x = 26,23 < 27,5947 se acepta la Hipótesis Nula.

6.3.5. Cálculos.
Si el tamaño de la muestra no fuese suficiente, para determinar cual es el tamaño de la
muestra debemos tantear con un valor superior a 10;

tamaño
muestra k ≥ 25 + 1,25 · t n , 0.05 k ≤ 30 - 1,25 · t n ,010
10 25 + 1,25 · 2,2622 = 27,8278 30 - 1,25 · -1,8331 = 27,7086
11 25 + 1,25 · 2,2281 = 27,7851 30 - 1,25 · -1,8125 = 27,7344
12 25 + 1,25 · 2,2010 = 27,7513 30 - 1,25 · -1,7959 = 27,7551
13 25 + 1,25 · 2,1788 = 27,7235 30 - 1,25 · -1,7823 = 27,7721
14 25 + 1,25 · 2,1604 = 27,7005 30 - 1,25 · -1,7709 = 27,7864
15 25 + 1,25 · 2,1448 = 27,6810 30 - 1,25 · -1,7613 = 27,7984
El primer valor que cumple las condiciones la muestra de 13 unidades.

6.3.6. Diseño del Test.

Pero hay que observar que la desviación tipo de la muestra puede varias, así que si las
desv tipo es mayor es bnecesario comprabar que la muestra de tamaño 13 sigue siendo
válida.

6.3.7. Ejemplos resueltos.

2.005 ENE ADE A partir de los a muestra anterior, indicar justificadamente si es


posible contrastar las siguientes hipótesis sobre la población A: H0 = { “m = 9” } ;
H1 = { “m = 10” } , con errores tipo I y tipo II del 10%.
9,4 7,44 10,49 12,55 12,4 13,47 5,63 9,53 12,19 7,83
8,62 6,62 6,31 8,04 8,45 5,76 8,86 9,19 10,27 9,27
TEMA 6: TEST DE HIPOTESIS 13
El estadístico de prueba será la media de la muestra, x , pero teniendo en cuenta que (x-
m)/s = t
Si la media de la muestra es inferior a k, aceptaremos la hipótesis nula
Error I = P ( x > k / m = 9 ) = P ( ( x - 9 ) / (s / raiz (n) ) > ( k – 9 ) / (s / raiz (n) ) ) =
= P ( t > ( K – 9 ) / (s / raiz (n) ) ) <= 0,10
Error II = P ( x < k / m = 10 ) = P ( ( x - 10 ) / (s / raiz (n) ) < ( k – 10 ) / (s / raiz (n) ) ) =
= P ( t < ( K – 10 ) / (s / raiz (n) ) ) <= 0,10
En la muestra de 20 unidades, s = 2,2755 ; raiz (20) = 4,4721 ; s / riz(n) = 0,5088
( K – 9 ) / 0,5088 >= 1,3277 -> K >= 1,3277 * 0,5088 + 9 = 9,6756
( K – 10 ) / 0,5088 <= -1,3277 -> K <= -1,3277 * 0,5088 + 10 = 9,3244
Como no hay ningún valor de K que satisfaga ambas condiciones se concluye que no se
pueden contrastar esas hipótesis a partir de la muestra anterior.

2.004 ENE 10.- Indicar esquemáticamente el procedimiento para diseñar un test


para contrastarlas hipótesis H 0 = {" m = 215"} y H 1 = {" m = 212"} con un error
tipo I del 4% y un error tipo II del 12%, en una población cuya varianza no se
conoce.

a) tomar una muestra previa de un tamaño arbitrario, n1 , pero no demasiado grande. En


esta muestra tendremos una estimación previa de la desviación tipo de la población.
b) Verificaremos si, para ese tamaño y esa desviación tipo estimada, las hipótesis se
pueden contrastar con los errores que se indican.
c) Si la hipótesis se pueden contrastar satisfaciendo las condiciones entonces
calcularemos el valor de k y contrastaremos el test.
d) Si las hipótesis no se pueden contrastar, entonces calcularemos el tamaño de la
muestra teniendo en cuenta la estimación previa de la desviación tipo. Seguiremos el
procedimiento desde el punto a).

En una población normal se toma una muestra de 40 unidades, se obtiene:


x = 7,14 y s = 0,6 ; se pide contrastar, si es posible, las hipótesis H 0 = {m = 7,1}
frente a H 1 = {m = 7,2} , con error tipo I del 5% y error tipo II del 10%

6.4. TEST SOBRE LA DIFERENCIA DE MEDIAS.


6.4.1. Estadístico de Prueba cuando se conocen las variancias de las
poblaciones.
Tenemos dos poblaciones que se distribuyen normalmente. De cada una de las
poblaciones tomamos una muestra de tamaños n1 y n 2 .

Si las desviaciones tipo de las poblaciones son conocidas, σ 1 y σ 2 , se procede como


en el caso anterior, teniendo en cuenta que el estadístico de prueba será la diferencia de
las medias muestrales: x1 − x 2 .
14 TEMA 6: TEST DE HIPOTESIS

 σ 12 σ 22 
El estadístico de prueba se distribuirá: x1 − x = N  m1 − m2 ; +
 n1 n 2 

6.4.2. Ejemplos resueltos.


Diseñar un test para contrastar la hipótesis nula : H 0 = {m1 = m 2 }; frente a la hipótesis
alternativa: H 1 = {m1 − m2 > 10} . Sabiendo que las varianzas de ambas poblaciones
son σ 12 = 5,24 y σ 22 = 6,17 con error I = 10% y error II = 15%.

Tomaremos como estadístico de prueba la diferencia de las medias muestrales x1 − x 2

Las regiones de Aceptación y Rechazo serán:

x1 − x 2
0 10

R. ACEPTACION R. CRITICA

Iniciamos los cálculos a partir de las condiciones de los errores.

Error I =

 
 
  5,24 6,17   k
P ( x1 − x 2 > k / m1 = m2 ) = P N  0 ;
 +  > k = P z >
  = 10%
 n n    5,24 6,17 
     + 
 n n 
Error II =

  5,24 6,17  
P ( x1 − x 2 < k / m1 − m2 = 10) = P N 10 ; +  > k =

 n n  
  
 
 
 k − 10  = 15%
P z>
 5,24 6,17 
 + 
 n n 

Con lo que se plantea el sistema de ecuaciones:

k k − 10
= 1,2816 y = −1,0364
11,41 11,41
n n

Despejando se obtiene: n = 2,6448 n = 7 y k = 5,5259

Con lo que el diseño del test sería:


TEMA 6: TEST DE HIPOTESIS 15
1) tomar una muestra de 7 unidades de cada población

2) calcular la diferencia de las medias de ambas muestras

3) si la diferencia anterior es menor que 5,5259 aceptar la hipótesis de que ambas


medias poblacionales son iguales; y si, por el contrario, la diferencia de las medias
muestrales es superior a 5,5259, aceptaremos la hipótesis alternativa de que las medias
poblacionales difieren más de 10 unidades.

6.4.3. Estadístico de Prueba cuando NO se conocen las variancias de


las poblaciones.
Tenemos dos poblaciones que se distribuyen normalmente. De cada una de las
poblaciones tomamos una muestra de tamaño n . Sean xi y xi ' la observación i de
cada una de las dos muestras. Para cada par de datos calculemos d i = xi − x 'i para
cada par de datos (se denominan observaciones pareadas) y seguidamente d y sd .

d − (m1 − m2)
El estadístico de prueba será: = t n −1
sd
n

El test se diseña igual que el que sirve para contrastar hipótesis sobre la media con
variancia poblacional desconocida.

Si las muestras de las dos poblaciones no tienen el mismo tamaño entonces:

s12 (n1 − 1) + s 22 (n2 − 1) ( x1 − x 2 ) − (m1 − m2 )


s d2 = y entonces = t n1+ n 2− 2
n1 + n2 − 2 sd 1 − 1
n1 n2

6.4.4. Ejemplos resueltos.

6.5. TEST SOBRE PROPORCIONES.


6.5.1. Estadístico de Prueba.
 p (1 − p) 
La proporción de la muestra, p se distribuye según N  p ;  por lo que es
 n 
 
un estimador insesgado de la proporción de la población, p , y lo utilizaremos como
estadístico de prueba para contrastar hipótesis sobre la proporción de la población.

6.5.2. Ejemplo.
Diseñar un test para contrastar la hipótesis H 0 = {p = 0,25} frente a la hipótesis
alternativa H 1 = {p = 0,20} con un nivel de significación del 5% y una potencia del 90%
16 TEMA 6: TEST DE HIPOTESIS

6.5.3. Región de Aceptación y Región Crítica.


La forma de la región crítica será:

p
0,20 0,25

R. CRITICA R. ACEPTACION

6.5.4. Cálculos.
Los cálculos los realizaremos a partir de las condiciones de los errores:

v   0,25· 0,75  
P( p < k / p = 25%) = P N  (0,25 ;  < k  = 0,05

Error I =  n 
   

v   0,20 · 0,80  
Error II = P ( p > k / p = 20% ) = P N  (0,20 ;  < k  = 0,10
  n  
   

Despejando se obtienen las ecuaciones:

0,25 · 0,75 0,20 · 0,80


k − 0,25 = −1,6449 y k − 0,20 = 1,2816
n n

Y resolviendo se tiene: n = 24.4981 ; n = 601 ; k = 22,09% ; n k = 132,78

6.5.5. Diseño del Test.


Se tomará una muestra de 601 unidades

Se contarán las que cumplen la propiedad N.

Si N es igual o superior a 133 se acepta la hipótesis nula .

6.5.6. Ejemplos resueltos.


2.004 JUN ADE 2.- Diseñar un test de hipótesis para contrastar las siguientes
hipótesis sobre la proporción de personas que consumen cierto producto:
H 0 = {p < 10%} frente a H 1 = {p > 15%} , con un error tipo I del 7% y un error
tipo II del 8%.

El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la


muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p < k }.

Las ecuaciones para determinar n y k se obtendrán a partir de los errores.


TEMA 6: TEST DE HIPOTESIS 17
 
 
  0,10 · 0,90    k − 0 ,10 
Error I = P( p > k / p = 10% ) ≈ P N  0,10 ; < k = P z <
  = 0,07 ⇒
  n   0 ,10 · 0,90
     
 n 
 
 
  0,15 · 0,85    k − 0,15 
Error II = P ( p < k / p = 15% ) ≈ P N 0,15 ;
   
> k = P z >  = 0,08 ⇒
  n   0 ,15 · 0 ,85
     
 n 
k − 0,10 k − 0,15
Error I ⇒ = −1,4758 ; Error II ⇒ = 1,4051
0,10 · 0,90 0,15 · 0,85
n n
Despejando n y k se tiene : n = 18,8889 ; k = 0,1159 ; n = 357
Diseño del Test:
• Tomaremos una muestra de 357 elementos,
• Contaremos el número de unidades que cumplen la propiedad
• Si el número de elementos que cumplen la propiedad es inferior a 0,1159 · 357 =
41,37, entonces aceptamos la hipótesis nula.

6.6. TEST SOBRE LA VARIANCIA.


6.6.1. Estadístico de Prueba.
El estimador insesgado de la variancia poblacional es la cuasivariancia de la muestra.

La cuasivariancia de la muestra se distribuye según una variable χ2, más


σ 2
concretamente como: s =
2
χ n2−1 , por lo que la cuasivariancia de la muestra se
n −1
tomará como estadístico de prueba.

6.6.2. Ejemplo.
{
Diseñar un test de hipótesis para contrastar la hipótesis nula H 0 = s = 2,1 frente a la
2
}
{ }
hipótesis alternativa H 1 = s = 3,9 con un error I del 10% y un error II del 20%. Se
2

parte de una muestra previa de 15 unidades en la que s = 2,9 .


2

La muestra previa es necesaria ya que la distribución que sigue el estadístico de prueba,


χ 2 , depende del tamaño de la muestra.
18 TEMA 6: TEST DE HIPOTESIS

6.6.3. Región de Aceptación y Región Crítica.

s2
2,1 3,9

R. ACEPTACION R. CRITICA

6.6.4. Cálculos.
Como siempre partiremos de las condiciones de los errores.

Error I = ( )

P s 2 > k / σ 2 = 2,1 = P χ n2−1
2,1
n −1

> k  ≤ 10%
 

Error II = ( )

P s 2 < k / σ 2 = 3,9 = P χ n2−1
3,9
n −1

< k  ≤ 20%
 

Como primer paso comprobaremos si la muestra previa, en este caso de 15 unidades, es


suficiente para contrastar ambas hipótesis, es decir, si podemos encontrar algún valor de
k que satisfaga las ecuaciones:

 2,1   14 k  14 k
P χ 142 > k  ≤ 10% ⇒ P χ 142 >  < 10% ⇒ ≥ 21,0641 ⇒
 14   2,1  2,1
(1)
21,0641· 2,1
k≥ = 3,1596
14

 3,9   14 k  14 k
P χ 142 < k  ≤ 20% ⇒ P χ 142 <  ≤ 20% ⇒ ≤ 9,4673 ⇒
 14   3,9  3,9
(2)
9,4673 · 3,9
k≤ = 2,6373
14

Como no hay ningún valor de k que satisfaga simultáneamente las desigualdades (1) y
(2), se concluye que la muestra previa de 15 unidades no es suficiente para contrastar las
hipótesis. Se requiere una muestra mayor.

Para estimar el tamaño de la muestra necesaria construiremos la tabla:

n χ n2−1;10% k≥ χ n2−1;1− 20% k≤


16 22,3071 3,1230 10,3070 2,6798
17 23,5418 3,0899 11,1521 2,7183
18 24,7690 3,0597 12,0023 2,7535
19 25,9894 3,0321 12,8570 2,7857
20 27,2036 3,0067 13,7158 2,8153
21 28,4120 2,9833 14,5784 2,8428
TEMA 6: TEST DE HIPOTESIS 19
22 29,6151 2,9615 15,4446 2,8683
23 30,8133 2,9413 16,3140 2,8920
24 32,0069 2,9224 17,1865 2,9142
25 33,1962 2,9047 18,0618 2,9350
26 34,3816 2,8881 18,9398 2,9546
27 35,5632 2,8724 19,8202 2,9730
28 36,7412 2,8577 20,7030 2,9904
29 37,9159 2,8437 21,5880 3,0069
30 39,0875 2,8305 22,4751 3,0225

6.6.5. Diseño del Test.


1) En la tabla observamos que para el tamaño de la muestra n = 25 ya hay un valor de
k que cumple ambas condiciones: k ≥ 2,9047 y k ≤ 2,9350

Tendríamos que ampliar nuestra muestra anterior de 15 unidades en 10 unidades más


para tener una muestra de 25 unidades. Podemos contrastar las hipótesis, tomando
2,9047 + 2,9350
como valor de k= = 2,9199
2

2) Calcularemos la cuasivariancia de la muestra

3) Si la cuasivariancia de la muestra de 25 unidades es inferior a 2,9199 entonces


aceptaremos la hipótesis nula, en caso contrario la rechazaremos.

6.6.6. Ejemplos resueltos.

2.004 JUN ADE Indicar justificadamente si para contrastar la hipótesis


H 0 = {x = N (12,3 ; 0,7)} frente a la hipótesis alternativa
H 1 = {x = N (12,3 ; 1,0)} con un error I del 20% y un error II del 10%, es suficiente
una muestra de 21 unidades.

Se debe utilizar un test para contrastar las hipótesis sobre las variancias o las
desviaciones tipo de la población.
Error tipo I = P( rechazar H 0 cuando es cierta H 0 ) =
 2 k · 20 
P (s 2 > k / σ 2 = 0,7 2 ) = P χ 20 >  ≤ 0,20
 0,7 2 
Error tipo II = P( aceptar H 0 cuando es cierta H 1 ) =
 2 k · 20 
P (s 2 < k / σ 2 = 1,0 2 ) = P χ 20 <  ≤ 0,10
 1,0 2 
 0,7 2
k > 25,04 = 0,6134
 20
Luego k tendrá que verificar:  2 como hay valores de k que
k < 1,0
12,44 = 0,6221
 20
verifiquen estas condiciones simultáneamente, concluimos que una muestra de 21
unidades es suficiente para contrastar el test con los errores indicados. Se tomaría
0,6134 + 0,6221
k= = 0,6178
2
20 TEMA 6: TEST DE HIPOTESIS

2.003 ENE ADE Indicar justificadamente si una muestra de 20 unidades es


suficiente para contrastar la hipótesis H 0 = "σ { 2
}
= 2,3" frente a la hipótesis
{ }
H 1 = "σ = 2,1" con un error I del 10% y un error tipo II del 20%
2

Para contrastar ambas hipótesis utilizaríamos como estadístico de prueba la


2
cuasivarianza de la muestra, s .

{
La región de aceptación será: x ∈ R / x > k
+
}
Error I = P (rechazar H 0 cuando es cierta)

 2,3   2 k · 19 
= P s > k
2
/ s 2 = χ 192  = P χ 19 >  ≤ 0,10
 19   2,3 
27,2036 · 2,3
Entonces, se tendrá que cumplir que k> = 3,2931
19
Error II = P (aceptar H 0 cuando es falsa)

 2,1   2 k · 19 
= P s
2
<k / s 2 = χ 192  = P χ 19 <  ≤ 0,20
 19   2,1 
13,7158 · 2,1
Entonces, se tendrá que cumplir que k< = 1,5160
19
Como NO hay valores de k que satisfagan simultáneamente ambas condiciones, se
concluye que con una muestra de 20 unidades NO se pueden contrastar ambas hipótesis
con los errores indicados.

6.7. TEST SOBRE RELACION ENTRE VARIANCIAS.


6.7.1. Estadístico de Prueba.
Si se quiere establecer un test para contrastar hipótesis sobre la relación entre las
σ1
desviaciones tipo de dos poblaciones como por ejemplo:
σ2

 σ   σ 
H 0 = σ 1 = σ 2 ⇔ 1 = 1 frente a H 1 = σ 1 = 2 ·σ 2 ⇔ 1 = 2 con errores del
 σ2   σ2 
1% y del 5% respectivamente.

El estimador insesgado de la variancia poblacional, σ2, es la cuasivariancia de la


2
muestra, s , por lo que el estadístico de prueba que se debe utilizar es la relación entre
s2
las cuasivariancias muestrales: 12 .
s2
TEMA 6: TEST DE HIPOTESIS 21
El cociente de las cuasivariancias muestrales se distribuye proporcionalmente a una F de
s12 σ 12
Snedcor: = Fn1−1;n 2−1 2 , donde n1 y n 2 son los tamaños de las muestras
s 22 σ2
tomadas de las dos poblaciones.

6.7.2. Región de Aceptación y Región Crítica.

s12
1,0 2,0
s 22

R. ACEPTACION R. CRITICA

6.7.3. Cálculos.
Error I =

 s2 σ2  σ 2 σ2 
P 12 > k / 12 = 1 = P 12 Fn1−1;n 2−1 > k / 12 = 1 = P (Fn1−1;n 2−1 > k ) ≤ 1% (1)
 s2 σ2  σ2 σ2 

Error II =

 s2 σ2  σ 2 σ2   k
P 12 < k / 12 = 4  = P 12 Fn1−1;n 2−1 < k / 12 = 4  = P Fn1−1;n 2−1 <  ≤ 5% ⇔
 s2 σ2  σ2 σ2   4
(2)

 k
⇔ P Fn1−1;n 2−1 >  ≥ 95%
 4

Para simplificar el problema podemos considerar que las muestras de ambas poblaciones
tienen el mismo tamaño, es decir, n1 = n 2 .

Con lo que, de la ecuación (1), se tendría: k ≥ f n −1,n −1;1% y de la ecuación (2):


k
≤ f n −1,n −1;95% , y por las propiedades de la F de Snedecor se puede poner
4
4
k

1
y por lo tanto k ≤ .
4 f n −1,n −1;5% f n −1 , n − 1; 5 %

Para ello buscaremos en la tabla de la F el primer valor de n para el que existan valores
4
de k que verifiquen: f n −1,n −1;1% ≤ k ≤
f n −1,n −1;5%
22 TEMA 6: TEST DE HIPOTESIS

4
n f n −1,n −1;1% f n −1,n −1;5%
20 2,938 1,883
21 2,857 1,919
22 2,785 1,953
23 2,719 1,986
24 2,659 2,016
25 2,604 2,046
26 2,554 2,073
27 2,507 2,100
28 2,464 2,125
29 2,423 2,150
30 2,386 2,173
31 2,351 2,195
32 2,318 2,217
33 2,287 2,237
34 2,258 2,257
35 2,231 2,276
36 2,205 2,295
37 2,181 2,313
38 2,157 2,330
39 2,135 2,347
40 2,114 2,363
El primer valor de n para el que existen valores de k es n = 35 ; tomado como
2,231 + 2,276
k= = 2,254
2

6.7.4. Diseño del Test.


A partir de la tabla anterior se concluye:

1) tomar una muestra de 35 unidades en cada una de las dos poblaciones.

s12
2) calcular la relación entre las cuasivariancias muestrales:
s22

s12
3) si < 2,254 aceptaremos la hipótesis nula que afirma que las variancias de las dos
s 22
poblaciones son iguales, y en caso contrario aceptaremos la hipótesis alternativa que
σ1 σ 12
afirma que: =2 o su equivalente =4
σ2 σ 22

6.8. TEST SOBRE DISTRIBUCIONES


TEMA 6: TEST DE HIPOTESIS 23

6.8.1. Ajuste de distribuciones.


En esta lección hemos estudiado el contraste de hipótesis estadísticas sobre parámetros
Poblacionales como la media m, la varianza σ 2 , y la proporción p.
En este apartado estudiaremos el procedimiento a seguir para verificar si una variable de
cierta población se ajusta a una distribución teórica determinada.
La hipótesis que se desea validar será del tipo:
H 0 = {la población sigue una distribuye Normal}
Puede ser una distribución normal o cualquier otra distribución estadística.
El principio del test de hipótesis sobre
distribuciones es comparar la frecuencia comparación de frecuencias F observada
realmente obtenida en el estudio de la F esperada
muestra de la población con la frecuencia 140
esperada según la distribución teórica que 120

frecuencias
se considere. 100
80
Si las frecuencias observadas son similares 60
a las esperadas, entonces concluiremos 40
que la variable se distribuye según la 20
distribución teórica con la que se ha 0
comparado. 1 2 3 4 5 6 7 8 9 10
clase

Si por el contrario, las frecuencias Serie1


comparación de frecuencias
observadas son diferentes de las
Serie2
esperadas, entonces concluiremos que la
140
variable NO se distribuye según la 120
distribución teórica con la que la hemos
frecuencias

100
comparado. 80
60
40
20
Para medir la diferencia entre dos 0
distribuciones se utiliza el estadístico: 1 2 3 4 5 6 7 8 9 10
k
(o i − e i ) 2 clase

i =1 ei
Donde oi y ei son las frecuencias observadas en la muestra y las esperadas según la
distribución teórica, en los k intervalos en los que hemos agrupado las observaciones.
Si este estadístico es pequeño, indicará que las frecuencias observadas y esperadas son
similares en todos los intervalos estudiados, por lo que supondremos que la frecuencia
observada se comporta aproximadamente como la esperada.
Si el valor de este estadístico es grande, entonces habrá diferencias importantes entre
las frecuencias observadas y las esperadas en algún intervalo por lo menos; por lo que
concluiremos que las frecuencias observadas son diferentes de las esperadas.
La dificultad que se plantea ahora es determinar qué valores del estadístico
consideraremos grandes y cuales consideraremos pequeños. Es decir, para qué valores
del estadístico aceptaremos la hipótesis nula, y para que valores del estadístico
rechazaremos la hipótesis nula.
k
( o i − ei ) 2
El estadístico ∑
i =1 ei
se distribuye aproximadamente como una variable χ2
con k-1 grados de libertad, por lo que si α es el nivel de significación o Error Tipo I
(probabilidad de rechazar la hipótesis nula cuando es cierta), el valor crítico χ α nos
2

delimitará la región crítica. χ α2 es el valor crítico de una Chi cuadrado de k-1 grados de
libertad, que deja a su derecha una probabilidad α.
• Si el valor del estadístico es menor que χ α2 aceptaremos la hipótesis nula
24 TEMA 6: TEST DE HIPOTESIS

• Si el valor del estadístico es mayor que χ α2 rechazaremos la hipótesis nula

Se desea saber si un dado es legal (todas las caras del dado tienen la misma
probabilidad de salir, distribución uniforme de los resultados) con un nivel de
significación del 5%. Para ello se lanza un dado 120 veces, los resultados
obtenidos son:
Puntuación 1 2 3 4 5 6 Total
Frecuencia observada 18 21 22 18 24 17 120
Construiremos una tabla en la que podamos comparar la frecuencia observada al alanzar
el dado con la frecuencia esperada si se cumple la hipótesis nula, en este caso que “el
dado sea legal”.
Puntuación 1 2 3 4 5 6 Total
Frecuencia observada 18 21 22 18 24 17 120
Frecuencia esperada (*) 20 20 20 20 20 20 120
(*) ya que si el dado es legal cabe esperar todos los resultados con la misma frecuencia.
Utilizando el estadístico indicado para los 6 intervalos en los que comparamos la
frecuencia observada y la esperada:
6
(oi − ei ) 2 (18 − 20)2 (21 − 20)2 (22 − 20)2 (18 − 20 )2 (24 − 20)2

i =1 ei
=
20
+
20
+
20
+
20
+
20
+

+
(17 − 20)2 = 0,2 + 0,05 + 0,2 + 0,2 + 0,8 + 0,45 = 1,9
20
De otro lado, el valor de una variable χ 02, 05 y 5 grados de libertad (6 intervalos menos
uno) fija el valor crítico que es 11,070.
En este caso como el valor del estadístico (1,9) es menor que el valor crítico (11,070) se
acepta la Hipótesis Nula de que el dado es legal.
Si el valor del estadístico de prueba fuese superior a 11,070, se rechazaría la Hipótesis
Nula de que el dado es legal.

Repetimos el test anterior con otro dado. Los resultados obtenidos al lanzar el
dado se indican el la tabla siguien. ¿podremos considerar que este dado es legal
con un nivel de significación del 5%?:
Puntuación 1 2 3 4 5 6
Frecuencia observada 15 23 22 16 27 17

Atención: Las conclusiones que se deriven del análisis del valor del estadístico sólo
pueden ser válidas en el caso de que todas y cada una de las comparaciones que se
( o i − ei ) 2
realizan, sean significativas. Esto sólo se puede garantizar si las frecuencias
ei
esperadas, ei, de todos los intervalos sean mayores o iguales a 5.
En el caso que alguno de los intervalos que se están comparando tenga una frecuencia
esperada inferior a 5, se agrupará con un intervalo vecino. Realizar este agrupamiento
hasta que todos los intervalos finales tengan una frecuencia esperada superior a 5. El
número de grados de libertad se determinará a partir del número final de intervalos.

2.005 ENE ADE 11.- Indicar, con un nivel de significación del 5%, si los datos
siguientes se ajustan a una distribución de Poisson de parámetro 2,5
TEMA 6: TEST DE HIPOTESIS 25

4 4 2 2 1 2 3 3 2 2 2 4 5 2 2
2 0 5 3 3 2 2 3 2 2 0 2 4 3 2
3 0 4 5 4 2 2 0 6 3 1 0 4 1 4

Construiremos una tabla en la que podamos comparar la frecuencia que se indica en la


tabla (la frecuencia observada) la frecuencia esperada si se cumple la hipótesis nula, en
este caso que se ajuste a una distribución de Poisson de parámetro 2,5.

Valor 0 1 2 3 4 5 6 >6 total


frec observ 5 3 17 8 8 3 1 0 45
frec esperada 3,694 9,235 11,54 9,619 6,012 3,006 1,253 0,638
8 17 8 12
12,93 11,54 9,619 10,91

El valor del estadístico de prueba es: 4,84 ; el valor crítico de una chi de 3 grados de libertad y nivel
de significación del 5% es 7,8147, por lo que se acepta que los datos de la tabla se ajustan a una
distribución de Poisson de parámetro 2,5.

Atención: si a partir de los datos se tiene que estimar algún parámetro de la distribución que
queremos ajustar, el número de grados de libertad de la variable χ2 se reducirá en una unidad por
cada parámetro estimado. Veamos el siguiente ejemplo.

2.005 JUN ADE Indicar, con un nivel de significación del 5%, si los datos siguientes se ajustan
a una distribución de Poisson.
4 5 2 3 1 2 3 3 4 2 4 4 5 2 2
2 0 7 3 4 2 4 3 2 4 0 2 5 3 5
3 2 4 5 4 2 2 0 6 3 3 0 4 1 4

En este caso tendremos que estimar el parámetro de la distribución de Poisson que


mejor se ajusta a los datos observados. Puesto que el parámetro de la distribución de
Poisson es la media, calcularemos la media de los datos observados. En este caso
λ = 3 , luego ajustaremos los datos a una variable p(3) .
Ahora construiremos la tabla de frecuencias observadas y esperadas; agrupando los
valores cuya frecuencia esperada sea inferior a 5:

Valor 0 1 2 3 4 5 6 7 8 9 suma

Frec obser 4 2 12 9 11 5 1 1 0 0 45

Frec espe 2,24 6,721 10,08 10,08 7,561 4,537 2,268 0,972 0,365 0,171 45

Frec obser 6 12 9 11 7 45

Frec espe 8,962 10,08 10,08 7,561 8,313 45

Error 0,979 0,365 0,116 1,564 0,207 3,231

e
(ei − oi )2
El estadístico que evalúa el error es ∑
i =1 ei
= 3,231 ; que compararemos con el valor crítico

de una variable χ2 de 5 – 1 – 1 = 3 grados de libertad, ya que el valor del parámetro de la variable


26 TEMA 6: TEST DE HIPOTESIS
de Poisson lo hemos tenido que estimar. Este valor es 7,815 que como es mayor que el estadístico
obtenido ( 3,231).se considera que los datos de la tabla se ajustan a una distribución de Poisson de
parámetro 3.

2.003 JUN ADE En la tabla siguiente se indica la duración en horas de cierto


componente. Se pide indicar si se ajusta a una distribución exponencial con nivel
de significación del 10%.
190 193 205 207 187 207 199 209 208 197 217 196 190 185 187 197 206 203 195 191
Determinaremos primero la duración media: 198,45. El cálculo de un parámetro en la
distribución muestral reduce en una unidad el número de grados de libertad.
Al ordenar los datos de menor a mayor
185 187 187 190 190 191 193 195 196 197 197 199 203 205 206 207 207 208 209 217
podemos agrupar los datos en los siguientes intervalos y compararlos con la frecuencia
esperada según una exponencial de media 198,45

intervalo < 190,5 190,5 - 197 - > 206,5 total


197 206,5
f.o. 5 5 5 5 20
f.e. 12,3417 0,2468 0,3464 7,0651 20
estadístico 4,3673 91,5532 62,5091 0,6036 159,0333

Como el valor crítico de una variable χ de 2 grados de libertad ( 4 – 1 – 1) es 4,6052 <


2

159,0333 concluimos que los datos de la tabla no proceden de una distribución


exponencial.

2.000 JUN ADE Indicar justificadamente si los datos de la tabla adjunta se ajustan
a una distribución uniforme U[ 0, 2 ] con un nivel de significación del 90%.
0,27 0,45 1,56 1,86 0,74 1,03 0,47 1,39 1,10 1,73
0,75 1,53 0,59 0,65 1,45 0,17 1,73 0,94 0,14 0,38
Dividiremos el intervalo en el que está definida la variable en 4 partes (la frecuencia
esperada en cada una de ellas debe ser igual o superior a 5)
Intervalo Frecuencia Frecuencia
Observada esperada
[ 0 ; 0,5 ] 6 5
] 0,5 ; 1 ] 5 5
] 1 ; 1,5 ] 4 5
] 1,5 ; 2 ] 5 5
4
(oi − ei )2
El estadístico para contrastar esta hipótesis es: ∑
i =1 ei
= 0,2 + 0 + 0,2 + 0 = 0,4

Que se debe comparar con el valor de una variable χ 02,9 y 3 grados de libertad, que es
:1,0052
TEMA 6: TEST DE HIPOTESIS 27

Como el valor del estadístico ( 0,4 ) es menor que el valor de la χ 02,9 se acepta que la
distribución de los datos de la tabla se comporta como una variable uniforme [ 0 ; 2 ] con
un nivel de significación del 90%

6.8.2. Independencia de Distribuciones.


El procedimiento para evaluar la independencia de dos distribuciones se basa en el
descrito en el apartado anterior.
Se comparar las frecuencias observadas y las calculadas suponiendo que ambas
distribuciones fuesen independientes.

1.997 ENE IND En la tabla adjunta se recogen los datos de una encuesta sobre las
preferencias de dos actividades de ocio. Si les gusta o no viajar, y si gusta o no
hacer deporte. ¿Puede suponerse que ambas preferencias son independientes con
un nivel de significación del 5%?. Indicar el valor del estadístico que nos permite
contestar a la pregunta anterior.
viajar SI viajar NO
deporte SI 57 80
deporte NO 40 65

Completaremos la tabla con las frecuencias marginales


frec observadas viajar SI viajar NO total
deporte SI 57 80 137
deporte NO 40 65 105
total 97 145 242
Si ambas preferencias fuesen independientes, se tendría que las frecuencias esperadas
serían:
frec esperadas viajar SI viajar NO total
deporte SI 54.91 82.09 137
deporte NO 42.08 62.91 105
total 97 145 242
k
(oi − ei ) 2
El estadístico a evaluar es : ∑
i =1 ei
, en nuestro caso:

(57-54.91) /54.91 + (80-82.09)2/82.09 + (40-42.08)2/42.08 + ( 65-62.91)2/62.91 =


2

= 0.07955 + 0.05321 + 0.10281 + 0.06943 = 0.30500


Para aceptar la hipótesis de independencia se tendría que comparar con el valor de una
variable χ2 de un grado de libertad y probabilidad a su derecha del 5% ( 3.841 )

6.8.3. Homogeneidad de Distribuciones.


Se desea conocer, con un nivel de significación del 5%, si la productividad se distribuye
del mismo modo (homogéneamente) en varias factorías. En la tabla se indican los días
que cada factoría ha alcanzado la producción indicada:
28 TEMA 6: TEST DE HIPOTESIS

Producción Factoría A Factoría B Factoría C Total


1.000 – 1.100 50 66 40 156
900 – 1.000 76 78 65 219
800 - 900 12 15 22 49
Total 138 159 127 424
Ahora construiremos la tabla de las frecuencias esperadas si las distribuciones fuesen
homogéneas.

Producción Factoría A Factoría B Factoría C Total


1.000 – 1.100 50,77 58,50 46,73 156,00
900 – 1.000 71,28 82,13 65,60 219,00
800 - 900 15,95 18,38 14,68 49,00
Total 138,00 159,00 127,00 424,00
Ahora calcularemos las diferencias entre las frecuencias observadas (las de la primera
( o i − ei ) 2
tabla) y las esperadas (la segunda tabla) .
ei

Producción Factoría A Factoría B Factoría C Total


1.000 – 1.100 0,01 0,96 0,97
900 – 1.000 0,31 0,21 0,01
800 - 900 0,98 0,62 3,65
Total 7,72
El número de grados de libertad será (3 – 1) x ( 3 – 1) = 4; ya que son tres filas y tres
columnas de datos y se obliga a que todas las filas y todas las columnas de la tabla de
frecuencias esperadas sumen lo mismo que en la tabla de frecuencias observadas.

Compararemos 7,72 con el valor crítico de una χ de 4 grados de libertad y nivel de


2

probabilidad del 5% que es 9,488. Por lo que se considerará que las productividades son
homogéneas en las tres factorías con un nivel de significación del 5%.

6.9. INTRODUCCION AL ANALISIS DE LA VARIANCIA


6.9.1. Planteamiento del Problema.
En un apartado anterior hemos diseñado test para evaluar la diferencia de medias de dos
poblaciones diferentes. Ahora vamos a aplicar el mismo procedimiento que se utiliza en
Análisis de la Variancia para diseñar un test que nos permita comparar medias de dos
poblaciones diferentes.

La hipótesis nula es: H 0 = {m1 = m 2 } y la hipótesis alternativa es H 0 = {m1 ≠ m2 },


para contrastarlas se toma una muestra de tamaño n de cada una de las dos
poblaciones, tal y como se indica en la tabla siguiente:

Población 1 Población 2 Total


TEMA 6: TEST DE HIPOTESIS 29

y11 y 21
y12 y 22
M M
y1n y2n
Total T1. T2. T..
Media y1. y 2. y..

m1 + m2
Si m = , cada una de las medias poblacionales se podría poner como:
2
mi = m + α i , verificándose que α 1 + α 2 = 0
Cada observación se puede interpretar como: y ij = mi + ε ij = m + α i + ε ij

Las hipótesis iniciales se pueden expresar ahora en los siguientes términos:

H 0 = {α 1 = α 2 =} frente a H 1 = {α 1 ≠ 0 ≠ α 2 }
Estas hipótesis se contrastarán comparando dos estimaciones diferentes de la variancia
poblacional común σ 2 . Para ello descompondremos la variancia total en dos sumandos:
2

SST = ∑∑ ( y ij − y.. ) = n∑ ( y i. − y.. ) + ∑∑ ( y ij − y i. ) = SSA + SSE


2 n 2 2 n
2 2

i =1 j =1 i =1 i =1 j =1

Donde SST es la suma total de las diferencias al cuadrado, SSA es la suma de las
diferencias al cuadrado para cada población, y SSE es la suma de los cuadrados de las
diferencias en una población o la suma de los cuadrados de los errores.
Si el experimento se repite varias veces, los valores obtenidos de SST , SSA y SSE
serían diferentes cada vez, por lo que pueden ser consideradas como variables
aleatorias.
2 2
Se tiene: E ( SSA) = 2σ
2
− σ 2 + n∑ α i2 = σ 2 + n∑ α i2
i =1 i =1

Si la hipótesis nula es verdadera ( α 1 = α 2 = 0 ), entonces SSA es un estimador


insesgado de σ2, basado en 2-1 grados de libertad. Si la hipótesis alternativa es
 2

verdadera, entonces SSA estimará a σ2 más un término adicional  n

∑α
i =1
i
2
 . Este

término adicional mide las desviaciones debidas a diferencias entre las medias de
ambas poblaciones.
SSE
Otra estimación independiente de σ 2 basada en n(2 − 1) grados de libertad es ;
2(n − 1)
esta estimación es insesgada independientemente de la veracidad o falsedad de la
hipótesis nula.
SSA
Cuando H 0 es verdadera, entonces la relación 2 − 1 = f se distribuirá como
SSE
k (n − 1)
una F de Snedecor con 2-1=1 y k ( n − 1) grados de libertad.
30 TEMA 6: TEST DE HIPOTESIS

Si la hipótesis nula es falsa el numerador sobreestima σ 2 se tiene una región crítica con
una sola cola en la zona derecha de la distribución.

La hipótesis nula se rechazará con un nivel de significación a si f > f a ;1; 2 ( n −1) , donde
f a ;1; 2 ( n −1) es el valor crítico de una distribución F.

(
Otro enfoque sería calcular la probabilidad P F1; 2 ( n −1) > f = a)

6.9.2. Ejemplo con Excel.


Se desea comparar las medias de dos poblaciones. Se toma una muestra de 20
unidades de cada población, tal y como se recoge en la tabla siguiente:

En el Menú Herramientas escogeremos la opción Análisis de Datos, y en el cuadro de


diálogo que se abre seleccionaremos Análisis de la Variancia de un Factor, indicando el
rango de los datos y el nivel de significación Alfa:
TEMA 6: TEST DE HIPOTESIS 31
En una Hoja Nueva se obtiene la siguiente información:

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
214,93676
Población 1 21 1 10,2350839 1,49523551
204,47234
Población 2 21 7 9,73677842 1,03740905

ANÁLISIS DE VARIANZA
Promedio
Origen de Suma de Grados de de Probabilida Valor crítico
variaciones cuadrados libertad cuadrados F d para F
2,6072372
Entre grupos 7 1 2,60723727 2,05890499 0,15909205 4,08474565
Dentro de los 50,652891
grupos 2 40 1,26632228

53,260128
Total 5 41

Los resultados se tiene que interpretar de la forma siguiente:


SSA = 2,60723727
SSE =50,6528912
Probabilidad, indica la probabilidad, que siendo cierta la igualdad de las medias, se
obtengan estas o mayores diferencias es de 15,90%
Valor crítico para F, que para rechazar la hipótesis nula con un nivel de significación
(alfa) del 5% se requiere que la relación entre el promedio de los cuadrados sea superior
a 4,0847.

6.10. CUESTIONES Y EJERCICIOS PROPUESTOS


6.01 Diseñar un Test de Hipótesis para contrastar la Hipótesis Nula H0 = {x = N(60,5)}
contra la Hipótesis Alternativa H1 = {x = N(57,5)}. Se desea cometer un error tipo I del
10% y un error del tipo II del 5%n ( Sol.: k = 58,6862 ; n = 24 )
6.02 Definir un criterio para verificar las cualidades de la mercancía adquirida por un
almacén. De los estudios realizados se deduce que la magnitud más representativa del
producto debe ser 58.5 mm. Así mismo, se ha observado que esta magnitud se distribuye
normalmente en cada lote con desviación típica de 0.25 mm . El acuerdo negociado con
el proveedor expresa:
El comprador aceptará en el 12% de los casos lotes cuyo promedio sea igual o superior a
59 mm.
El proveedor admitirá devoluciones cuyo promedio sea inferior o igual a 58.5 en un 5% de
los casos. ( Sol.: n = 1.884 ; k = 58.74 )
6.03 Una empresa fabrica dos tipos de ejes, A y B. La resistencia a la rotura del tipo A se
distribuye como N(3700, 300) y la de B según N(4200, 300). Se desconoce si un lote está
32 TEMA 6: TEST DE HIPOTESIS
integrado por piezas del tipo A o del tipo B. Diseñar un test para contrastar la hipótesis H0
= {media = 3700 } frente a la hipótesis H1 = { media = 4200 } con errores de primera y
segunda especie del 5% y del 10% respectivamente.
6.04 Mediante un test de hipótesis se desea contrastar la hipótesis nula H0= { la variable
se distribuye según N(14, 0.5) } contra la hipótesis alternativa H1 = { la variable se
distribuye como N(16,0.5)}. Si se toma una muestra de 10 unidades,
a) cual debe ser la región de aceptación de la hipótesis H0 de modo que la probabilidad
de cometer un error tipo II sea del 10%.
b) Cuál sería el Error Tipo I
c) Cual sería la región de aceptación para que los errores Tipo I y Tipo II fuesen iguales.
6.05 El número de llamadas telefónicas recibidas en una central durante cierto periodo
de tiempo, se indican en la tabla siguiente. Se pide indicar si es posible ajustar una
distribución de poisson con un nivel de significación del 10%.
Llamadas 0 1 2 3 4 5 6 7 8
Frecuen. 1.89 7.54 14.81 19.96 19.84 15.9 10.75 6.12 3.19
6.06 Estudiar si la distribución de frecuencias indicada en la tabla se ajusta a una
distribución N( 3.5 , 0.7 ) con un nivel de significación del 10%..

Límites de clase Frecuencias Frecuencias


observadas Esperadas
1.45-1.95 2 0.5
1.95-2.45 1 2.1
2.45-2.95 4 5.9
2.95-3.45 15 10.3
3.45-3.95 10 10.7
3.95-4.45 5 7.0
4.45-4.95 3 3.5
Nota: obsérvese que hay intervalos en los que la frecuencia esperada es menor que 5.

6.07 Diseñar un test para contrastar las hipótesis siguientes sobre la proporción de una
población H 0 = { p = 20%} H1 = { p > 20%} con un Error Tipo I del 10%.

6.08 Diseñar un test para contrastar las hipótesis siguientes sobre la proporción de una
población H 0 = { p = 20%} H1 = { p = 30%} con un Error Tipo I del 10% y un Eroro
Tipo II del 15%.
6.09 Se realiza una prueba sobre las preferencias de los consumidores sobre una marca
de refrescos. Se realiza una encuesta a 250 personas, de las que 83 revelan su
preferencia por dicho refresco. Determinar la amplitud del intervalo de confianza, con un
nivel de confianza del 95%, para estimar la proporción de la población que prefiere ese
refresco. (Ene 97)
6.10 Las estaturas de un grupo de personas se indican en la tabla siguiente:
Estaturas frecuencias absolutas
1.51 - 1.55 1
1.56 - 1.60 3
1.61 - 1.65 10
1.66 - 1.70 29
1.71 - 1.75 43
1.76 - 1.80 36
TEMA 6: TEST DE HIPOTESIS 33
1.81 - 1.85 12
1.86 - 1.90 3
1.91 - 1.95 1
1.96 - 2.00 1

Indicar si estos datos se pueden ajustar a una distribución normal con un nivel de
significación del 10%.

6.11. EJERCICIOS DE EXAMENES


6.11.1. TEST DE HIPOTESIS SOBRE LA MEDIA. VARIANCIA
CONOCIDA
2.005 JUN 10.- Sean H 0 = {m = 40} H 1 = {m = 34} . Diseñar un test para
contrastar estas hipótesis en una población normal con error I del 10% y error II
del 5%. La desviación tipo de la población es 5,67 .

Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la


hipótesis nula si x > k .
Error tipo I =

 
  5, 67    k − 40  k − 40
P x < k / x = N  40 ;   = P z < )  = 0,05 ⇒ =
  n   5 . 67  5, 67
 n  n
-1,2816
Error tipo II =

 
 k − 34  k − 34
P x > k / x = N (34 ; 5,67 
 = P z > 5,67  = 0,10 ⇒ = 1,6449
 n   5,67
 n n

Resolviendo el sistema queda, k = 37,3724 ; n = 2,7655 ⇒ n = 8


Diseño del Test:
• Tendremos que tomar una muestra de 8 unidades,
• Calcula la media de esa muestra
• si la media de esa muestra es superior a 37,3724 aceptaremos la hipótesis de que la
media de la población es 40 ; en caso contrario consideraremos que la media de la
población es 34.

2.005 ENE IND En una población normal cuya variancia es 3,9, diseñar un test para
contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,0"} con un
error I del 10% y un error tipo II del 5%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =
34 TEMA 6: TEST DE HIPOTESIS

 
 
  3,9    k − 10,5  k − 10,5
P x < k / x = N 10,5 ; 
  = P z < ) = 0,10 ⇒ = −1,2816
  n   3,9  3,9
 
 n  n
Error tipo II =

 
 
 3,9   k − 10,0  k − 10,0
P x > k / x = N (10,0 ;  = P z > = 0,05 ⇒ = 1,6449
 n  3,9  3,9
 
 n n
Resolviendo el sistema queda, k = 10,281 ; n = 11,5585 ⇒ n = 134
Diseño del Test:
• Tendremos que tomar una muestra de 134 unidades,
• Calcular la media de esa muestra
• si la media de esa muestra es superior a 10,281 aceptaremos la hipótesis de que la
media de la población es 10,5 ; en caso contrario consideraremos que la media de la
población es 10,0.

2.003 ENE IND En una población normal cuya varianza es 2,14, diseñar un test para
contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,9"} con un
error I del 4,5% y un error tipo II del 8,5%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =

 
 
  2,14    k − 10,5  k − 10,5
P x > k / x = N 10,5 ; 
 =P z> ) = 0,045 ⇒ =
  n    2,14  2,14
 
 n  n
Error tipo II =

 
 
 2,14   k − 10,9  k − 10,9
P x < k / x = N (10,9 ; =P z< = 0,085 ⇒ =−
 n   2,14  2,14
 
 n n
Resolviendo el sistema queda,

k = 10,7219 ; n = 11.541 ⇒ n = 133,20 ⇒ n = 134


Diseño del Test:
• Tendremos que tomar una muestra de 134 unidades,
• Calcula r la media de la muestra
• si la media de esa muestra es inferior a 10,7219 aceptaremos la hipótesis de que la
media de la población es 10,5 ; en caso contrario consideraremos que la media de la
población es 10,9.
TEMA 6: TEST DE HIPOTESIS 35
2.002 JUN 7.- Diseñar un test para contrastar, en una población normal con
varianza 5, la hipótesis H 0 = {" m ≤ 12"} frente a la hipótesis alternativa
H 1 = {" m ≥ 12.5"} , con error tipo I del 10% y error tipo II del 15%.
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =
k − 12 k − 12
= P( x > k / x = N (12 ; 5 ) = P( z > ) = 0,10 ⇒ = 1,2816
n 5 5
n n
Error tipo II =
k − 12,5 k − 12,5
P( x < k / x = N (12,5 ; 5 ) = P( z < ) = 0,15 ⇒ = −1,0364
n 5 5
n n
Resolviendo el sistema queda,

k = 12,2764 ; n = 10,3664 ⇒ n = 107,46 ⇒ n = 108


Diseño del Test:
• Tendremos que tomar una muestra de 108 unidades,
• Calcular la media de la muestra
• si el promedio de esa muestra es inferior a 12,2764 aceptaremos la hipótesis de que
la población se distribuye según una N 12 ; ( 5 . )
2.002 ENE 10.- Diseñar un test para contrastar la hipótesis
H 0 = {" x = N (0.12 ; 0.02)"} frente a la hipótesis alternativa
H 1 = {" x = N (0.14 ; 0.02)"} , con error tipo I del 5% y error tipo II del 10%.
El estadístico que utilizaremos parta contrastar la hipótesis es la media muestral, x ; el
tamaño n de la muestra se determinará en el proceso siguiente ; y la forma de la región
crítica es {x ∈ R / x > k } . Las ecuaciones para determinar n y k se obtendrán a partir
de los errores.
Error I =

 
     k − 0,12 
= P(x > k / m = 0,12) = P N  0,12 ; 0, 02
 > k  = P z >  = 0,05 ⇒
  n   0,02 
 n
k − 0,12
⇒ = 1,6449
0,02
n
Error II =

 
     k − 0,14 
= P(x < k / m = 0,14) = P N  0,14 ; 0, 02
 < k  = P z <  = 0,10 ⇒
  n   0,02 
 n
k − 0,14
⇒ = −1,2816
0,02
n
36 TEMA 6: TEST DE HIPOTESIS

Despejando n y k se tiene : n = 2,9265 ; k = 0,1312 ; n = 8,5644 ⇒ n = 9


Diseño del Test
• tomaríamos una muestra de 9 elementos,
• calcularíamos su media, x ;
• si ésta es mayor que 0,1312, entonces rechazaremos la hipótesis nula.

2.000 ENE IND Diseñar un test para contrastar la hipótesis nula


H 0 = {m = 25} frente a la hipótesis alternativa H 1 = {m = 27.5} con un error tipo I
del 7%, y un error tipo II del 14%. Se considera que la población se distribuye
normalmente con desviación típica 7.2 .
El estadístico que se utilizará para contrastar las hipótesis será la media de la muestra
x . El tamaño de la muestra n y la frontera entre la región crítica y la región de
aceptación, k, se obtendrán a partir de los errores.
La región de aceptación será: { x / x < k } ; y la región crítica será: : { x / x > k }
El error tipo I es la probabilidad de rechazar la hipótesis nula, H 0 , cuando es cierta. Es

 7.2   k − 25 
decir: P ( x > k / m = 25) = P( N  25,  > k ) = P z > = 0.07
 
 n  7.2 / n 
Buscando en las tablas el valor crítico correspondiente a ese nivel de probabilidad, se
k − 25
tiene: = 1.4758
7.2 / n
El error tipo II es la probabilidad de aceptar la hipótesis nula, H 0 , cuando es falsa. Es
 7 .2  k − 27.5
decir: P ( x < k / m = 27.5) = P( N  27.5,  < k ) = P( z < ) = 0.14
 n 7.2 / n
Buscando en las tablas el valor crítico correspondiente a ese nivel de probabilidad, se
k − 27.5
tiene: = −1.0803
7.2 / n

 7.2
 k − 25 = 1.4758
Con lo que queda el sistema 
n
7.2
k − 27.5 = −1.0803
 n
7.2
Restando ambas ecuaciones, se tiene: 2.5 = 2.5561 , con lo que
n
7.2 2.5
= = 0,9781
n 2.5561

Con lo que k será: k = 25 + 1.4758 · 0.9781 = 26,4435


TEMA 6: TEST DE HIPOTESIS 37
2
 7.2 
n será: n=  = 54,1874 ; redondeando al entero inmediatamente
 0.9781 
superior, el tamaño de la muestra será 54 unidades. Se aceptará la hipótesis nula si la
media de la muestra, de 55 unidades, es inferior a 26,4435

1.999 JUN IND En una población normal, cuya desviación típica es 12.5, se pide
diseñar un Test de Hipótesis para contrastar, en dicha población, la Hipótesis Nula
{m = 125.3} contra la Hipótesis Alternativa { m = 128 } de modo que la probabilidad
de cometer el Error I sea de 10% y la de cometer el Error II sea del 5%.
Si representamos por n el tamaño de la muestra y por k la frontera entre la zona de
aceptación y la de rechazo.
El error tipo I es la probabilidad de rechazar la hipótesis nula cuando es cierta:
12.5 k − 125.3
P ( N (125.3, ) > K ) = 0.10 y por lo tanto = 1.281
n 12.5
n
El error tipo II es la probabilidad de aceptar la hipótesis nula cuando es cierta la hipótesis
alternativa:
12.5 k − 128
P ( N (128, ) < K ) = 0.05 y por lo tanto = −1.645
n 12.5
n
Planteando el sistema de ecuaciones con las incógnitas n k, se tiene:

 12.5
k − 125.3 = 1.281·
n
 12.5
k − 128 = −1.645·
 n

Resolviendo el sistema se tiene : k = 126.4820 ;


n = 13.5463 , con lo que
n = 183.54 y deberá tomarse el tamaño de la muestra n = 184 y la región crítica
{x / x > 126.4820}

2.000 JUN Diseñar un test para contrastar la hipótesis nula H 0 = {m = 25} frente a
la hipótesis alternativa H 1 = {m = 27.5} con un error tipo I del 7%, y un error tipo II
del 14%. Se considera que la población se distribuye normalmente con desviación
típica 7.3 .
El estadístico a escoger es la media de la muestra.

La región crítica será {x ∈ R / x > k }

El tamaño de la muestra, n, y la frontera de la región crítica, k, los obtendremos a partir


de los errores:

 
 7 .3   7 .3   k − 25 
Error I : P x > k / x = N ( 25 ; )  = P N (25 ; ) > k  = P z >  = 0.07
 n   n   7 . 3 
 n
Error II :
38 TEMA 6: TEST DE HIPOTESIS

 
 7 .3   7 .3   k − 27.5 
P x < k / x = N (27.5 ; )  = P N (27.5 ; ) < k  = P z <  = 0.14
 n   n   7 . 3 
 n 
k − 27.5 k − 25
= −1,0803 = 1,4757
7 .3 7 .3
n n
Resolviendo estas ecuaciones, se obtiene k = 26,4430 n = 55,6736 ; y se tomará
n = 56
En consecuencia se tomará una muestra de 56 unidades. Se calculará su media. Y si la
media es superior a 26,4430 se rechazará la hipótesis nula:_ H 0 = {m = 25} .

1.996 ENE IND Mediante un test de hipótesis se desea contrastar la hipótesis nula
H :={ la variable se distribuye normalmente N(14, 0'5 )}, contra la hipótesis
0
alternativa H := { la variable se distribuye como una N(16, 0'5) }.
1
Si se toma una muestra de 10 unidades, cual debe ser la región de aceptación de la
hipótesis nula de tal modo que la probabilidad de cometer un error tipo II sea del
5%.
Tomaremos como estadístico la media muestral para contrastar ambas hipótesis.

En ambas hipótesis la desviación típica de la media muestral será 0'5 / 10 .


El error del tipo II se comete cuando se acepta la hipótesis nula siendo falsa ( la hipotesis
nula es verdadera).
En una variable aleatoria normal tipificada la abcisa -1'645 ( consultando las tablas e
interpolando) deja a la izquierda el 5% de probabilidad.
Por lo tanto la frontera entre el intervalo de aceptación y el intervalo de rechazo será:

16'00 - 1'645 · 0'5 / 10 = 15.74


La región de aceptación será { x / x < 15.74 }

2.005 ENE ADE 10.- Sean H 0 = {m = 35} H 1 = {m = 34}. Diseñar un test para
contrastar estas hipótesis en una población normal con error I del 5% y error II del
10%. La varianza de la población es 25,67 .
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =

 
 
  25,67   k − 35  k − 35
P x < k / x = N  35 ;   = P z <
 ) = 0,05 ⇒ =
  n   25,67  25,67
 
 n  n
-1,6448
Error tipo II =
TEMA 6: TEST DE HIPOTESIS 39

 
 
 25,67  k − 34  k − 34
P x > k / x = N (34 ;  = P z > = 0,10 ⇒ = 1,282
 n   25,67  25,67
 
 n n
Resolviendo el sistema queda,

k = 34,438 ; n = 14,827 ⇒ n = 219,83 ⇒ n = 220


Diseño del Test:
Tendremos que tomar una muestra de 220 unidades,
Calcular la media de esas 220 unidades
Si la media de esa muestra es superior a 34,438 aceptaremos la hipótesis de que la
media de la población es 35 ; en caso contrario consideraremos que la media de la
población es 34.

2.004 ENE ADE 12.- Sean H 0 = {m = 35} H 1 = {m = 34}. Diseñar un test para
contrastar estas hipótesis en una población normal con error I del 5% y error II del
10%. La varianza de la población es 25,67 .
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x > k .
Error tipo I =

 
 
  25,67   k − 35  k − 35
P x < k / x = N  35 ;   = P z <
 ) = 0,05 ⇒ =
  n   25,67  25,67
 
 n  n
-1,6448
Error tipo II =

 
 
 25,67  k − 34  k − 34
P x > k / x = N (34 ;  = P z > = 0,10 ⇒ = 1,282
 n   25,67  25,67
 
 n n
Resolviendo el sistema queda,

k = 34,438 ; n = 14,827 ⇒ n = 219,83 ⇒ n = 220


Diseño del Test:
• Tendremos que tomar una muestra de 220 unidades,
• Calcular la media de esas 220 unidades
• si la media de esa muestra es superior a 34,438 aceptaremos la hipótesis de que la
media de la población es 35 ; en caso contrario consideraremos que la media de la
población es 34.

2.003 ENE ADE 7.- En una población normal cuya varianza es 2,14, diseñar un test
para contrastar la H 0 = {" m = 10,5"} frente a la hipótesis H 1 = {" m = 10,9"} con
un error I del 5% y un error tipo II del 10%
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
40 TEMA 6: TEST DE HIPOTESIS
Error tipo I =

 
 
  2,14   k − 10,5  k − 10,5
P x > k / x = N 10,5 ;  = P z > ) = 0,05 ⇒ = 1,6448
  n    2,14  2,14
 
 n  n

Error tipo II =

 
 
 2,14  k − 10,9 k − 10,9
P x < k / x = N (10,9 ;  = P z <  = 0,10 ⇒ = −1,2816
 n  2,14  2,14
 
 n n
Resolviendo el sistema queda,

k = 10,7248 ; n = 10,7024 ⇒ n = 114,5 ⇒ n = 115


Diseño del Test:
Tendremos que tomar una muestra de 134 unidades,
Calcula la media de esas 134 unidades
si el promedio de esa muestra es inferior a 10,7219 aceptaremos la hipótesis de que la
media de la población es 10,5 ; en caso contrario consideraremos que la media de la
población es 10,9.

2.002 ENE ADE Diseñar un test para contrastar, en una población normal con
varianza 5, la hipótesis H 0 = {" m ≤ 12"} frente a la hipótesis alternativa
H 1 = {" m ≥ 12.5"} , con error tipo I del 10% y error tipo II del 15%.
El estadístico que utilizaremos parta contrastar la hipótesis es la media muestral, x ; el
tamaño n de la muestra se determinará en el proceso siguiente ; y la forma de la región
crítica es {x ∈ R / x > k } . Las ecuaciones para determinar n y k se obtendrán a partir
de los errores.
Error I =

 k − 12 
( ( ) )
P( x > k / m = 12) = P N 12 ; 5 n > k = P z >
 5 n 
= 0,10 ⇒
k − 12
5n
= 1,2816
 

Error II =

 k − 12,5 
( ( ) )
P( x < k / m = 12,5) = P N 12,5 ; 5 n < k = P z <
 5 n 
= 0,15 ⇒
k − 12,5
5n
= −1,0364

Despejando n y k se tiene : n = 10,3665 ; k = 12,2764 ; n = 108


Diseño del Test:
• tomaríamos una muestra de 108 elementos,
• calcularíamos su media, x;
si ésta es mayor que 12,2764 , entonces rechazaremos la hipótesis nula.
TEMA 6: TEST DE HIPOTESIS 41

6.11.2. TEST DE HIPOTESIS SOBRE LA VARIANCIA

2.005 ENE IND Indicar justificadamente si una muestra de 20 unidades, tomada de


una población normal, es suficiente para contrastar la hipótesis H 0 = "σ { 2
= 1,5" }
frente a la hipótesis H 1 = "σ { 2
= 2,9" } Con un error I del 20% y un error tipo II
del 10%
Para contrastar ambas hipótesis utilizaríamos como estadístico de prueba la
2
cuasivarianza de la muestra, s .

La región de aceptación será: x ∈ R / x < k { +


}
Error I = P (rechazar H 0 cuando es cierta)=

 1,5   2 k · 19 
= P s > k
2
/ s 2 = χ 192  = P χ 19 >  ≤ 0,20
 19   1,5 
23,9004 · 1,5
Entonces, se tendrá que cumplir que k > = 1,8869
19
Error II = P (aceptar H 0 cuando es falsa) =

 2,9   k · 19 
P s 2 < k / s 2 = χ 192 = P χ 192 < ≤ 0,10
 19   2,9 
11,6509 · 2,9
Entonces, se tendrá que cumplir que k < = 1,7783
19
Como no hay ningún valor de k que satisfaga simultáneamente ambas condiciones, se
concluye que con una muestra de 20 unidades no se pueden contrastar ambas hipótesis.

2.003 ENE IND Indicar justificadamente si una muestra de 30 unidades, tomada de


una población normal, es suficiente para contrastar la hipótesis H 0 = "σ { 2
= 1,5" }
frente a la hipótesis H 1 = "σ { 2
= 1,9" } Con un error I del 20% y un error tipo II del
10%
Para contrastar ambas hipótesis utilizaríamos como estadístico de prueba la
2
cuasivarianza de la muestra, s .

La región de aceptación será: x ∈ R / x < k { +


}
Error I = P (rechazar H 0 cuando es cierta) =

 1,5   2 k · 19 
= P s > k
2
/ s 2 = χ 192  = P χ 19 >  ≤ 0,20
 19   1,5 
23,9004 · 1.5
Entonces, se tendrá que cumplir que k > = 1,8869
19
Error II = P (aceptar H 0 cuando es falsa) =

 1,9   2 k · 19 
= P s < k
2
/ s 2 = χ 192  = P χ 19 <  ≤ 0,10
 19   1,9 
13,7158 · 1,9
Entonces, se tendrá que cumplir que k < = 1,3716
19
42 TEMA 6: TEST DE HIPOTESIS

Como no hay ningún valor de k que satisfaga simultáneamente ambas condiciones, se


concluye que con una muestra de 20 unidades no se pueden contrastar ambas hipótesis.

2.002 ENE 11.- Diseñar un test para contrastar la hipótesis


{
H 0 = " x = N (0.12 ; 0.02 " } frente a la hipótesis alternativa
H1 = {" x = N (0.12 ; 0.04"}, con error tipo I del 20% y error tipo II del 10%.
El estadístico que utilizaremos parta contrastar la hipótesis es la cuasivarianza muestral,
s 2 ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la forma de la
región crítica es s ∈ R / x { > k }. Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.

 n −1 
(
Error I = P s > k / σ
2 2
) 
= 0,02 = P χ 2
0,02
n −1

> k  = P χ 2 > k  = 0,20
0,02 
  
 n −1 
(
Error II = P s < k / σ
2 2
) 
= 0,04 = P χ 2
0,04
n −1

< k  = P χ 2 < k  = 0,10
0,04 
  
El valor de k tendrá que verificar simultáneamente las condiciones:
0,02 0,04
k > χ n2−1;0 , 05 y k < χ n2−1;0,9
n n
Resolvamos este sistema de ecuaciones asignando un valor arbitrario de n = 10 ,
tendremos:
0,02 0,04
k > χ 92;0, 20 = 0,0272 y k < χ 92;0,9
= 0,0185 ; como no hay ningún valor de
9 9
k que satisfaga estas condiciones buscaremos un valor de n mayor que 10. Por ejemplo
n = 20 ; y tendremos
0,02 0,04
k > χ 192 ;0, 20 = 0,0252 y k < χ 192 ;0,9
= 0,0245 ; como no hay ningún valor
19 19
de k que satisfaga estas condiciones buscaremos un valor de n mayor que 10. Por
ejemplo n = 22 ; y tendremos

0,02 0,04
k > χ 21
2
; 0 , 20 = 0,0249 y k < χ 21
= 0,0252 ;como hay varios valores de
2
; 0,9
21 21
k que satisfacen ambas condiciones, probaremos con un valor de n menor; por ejemplo
n = 21
0,02 0,04
k > χ 20
2
; 0 , 20 = 0,0250 y k < χ 20
= 0,0249 ; como no hay ningún valor
2
;0,9
20 20
de k que satisfaga estas condiciones nos quedaremos con el valor de n = 22 y el valor
0,0249 + 0,0252
de k = = 0,0250
2
Conclusión: tomaríamos una muestra de 22 elementos, calcularíamos su cuasivarianza,
s 2 ; si ésta es mayor que 0,0250 , entonces rechazaremos la hipótesis nula.

2.004 ENE ADE 7.- Indicar justificadamente si para contrastar la hipótesis


H 0 = {x = N (12,3 ; 0,7)} frente a la hipótesis alternativa
TEMA 6: TEST DE HIPOTESIS 43
H 1 = {x = N (12,3 ; 1,0)} con un error I del 10% y un error II del 20% es suficiente
una muestra de 10 unidades.
Este test es para contrastar las hipótesis sobre las variancias o las desviaciones tipo de
la población.

Error tipo I = P( rechazar H 0 cuando es cierta H 0 ) =

 k ·9
( )
P s 2 > k / σ 2 = 0,7 2 = P χ 92 >  ≤ 0,10
0,7 2 

Error tipo II = P( aceptar H 0 cuando es cierta H 1 ) =

 k ·9
( )
P s 2 < k / σ 2 = 1,0 2 = P χ 92 <  ≤ 0,20
1,0 2 

 0,7 2
 k > 14,684 = 0,7994
Luego k tendrá que verificar:  9 como no hay ningún valor de
2
k < 1,0
5,3801 = 0,5978
 9
k que verifique estas condiciones simultáneamente, concluimos que una muestra de 10
unidades es insuficiente para contrastar

6.11.3. TEST DE HIPOTESIS SOBRE PROPORCIONES

2.003 JUN IND Indicar el procedimiento Establecer y Validar un Test de Hipótesis


sobre proporciones
• Especificar la Hipótesis Nula y, si procede, la hipótesis alternativa.
• Indicar los errores Tipo I y Tipo II
• Escoger el estadístico para contrastar la Hipótesis Nula: proporción de la muestra
• Indicar la forma de la Región Crítica
• Determinar el tamaño de la muestra
• Indicar la Región Crítica, como criterio para contrastar la hipótesis nula
• Tomar la Muestra del tamaño indicado
• Aceptar o Rechazar la Hipótesis Nula según el valor del estadístico de la muestra
• Para implementar del test, realizar el contraste con el número de unidades que
cumplen la condición.

2.000 ENE ADE Diseñar un test de Hipótesis para contratar la hipótesis nula H0 = {p
= 10% } contra la hipótesis alternativa H1 = { p = 14%} con un error tipo I del 5% y
un error del tipo II del 10%. Se ha tomado una muestra inicial de 50 unidades y el
valor de la proporción muestral es del 12%.
El estadístico a utilizar será el número de unidades de una muestra que tengan la
propiedad a la que hace referencia la proporción, q.
Tendremos que determinar el tamaño de la muestra, n, y la región crítica, q > Q.
La probabilidad de rechazar la hipótesis nula cuando es cierta ( Error tipo I ) es:

P(q > Q / q = B (n ; 0,10) ) = P(B(n ; 0,10) > Q )


44 TEMA 6: TEST DE HIPOTESIS

Aproximando a una variable normal ( si n · 0,10 > 15 )

( )
P N (0,10 n ; n 0,10 0,9 ) > Q + 0,5 = 0,05
Tipificando y buscando en tablas, se tiene:
Q + 0,5 − 0,10 n
= 1,6458
n 0,10 0,90
La probabilidad de aceptar la hipótesis nula cuando es falsa ( Error tipo II ) es:

P(q ≤ Q / q = B(n ; 0,14) ) = P(B(n ; 0,14) ≤ Q )


Aproximando a una variable normal ( si n · 0,15 > 15 )

(
P N (0,14 n ; n 0,14 0,86 ) ≤ Q + 0,5 = 0,10 )
Tipificando y buscando en tablas, se tiene:
Q + 0,5 − 0,14 n
= −1,2808
n 0,14 0,86
Con lo que se puede plantear el sistema:

Q + 0,5 − 0,14n = −1,2816 0,14 0,86n



Q + 0,5 − 0,10n = 1,6448 0,10 0,90n
Resolviendo se obtiene:

n = 23,4535 → n = 550,06 → n = 551

Q = 0,14n − 0,4447 n − 0,5 = 86,9380


Con lo que se tendría que tomar la decisión de aceptar o rechazar la hipótesis nula en
base a la información suministrada por una muestra de 551 unidades. Si se obtienen, en
una muestra de 551 unidades, 87 o más unidades con la propiedad, se rechaza la
hipótesis nula. Como se ha tomado una muestra preliminar de 50 unidades, ahora se
necesitará ampliar la muestra con 501 unidades.

2.001 ENE ADE Diseñar un test para contrastar la hipótesis nula de que la
proporción de una población es 25% contra la hipótesis alternativa de que la
proporción sea inferior a 22%. Tomar como error tipo I el 5% y como error tipo II el
10%

La hipótesis nula es H 0 = { p = 25%} , y la hipótesis alternativa es H 1 = { p ≤ 22%}


)
El estadístico de prueba será la proporción de la muestra, p , o el número de unidades
de la muestra que verifican la propiedad, n . Se distribuye según una binomial .

La región crítica será de la forma {n ∈ N / n < k } , donde k es un parámetro a


determinar.
El tamaño de la muestra, m , se determinará
Error I =

 k − 0,5 − 0,25 * m 
(( )
P(B(m ;0,25) < k ) ≈ P N 0,25 * m ; 0,25 * 0,75 * m < k − 0,5 = P z < ) = 0,0
 0,25 * 0,75 * m 

Error II =
TEMA 6: TEST DE HIPOTESIS 45

( ( )
P (B(m ;0,22 ) ≥ k ) ≈ P N 0,22 * m ; 0,22 * 0,78 * m > k − 0,5 = )
 k − 0,5 − 0,22 * m 
= P z >  = 0,10
 0, 22 * 0, 78 * m 
Se tiene :
k − 0,5 − 0,25 * m
= −1,6449 ⇒ k − 0,5 − 0,25 * m = −1,6449 * 0,25 * 0,75 * m
0,25 * 0,75 * m

k − 0,5 − 0,22 * m
y = 1,2816 ⇒ k − 0,5 − 0,22 * m = 1,2816 * 0,22 * 0,78 * m
0,22 * 0,78 * m
1,2432
0,03 * m = 1,2432 m ⇒ m= = 41,44 ⇒ m = 1.717,2736 ⇒
0.03
⇒ m = 1.718 unidades
El valor de k es 400,30 ( 23, 31%) Por lo que tomaríamos una muestra de 1.718
unidades y si el número de unidades que cumple la propiedad es menor o igual que 400
rechazaríamos la hipótesis nula.

2.003 JUN ADE Diseñar un test de hipótesis para contrastar las siguientes
hipótesis sobre la proporción de personas que consumen cierto producto:
H 0 = {p > 16%} frente a H 1 = {p < 12%}, con un error tipo I del 7% y un error
tipo II del 8%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p < k }. Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.

 
 
  0,16 · 0,84   k − 0,16 
Error I = P ( p < k / p = 16% ) ≈ P N  0,16 ;
  < k = P z <
 = 0,07 ⇒
 n    0,16 · 0,84 
     
 n 

 
 
  0,12 · 0,88   k − 0,12 
Error II = P( p > k / p = 12% ) ≈ P N  0,12 ;  > k =
 P z > = 0,05 ⇒

  n 

 0,12 · 0,88 
 
 n 
k − 0,18 k − 0,12
Error I ⇒ = −1,2816 ; Error II ⇒ = 1,6449
0,18 · 0,82 0,12 · 0,88
n n
Despejando n y k se tiene : n = 17,1150 ; k = 0,1512 ; n = 293
Diseño del Test:
• tomaremos una muestra de 293 elementos,
• contaremos el número de elementos que cumplen la propiedad
si el número de elementos que cumplen la propiedad es superior a 0,1512 · 293 = 44,30,
entonces aceptamos la hipótesis nula.
46 TEMA 6: TEST DE HIPOTESIS

2.002 JUN ADE Diseñar un test para contrastar la hipótesis siguiente sobre la
proporción de una población, H 0 = {" p = 18%"} frente a la hipótesis alternativa
H 1 = {" p = 12%"} , con error tipo I del 10% y error tipo II del 5%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p < k }. Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.

  0,18 · 0,82  
Error I = P( p < k / p = 18% ) ≈ P N  0,18 ;  < k =

 n 
   
 
 
k − 0,18  k − 0,18
= P z < = 0,10 ⇒ = −1,2816
0,18 · 0,82  0,18 · 0,82
 
 n  n

  0,12 · 0,88  
Error II = P( p > k / p = 12% ) ≈ P N  0,12 ;  > k =

 n 
   
 
 
k − 0,12  k − 0,12
= P z > = 0,05 ⇒ = 1,6449
0,12 · 0,88  0,12 · 0,88
 
 n  n

Despejando n y k se tiene : n = 17,1150 ; k = 0,1512 ; n = 293


Diseño del test
• tomaríamos una muestra de 293 elementos,
• contaríamos el número de elementos que cumplen la propiedad
• si el número de elementos que cumplen la propiedad es superior a 0,1512 · 293 =
44,30, entonces aceptamos la hipótesis nula.

2.002 ENE ADE Diseñar un test para contrastar la hipótesis siguiente sobre la
proporción de una población, H 0 = {" p = 12%"} frente a la hipótesis alternativa
H 1 = {" p = 18%"} , con error tipo I del 5% y error tipo II del 10%.
El estadístico que utilizaremos parta contrastar la hipótesis es la proporción de la
muestra, p ; el tamaño n de la muestra se determinará en el proceso siguiente ; y la
forma de la región crítica es {p ∈ R / p > k } . Las ecuaciones para determinar n y k se
obtendrán a partir de los errores.
TEMA 6: TEST DE HIPOTESIS 47

  0,12 · 0,88  
Error I = P( p > k / p = 12% ) ≈ P N  0,12 ;  > k =

 n 
   
 
 
k − 0,12  k − 0,12
= P z > = 0,05 ⇒ = 1,6449
0,12 · 0,88  0,12 · 0,88
 
 n  n

  0,18 · 0,82  
Error II = P( p < k / p = 18% ) ≈ P N  0,18 ;  < k =

 n 
   
 
 
k − 0,18  k − 0,18
= P z < = 0,10 ⇒ = −1,2816
0,18 · 0,82  0,18 · 0,82
 
 n  n

Despejando n y k se tiene : n = 17,1150 ; k = 0,1512 ; n = 293


Conclusión: tomaríamos una muestra de 293 elementos, si el número de elementos que
cumplen la propiedad es superior a 0,1512 · 293 = 44,30, entonces rechazaremos la
hipótesis nula.

2.001 JUN ADE Diseñar un test para contrastar la hipótesis nula: “La proporción
de fruta de pequeño calibre es del 50%” ; frente a la hipótesis alternativa: “La
proporción de fruta de pequeño calibre es del 80%”. Se establece el error I en el
10% y el error tipo II en el 15%.

Tomaríamos una muestra de N 1 = 20 unidades (puede ser otra cantidad pero tienen que
ser suficientemente grande para que la distribución binomial pueda aproximarse a una
normal);

n1
ˆ1 =
En esta muestra se cuentan las unidades defectuosas n1 , y se calcula p , el
N1
estimador previo de la proporción.

El tamaño de la muestra será N 2 y aceptaremos la hipótesis nula si, en la muestra, el


número de frutas de pequeño calibre, n2 , es menor o igual que k 2 .

n2
ˆ2 =
Utilizamos la magnitud de los errores para calcular los valores de N 2 y k 2 . ; p ;
N2
k2
q2 = :
N2
Error I =

P ( pˆ 2 > q 2 / p = 0,5) = P( N 2 > k 2 / p = 0,5) = P(B( N 2 ; 0,5) > k 2 ) = 0,10


Error II =

P ( pˆ 2 < q 2 / p = 0,8) = P(N 2 ≤ k 2 / p = 0,8) = P(B( N 2 ; 0,8) ≤ k 2 ) = 0,15


Si n2 es grande, las distribuciones binomiales se podrán aproximar a distribuciones
normales:
48 TEMA 6: TEST DE HIPOTESIS

 
( (
Error I = P N 0,5 N 2 ; ) 
)k + 0,5 − 0,5 N 2
0,5 0,5 N 2 > k 2 + 0,5 = P z > 2
0,5 0,5 N 2
 = 0,10

 
 
( (
Error II = P N 0,8 N 2 ; ) 
)k + 0,5 − 0,8 N 2
0,8 0,2 N 2 < k 2 + 0,5 = P z < 2
0,8 0,2 N 2
 = 0,15

 
5) Se plantea el sistema de ecuaciones:

k 2 + 0,5 − 0,5 N 2
= 1,2816 ⇔ k 2 + 0,5 − 0,5 N 2 = 1,2816 0,5 0,5 N 2
0,5 0,5 N 2

k 2 + 0,5 − 0,8 N 2
= −1,0364 ⇔ k 2 + 0,5 − 0,8 N 2 = −1,0364 0,8 0,2 N 2
0,8 0,2 N 2
Restando ambas ecuaciones, se tiene:
1,0554
0,3 N 2 = 1,0554 N 2 ⇔ N2 = ⇔ N 2 = 12,38
0,3
Por lo que necesitamos una muestra de 13 unidades, pero para asumir la hipótesis de
normalidad se requiere que el tamaño de la muestra sea superior a 30 unidades.

Otro método, utilizando directamente la tablas de la binomial los valores de N2 y


k 2 que cumplen las condiciones siguientes:
P(B( N 2 ; 0,5) > k 2 ) ≤ 0,10 y P(B( N 2 ; 0,8) ≤ k 2 ) = 0,15
se encuentra N 2 = 14 y k2 = 9

6.11.4. TEST DE HIPOTESIS SOBRE DISTRIBUCIONES

2.001 JUN IND Indicar con un nivel de significación del 5% si los datos observados
y recogidos en la tabla corresponden a una distribución de Poisson de parámetro
4:
Valor 0 1 2 3 4 5 6 7
Frecuencia 13 17 25 23 11 5 4 1
La frecuencia esperada para una variable de Poisson de parámetro 4 es:
Valor 1 2 3 4 5 6 7
Frec.
30 25 23 11 5 4 1
Observada
Frec.
Esperada 9,0662 14,5059 19,3413 19,3413 15,4731 10,3153 5,8945

(ei − oi )2 / ei
48,3356 7,5916 0,6921 3,5973 7,0888 3,8665 4,0641
7

∑ (e − oi ) / ei = 75,2371
2
El estadístico de prueba es i
i =0
TEMA 6: TEST DE HIPOTESIS 49

Como el valor de una χ 62 con un nivel de significación del 5% es 12,5916, no se acepta


la hipótesis de que los datos de la tabla se distribuyen según una variable de Poisson de
parámetro 4.

1.999 ENE IND En la tabla se indica la frecuencia del número de visitantes a un


museo cada día. ¿El número de visitantes que recibe el museo diariamente se
puede representar mediante una distribución de Poisson con un nivel de
significación del 90%?
Visitas 0 1 2 3 4 5 6 7 8 9 10
Frecu. 1 4 8 12 17 11 6 4 4 2 1
La mejor variable de Poisson que podemos ajustar tendrá como parámetro el promedio
de visitas:
( 0·1 +1·4 +2·8 +3·12 +4·17 +5·11 + 6·6 + 7·4 + 8·4 + 9·2 + 10· 1) / (1+4+8+12 +17+11+
6+4+4+2+1) = 303 / 70 = 4.3286
Para ver si es posible ajustar una distribución de Poisson debemos agrupar los
inteRvalos para que la frecuencia esperada en cada uno de ellos sea igual o superior a 5.
Visitas 0,1 2 3 4 5 6,7 8,9,10
Frecu.Observada 1+4 8 12 17 11 6+4 4+2+1
Frecu Esperada 4,9184 8,6472 12,4767 13,5017 11,6887 13,6471 4,7658

Como ejemplo en Frecuencia Esperada para 2 visitas es 70 · P( p(4.3286) = 2 ) = 70 ·


0.1235 = 8.6472

(o i − e ) 2
Calculando el estadístico ∑ ei
= 8.6472

Una variable χ 2 de 6 grados de libertad y nivel de significación 0.9 vale 2.2041


Como 8.6472 > 2.2041 se concluye que no se puede ajustar una distribución de Poisson
con un nivel de significación del 90%

2.000 ENE ADE En la tabla siguiente, se indica la frecuencia observada de un


determinado suceso durante varios intervalos de tiempo. Se pide indicar,
justificadamente, si los datos observados se pueden ajustar a una distribución de
Poisson con un nivel de significación del 10%
Sucesos 0 1 2 3 4 5 6 7 8 9
ecuencia
1 3 5 8 6 3 2 0 1 1
servada
105 observaciones
El valor medio es = 3,5
30 periodos
Sucesos 0 1 2 3 4 5 6 7 8 9
Frecuencia
1 3 5 8 6 3 2 0 1 1
Observada
Frecuencia relativa 0,030 0,105 0,185 0,215 0,188 0,132 0,077 0,038 0,016 0,006
esperada 2 7 0 8 8 2 1 5 9 6

Frecuencia 0,905 3,170 5,548 6,473 5,664 3,965 2,313 1,156 0,506 0,196
Esperada 9 7 8 6 4 1 0 5 0 8

Agrupamos los intervalos de forma que en todos ellos la frecuencia esperada sea igual o
superior a 5
Frecuencia Observada 9 8 6 7
50 TEMA 6: TEST DE HIPOTESIS

Frecuencia Esperada 9,6254 6,4736 5,6644 8,1372


4
(ei − oi )2
Calculamos el estadístico ∑ i =1 ei
= 0,2745 + 0,3599 + 0,0199 + 0,1589 = 0,8132

Comparamos el valor de este estadístico con el valor crítico de una variable χ de (4-1-
2

1) grados de libertad y nivel de significación del 10%, ya que a partir de los datos se ha
estimado un parámetro y esto reduce en una unidad el número de grados de libertad. En
tablas 4,6052.

Como el valor del estadístico ( 0,8132 ) es menor que el valor de referencia de la χ


2

para el nivel de significación pedido ( 4,6052 ), se acepta la hipótesis de que los datos
observados se ajustan a una distribución de Poisson de parámetro 3,5.

2.004 JUN ADE La frecuencia de los ingresos, en euros, durante las últimas
semanas se indican en la tabla siguiente:
< 1600 1900 - 2200 2200 - 2500 2500 - 2800 2800 - 3100 > 3400
8 18 25 30 14 5
Se pide indicar justificadamente si estos datos se ajustan a una variable normal de
media 2.500 y desviación tipo 400, con un nivel de significación del 10%
Compararemos la frecuencia esperada con la realmente observada:
intervalo < 1600 1900 - 2200 - 2500 - 2800 - > 3400 total
2200 2500 2800 3100
f. Esperada 6,6807 15,9820 27,3373 27,3373 15,9820 6,6807 100
f. Observada 8 18 25 30 14 5 100

(ei − oi )2 0,2605 0,2548 0,1998 0,2594 0,2458 0,4228 1,6431

ei

Como el valor crítico de una χ de 5 grados de libertad y nivel de significación es


2

9,2363, y el valor del estadístico de prueba es 1,6431, se acepta la Hipótesis de que los
datos se distribuyen según la variable indicada.

2.004 ENE ADE 6.- Indicar si los datos de la tabla siguiente se ajustan a una
distribución de Poisson de parámetro 5, con un nivel de significación del 5%
3 7 2 3 6 3 9 5 4 5
6 3 5 5 3 4 4 2 2 7
6 4 5 9 4 4 9 4 4 7
6 6 3 5 6 3 6 4 3 7
Compararemos la frecuencia observada con la frecuencia esperada según una
distribución de Poisson:
Valor 0 1 2 3 4 5 6 7 8 9 10 suma
Frec.Observ. 0 0 3 8 9 6 7 4 0 3 0 40
Frec. Esper. 0,2695 1,3476 3,369 5,615 7,0187 7,0187 5,8489 4,1778 2,6111 1,4506 1,2731 40

Frec.Observ. 3 8 9 6 7 7 40
Frec. Esper. 4,9861 5,615 7,0187 7,0187 5,8489 9,5127 40
TEMA 6: TEST DE HIPOTESIS 51

0,7911 1,0131 0,5593 0,1479 0,2265 0,6637 3,4016


( ei − o i ) 2 / e i

Como estamos comparando 6 intervalos, el valor del estadístico obtenido ( 3,4016 ) lo


tendremos que comparar con el valor crítico de una Chi-cuadrado de 5 ( 6 – 1 ) grados de
libertad ( 11,07 ); por lo que aceptaremos la hipótesis que los datos corresponden a una
distribución de Poisson de parámetro 5.,.
el test con los errores indicados.

2.003 ENE ADE 3.- En la tabla siguiente se indica el número de clientes que acude
diariamente a un establecimiento. Se pide indicar si los datos observados se
pueden ajustar a una distribución de Poisson de parámetro 5 con un nivel de
significación del 5%
5 3 2 6 6 7 3 3 6 7 7 9 7 5 3 12 6 10 7 2
6 8 0 7 4 6 5 6 3 5 5 9 3 9 5 3 5 3 7 3
4 3 1 2 2 5 5 6 4 7 5 6 7 8 7 5 7 8 4 3

Construiremos la tabla que nos indique la frecuencia observada oi , y esperada ei , de


cada uno de los valores
Valor 0 1 2 3 4 5 6 7 8 9 10 11 12suma

oi 1 1 4 11 4 11 9 11 3 3 1 0 1 60

ei 0,40 2,02 5,05 8,42 10,53 10,53 8,77 6,27 3,92 2,18 1,09 0,49 0,21 59,88

oi 6 11 4 11 9 11 8

ei 7,479 8,42 10,53 10,53 8,77 6,27 7,881

0,293 0,789 4,048 0,021 0,006 3,575 0,002 8,733


(ei − o i ) 2
ei
Las últimas filas de la tabla se agregan para garantizar que cada uno de los intervalos en
los que se compara la frecuencia observada y la frecuencia esperada, esta última es
superior a 5.
El estadístico de prueba es

(ei − oi )2 (7,479 − 6 )
2
(8,42 − 11)
2
(10,53 − 4 )
2
(10,53 − 11)
2
(8,77 − 9 )
2

∑ ei
=
7,479
+ +
8,42
+
10,53
+
10,53 8,77
+

+
(6,27 − 11)2 + (7,881 − 8)2 = 8,773
6,27 7,881
Como el valor de este estadístico es menor que el valor de una χ de 6 (7-1) grados de
2

libertad y nivel de significación del 5% ( 12,5916), aceptaremos que los datos observados
corresponden a una variable de Poisson de parámetro 5.

2.002 JUN ADE 6.- En la tabla siguiente se indica el número de clientes que piden
langosta en un restaurante.
5 4 3 10 8 5 2 6 9 6 9 7
6 12 9 11 10 9 7 7 6 9 9 3
7 11 5 11 7 6 4 10 7 3 5 6
52 TEMA 6: TEST DE HIPOTESIS
Se pide indicar si estos datos se ajustan, con un nivel de significación del 10%, a
una distribución Binomial de 12 intentos.
Primero calcularemos la probabilidad de la variable binomial
exitos 254
= = 0,588
int entos 36 · 12
Como se utilizan los datos de la muestra para calcular un parámetro, los grados de
libertad se reducen en una unidad.
Luego, construiremos la tabla de frecuencia observada y de frecuencia esperada para
una distribución Binomial de 12 intentos con probabilidad de éxito de 0,588


clientes 0 1 2 3 4 5 6 7 8 9 10 11 12
frec 0,000 0,014 0,115 0,551 1,769 4,039 6,725 8,225 7,335 4,652 1,991 0,516 0,061
esperada 9 8 9 1 3 5 0 4 9 5 7 7 4
6,491 6,725 8,225 7,335 7,222
4 0 4 9 3

10 6 6 1 13
frec
observada 0 0 1 3 2 4 6 6 1 6 3 3 1
Hay cinco intervalos en los que la frecuencia esperada es superior a 5, calcularemos el
estadístico:

(ei − oi )2 (6,4914 − 10)2 + (6,7250 − 6)2 + (8,2254 − 6)2 + (7,3359 − 1)2


∑ ei
=
6,4914 6,7250 8,2254 7,3359
+

+
(7,2223 − 13)
2
= 12,671
7,2223
Como el valor de este estadístico es mayor que el valor de una χ de 3 (5-1-1) grados de
2

libertad y nivel de significación del 10% (6,2514), rechazaremos que los datos
observados corresponden a una variable de Binomial de 12 intentos (con probabilidad
del 58,8%).

2.002 ENE ADE 8.- En la tabla siguiente se indica el número de clientes que piden
langosta en un restaurante.
5 4 3 10 8 5 2 6 9 6 9 7
6 12 9 11 10 9 7 7 6 9 9 3
7 11 5 11 7 6 4 10 7 3 5 6
Se pide indicar si estos datos se ajustan a una distribución de Poisson de
parámetro 8 con un nivel de significación del 10%
Primero construiremos la tabla de frecuencia observada y de frecuencia esperada para
una distribución de Poisson de parámetro 8:

nº clientes 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Frec esperada 0,01 0,10 0,39 1,03 2,06 3,30 4,40 5,03 5,03 4,47 3,57 2,60 1,73 1,07 0,61 0,32 0,16
frec observada 0 0 1 3 2 4 6 6 1 6 3 3 1 0 0 0 0

6,88 9,42 5,03 8,04 6,49

10 12 1 9 4

Hay cinco intervalos en los que la frecuencia esperada es superior a 5, calcularemos el


estadístico:
TEMA 6: TEST DE HIPOTESIS 53

(ei − oi )2 (6,88 − 10)2 + (9,42 − 12)2 + (5,03 − 1)2 + (8,04 − 9)2 + (6,49 − 4)2
∑ ei
=
6,88 9,42 5,03 8,04 6,49
= 6,4203

Como el valor de este estadístico es menor que el valor de una χ de 4 (5-1) grados de
2

libertad y nivel de significación del 10% ( 7,7794), aceptaremos que los datos observados
corresponden a una variable de Poisson de parámetro 8.
NOTA: pueden haber otras formas de agrupar los intervalos.

2.001 JUN ADE Indicar si los datos recogidos en la tabla siguiente se ajustan a una
distribución uniforme con un nivel de significación del 10%:
Intervalo 0.01-10 10.01- 20.01- 30.01- 40.01- 50.01- 60.01- 70.01-
20 30 40 50 60 70 80
Frecuencia 11 12 4 10 8 12 7 6

0.01- 10.01- 20.01- 30.01- 40.01- 50.01- 60.01- 70.01- suma


Intervalo 10 20 30 40 50 60 70 80
Frec Obs 11 12 4 10 8 12 7 6 70
Frec
Esper. 8,75 8,75 8,75 8,75 8,75 8,75 8,75 8,75

( ei − o i ) 2 /
0,57857 1,20714 2,57857 0,17857 0,06429 1,20714 0,35 0,86429 7,02857

El valor crítico de una χ 2 de 7 grados de libertad con un nivel de significación del 10% es
12,0170
Como el estadístico de prueba ( 7,0286 ) es inferior al valor crítico ( 12,0170 ), entonces
consideramos que los datos se ajustan a una distribución uniforme.

2.001 ENE ADE 8.- Indicar con un nivel de significación del 5% si los datos
observados y recogidos en la tabla corresponden a una distribución de Poisson:
Valor 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 2 19 21 22 14 9 6 4 2
Primero calcularemos el parámetro de la distribución de Poisson. Se han observado 407
incidentes en 100 intervalos, el número medio de incidentes de Poisson es 4,07 .
Calcularemos la frecuencia esperada.

Valor 0 1 2 3 4 5 6 7 8 9
Frec.
1 2 19 21 22 14 9 6 4 2
Observada
Frec.
70774 9505 ,1443 9,189 ,5249 ,8932 ,7809 26833 18901 44214
Esperada
Agruparemos los intervalos en los que la frecuencia esperada sea menor que 5.

Valor 0-1 2 3 4 5 6 7-8-9

Frecuencia
3 19 21 22 14 9 12
Observada
Frecuencia
8,65824 14,1443 19,189 19,5249 15,8932 10,7809 10,8995
Esperada
54 TEMA 6: TEST DE HIPOTESIS

(ei − oi )2
3,69771 1,66698 0,17091 0,31377 0,22553 0,29419 0,11112
ei

(ei − oi )2
El valor del estadístico es = ∑i ei
= 6,4802

Como el valor crítico de una χ de (7-1) grados de libertad y nivel de significación del
2

5% es 12,5916 ( > 6,4802 ) se acepta la hipótesis de que los datos observados


corresponden a una distribución de Poisson.

6.11.5. TEST DE HIPOTESIS DIVERSOS

2.001 JUN IND Diseñar un test para contrastar la hipótesis “A = N( 27 ; 2)” contra la
hipótesis alternativa “A = N(27,5 ; 2,5)” con un nivel de significación del 10% y una
potencia del 95%.
Tomaremos como estadístico la media de una muestra de tamaño n. Aceptaremos la
hipótesis nula si x < k .
Error tipo I =
k − 27 k − 27
P( x > k / x = N (27 ; 2 ) = P( z > ) = 0,10 ⇒ = 1,2816
n 2 2
n n
Error tipo II =
k − 27,5 k − 27,5
P( x < k / x = N (27,5 ; 2,5 ) = P( z < ) = 0,05 ⇒ = −1,6449
n 2,5 2,5
n n
Resolviendo el sistema queda,

k = 27,1920 ; n = 13,3508 ⇒ n = 178,2439 ⇒ n = 179


Diseño del test
• Tendremos que tomar una muestra de 215 unidades,
• Calcular la media de esa muestra
• si el promedio de esa muestra es inferior a 27,219 aceptaremos la hipótesis de que la
población se distribuye según una N(27,5 ; 2,5)

2.000 JUN 1.- Indicar el esquema a seguir para la Validación de Test de Hipótesis
• Especificar la Hipótesis Nula y, si procede, la hipótesis alternativa.
• Indicar los errores Tipo I y Tipo II
• Escoger el estadístico para contrastar la Hipótesis Nula
• Indicar la forma de la Región Crítica
• Determinar el tamaño de la muestra
TEMA 6: TEST DE HIPOTESIS 55
• Indicar la Región Crítica, como criterio para contrastar la hipótesis nula
• Tomar la Muestra del tamaño indicado
• Aceptar o Rechazar la Hipótesis Nula según el valor del estadístico de la muestra

1.997 ENE IND El número de llamadas que se reciben en una centralita en periodos
de 5 minutos se recoge en la tabla siguiente:
llamadas en 5 0 1 2 3 4 5 6 7
minutos
frecuencia 169 134 74 32 11 2 0 1

Suponiendo que el número de llamadas recibidas sigue una distribución de


Poisson, cual es la probabilidad de recibir menos de tres llamadas en un periodo
de tiempo.
La distribución de Poisson que mejor se ajusta a esos datos será aquella cuyo parámetro
sea el número medio de incidencias en el periodo de tiempo.
periodos analizados = 169 + 134 + 74 + 32 + 11 + 2 + 0 + 1 = 423
llamadas recibidas = 169·0 + 134·1 + 74·2 + 32·3 + 11·4 + 2·5 + 0·6 + 1·7 = 439
439
El parámetro de la distribución de Poisson es λ= = 1.0378
423
La probabilidad de recibir menos de tres llamadas será:

−1.0378 1.0378 0 1.0378 1 1.0378 2


P( n = 0 ) + P( n = 1) + P( n = 2 ) = e ( + + ) = 0.9126
0! 1! 2!

2.000 JUN ADE 5.- Diseñar un test de hipótesis, con error tipo I =5% y error tipo II =
10%, que nos permita diferenciar dos partidas de bolas de billar, unas de plástico,
cuyo peso se distribuye según una N ( 225 gr, 10 gr ), y otras de marfil, cuyo peso
se distribuye según una N( 230 gr, 12 gr)
Tomaremos como hipótesis nula que “las bolas son de plástico.
Si representamos por n el tamaño de la muestra y por k la frontera entre la zona de
aceptación y la de rechazo, el error tipo I (la probabilidad de rechazar la hipótesis nula
cuando es cierta) es :
k − 225
P( N (225, 10) > k ) = 0,05 y por lo tanto = 1,645
10 n
Y el error tipo II (la probabilidad de aceptar la hipótesis nula cuando es falsa) será:
k − 230
P( N (230, 12) < k ) = 0,10 y por lo tanto = −1,281
12 n
Planteando el sistema de ecuaciones con las incógnitas n y k, se tiene:

 10
 k − 225 = 1,645 n
 12
k − 230 = −1,281
 n

Resolviendo el sistema se tiene k = 227,5847 ; n = 6,3644 ; con lo que n = 40,5056 ;


Diseño del Test:
56 TEMA 6: TEST DE HIPOTESIS
• se tomará una muestra de 41 unidades
• calcularemos el promedio de la muestra
• si el promedio de la muestra es superior a 227,5847 se rechazará la hipótesis nula y
se considerará que las bolas son de marfil.

2.001 ENE ADE Diseñar un test para contrastar la hipótesis nula: “El número medio
de llamadas que se reciben durante 10 minutos es 5” ; frente a la hipótesis
alternativa: “El número medio de llamadas que se reciben durante 10 minutos es
6”. Se establece el error I en el 10% y el error tipo II en el 15%.

La hipótesis nula es H 0 = {λ = 5} , y la hipótesis alternativa es H 1 = {λ = 6}


El estadístico de prueba será el número de llamadas, n , que se recibe en T minutos.
La región crítica será de la forma {n ∈ N / n > k } , donde k es un parámetro a
determinar.
El tamaño de la muestra, T , en este caso el tiempo en el que se registran las llamadas
recibidas, se determinará

Error I =

 5 *T 
 k − 0,5 − 
  5 *T     5 *T 5 *T  
P p  > k  ≈ P N  ;  > k + 0,5  = P z > 10  = 0,10
   
  10     10 10   
5*T

 10 
Error II =

 6 *T 
 k − 0,5 − 
  6 *T     6 *T 6 * T  
P p  ≤ k  ≈ P N  ;  < k + 0,5  = P z < 10  = 0,15
   
  10     10 10   
6 *T

 10 
5 *T
k − 0,5 −
Se tiene :
10 = 1,2816 ⇒ k − 0,5 − 5 * T = 1,2816 * 5 * T
5 *T 10 10
10
6 *T
k − 0,5 −
y
10 = −1.0364 ⇒ k − 0,5 − 6 * T = −1.0364 * 6 * T
6 *T 10 10
10
T 5*T 6 *T
= 1,2816 * + 1,0364 * ⇒ T = 17,0902 ⇒ T = 292,0709
10 10 10
El valor de k es 158,62 . Por lo que contaríamos las llamadas recibidas durante 292,07
minutos y si el número de llamadas recibidas es menor o igual que 158 aceptaríamos la
hipótesis nula.
TEMA 6: TEST DE HIPOTESIS 57

Vous aimerez peut-être aussi