Vous êtes sur la page 1sur 34

Tecnicas de Inferencia Estadstica II

Tema 2. Contrastes de hip otesis en poblaciones


normales
M. Concepcion Ausn
Universidad Carlos III de Madrid
Grado en Estadstica y Empresa
Curso 2011/12
Tema 2. Contrastes de hip otesis en poblaciones normales
Contenidos

Contrastes para una muestra de una poblacion normal.

Contrastes para la media con varianza conocida.

Contrastes para la media con varianza desconocida.

Contrastes para la varianza.

Contrastes para dos muestras de dos poblaciones normales


independientes.

Contrastes para la igualdad de varianzas.

Contrastes para la igualdad de medias.

Contrastes para una muestra bivariante de una poblacion normal


bivariante (dos muestras no independientes).

Contrastes para la igualdad de medias.

Contrastes para muestras grandes.


Contrastes para una muestra de una poblaci on normal
Suponemos una muestra aleatoria simple (X
1
, X
2
, . . . , X
n
) de una
poblacion normal, N(,
2
). Queremos resolver contrastes del tipo:
Bilateral Unilateral Unilateral
por la derecha por la izquierda
H
0
: =
0
H
0
: =
0
H
0
: =
0
H
1
: =
0
H
1
: >
0
H
1
: <
0
donde representa el parametro de interes, que puede ser la media, , o
la varianza,
2
.

Las region de rechazo se obtiene usando un estadstico de contraste,


que es una medida de discrepancia entre la muestra de datos y la
hip otesis nula.

Un estadstico de contraste sera cualquier funcion de la muestra y


del parametro especicado en H
0
(con distribucion conocida cuando
H
0
es cierta) que permita decidir hasta que punto la muestra de
datos esta de acuerdo o no con la hipotesis nula.
Contrastes para la media con varianza conocida
Suponemos primero una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una
poblacion normal, N(,
2
), con la varianza,
2
conocida.
Queremos resolver contrastes para la media del tipo:
H
0
: =
0
H
1
: =
0
H
0
: =
0
H
1
: >
0
H
0
: =
0
H
1
: <
0
El estadstico de contraste en este caso es:

X
0
/

n

H
0
N(0, 1)

Este estadstico proporciona una medida de discrepancia entre los


datos y la hipotesis nula.

Para elegir la region de rechazo, de la hipotesis nula debemos de


jar el nivel de signicacion, , donde recordamos que:
= Pr(rechazar H
0
| H
0
cierta)
Contrastes para la media con varianza conocida

H
0
: =
0
vs H
1
: =
0

Dados los datos, (x


1
, . . . , x
n
), si

x
0
/

es grande, se rechazara H
0
.

La regi on de rechazo es:


R =

x
0
/

> z
/2

B
i
o
e
s
t
a
d

s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p

t
e
s
i
s
Las regiones de aceptacin-rechazo dependen de la hiptesis alternativa, H
1
:
a)
0 1
: H . La regin de rechazo la forman
las dos colas de la distribucin del
estadstico bajo H
0
, ambas con la misma
probabilidad /2.
1
Aceptacin
Rechazo
2

Rechazo
2


b)
0 1
: < H . La regin de rechazo la forman
la cola inferior de la distribucin del
estadstico bajo H
0
, con la probabilidad .
1
Aceptacin
Rechazo

c)
0 1
: > H . La regin de rechazo la forman
la cola superior de la distribucin del
estadstico bajo H
0
, con la probabilidad .
1
Aceptacin
Rechazo

p-valor = 2 Pr

Z >
x
0
/

Ejemplo 2.1.
Uno de los productos de una empresa es cafe molido en paquetes de 200
gramos. Se dise na un experimento en el que se pesan con precision el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribucion normal y
que su desviacion tpica es conocida (no realista) e igual a 4.5 gramos.

La empresa desea saber si el peso medio de los paquetes es distinto


de los 200 gramos que guran en la etiqueta. Contrastar dicha
hipotesis usando el p-valor para = 0.05 y 0.01.

Construir dos intervalos de conanza al 95 % y al 99 % para el valor


real del peso medio de un paquete de cafe.
Contrastes para la media con varianza conocida

H
0
: =
0
vs H
1
: >
0

Dados los datos, (x


1
, . . . , x
n
), si
x
0
/

n
es grande, se rechazara H
0
.

La regi on de rechazo es:


R =

x
0
/

n
> z

B
i
o
e
s
t
a
d

s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p

t
e
s
i
s
Las regiones de aceptacin-rechazo dependen de la hiptesis alternativa, H1:
a)
0 1
: H . La regin de rechazo la forman
las dos colas de la distribucin del
estadstico bajo H0, ambas con la misma
probabilidad /2.
1
Aceptacin
Rechazo
2

Rechazo
2


b)
0 1
: < H . La regin de rechazo la forman
la cola inferior de la distribucin del
estadstico bajo H0, con la probabilidad .
1
Aceptacin
Rechazo

c)
0 1
: > H . La regin de rechazo la forman
la cola superior de la distribucin del
estadstico bajo H0, con la probabilidad .
1
Aceptacin
Rechazo

p-valor = Pr

Z >
x
0
/

Contrastes para la media con varianza conocida

H
0
: =
0
vs H
1
: <
0

Dados los datos, (x


1
, . . . , x
n
), si
x
0
/

n
es peque no, se rechazara H
0
.

La regi on de rechazo es:


R =

x
0
/

n
< z

B
i
o
e
s
t
a
d

s
t
i
c
a
C
o
n
t
r
a
s
t
e
s

d
e

h
i
p

t
e
s
i
s
Las regiones de aceptacin-rechazo dependen de la hiptesis alternativa, H1:
a)
0 1
: H . La regin de rechazo la forman
las dos colas de la distribucin del
estadstico bajo H0, ambas con la misma
probabilidad /2.
1
Aceptacin
Rechazo
2

Rechazo
2


b)
0 1
: < H . La regin de rechazo la forman
la cola inferior de la distribucin del
estadstico bajo H0, con la probabilidad .
1
Aceptacin
Rechazo

c)
0 1
: > H . La regin de rechazo la forman
la cola superior de la distribucin del
estadstico bajo H0, con la probabilidad .
1
Aceptacin
Rechazo

p-valor = Pr

Z <
x
0
/

Ejemplo 2.2.
Uno de los productos de una empresa es cafe molido en paquetes de 200
gramos. Se dise na un experimento en el que se pesan con precision el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribucion normal y
que su desviacion tpica es conocida (no realista) e igual a 4.5 gramos.

A la vista del resultado anterior, la empresa desea saber si el peso


medio de los paquetes es de hecho superior a los 200 gramos que
guran en la etiqueta. Contrastar dicha hipotesis usando el p-valor
para = 0.05 y 0.01.
Contrastes para la media con varianza desconocida
En la practica, la varianza poblacional es casi siempre desconocida.
Consideramos ahora el caso para una muestra aleatoria (X
1
, X
2
, . . . , X
n
)
de una poblacion normal, N(,
2
), con la varianza,
2
, desconocida.
Queremos resolver contrastes del tipo:
H
0
: =
0
H
1
: =
0
H
0
: =
0
H
1
: >
0
H
0
: =
0
H
1
: <
0
El estadstico de contraste en los tres casos es:

X
0
S/

n

H
0
t
n1
Gracias a la simetra de la distrbucion t, las regiones de rechazo se
obtienen de manera equivalente a las de los contrastes para la media con
varianza conocida.
Contrastes para la media con varianza desconocida
Calculo del p-valor

H
0
: =
0
vs H
1
: >
0
p-valor = Pr
_
t
n1
>
x
0
s/

n
_

H
0
: =
0
vs H
1
: <
0
p-valor = Pr
_
t
n1
<
x
0
s/

n
_

H
0
: =
0
vs H
1
: =
0
p-valor = 2 Pr
_
t
n1
>
x
0
s/

n
_
Ejemplo 2.3.
Uno de los productos de una empresa es cafe molido en paquetes de 200
gramos. Se dise na un experimento en el que se pesan con precision el
peso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,
206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.
Se supone que el peso de estos paquetes sigue una distribucion normal y
que su desviacion tpica es desconocida.

La empresa desea saber si el peso medio de los paquetes es distinto


de los 200 gramos que guran en la etiqueta y, en ese caso,
averiguar si es superior a 200 gramos. Contrastar dicha hipotesis
usando el p-valor para = 0.05 y 0.01.

Construir dos intervalos de conanza al 95 % y al 99 % para el valor


real del peso medio de un paquete de cafe.
Contrastes para la varianza
Consideramos una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una poblacion
normal, N(,
2
), con , desconocida. Queremos contrastar:
H
0
:
2
=
2
0
H
1
:
2
=
2
0
H
0
:
2
=
2
0
H
1
:
2
>
2
0
H
0
:
2
=
2
0
H
1
:
2
<
2
0
El estadstico de contraste en los tres casos es:
(n 1)S
2

2
0

H
0

2
n1
Las regiones de rechazo se obtienen de manera equivalente a los casos
anteriores, pero teniendo en cuenta que la distribucion
2
n1
es asimetrica.
Varianza de una poblacion normal
Procedimiento

Seleccionamos los valores como


P(
2
n1

2
n1,1/2
) = 1 /2, P(
2
n1

2
n1,/2
) = /2

Estos valores cumplen


P(
2
n1,1/2

2
n1

2
n1,/2
) = 1
!"# !"# 1-!
$
#
%&'('&!"# $
#
%&'(!"#
Contrastes para la varianza
Calculo del p-valor

H
0
:
2
=
2
0
vs H
1
:
2
>
2
0
p-valor = Pr
_

2
n1
>
(n 1)s
2

2
0
_

H
0
:
2
=
2
0
vs H
1
:
2
<
2
0
p-valor = Pr
_

2
n1
<
(n 1)s
2

2
0
_

H
0
:
2
=
2
0
vs H
1
:
2
=
2
0
p-valor = mn
_
2 Pr
_

2
n1
>
(n 1)s
2

2
0
_
, 2 Pr
_

2
n1
<
(n 1)s
2

2
0
__
Ejemplo 2.4.
Un inversor quiere saber si la variacion del precio de las acciones de una
compa na este mes sera superior a la variacion del mes pasado, que fue
de 114.09. Ha observado que la varianza muestral de los precios de los
primeros 10 das de este mes ha sido igual a 110.2. Asumiendo que los 10
datos pueden considerarse una muestra aleatoria de una poblacion
normal, contrastar al 5 % la hipotesis anterior.
En las siguientes secciones, vamos a abordar problemas en los que
disponemos de dos muestras de poblaciones normales.
Distinguiremos dos casos:

Dos muestras independientes: Suponemos dos muestras aleatorias


simples (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos poblaciones
normales independientes:
X N(
1
,
2
1
) e Y N(
2
,
2
2
).

Una muestra bivariante: Suponemos una muestra bivariante,


{(X
1
, Y
1
), . . . , (X
n
, Y
n
)} de una poblacion normal bivariante,
(X, Y) N
__

1

2
_
,
_

2
1

12

12

2
2
__
.
En el primer caso las variables X e Y son independientes. En el segundo,
X e Y son dependientes (a no ser que
12
= 0).
Supondremos siempre que las medias (
1
y
2
), las varianzas (
1
y
2
), y
en su caso, la covarianza (
12
), son desconocidas.
Ejemplo 2.5.
En los siguientes ejemplos distinguir si se trata de dos muestras
independientes de dos variables X e Y independientes o de una muestra
bivariante de una variable (X, Y) de modo que X e Y puedan ser
dependientes.
1. (X
1
, X
2
, . . . , X
10
) e (Y
1
, Y
2
, . . . , Y
15
) representan los salarios de 10
mujeres y 15 hombres, respectivamente.
2. (X
1
, X
2
, . . . , X
8
) e (Y
1
, Y
2
, . . . , Y
8
) son las calicaciones de 8
estudiantes en matematicas y estadstica, respectivamente.
3. (X
1
, X
2
, . . . , X
16
) e (Y
1
, Y
2
, . . . , Y
16
) son las edades de 16 fumadores
y 16 no fumadores.
4. (X
1
, X
2
, . . . , X
20
) e (Y
1
, Y
2
, . . . , Y
20
) representan el n umero de
parados en 20 ciudades de dos paises distintos.
5. (X
1
, X
2
, . . . , X
32
) e (Y
1
, Y
2
, . . . , Y
32
) representan el peso de 32
pacientes antes y despues de un tratamiento de adelgazamiento.
Contrastes para dos muestras independientes de dos
poblaciones normales
Suponemos ahora la primera situacion en la que disponemos de dos
muestras aleatorias simples (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales, N(
1
,
2
1
) y N(
2
,
2
2
), independientes.
Queremos resolver contrastes del tipo:
H
0
:
1
=
2
H
1
:
1
=
2
H
0
:
1
=
2
H
1
:
1
>
2
H
0
:
1
=
2
H
1
:
1
<
2
H
0
:
2
1
=
2
2
H
1
:
2
1
=
2
2
H
0
:
2
1
=
2
2
H
1
:
2
1
>
2
2
H
0
:
2
1
=
2
2
H
1
:
2
1
<
2
2
Contrastes para la igualdad de varianzas
Se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales e independientes, N(
1
,
2
1
) y N(
2
,
2
2
), con
medias,
1
y
2
, desconocidas.
Queremos resolver contrastes del tipo:
H
0
:
2
1
=
2
2
H
1
:
2
1
=
2
2
H
0
:
2
1
=
2
2
H
1
:
2
1
>
2
2
H
0
:
2
1
=
2
2
H
1
:
2
1
<
2
2
El estadstico de contraste es:
S
2
1
S
2
2

H
0
F
n1,m1
Las regiones de rechazo y el calculo del p-valor se realiza de manera
analoga al contraste para la varianza, teniendo en cuenta que la
distribucion de F
n1,m1
es asimetrica.
Ejemplo 2.6.
Se conjetura que las acciones de una compa na sufriran mas variacion en
una industria con competencia en precios que en una en la que existiera
un duopolio y colusion tacita.
En un estudio sobre la industria de generadores mediante turbinas de
vapor, se hallo que en 4 a nos de competencia en precios la variacion de
las acciones de la General Electric fue de 114.09. En los siguientes 7
a nos, en los cuales hubo un duopolio y colusion tacita, esta varianza fue
de 16.08.
Asumir que los datos pueden considerarse muestras aleatorias
independientes de dos poblaciones normales y contrastar al 5 % la
conjetura anterior.
Contrastes para la igualdad de medias
Se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) de dos
poblaciones normales e independientes, N(
1
,
2
1
) y N(
2
,
2
2
), con
varianzas,
2
1
y
2
2
, desconocidas.
Queremos resolver contrastes del tipo:
H
0
:
1
=
2
H
1
:
1
=
2
H
0
:
1
=
2
H
1
:
1
>
2
H
0
:
1
=
2
H
1
:
1
<
2
Contrastes para la igualdad de medias
Si las varianzas son iguales:
2
1
=
2
2
El estadstico de contraste es:

X

Y
_
(n1)S
2
1
+(m1)S
2
2
n+m2
_
1
n
+
1
m

H
0
t
n+m2
Si las varianzas son distintas:
2
1
=
2
2
El estadstico de contraste es:

X

Y
_
S
2
1
n
+
S
2
2
m

H
0
t
f
donde:
f =
_
S
2
1
n
+
S
2
2
m
_
2
1
n1
_
S
2
1
n
_
2
+
1
m1
_
S
2
2
m
_
2
Ejemplo 2.7.
De una muestra aleatoria de 12 licenciados en Economicas en una
Universidad p ublica, los sueldos de su primer empleo fueron los siguientes
(expresados en miles de dolares):
26.2, 29.3, 31.3, 28.7, 27.4 , 25.1,
26.0, 27.2, 27.5, 29.8, 32.6, 34.6
De otra muestra aleatoria independiente de 10 licenciados en Economicas
en una Universidad privada los primeros sueldos fueron los siguientes:
25.3, 28.2, 29.2, 27.1, 26.8,
26.5, 30.7, 31.3, 26.3, 24.2
Asumiendo normalidad en los datos, discutir si existen diferencias entre
los sueldos de los licenciados de Universidades p ublicas y privadas.
Contrastes para una muestra bivariante de una poblaci on
normal bivariante
Consideramos que se tiene una muestra (X
1
, Y
1
), (X
2
, Y
2
), . . . , (X
n
, Y
n
)
de una poblacion normal bidimensional:
(X, Y) N
__

1

2
_
,
_

2
1

12

12

2
2
__
.
Queremos resolver contrastes del tipo:
H
0
:
1
=
2
H
1
:
1
=
2
H
0
:
1
=
2
H
1
:
1
>
2
H
0
:
1
=
2
H
1
:
1
<
2
Contrastes para una muestra bivariante de una poblaci on
normal bivariante
Transformamos el problema en otro en el que se tiene una sola muestra
(D
1
= X
1
Y
1
, D
2
= X
2
Y
2
, . . . , D
n
= X
n
Y
n
) de la variable:
D = X Y N(
D
,
2
D
)
donde
D
= E[X Y] =
1

2
.
El problema se convierte en resolver los contrastes:
H
0
:
D
= 0
H
1
:
D
= 0
H
0
:
D
= 0
H
1
:
D
> 0
H
0
:
D
= 0
H
1
:
D
< 0
El estadstico de contraste es:

D
S
D
/

n

H
0
t
n1
donde S
2
D
es la cuasivarianza muestral de (D
1
, . . . , D
n
).
Ejemplo 2.8.
Antes de lanzar una promocion muy agresiva de un cierto producto
dirigida a los hipermercados de grandes supercies, la directora de
marketing de la empresa quiere saber si es o no rentable. Para ello se
seleccionan al azar 5 hipermercados de Madrid para llevar a cabo la
promocion y se recogen datos de las ventas en miles de euros antes y
despues de la promocion. Se supone que las ventas se distribuyen
normalmente.
Antes 102 120 135 114 175
Despues 110 125 141 113 182

Contrastar la hipotesis de que dicha promocion sea rentable,


teniendo en cuenta que se trata de datos apareados.

Contrastar la misma hipotesis, pero asumiendo que son muestras


independientes.

Comparar y explicar las diferencias en los dos apartados anteriores.


Contrastes para muestras grandes: contraste para una
media
Supongamos que se tiene una muestra (X
1
, . . . , X
n
) de una poblacion
cualquiera con n grande (n >30).
Aunque la poblacion no sea normal, se pueden resolver contrastes para la
media:
H
0
: =
0
H
1
: =
0
H
0
: =
0
H
1
: >
0
H
0
: =
0
H
1
: <
0
utilizando el Teorema Central del Lmite, que garantiza que:

X
0
S/

n

H
0
N(0, 1)
Ejemplo 2.9.
La vida media de una muestra de 55 tubos uorescentes producidos por
una empresa es de 1750 horas con una cuasi-desviacion tpica de 120
horas. Contrastar la hipotesis de que la vida media sea distinta de 1600
horas, utilizando un nivel de signicacion de 0.05.
Contrastes para muestras grandes: contraste para la
igualdad de dos medias
Consideramos ahora que se tienen dos muestras (X
1
, X
2
, . . . , X
n
) e
(Y
1
, Y
2
, . . . , Y
m
) de dos poblaciones no necesariamente normales de
medias
1
y
2
y varianzas,
2
1
y
2
2
, resp., tales que n y m sean grandes
(n, m >30).
Aunque las poblaciones no sean normales, se pueden resolver contrastes
para la diferencia de medias:
H
0
:
1
=
2
H
1
:
1
=
2
H
0
:
1
=
2
H
1
:
1
>
2
H
0
:
1
=
2
H
1
:
1
<
2
utilizando el Teorema Central del Lmite, que garantiza que:

X

Y
_
S
2
1
n
+
S
2
2
m

H
0
N(0, 1)
Ejemplo 2.10.
El metodo MATWES fue dise nado para medir las actitudes hacia las
mujeres ejecutivas. Una puntuacion alta indica actitudes negativas hacia
las mujeres ejecutivas. Se conjetura que la actitud hacia las mujeres
ejecutivas cambia en funcion del sexo.
Para contrastar esta hipotesis se tomaron muestras aleatorias
independientes de 151 hombres y de 108 mujeres estudiantes de M.B.A.
En el grupo de los hombres se obtuvo una puntuacion media de 85.8 con
una desviacion tpica de 19.3. En el de mujeres se obtuvo una puntuacion
media de 71.5 con una desviacion tpica de 12.2.

Plantea el contraste oportuno y resuelvelo para = 0.01.

Como se construira un intervalo de conanza al 99 % para la


diferencia de puntuaciones medias? contendra al 0?
Contrastes para muestras grandes: contraste para una
proporci on
Consideramos que se tiene una muestra (X
1
, X
2
, . . . , X
n
) con n grande
(n >30) de una poblacion Bernouilli, B(1, p):
X =
_
1, con probabilidad p
0, con probabilidad 1 p
Aunque la poblacion no sea normal, se pueden resolver contrastes para la
proporci on:
H
0
: p = p
0
H
1
: p = p
0
H
0
: p = p
0
H
1
: p > p
0
H
0
: p = p
0
H
1
: p < p
0
utilizando el Teorema Central del Lmite, que garantiza que:
p p
0
_
p
0
(1p
0
)
n

H
0
N(0, 1)
donde,
p =

n
i =1
X
i
n
.
Ejemplo 2.11.
Se trabaja con la hipotesis de que uno de cada diez varones maniesta
alg un tipo de daltonismo.

Elegidos 400 varones, se detectan 50 daltonicos. Con un nivel de


signicacion del 10 %, se puede rechazar la hipotesis de partida? se
obtendra la misma conclusion si el nivel de signicacion es del 2 %?
Contrastes para muestras grandes: contraste para la
igualdad de dos proporciones
Consideramos ahora que se tiene dos muestras independientes
(X
1
, X
2
, . . . , X
n
) y (Y
1
, Y
2
, . . . , Y
m
) con n y m grandes (n, m >30) de dos
poblaciones Bernouilli, B(1, p
1
) y B(1, p
2
).
Aunque las poblaciones no sean normales, se pueden resolver contrastes
para la diferencia de proporciones:
H
0
: p
1
= p
2
H
1
: p
1
= p
2
H
0
: p
1
= p
2
H
1
: p
1
> p
2
H
0
: p
1
= p
2
H
1
: p
1
< p
2
utilizando el Teorema Central del Lmite, que garantiza que:
p
1
p
2
_
p
0
(1 p
0
)
_
1
n
+
1
m
_

H
0
N(0, 1)
donde p
0
= p
1
= p
2
es la proporcion com un bajo H
0
que se estima
mediante:
p
0
=
n p
1
+ m p
2
n + m
.
Ejemplo 2.12.
Se quiere determinar si el paro en dos grandes areas urbanas del pas,
como son Madrid y Barcelona, es diferente. Para ello se toman muestras
aleatorias en ambas ciudades, cada una de 500 personas, obteniendose
que en Madrid 35 estaban desempleadas y en Barcelona 25. Existe
alguna razon para creer que las frecuencias de paro en Madrid y
Barcelona son diferentes?

Plantea el contraste oportuno con un nivel de signicacion del 5 %,


especicando claramente la hipotesis nula y alternativa que
consideras, as como las hipotesis de trabajo.

Vous aimerez peut-être aussi