Vous êtes sur la page 1sur 30

UNIVERSIDAD DE LOS ANDES

Facultad de Ingeniera Facultad de Ingeniera


Departamento de Ingeniera Industrial
Probabilidad y Estadstica I Probabilidad y Estadstica I
Sesiones # 24, 25 y 26
Pruebas de Hiptesis Pruebas de Hiptesis
Mario Castillo
(Coordinador General Curso)
1
Hiptesis Estadsticas
Cierto producto tiene hasta el momento, segn las estadsticas conocidas, una aceptacin del p , g , p
30% entre los compradores potenciales. Se ha hecho una mejora del producto y se quiere
establecer si dicho porcentaje de aceptacin ha cambiado.
Para tal efecto se plantean las siguientes hiptesis estadsticas:
Objetivo: Presentar tcnicas estadsticas que permiten con base en una muestra aleatoria de la
4 . 0 :
3 . 0 :
1
0
=
=
p H
p H
Objetivo: Presentar tcnicas estadsticas que permiten, con base en una muestra aleatoria de la
poblacin, tomar la decisin de rechazar (o aceptar) la hiptesis H
0
, aceptando (o rechazando)
la hiptesis H
1
.
Definiciones
- Hiptesis Estadsticas
- Prueba Estadstica (de H
0
contra H
1
)
- Hiptesis Nula e Hiptesis Alterna - Hiptesis Nula e Hiptesis Alterna.
- Regin Crtica, C
2
Hiptesis Estadsticas - Definiciones Bsicas
- Hiptesis Estadstica: Una hiptesis estadstica (HE) es una afirmacin acerca del valor Hiptesis Estadstica: Una hiptesis estadstica (HE) es una afirmacin acerca del valor
de los parmetros de la distribucin de una poblacin si dicha distribucin se conoce, sobre el
tipo de distribucin si sta es desconocida. Si la hiptesis especifica completamente la
distribucin, se le llama hiptesis simple, de lo contrario decimos que es una hiptesis
compuesta.
- Prueba estadstica (de H
0
contra H
1
): Una prueba para confrontar una hiptesis estadstica
H
0
contra una hiptesis estadstica H
1
(dichas hiptesis deben ser excluyentes) es una regla H
0
contra una hiptesis estadstica H
1
(dichas hiptesis deben ser excluyentes) es una regla
que permite tomar la decisin de aceptar rechazar la hiptesis H
0
(y consecuentemente
rechazar o aceptar H
1
), segn los valores obtenidos en la muestra aleatoria y de acuerdo con
cierto porcentaje admisible de error.
- Hiptesis nula e hiptesis alterna: En pruebas de hiptesis estadsticas, se acostumbra a
llamar hiptesis nula (H
0
) a aquella que se asume hasta el momento como verdadera, e
hiptesis alterna (H
1
) a aquella que se presenta como nueva alternativa a la hiptesis H
0
que hiptesis alterna (H
1
) a aquella que se presenta como nueva alternativa a la hiptesis H
0
que
hasta el momento apareca como verdadera.
- Regin crtica C: La regin crtica C asociada a la prueba de una hiptesis estadstica es el
j t d t d l ibl lt d d l t l t i l l l hi t i conjunto de todos los posibles resultados de la muestra aleatoria para los cuales la hiptesis
nula es rechazada, de acuerdo con la prueba aplicada.
3
Hiptesis Simples
Errores de Tipo I y de Tipo II - Nivel de Significancia de una Prueba
- ERROR de TIPO I:
RECHAZAR H
0
siendo H
0
VERDADERA
0 0
- ERROR de TIPO II:
ACEPTAR H
0
siendo H
0
FALSA
( ) ( )
= =
= /
0 0
CIA SIGNIFICAN DE NIVEL
VERDADERA H H RECHAZAR P I TIPO ERROR P
( ) ( )
( )
( )

=
=
= =
/
/
0 0
FALSA H H RECHAZAR P
T P T PRUEBA LA DE POTENCIA
FALSA H H ACEPTAR P II TIPO ERROR P
( )
( ) = =
=
1 / 1
/
0 0
0 0
FALSA H H ACEPTAR P
FALSA H H RECHAZAR P
4
Resumen Errores de Tipo I y II
HIPTESIS VERDADERA
H H H
0
H
1
H
Decisin Acertada
1
*
HIPTESIS
H
0
p = 1 -
Error de Tipo II
p =
*
Decisin Acertada
ACEPTADA
H
1
Error de Tipo I
p =
Decisin Acertada
Potencia de la prueba
p = 1 -
5
Ejemplo - Contenido de la Cerveza
De acuerdo con las normas establecidas por el gobierno el contenido X de las De acuerdo con las normas establecidas por el gobierno, el contenido, X, de las
cervezas de determinada presentacin (250 cc) debe seguir una distribucin
N(250, 100).
Supongamos que hay dudas sobre si la compaa LA CAMPEONA est violando la Supongamos que hay dudas sobre si la compaa LA CAMPEONA est violando la
norma de contenido, embotellando en promedio nicamente 245 cc.
En ese caso, podramos formular, por ejemplo, las siguientes hiptesis
t d ti estadsticas:
H
0
: = 250,
H
1
: = 245
6
Se toma una MA de 100 cervezas de la marca mencionada,
de acuerdo con un plan de muestreo apropiadamente p p p
diseado.
Se formulan las siguientes pruebas estadsticas:
T
1
: Rechazar H
0
249
T
2
: Rechazar H
0
248

X

T
2
: Rechazar H
0
248
T
3
: Rechazar H
0
246

X
X

Cul ser la prueba ms apropiada si el mximo Error de


Tipo I permitido es = 0.05?

7
Solucin Ejemplo Cerveza
T1: Rechazar H si 249
X
H
0
: = 250,
H
1
: = 245
T1: Rechazar H
o
si 249.
= P (Rechazar H
o
/ H
o
verdadera)
= P( 249 / X es N (250, 100)); => es N (250, 100/100)
= P( Z (249 250) )
X
X
X
P( Z (249 250) )
= P( Z -1 )
= 1 0.8413 = 0.1587 (Como se puede observar es mayor que 0.05)
= P (No rechazar H
o
/ H
o
falsa)
= P( > 249 / X es N (245, 100)); => es N(245, 100/100)
= P( Z > (249 245) )
X X
( ( ) )
= P( Z > 4 )
= 1 1 = 0
Realizar el mismo anlisis para las pruebas T2 y T3 y concluir.
8
Definicin de la MRC de tamao : Sea el conjunto de todos los resultados posibles
de la muestra aleatoria. Se dice que C es la Mejor Regin Crtica de tamao si para
Hiptesis Estadsticas
de la muestra aleatoria. Se dice que C es la Mejor Regin Crtica de tamao si para
cualquier otra regin crtica A se tiene que:
P((x
1
,,x
n
) A | H
0
) =
P((x
1
,,x
n
) C | H
0
FALSA) P((x
1
,,x
n
) A | H
0
FALSA)

Criterio de Neyman Pearson


Sea X una VA con f
x
(x;), y X
1
,X
2
,X
3
,,X
n
una MA X.
Se quiere confrontar la hiptesis estadsticas simples: Se quiere confrontar la hiptesis estadsticas simples:
H
0
: =
0
= {
0
,
1
}
H
1
: =
1
C l MRC d t f t H H k 0 t l C es la MRC de tamao para confrontar H
0
y H
1
k > 0 tal que:
i) En donde L
0
= L(
0
; x
1
,,x
n
) y L
1
= L (
1
; x
1
,,x
n
)


C ) x ,..., (x ,
n 1
1
0
k
L
L
ii)
iii)
C ) x ,..., (x ,
n 1
1
0
k
L
L
) | ) ,..., , (
2 1
= Ho C x x x P
n
9
Ejemplo 1: X N(,1), y x
1
,x
2
,,x
n.
una MA de tamao n de X. Hallar la MRC de tamao
para confrontar las hiptesis simples
H
0
: = 0 H
0
: 0
H
1
: = 1, con espacio paramtrico = {0,1}
Desarrollo:
Pasos: 1. Formule con precisin la razn de verosimilitud L
o
/L
1
2. Determine la forma de la regin
3. Precise la regin utilizando la restriccin del tamao de la RC
2
ke e
n
x
i

0 on
1
2
1
) 1 (
1
1
) 0 (
2
1
0
2
2
k c k
e
L
L
n
x
n
i
x
i
i
> =

2 ) ln(
' 2 ) ln(
n k x
k n k x
ke e
i
i
+
=

2
2
1
-
e
2
2
1
-
e
2
1
1
) 1 (
2
1
i
x
i
x
e
L
i
x
i

=

}
'
: ) ,..., {(
2 ) ln(
1
n
k
n
x
x x C
n k x
i
n
i
=
+


2
n
- )
2
(
2
1
-
e
2
e
) 1 2
2
(
2
1
-
e
2
e
k
e
i
x
e
i
x
i
x
i
x

+
=
}
'
: ) ,..., {( *
1
n
k
n
x
x x C
i
n
< =

10
Hiptesis Estadsticas
H
0
3. P( X k | H
0
) = ; sea = 0.05 y n = 100 => X N(0, 1/100)
0.05 = P( X k | H
0
) = 1 - P( X < k | H
0
)
= 1 P((X 0)/(1/10) k/(1/10))
H
0
= 1 - (10K) = 0.05 =>
= (10K) = 0.95 =>
= 10k = 1.645

=> k = 0.1645 =>


La MRC de tamao = 0.05 est dada por:
C = {(x
1
,,x
100
) : X 0.1645}
Ejercicio 1: Hallar = P( NO RECHAZAR H | H es falsa) Ejercicio 1: Hallar = P( NO RECHAZAR H
0
| H
0
es falsa)
Ejercicio 2, Sea x
1
,x
2
,,x
n.
una MA de tamao n de X Poisson(). Encuentre la
MRC para confrontar H
0
: = 2, H
1
: = 5, usando un nivel de significancia de 0.064 y
4 n=4.
11
Pruebas de Hiptesis Sntesis
Procedimiento General Procedimiento General
1. Establezca las hiptesis Nula y Alterna.
2. Defina el nivel de significancia de la prueba.
3. Seleccione un estadstico de prueba adecuado.
4 Establezca la regin crtica con base en 4. Establezca la regin crtica con base en .
5. A partir del estadstico de prueba calculado, rechace H
o
si el
estadstico de prueba est en la regin crtica. De lo contrario, no
rechace H
o
.
6. Produzca sus conclusiones.
12
Pruebas de Hiptesis Sntesis
Algunas Pruebas de Especial Inters en las Aplicaciones
Caso 1: H
0
: =
0
T: Intervalos de Confianza de dos colas basado en un estimador
H
1
:
o
apropiado de .
Algunas Pruebas de Especial Inters en las Aplicaciones
Caso 2A: H
0
: =
0
H
1
: >
0
T: Intervalos de Confianza de una Cola Pruebas Uniformemente ms
Potentes Potentes
Caso 2B: H
0
: =
0
.
H
1
: <
0
Pruebas sobre la Media :
En particular si: , utilizar como estimador
) 1 , 0 (
) X (
) , N( X
0
0
2
0
N n
H

X
X N(,
2
), , desconocidos
0

) 1 (
) - X (

0
0
n t n
S
H

13
Pruebas para las Diferencias de Medias de dos Poblaciones
Pruebas de Hiptesis
Pruebas para las Diferencias de Medias de dos Poblaciones
Independientes:
En particular si X N(
X
,
X
2
) con
Y N(
2
) y conocidas Y N(
Y
,
Y
2
)
X
y
Y
conocidas.
H
0
:
X

Y
= : UTILIZAR
) 1 , 0 (
- Y - X
0
2 2
0
N
H

H
0
:
X

Y
=
2 2
n n
Y
Y
X
X
+

0

H
0
:
X

Y
Si X N(
X
,
2
)
2
desconocida, UTILIZAR
Y N(
Y
,
2
)
) 2 (
1 1
- Y - X
0
+
+
Y X
P
n n t
S

0
(
Y
, )
+
Y X
P
n n
S
2
) 1 ( ) 1 (
2 2
2
+
=
Y Y X X
P
S n S n
S Con
2 +
Y X
P
n n
14
Pruebas de Hiptesis
Pruebas sobre la Varianza:
X N(,
2
)
2
H
0
:
2 =

0
2
H
1
:
2
>
0
2
) 1 ( ) 1 (
2
2
0
2
n
S
n
X

15
Pruebas
2
Pruebas
Bondad de Ajuste - Crystal Ball
Anlisis de Contingencia g
16
Pruebas X
2
Consideremos un experimento aleatorio y llamemos al espacio muestral asociado; sea
A
1
, A
2
, ..., A
m
una particin de , es decir, una familia de subconjuntos (eventos) de tales
que:
= A A A con AA = si i j = A
1
A
2
... A
m
con A
i
A
j
= si i j.
Supongamos que realizamos n veces el experimento; para cada realizacin del experimento
el resultado de ste estar en uno y slo uno de los eventos A
i
:

Definamos p
i
y X
i
por:

p
i
= P(Resultado del experimento caiga en A
i
en una realizacin del mismo)
= P(A
i
); como resultado de la definicin se obtiene que 1 p
m
1 i
i
=

=
.
X
i
= Nmero de veces en que el resultado del experimento cae en A
i
, de las n
realizaciones del mismo realizaciones del mismo.

A partir de tales supuestos, es posible demostrar que la VA definida por


=
m
1 i
i
2
i i
1 m
np
) np X (
Y tiene aproximadamente una distribucin del tipo
2
(m-1)
.
17
Prueba X
2
para Bondad de Ajuste

La estadstica


=
m
1 i
i
2
i i
1 m
np
) np X (
Y
se utiliza para probar la hiptesis,

H
0
: p
1
= p
1
*
, p
2
= p
2
*
, ..., p
m-1
= p
m-1
*
, contra la hiptesis H
1
: al menos uno de los p
i
p
i
*
,

Donde los p
i
*
son constantes dadas.

La prueba
2
consiste en lo siguiente: Como tericamente la VA


=
m
1 i
2
i i
1 m
np
) np X (
Y tiene aproximadamente una distribucin del tipo
2
(m-1)
,
=1 i
i
np

entonces, dependiendo del nivel de significancia que nos dan para la prueba, determinamos el
punto crtico b

definido por

1-
f
2
(m-1)
m - 1

b


Si la estadstica calculada Y
m-1,C
segn los valores de la muestra cumple que, Y
m-1,C
b

,
entonces aceptamos la hiptesis nula de lo contrario la rechazamos
18
entonces aceptamos la hiptesis nula, de lo contrario la rechazamos.
Prueba X
2
para Bondad de Ajuste
19
Bondad de Ajuste Ejemplo 2 Bondad de Ajuste Ejemplo 2
La distribucin de los ingresos anuales expresados en dlares de una
muestra aleatoria de 100 familias que habitan en cierta poblacin present q p p
los siguientes resultados:

Ingresos anuales Nro. de familias g
en miles de
dlares
40 X 60
12
40 X 60
60 < X 80
8
80 < X 100
25
100 < X 120
30
100 < X 120
30
120 < X 140
25

Puede admitirse que los ingresos X de las familias que habitan en dicha Puede admitirse que los ingresos X de las familias que habitan en dicha
poblacin, siguen una distribucin uniforme en el intervalo [40.000,
140.000], con un nivel de significancia de = 0.05?
20
Bondad de Ajuste Ejemplo 1
Desarrollo:

Definamos los eventos A
1
, ... A
5
segn los 5 rangos presentados en la tabla. Si
asumimos que los ingresos estn uniformemente distribuidos entre US $40.000 y
US $140 000 entonces como todos los rangos tienen la misma longitud se debe US $140.000 entonces como todos los rangos tienen la misma longitud, se debe
tener que P(A
i
) = p
i
= 1/5 para i = 1,2,...,5, obteniendo la siguiente tabla para la
prueba:

Rango X
i
p
i
np
i
X
i
- np
i
(X
i
- np
i
)
2
(X
i
- np
i
)
2
/ np
i
A
1
12 0.20 20 -8 64 3.2
A
2
8 0.20 20 -12 144 7.2
A 25 0 20 20 5 25 1 25 A
3
25 0.20 20 5 25 1.25
A
4
30 0.20 20 10 100 5
A
5
25 0.20 20 5 25 1.25

De lo cual resulta que la estadstica calculada segn la muestra aleatoria nos da
Y
4,6
= 17.9, mientras que el valor crtico de b

para una
2
con cuatro grados de
libertad y = 0.05 nos da segn las tablas b

= 9.49.
Como Y
4,6
= 17.9 > b

= 9.49, debemos rechazar la hiptesis de que los ingresos


de dichas familias estn uniformemente distribuidos en el intervalo [40.000,
140.000].
21
Bondad de Ajuste: Ejemplo 2


Se toma una MA de tamao 80 de una poblacin distribuida en el intervalo (0,1) segn la FDP
x 2 ) x ( f
X
= , si x (0,1), 0 si no
Consideramos los siguientes eventos relacionados con el experimento aleatorio:

A
1
= (0,), A
2
= (,), A
3
= (,1)

Se encontr la siguiente reparticin de los valores de la MA

6 valores en A
1

18 valores en A
2

56 valores en A
3


Con base en los resultados observados en la muestra aleatoria, es vlido suponer que la poblacin sigue
realmente la distribucin especificada, asumiendo un nivel de significancia de = 0.025?

Desarrollo:
Para tili ar el modelo antes descrito es necesario erificar si se c mplen las hiptesis calc lar los Para utilizar el modelo antes descrito, es necesario verificar si se cumplen las hiptesis y calcular los
diferentes trminos de la estadstica Y
m -1
, lo cual haremos a continuacin.

Claramente la unin de los eventos A
1
, A
2
, A
3
nos da el espacio muestral asociado = (0,1). Los
diferentes trminos se calculan de la manera siguiente: diferentes trminos se calculan de la manera siguiente:

m = nmero de eventos de la particin = 3
n = tamao de la muestra = 80
22
Bondad de Ajuste: Ejemplo 1

4 / 1
16 / 1
2
x
2 xdx 2 ) A ( P p
4 / 1
0
2
4 / 1
0
1 1
=

= = =



2 / 1
2 / 1
16 / 3 6 / 1 4 / 1 x xdx 2 ) A ( P p
2 / 1
4 / 1
2
2 / 1
4 / 1
2 2
= = = = =

; p
3
= P(A
3
) = 12/16

De lo cual resulta que la hiptesis nula H
0
es: H
0
: p
1
= 1/16, p
2
= 3/16, p
3
= 12/16.

La estadstica Y
m-1
calculada que la notamos Y
m-1,C
estar dada por:

)] 16 / 12 ( 80 56 [ )] 16 / 3 ( 80 18 [ )] 16 / 1 ( 80 6 [ ) 80 (
2 2 2 3 2
2

+

i i
C
p X
Y
066 . 1
15
16
60
64
60
16
15
9
5
1
) 16 / 12 ( 80 ) 16 / 3 ( 80 ) 16 / 1 ( 80 80
1
, 2
= = = + + =
+ +

= i i
C
p
Y

2
Segn el modelo la VA Y
2
debe seguir una distribucin del tipo
2
(2). Para un nivel de significancia de =
0.025, el valor crtico b

se obtiene utilizando las tablas de la


2
(2) y la ecuacin:

( ) 975 . 0 b X P

) 2 (
2
= , de la cual se deduce segn las tablas que b

= 7.38 ( )

) 2 (
g

Entonces, como la estadstica calculada, Y
2,C
= 1.066 < b

= 7.38.Se puede concluir que s es vlido


suponer que la poblacin en cuestin tiene una FDP asociada x 2 ) x ( f
X
= , para 0 < x < 1.
23

Pruebas X
2 :
Anlisis de Contingencia Utilizando la Estadstica
( ) 1
) (
2
2

np x
Y
m
i i
En el mismo contexto de las pruebas
2
consideremos la situacin en la que el resultado de un
Experimento Aleatorio se puede analizar con respecto a 2 atributos A y B
( ) 1
) (
2
1
=

=
m
np
np x
Y
i
i
i i

Experimento Aleatorio se puede analizar con respecto a 2 atributos A y B.


A = A
1
UA
2
UUA
k
A
i
A
j
=
B = B
1
UB
2
UUB
l
B
i
B
j
=
Definimos C
ij
= A
i
B
j
Sea P(C
ij
) = p
ij
= P(A
i
B
j
)
Si los atributos A y B fueran independientes
ij : P(A
i
B
j
) = P(A
i
)P(B
j
) = p
i
.p.
j
j (
i j
) (
i
) (
j
) p
i
p
j
Definamos la VA:
X
ij
= # de veces en que los n exp. aleatorios cayeron en C
ij

= =
k
i
ij j
l
j
ij i
X X X X
1 1

24
PRUEBAS X
2
) (
2
X
l k
Estamos interesados en construir una prueba para establecer si A y B son o no independientes:
) 1 ( distrib. una mente aproximada tiene
) (
2
1 1
2

= =
kl
np
np X
Y
l
j
k
i ij
ij ij

Estamos interesados en construir una prueba para establecer si A y B son o no independientes:


A y B son independientes P(C
ij
) = P(A
i
B
j
) = P(A
i
)P(B
j
)
p
ij
= p
i
. x p.
j

Es necesario estimar cada p


i
. y cada p.
j
por:

=
= =
k
l
j
ij i
i
i
X
X X
n
X
P
1
.
.
.

dado ,

=
= =
i
ij j
j
j
X X
n
X
P
1
.
.
.
dado ,

)

(
2
l k
kl 1 k 1 l 1
) 1 )( 1 (( )) 1 ( ) 1 ( 1 (

) (

2 2
1 1
. .
2
. .
=

= =
l k l k kl
P P n
P P n X
Y
l
j
k
i
j i
j i ij

= kl 1 k + 1 l 1
= kl k l +1
= (k - 1)(l - 1)
25
Resolver Ejemplo 14.14, texto gua, pgina 592.
26
27
28
Otros Ejercicios Propuestos
3. Los profesores del curso de P&E I estn analizando dos variables relacionadas con sus
estudiantes: el nmero de horas que dedican diariamente a navegar por internet y el
nmero de horas que dedican diariamente a ver TV. Como un paso importante del q p p
anlisis se debe establecer si las varianzas de las dos variables son iguales o si por el
contrario la varianza del tiempo que se dedica a navegar por internet es mayor que la
varianza del tiempo dedicado a ver TV. Usando el archivo Ejercicios PH.xlsx formule
adecuadamente una prueba de hiptesis que le permita establecer si existe diferencia adecuadamente una prueba de hiptesis que le permita establecer si existe diferencia
entre las varianzas. Utilice un nivel de significancia del 5% y analice sus resultados.
4. Los profesores del curso de P&E I afirman que sus estudiantes dedican diariamente, en
promedio, al menos una hora ms a navegar por internet que a ver TV. Usando el
archivo Ejercicios PH.xlsx formule adecuadamente una prueba de hiptesis que le j p p q
permita concluir acerca de dicha afirmacin. Utilice un nivel de significancia del 5% y
analice sus resultados. Las desviaciones poblacionales son conocidas e iguales a 9,901
horas para internet y 4,518 horas para TV.
29
5. Se sospecha que el nmero de unidades defectuosas x, en un lote de tamao n=3,
sigue una distribucin Binomial. Realice una prueba Ji-cuadrada con =0,05 para
rechazar o no rechazar la hiptesis nula de que la siguiente muestra de 200 lotes
proviene de una distribucin Binomial con parmetros (N=200, p). La frecuencia
observada que aparece a continuacin se refiere al nmero de lotes de tamao 3 en los observada que aparece a continuacin se refiere al nmero de lotes de tamao 3 en los
que se encontraron xi unidades defectuosas. Para facilitar los clculos se recomienda
redondear los valores de la frecuencia esperada.
Xi F i F i Xi Frecuencia
Observada
Frecuencia
Esperada
0 85
1 82
Totales 200
2 25
3 8

Totales 200
30

Vous aimerez peut-être aussi