Académique Documents
Professionnel Documents
Culture Documents
=
=
= =
/
/
0 0
FALSA H H RECHAZAR P
T P T PRUEBA LA DE POTENCIA
FALSA H H ACEPTAR P II TIPO ERROR P
( )
( ) = =
=
1 / 1
/
0 0
0 0
FALSA H H ACEPTAR P
FALSA H H RECHAZAR P
4
Resumen Errores de Tipo I y II
HIPTESIS VERDADERA
H H H
0
H
1
H
Decisin Acertada
1
*
HIPTESIS
H
0
p = 1 -
Error de Tipo II
p =
*
Decisin Acertada
ACEPTADA
H
1
Error de Tipo I
p =
Decisin Acertada
Potencia de la prueba
p = 1 -
5
Ejemplo - Contenido de la Cerveza
De acuerdo con las normas establecidas por el gobierno el contenido X de las De acuerdo con las normas establecidas por el gobierno, el contenido, X, de las
cervezas de determinada presentacin (250 cc) debe seguir una distribucin
N(250, 100).
Supongamos que hay dudas sobre si la compaa LA CAMPEONA est violando la Supongamos que hay dudas sobre si la compaa LA CAMPEONA est violando la
norma de contenido, embotellando en promedio nicamente 245 cc.
En ese caso, podramos formular, por ejemplo, las siguientes hiptesis
t d ti estadsticas:
H
0
: = 250,
H
1
: = 245
6
Se toma una MA de 100 cervezas de la marca mencionada,
de acuerdo con un plan de muestreo apropiadamente p p p
diseado.
Se formulan las siguientes pruebas estadsticas:
T
1
: Rechazar H
0
249
T
2
: Rechazar H
0
248
X
T
2
: Rechazar H
0
248
T
3
: Rechazar H
0
246
X
X
7
Solucin Ejemplo Cerveza
T1: Rechazar H si 249
X
H
0
: = 250,
H
1
: = 245
T1: Rechazar H
o
si 249.
= P (Rechazar H
o
/ H
o
verdadera)
= P( 249 / X es N (250, 100)); => es N (250, 100/100)
= P( Z (249 250) )
X
X
X
P( Z (249 250) )
= P( Z -1 )
= 1 0.8413 = 0.1587 (Como se puede observar es mayor que 0.05)
= P (No rechazar H
o
/ H
o
falsa)
= P( > 249 / X es N (245, 100)); => es N(245, 100/100)
= P( Z > (249 245) )
X X
( ( ) )
= P( Z > 4 )
= 1 1 = 0
Realizar el mismo anlisis para las pruebas T2 y T3 y concluir.
8
Definicin de la MRC de tamao : Sea el conjunto de todos los resultados posibles
de la muestra aleatoria. Se dice que C es la Mejor Regin Crtica de tamao si para
Hiptesis Estadsticas
de la muestra aleatoria. Se dice que C es la Mejor Regin Crtica de tamao si para
cualquier otra regin crtica A se tiene que:
P((x
1
,,x
n
) A | H
0
) =
P((x
1
,,x
n
) C | H
0
FALSA) P((x
1
,,x
n
) A | H
0
FALSA)
C ) x ,..., (x ,
n 1
1
0
k
L
L
ii)
iii)
C ) x ,..., (x ,
n 1
1
0
k
L
L
) | ) ,..., , (
2 1
= Ho C x x x P
n
9
Ejemplo 1: X N(,1), y x
1
,x
2
,,x
n.
una MA de tamao n de X. Hallar la MRC de tamao
para confrontar las hiptesis simples
H
0
: = 0 H
0
: 0
H
1
: = 1, con espacio paramtrico = {0,1}
Desarrollo:
Pasos: 1. Formule con precisin la razn de verosimilitud L
o
/L
1
2. Determine la forma de la regin
3. Precise la regin utilizando la restriccin del tamao de la RC
2
ke e
n
x
i
0 on
1
2
1
) 1 (
1
1
) 0 (
2
1
0
2
2
k c k
e
L
L
n
x
n
i
x
i
i
> =
2 ) ln(
' 2 ) ln(
n k x
k n k x
ke e
i
i
+
=
2
2
1
-
e
2
2
1
-
e
2
1
1
) 1 (
2
1
i
x
i
x
e
L
i
x
i
=
}
'
: ) ,..., {(
2 ) ln(
1
n
k
n
x
x x C
n k x
i
n
i
=
+
2
n
- )
2
(
2
1
-
e
2
e
) 1 2
2
(
2
1
-
e
2
e
k
e
i
x
e
i
x
i
x
i
x
+
=
}
'
: ) ,..., {( *
1
n
k
n
x
x x C
i
n
< =
10
Hiptesis Estadsticas
H
0
3. P( X k | H
0
) = ; sea = 0.05 y n = 100 => X N(0, 1/100)
0.05 = P( X k | H
0
) = 1 - P( X < k | H
0
)
= 1 P((X 0)/(1/10) k/(1/10))
H
0
= 1 - (10K) = 0.05 =>
= (10K) = 0.95 =>
= 10k = 1.645
X
X N(,
2
), , desconocidos
0
) 1 (
) - X (
0
0
n t n
S
H
13
Pruebas para las Diferencias de Medias de dos Poblaciones
Pruebas de Hiptesis
Pruebas para las Diferencias de Medias de dos Poblaciones
Independientes:
En particular si X N(
X
,
X
2
) con
Y N(
2
) y conocidas Y N(
Y
,
Y
2
)
X
y
Y
conocidas.
H
0
:
X
Y
= : UTILIZAR
) 1 , 0 (
- Y - X
0
2 2
0
N
H
H
0
:
X
Y
=
2 2
n n
Y
Y
X
X
+
0
H
0
:
X
Y
Si X N(
X
,
2
)
2
desconocida, UTILIZAR
Y N(
Y
,
2
)
) 2 (
1 1
- Y - X
0
+
+
Y X
P
n n t
S
0
(
Y
, )
+
Y X
P
n n
S
2
) 1 ( ) 1 (
2 2
2
+
=
Y Y X X
P
S n S n
S Con
2 +
Y X
P
n n
14
Pruebas de Hiptesis
Pruebas sobre la Varianza:
X N(,
2
)
2
H
0
:
2 =
0
2
H
1
:
2
>
0
2
) 1 ( ) 1 (
2
2
0
2
n
S
n
X
15
Pruebas
2
Pruebas
Bondad de Ajuste - Crystal Ball
Anlisis de Contingencia g
16
Pruebas X
2
Consideremos un experimento aleatorio y llamemos al espacio muestral asociado; sea
A
1
, A
2
, ..., A
m
una particin de , es decir, una familia de subconjuntos (eventos) de tales
que:
= A A A con AA = si i j = A
1
A
2
... A
m
con A
i
A
j
= si i j.
Supongamos que realizamos n veces el experimento; para cada realizacin del experimento
el resultado de ste estar en uno y slo uno de los eventos A
i
:
Definamos p
i
y X
i
por:
p
i
= P(Resultado del experimento caiga en A
i
en una realizacin del mismo)
= P(A
i
); como resultado de la definicin se obtiene que 1 p
m
1 i
i
=
=
.
X
i
= Nmero de veces en que el resultado del experimento cae en A
i
, de las n
realizaciones del mismo realizaciones del mismo.
A partir de tales supuestos, es posible demostrar que la VA definida por
=
m
1 i
i
2
i i
1 m
np
) np X (
Y tiene aproximadamente una distribucin del tipo
2
(m-1)
.
17
Prueba X
2
para Bondad de Ajuste
La estadstica
=
m
1 i
i
2
i i
1 m
np
) np X (
Y
se utiliza para probar la hiptesis,
H
0
: p
1
= p
1
*
, p
2
= p
2
*
, ..., p
m-1
= p
m-1
*
, contra la hiptesis H
1
: al menos uno de los p
i
p
i
*
,
Donde los p
i
*
son constantes dadas.
La prueba
2
consiste en lo siguiente: Como tericamente la VA
=
m
1 i
2
i i
1 m
np
) np X (
Y tiene aproximadamente una distribucin del tipo
2
(m-1)
,
=1 i
i
np
entonces, dependiendo del nivel de significancia que nos dan para la prueba, determinamos el
punto crtico b
definido por
1-
f
2
(m-1)
m - 1
b
Si la estadstica calculada Y
m-1,C
segn los valores de la muestra cumple que, Y
m-1,C
b
,
entonces aceptamos la hiptesis nula de lo contrario la rechazamos
18
entonces aceptamos la hiptesis nula, de lo contrario la rechazamos.
Prueba X
2
para Bondad de Ajuste
19
Bondad de Ajuste Ejemplo 2 Bondad de Ajuste Ejemplo 2
La distribucin de los ingresos anuales expresados en dlares de una
muestra aleatoria de 100 familias que habitan en cierta poblacin present q p p
los siguientes resultados:
Ingresos anuales Nro. de familias g
en miles de
dlares
40 X 60
12
40 X 60
60 < X 80
8
80 < X 100
25
100 < X 120
30
100 < X 120
30
120 < X 140
25
Puede admitirse que los ingresos X de las familias que habitan en dicha Puede admitirse que los ingresos X de las familias que habitan en dicha
poblacin, siguen una distribucin uniforme en el intervalo [40.000,
140.000], con un nivel de significancia de = 0.05?
20
Bondad de Ajuste Ejemplo 1
Desarrollo:
Definamos los eventos A
1
, ... A
5
segn los 5 rangos presentados en la tabla. Si
asumimos que los ingresos estn uniformemente distribuidos entre US $40.000 y
US $140 000 entonces como todos los rangos tienen la misma longitud se debe US $140.000 entonces como todos los rangos tienen la misma longitud, se debe
tener que P(A
i
) = p
i
= 1/5 para i = 1,2,...,5, obteniendo la siguiente tabla para la
prueba:
Rango X
i
p
i
np
i
X
i
- np
i
(X
i
- np
i
)
2
(X
i
- np
i
)
2
/ np
i
A
1
12 0.20 20 -8 64 3.2
A
2
8 0.20 20 -12 144 7.2
A 25 0 20 20 5 25 1 25 A
3
25 0.20 20 5 25 1.25
A
4
30 0.20 20 10 100 5
A
5
25 0.20 20 5 25 1.25
De lo cual resulta que la estadstica calculada segn la muestra aleatoria nos da
Y
4,6
= 17.9, mientras que el valor crtico de b
para una
2
con cuatro grados de
libertad y = 0.05 nos da segn las tablas b
= 9.49.
Como Y
4,6
= 17.9 > b
= = =
2 / 1
2 / 1
16 / 3 6 / 1 4 / 1 x xdx 2 ) A ( P p
2 / 1
4 / 1
2
2 / 1
4 / 1
2 2
= = = = =
; p
3
= P(A
3
) = 12/16
De lo cual resulta que la hiptesis nula H
0
es: H
0
: p
1
= 1/16, p
2
= 3/16, p
3
= 12/16.
La estadstica Y
m-1
calculada que la notamos Y
m-1,C
estar dada por:
)] 16 / 12 ( 80 56 [ )] 16 / 3 ( 80 18 [ )] 16 / 1 ( 80 6 [ ) 80 (
2 2 2 3 2
2
+
i i
C
p X
Y
066 . 1
15
16
60
64
60
16
15
9
5
1
) 16 / 12 ( 80 ) 16 / 3 ( 80 ) 16 / 1 ( 80 80
1
, 2
= = = + + =
+ +
= i i
C
p
Y
2
Segn el modelo la VA Y
2
debe seguir una distribucin del tipo
2
(2). Para un nivel de significancia de =
0.025, el valor crtico b
= 7.38 ( )
) 2 (
g
Entonces, como la estadstica calculada, Y
2,C
= 1.066 < b
np x
Y
m
i i
En el mismo contexto de las pruebas
2
consideremos la situacin en la que el resultado de un
Experimento Aleatorio se puede analizar con respecto a 2 atributos A y B
( ) 1
) (
2
1
=
=
m
np
np x
Y
i
i
i i
= =
k
i
ij j
l
j
ij i
X X X X
1 1
24
PRUEBAS X
2
) (
2
X
l k
Estamos interesados en construir una prueba para establecer si A y B son o no independientes:
) 1 ( distrib. una mente aproximada tiene
) (
2
1 1
2
= =
kl
np
np X
Y
l
j
k
i ij
ij ij
=
= =
k
l
j
ij i
i
i
X
X X
n
X
P
1
.
.
.
dado ,
=
= =
i
ij j
j
j
X X
n
X
P
1
.
.
.
dado ,
)
(
2
l k
kl 1 k 1 l 1
) 1 )( 1 (( )) 1 ( ) 1 ( 1 (
) (
2 2
1 1
. .
2
. .
=
= =
l k l k kl
P P n
P P n X
Y
l
j
k
i
j i
j i ij
= kl 1 k + 1 l 1
= kl k l +1
= (k - 1)(l - 1)
25
Resolver Ejemplo 14.14, texto gua, pgina 592.
26
27
28
Otros Ejercicios Propuestos
3. Los profesores del curso de P&E I estn analizando dos variables relacionadas con sus
estudiantes: el nmero de horas que dedican diariamente a navegar por internet y el
nmero de horas que dedican diariamente a ver TV. Como un paso importante del q p p
anlisis se debe establecer si las varianzas de las dos variables son iguales o si por el
contrario la varianza del tiempo que se dedica a navegar por internet es mayor que la
varianza del tiempo dedicado a ver TV. Usando el archivo Ejercicios PH.xlsx formule
adecuadamente una prueba de hiptesis que le permita establecer si existe diferencia adecuadamente una prueba de hiptesis que le permita establecer si existe diferencia
entre las varianzas. Utilice un nivel de significancia del 5% y analice sus resultados.
4. Los profesores del curso de P&E I afirman que sus estudiantes dedican diariamente, en
promedio, al menos una hora ms a navegar por internet que a ver TV. Usando el
archivo Ejercicios PH.xlsx formule adecuadamente una prueba de hiptesis que le j p p q
permita concluir acerca de dicha afirmacin. Utilice un nivel de significancia del 5% y
analice sus resultados. Las desviaciones poblacionales son conocidas e iguales a 9,901
horas para internet y 4,518 horas para TV.
29
5. Se sospecha que el nmero de unidades defectuosas x, en un lote de tamao n=3,
sigue una distribucin Binomial. Realice una prueba Ji-cuadrada con =0,05 para
rechazar o no rechazar la hiptesis nula de que la siguiente muestra de 200 lotes
proviene de una distribucin Binomial con parmetros (N=200, p). La frecuencia
observada que aparece a continuacin se refiere al nmero de lotes de tamao 3 en los observada que aparece a continuacin se refiere al nmero de lotes de tamao 3 en los
que se encontraron xi unidades defectuosas. Para facilitar los clculos se recomienda
redondear los valores de la frecuencia esperada.
Xi F i F i Xi Frecuencia
Observada
Frecuencia
Esperada
0 85
1 82
Totales 200
2 25
3 8
Totales 200
30