Académique Documents
Professionnel Documents
Culture Documents
Prueba) de Hiptesis
1. Estimacin puntual.
2. Estimacin por intervalos.
3. Test de hiptesis.
r a l i t r b u i o n : m = 0 , s2 = 1
0 . 3
0.95 probabilidad
0.025 regin de
0 . 2
0.025 regin
rechazo de rechazo
f ( x
0 . 1 Regin de no
rechazo
. 0
- 5
-4 -3 -2 -1 0 1 2 3 4
Valor crtico Valor crtico
z = -1.96 z = 1.96
Hiptesis nula unilateral a derecha ( 0)
Distribucin de muestreo para la estadstica z
r a l i t r b u i o n : m = 0 , s2 = 1
0 . 3
0.95 probabilidad
0 . 2 0.05 regin de
rechazo
f ( x
0 . 1
Regin de no
. 0 rechazo
- 5
0 1 2 3 4
Valor Critico
z = 1.65
Hiptesis nula unilateral a izquierda ( 0)
Distribucin de muestreo para la estadstica z
r a l i t r b u i o n : m = 0 , s2 = 1
0 . 3
0.95 probabilidad
0 . 2
0.05 regin de
rechazo
f ( x
0 . 1
Regin de no
Regin de no
. 0
rechazo
rechazo
- 5
Valor 0 1 2 3 4
crtico
z= -1.65
Distribuciones de probabilidad para muestras
pequeas
1. Distribucin t de Student
3. Distribucin F de Fisher
13
1) Distribucin t de Student
La distribucin muestral del promedio se ajusta muy bien a la
distribucin Normal cuando se conoce . Si n es grande, esto
no presenta ningn problema, aun cuando sea
desconocida, por lo que en este caso es razonable sustituirla
por s.
Sin embargo, en el caso de usar valores de n < 30, o sea en
el caso de pequeas muestras, esto no funciona tan bien.
Definiendo el estadstico t:
x-m
t=
s/ n
Se puede probar que siendo `x el promedio de una
muestra tomada de una poblacin normal con media m y
varianza s2, el estadstico t es el valor de una variable
aleatoria con distribucin t de Student y parmetro (Ni,
grados de libertad) = n - 1.
Caractersticas de la Distribucin t de Student
Tiene media igual a 0, es asinttica al eje x y su
dominio va de - a + ;
El rea bajo la curva, desde - a + es igual a 1
m = 0, la s2 depende del parmetro (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n
Al aumentar n, la distribucin t se aproxima a la
Normal; n >= 30, excelente aproximacin
Entre las aplicaciones:
Estimacin de intervalos de confianza para medias a partir de
muestras pequeas.
Pruebas de hiptesis basadas en muestras pequeas (n <
30)
Forma de la distribucin Normal estandarizada y la t-Student
9-3
9-3
1,9666 2
P( x 1,9666) = T = T (1,366) = 0,1
0,025
La probabilidad de que la media sea menor a 1,9666 kg es 0,1.
SOLUCION
2
(n -1) s
=2
s 2
Grficos de Chi-cuadrado (2)
df = Degrees of freedom
Caractersticas de la distribucin Ji-cuadrado
Asimtrica y asinttica al eje X por la derecha
Su dominio va de 0 a +
rea bajo la curva desde 0 a + = 1
Tiene parmetro = n-1 (gl)
Al aumentar n se aproxima a la normal
Representa distribucin muestral de varianza.
Entre las aplicaciones:
Determinacin de intervalos de confianza para varianzas
Pruebas de hiptesis para una varianza
Tablas de contingencia
El ajuste de datos a una distribucin dada conocida
Las pruebas de independencia.
EJEMPLO (supervivencia en el Titanic)
1) Grados de libertad:
K = (nmero de filas - 1)*(nmero de columnas - 1)
= (3 - 1)*(2 - 1) = 2
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
2
g .l .; = 2
2;0, 05 = 5,99
SIGNIFICADO: La probabilidad de obtener un
valor mayor que 5,99 es 0,05
Distribucin de
probabilidad
Chi cuadrado
s2
F es el valor de una variable aleatoria que tiene una
distribucin F con parmetros 1 = n1 - 1 y 2 = n2 - 1.
Propiedades de la distribucin F
SOLUCIN
a.
P( F 1,97) = 1 0,9 = 0,1 para v1 = 15 y v2 = 15
d
t= ; Pares.de.medias; d i . para.cada. par
Sd / n
( n 1) S 2
X 2
= ; DF = ( n 1); prueba.una.v ar ianza
s 2
(O E ) 2
X2 = ; DF = ( r 1)(c 1); bondad .ajuste
E
43
RESUMEN DE ERRORES DE LA PRUEBA DE HIPTESIS
Condicin verdadera
Conclusiones de la
muestra H0 es verdadero H0 es falso
48,5 50 51,5
Valores Crticos
Errores Tipo I y Tipo II...
Ho z 1
ACEPTACIN RECHAZO
Valor crtico
Grfica de los errores Tipo I y Tipo II...
Si disminuimos aumenta
Ho z 1
ACEPTACIN RECHAZO
Valor crtico
Error Tipo I
A la probabilidad de cometer un error de tipo I (riesgo del
productor) se denota por , y se le llama el nivel o tamao de
significancia de la prueba es decir:
= P(error Tipo I) = P(rechazar H0 | H0 es verdadera)
Ejemplo: Calcular para el ejemplo (Vuelos Areos) de la rapidez de
combustin para una muestra de n = 10 datos, suponiendo que la desviacin
estndar de la rapidez de combustin es s = 2.5 cm/s y = P( x caiga en la
regin crtica | m = 50), es decir:
_ _
= P( x < 48.5) + P( x > 51.5)
_
Recordando que la distribucin de x es Normal con media m = 50 y desviacin
estndar s/n = 0,79:
= 0,0576 (Verificar)
0.4
0.3
0.2
0.1
0
45 46 47 48 49 50 51 52 53 54 55
_
De acuerdo a la figura: = P(48,5 x 51,5 | m = 52)
= 0,2643 (Verifica)
Error tipo II...
La probabilidad de obtener un error de tipo II aumenta muy
rpido a medida que el valor verdadero m tiende al valor
hipottico, por ejemplo, si suponemos que m = 50,5, y
recalculamos , obtenemos:
= 0,8923 (Verifica)
NOTA:
Una manera en que podemos controlar la probabilidad de cometer un error del
tipo II, consiste en aumentar el tamao de la muestra. Tamaos ms grandes
de muestra, permitirn detectar diferencias incluso muy pequeas entre las
estadsticas de muestra y los parmetros de la poblacin. Cuando se
disminuye , aumentar de modo que una reduccin en el riesgo de cometer
un error de tipo I tendr como resultado un aumento en el riesgo de cometer un
error tipo II.
La potencia de prueba 1- representa la sensibilidad de la prueba estadstica
para detectar cambios que se presentan al medir la probabilidad de rechazar la
hiptesis nula cuando de hecho es falsa. La potencia de la prueba estadstica
depende de qu tan diferente en realidad es la media verdadera de la
poblacin del valor supuesto.
Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera
utilizar siempre que sea adecuado especificar la direccin de la hiptesis alternativa.
Conclusin Fuerte y Dbil
/2
X = 43 p/2
Valor p...
X = 50
Valor P...
X m
z= N (0;1)
s/ n
el cual se distribuye como una Normal de media 0 y desvo estndar 1.
Sustituyendo:
x m 0 19 14
z= = = 3,03
s 7
n 18
Si Z > 1,645 rechazamos H0 al nivel de significancia del 5%
Con lo que se observa que el estadstico se sita en la regin
crtica y, por lo tanto no sigue el criterio de aceptacin de la
hiptesis nula.
Datos
H0: 1 = 800 H1: 2 800
= 40 h
X = 788
Significancia = 0,04
Propuesta de solucin
xm
t= t gl = n 1
S n 1 / n
el cual se distribuye como una t de Student con n - 1
grados de libertad.
Ejemplo 1. El gerente de la fbrica DC_OS
procesadora de cristal (templado, insulado y laminar),
afirma que la media del saldo para los clientes con
crdito es de US$410. El auditor interno selecciona
una muestra aleatoria de 18 cuentas y encuentra una
media de saldo de $511,33 y una desviacin
estndar de $183,75. Si la declaracin del gerente no
es apoyada por estos datos, el auditor pretende
examinar todos los saldos de las cuentas de crdito.
Se supone que la poblacin de saldos de crdito
tiene una distribucin aproximadamente normal,
qu accin debe emprender el auditor?
Propuesta de solucin:
Formular las hiptesis nula y alternativa (1)
H0: = 410 El saldo medio real es $410.
H1: 410 El saldo medio real es algn otro valor
Para evaluar la afirmacin del gerente, es adecuada una
prueba de dos colas, porque es una afirmacin no direccional
que puede rechazarse a causa de un resultado extremo en
cualquier direccin. El centro de distribucin de la hiptesis
para la media muestral, para una muestra de n = 18, ser 0 =
$410.
El estadstico de prueba es
,
xm
t= t gl = n 1
S n 1 / n
y se usar la distribucin t para describir la distribucin muestral
de la media para las muestras de n = 18. El centro de la
distribucin es 0 = $410, lo cual corresponde a t = 0,000.
km
p pHo
z= N (0,1) donde
sp =
pHo * qHo
sp n
Para esta prueba, se utilizar un nivel de significancia de 0.05. La suma de las reas de
las dos colas ser 0.05.
Propuesta de solucin:
Seleccionar el estadstico de la prueba y calcular su valor (3)
= 0.0324
= -1.23
Identificar los valores crticos para el estadstico de la
prueba y plantear la regla de decisin (4)
= 0.92
Propuesta de solucin
(4)
(5)
Propuesta de solucin
Donde:
y : medias muestrales 1 y 2.
: diferencia hipottica entre las medias
poblacionales.
n1 y n2 : tamaos de las muestras 1 y 2.
s1 y s2 : desviaciones estndar de las muestras 1 y 2.
Ejemplo
Tratamiento 40 72 10
Control 40 120 12
Reemplazando tenemos
Propuesta de solucin...
Ho: 1 2 = 0
H1: 1 - 2 0
n1 = 8 x1 = 5,14 S1 = 0,99
n2 = 8 x2 = 6,09 S 2 = 0,66
___ ___
t = X X 1 2
(n 1 ) s (n 1 ) s 1 1
2 2
1 1 2 2
(n 1) (n 1)
1 n n2 1 2
Ejemplo 2
n1 = 8 x1 = 5,14 S1 = 0,99
n2 = 8 x2 = 6,09 S 2 = 0,66
___ ___
t = X X 1 2
(n 1 ) s (n 1 ) s 1 1
2 2
1 1
2 2
(n 1) (n 1)
1 n n
2 1 2
5,14 6,09
t =
(8 1)0,992 (8 1)0,662 1 1
(8 1) (8 1) 8 8
Ejemplo 2
Valor calculado
to = 2.28
t0.025;14 = 2.14
t0.975;14 = 2.14
grados de libertad
(n1 - 1) + (n2 - 1)
to = 2.28
Se Rechaza Ho
Ejemplo 3. Se lleva a cabo un experimento para comparar
el desgaste por abrasivo (*) de dos diferentes materiales
laminados. Se prueban 12 piezas del material 1 mediante
la exposicin de cada pieza a una mquina para medir el
desgaste. Diez piezas del material 2 se prueban de
manera similar. En cada caso, se mide la profundidad del
desgaste. Las muestras del material 1 dan un desgaste
promedio de 85 unidades con una desviacin estndar
muestral de 4, mientras que las muestras del material 2
dan un promedio de 81, desviacin estndar muestral de 5
Podemos concluir con un nivel de significancia del 0.05
que el desgaste abrasivo del material 1 excede el del
material 2 en dos unidades?
(*) Sustancia que tiene como finalidad actuar sobre otros
materiales con diferentes clases de esfuerzo mecnico
triturado, molienda, corte, pulido.
Propuesta de solucin:
H: - = 2
H: - 2
= 0,05
x1 = 85 s1 = 4 n1 = 12
x 2 = 81 s2 = 5 n 2 = 10
x x 2 - m1 m2
3) Prueba estadstica
=
1
tc
1 1
S
2
n1 n2
p
Variancia =
1 1 2 2
n 1 S 2
n 1 S 2
S p2 n1 n2 2
ponderada
4) Criterios de decisin
to con (n1 + n2 - 2) = 2,0154
ZONA DE
m1 m2 ACEPTACIN
m1 > m2
m1 = m2
ZONA DE ZONA DE
RECHAZO RECHAZO
/2 1- /2
-t t
-2,0154 2,0154
66,432
S 2 = = 1,51
p 44
( x1 x2 ) ( m1 m 2)
z= N (0,1)
s1 s 2
2 2
n1 n2
el cual se distribuye como una Normal de media 0 y desvo
estndar 1.
Prueba de hiptesis sobre la igualdad de dos medias
(varianzas conocidas)
Ho: 1 = 2
H1: 1 2
Con un = 0,10
Entonces : t = 20 16 = 2.52
1.59
Cuando: = 0.10 y gl = 10 + 5 - 2 = 13
d md
t= t gl = n 1
sd
n
n
i
n n
d (x x )
i i 2
( d d ) 2
d= i =1
= i =1 S 2d = i =1
n n n 1
el cual se distribuye como una t de Student con n - 1 grados
de libertad.
Ejemplo. Al investigar la manera de aumentar la productividad en
las oficinas, el gerente de la empresa de saneamiento Yo Hago
Agua adquiri 12 teclados ergonomtricos y los distribuy a un
grupo de secretarias. Si los teclados aumentan la productividad de
manera sustancial, el gerente planea sustituir todos los teclados
actuales por los modelos nuevos. Antes de entregar los teclados,
cada uno de los 12 integrantes de la muestra escribi un documento
comn con su viejo teclado, y se midi el nmero de palabras por
minuto. Despus de recibir los nuevos teclados y de dedicar
algunas semanas a familiarizarse con ellos, cada secretaria escribi
el mismo documento con el modelo ergonomtrico.
La siguiente tabla contiene el nmero de palabras por
minuto que escribi cada secretaria en cada prueba:
x2,
x1, Palabras/Minuto Palabras/Minuto Diferencia Diferencia
Secretaria
con teclado viejo con teclado d = (x1 - x2) al cuadrado
nuevo
1 25.5 43.6 -18.1 327.61
2 59.2 69.9 -10.7 114.49
3 38.4 39.8 -1.4 1.96
4 66.8 73.4 -6.6 43.56
5 44.9 50.2 -5.3 28.09
6 47.4 53.9 -6.5 42.25
7 41.6 40.3 1.3 1.69
8 48.9 58.0 -9.1 82.81
9 60.7 66.9 -6.2 38.44
10 41.0 66.5 -25.5 650.25
11 36.1 27.4 8.7 75.69
12 34.4 33.7 0.7 0.49
-78.7 1407.33
= =
; donde:
P1 y p2 = las proporciones muestrales
n1 y n2 = los tamaos de las muestras
= la estimacin combinada de la proporcin
poblacional, con
Estadstico de la prueba para comparar
proporciones de dos muestras
independientes
= 0.0899
El valor calculado del estadstico de la prueba, z, es:
Solucin...
ZONA DE
p1 p2 ACEPTACIN
p1 > p2
p1 = p2
ZONA DE ZONA DE
RECHAZO RECHAZO
/2 1- /2
-Z Z
- 2,58 2,58