Vous êtes sur la page 1sur 28

1

UNIVERSIDAD NACIONAL DE TUMBES


ESCUELA DE POST GRADO
CURSO ESTADSTICA

SEGUNDA UNIDAD:- ESTIMACIN DE PARMETROS Y PRUEBA DE
HIPTESIS


INTRODUCCIN

La inferencia estadstica comprende dos partes principales, a saber: la
estimacin de parmetros y la prueba o docimasia de hiptesis.

La inferencia estadstica est basada en el supuesto de que tomaremos
muchas muestras, todas con igual probabilidad de ser seleccionadas; y a
travs de una muestra obtenida sabremos algo acerca de la poblacin,
mediante el clculo de estimadores.

Estos mtodos se basan en la aplicacin de tcnicas de muestreo, para lo cual
se requiere de un buen diseo, adems de la aplicacin de mtodos aleatorios
de seleccin, siendo las probabilidades iguales para cada elemento de la
poblacin.

Estimacin de Parmetros:-
Es un mtodo inferencial. Se basa en el estudio de una muestra que
representa adecuadamente a la poblacin. Producto de dicho estudio
obtenemos una medida que se denomina estimador; mediante la inferencia o
induccin de este valor obtenemos la medida poblacional esperada
denominada parmetro. Se realiza esta inferencia obteniendo en cada caso el
margen de error que corresponda.

Prueba de Hiptesis:-
Denominada tambin prueba de significacin, tiene como objetivo
principal evaluar suposiciones o afirmaciones acerca de los valores estadsticos
de la poblacin, denominados parmetros.

La palabra docimar significa probar, cuando se hace indispensable tomar una
decisin sobre la validez de la representacin de una poblacin, con base en
los resultados obtenidos a travs de una muestra, se dicen que se toman
decisiones estadsticas. Para tomar una decisin es necesario, ante todo
plantear posibilidades acerca de la caracterstica o caractersticas a estudiar
en una poblacin determinada. La suposicin puede ser cierta o falsa. Estas
suposiciones se llaman hiptesis estadsticas.

Hiptesis Estadstica:-
Es un supuesto acerca de un parmetro o de algn valor estadstico de
una poblacin. Con esta definicin encontramos que no todas las hiptesis son
hiptesis estadsticas. Se debe tomar con referencia a un parmetro, ya sea
una media aritmtica, una proporcin (porcentaje) o varianza para que sea
hiptesis estadstica.
2
Una hiptesis estadstica tambin puede considerarse, como la afirmacin de
una caracterstica ideal de una poblacin sobre la cual hay inseguridad en el
momento de formularla y que, a la vez, es expresada de tal forma que puede
ser realizada.

Tipo de error:-
En la decisin de aceptar o rechazar una hiptesis pueden cometerse
dos tipos de error:

a) Error tipo II.- Aceptar la hiptesis cuando ha debido rechazarse.
b) Error tipo I.- Rechazar la hiptesis cuando ha debido aceptarse.

Existe por lo tanto, dos posibles decisiones: aceptar o rechazar la hiptesis la
que, a la vez, puede ser cierta o falsa.


Tipos de error


d
e
s
i
c
o
n
e
s

Verdadera Falsa
ACEPTAR
decisin
correcta
error de tipo II



RECHAZAR error de tipo I
decisin
correcta

- Si se acepta una hiptesis verdadera la decisin es correcta.
- Si se acepta una hiptesis falsa, cometemos error de tipo II.
- Si rechazamos una hiptesis verdadera, encontramos error de tipo I.
- Si rechazamos una hiptesis falsa, la decisin es correcta.

El ejemplo ms indicado y ms utilizado para comprender mejor lo enunciado
en forma precedente es el siguiente: supongamos que se detiene a una
persona por robo y se le enva al juez quien podr declararlo inocente o
culpable. Al juez se le presentan los pro y contra y, con base en toda la
informacin, decide dejarlo libre o condenarlo. El juez, no sabr si hubo error
en su decisin, solo lo podr saber la persona que ha sido juzgada.


Persona Juzgada
d
e
s
i
c
o
n
e
s

del juez Inocente Culpable

error de tipo II
Libre
decisin
correcta



Condenado error de tipo I
decisin
correcta
3
Hiptesis nula y alternativa:-
Corresponde a un enunciado acerca del valor estadstico poblacional
(parmetro).

La hiptesis se debe formular en forma correcta o lgica y debe ser enunciada
antes de obtener los datos muestrales.

Hay dos tipos de hiptesis que se deben formular: la hiptesis nula,
simbolizada por
0
H y la hiptesis alternativa por
a
H

La hiptesis nula, es aquella por medio de la cual se hace una afirmacin
sobre un parmetro, que se va a constatar con el resultado muestral.

La hiptesis alternativa, es toda aquella hiptesis que defiere de la hiptesis
nula, es decir, ofrece una alternativa, afirmando que la hiptesis nula es falsa.

Cuando el fabricante dice que su producto tiene una duracin de 6000 horas,
se le considera como hiptesis nula, pues es lo que se quiere probar. :
0
H
. 6000hrs = Las hiptesis alternativas prodian ser:

a. El fabricante ha exagerado la duracin de su producto.
:
a
H < 6000hrs. (prueba unilateral izquierda)

b. El producto tiene una duracin superior al sealado por el fabricante.
:
a
H > 6000 hrs. (prueba unilateral derecha)

c. La duracin del producto no es la sealada por el fabricante.
:
a
H . 6000hrs = (Prueba bilateral)

La prueba unilateral y bilateral:-
La prueba de hiptesis unilateral, es aquella en la cual la zona de
rechazo o zona crtica est completamente comprendida en uno de los
extremos de la distribucin. :
a
H < a, regin crtica ubicada al lado izquierdo.
:
a
H >a, regin crtica ubicada al lado derecho. :
a
H = A, regin crtica
ubicada al lado izquierda y derecha de la distribucin

Nivel de significacin y puntos crticos:-

Se entiende por nivel de significacin, la mxima probabilidad que se
especifique, con el fin de hacer mnimo el primer tipo de error. Generalmente
esta probabilidad se fija antes de escoger la muestra.

El nivel de significacin se simboliza por alfa (o ), siendo generalmente del 1%,
5%, o 10%, pero se puede usar cualquier nivel. Existe la costumbre de trabajar
con el nivel de 0.05 o sea del 5%, especialmente cuando el enunciado del
problema no lo brinda.

4
Cuando se trabaja con un nivel del 5%, el resultado es significativo, y si se
emplea 1% el resultado es altamente significativo, y si es del 10%, se considera
poco significativo.

El valor del nivel de significacin corresponde a un rea bajo la curva de
probabilidad o normal, denominado regin crtica o zona de rechazo.

Procedimientos a seguir en las pruebas de hiptesis:

1. Formular la hiptesis nula y la alternativa.

2. Seleccionar el nivel de significacin.

3. Elegir la estadstica de prueba, entre las caractersticas existentes en la
poblacin y muestra.

4. Definir las regiones de aceptacin y de rechazo.

5. Calcular el valor de la estadstica de prueba.

6. Calcular los valores experimental y tabular.

7. Decidir la aceptacin o rechazo de
0
H

8. Toma de decisiones.



ESTIMACIN DE PARMETROS

Ecuacin general para estimar parmetros

: u
u
o
o u
2 /

k

Donde:

u = Parmetro
u

= Estimador
2 / o
k = Valor crtico que corresponde a la distribucin con la cual
trabajamos.
u
o

= Error estndar del estimador


(
u
o

= n / o )

d u u

:

d = margen de error
d s u u


5
d d + < < u u u


s i
L L < < u
P ( d d + < < u u u

)= .

Interpretacin:

- la probabilidad de que el parmetro (u ) en estudio asuma valores de (
d u

) a ( d + u

) es de de probabilidad.

Interpretacin equivalente:

- - Al de probabilidad, el parmetro en estudio (u ), asume valores de (
d u

) a ( d + u

).

Objetivo: en base a variables en estudio estimar un parmetro determinado o
probar una hiptesis en referencia a un determinado comportamiento
paramtrico.

Estimacin Promedio Poblacional:-

Aplicacin:- Dada la informacin referida a pedidos por da a una empresa xyz
de un determinado artculo, durante el segundo semestre del ao 2006 en la
ciudad de Tumbes.

Se trabajar con una muestra aleatoria de 34 das se pide estimar el promedio
poblacional de pedidos por da confiabilidad del 95%.

dia pedidospor x
i
=


=
i
x 120, 130, 115, 136, 121, 151, 90, 132, 123, 107, 104, 128, 92, 86, 105, 96,
100, 88, 103, 71, 104, 102, 100, 86, 96, 93, 125, 128, 76, 97, 90, 122, 126.

Solucin:

N = 180 das.

La ecuacin: :
2 / o
k x n / o 1 / n n N

= promedio poblacional.
x = promedio muestral
o = desviacin poblacional
N = tamao poblacional
n = tamao muestral
2 / o
k = valor crtico que corresponde a la confiabilidad con la que se
trabaja.
= = s o desviacin muestral
6

Siendo n= 34 > 30, usamos la distribucin normal,

1
:
2 /

N
n N
n
s
Z x
o


En base a la muestra calcular x y s.

85 . 106 = x , s = 18.83

Se evala el tamao muestral y si se conoce o no la varianza poblacional.

Entonces: n = 34 > 30 y
2
o no es conocida.

Siendo n > 30,
2 / 2 / o o
Z k = (sigue la normal)

Se pide realizar la estimacin para = 0.95

4750 . 0
2
95 . 0
2
= =
o
. Para 0.4750 en la tabla normal, 96 . 1
2 /
=
o
Z

Datos:
85 . 106 = x , s = 18.83, z = 1.96

N = 180, n = 34

: 106.85 (1.96)
34
83 . 18

1 180
34 180



106.85 5.72

106.85 5.72, 106.85 + 5.72

101.13 112.57

P ( 57 . 112 13 . 101 < < ) = 0.95

Al 0.95 de confiabilidad la empresa xyz espera ser demandada por un
promedio poblacional diario, de 101 a 113 artculos, durante el ltimo semestre
del ao 2006.

Aplicacin de prueba de hiptesis

Prueba de hiptesis promedio poblacional

Hiptesis cientfica:- La empresa xyz de la ciudad de Tumbes, durante el
ltimo semestre del ao 2006, despach en promedio 98 artculos por da,
Puede dudarse de lo sustentado por la compaa?
7

Trabajor para = 0.90

Procedimiento: Para evaluar la hiptesis si es verdadera o falsa.

- esta evaluacin se realizar en base a la muestra que corresponde a las
ventas realizadas en 34 das (datos precedentes)

Solucin:

1. Planteamiento de hiptesis

98
0
s = H
98 > =
a
H

2. Nivel de significacin: 10 . 0 = o

3. Estadstica de prueba
Condiciones de la N y n
N = 180, n = 34 y ?
2
= o
Usamos la normal (Z)

4. Regiones de aceptacin y rechazo de
0
H
10 . 0 = o RA/
0
H
a
H : > Z RR/
0
H
0 28 . 1 =
o
z
Para 0.4000 28 . 1 =
o
z

RA/
0
H = 28 . 1 0 < s z
RR/
0
H = 28 . 1 > z

5. Clculos Z =
n z
x
/



85 . 106 = x

s = 18.83 74 . 2
34 / 83 . 18
98 85 . 106
=

=
c
Z

98 = 74 . 2 =
c
Z

n = 34
8

6.
tabla
Z vs
c
Z

1.645 < 2.74
2.74 e RR /
0
H

7. Rechazamos
0
H aceptamos
a
H significa, el promedio diario en pedidos
demandado la empresa xyz, ciudad de Tumbes, semestre seguido 2006, es
superior a 98.

8. la empresa xyz debe estar preparando para brindar la mejor respuesta al
mundo.


ESTIMACIN PROPORCIONAL POBLACIONAL

Se elige una muestra de la produccin fitoplanctnica en un estanque, durante
el mes de mayo de 1999 (fertilizada con nutrilake y superfosfato triple de
fsforo SPT) estime la proporcin de das cuya produccin de clorofila oscila de
12500 a 37250. Para = 98.

La informacin es la siguiente: n = 24; N = 50

15000, 37500, 50000, 37250, 25000, 12500, 37250, 37500, 25000, 43750, 37500,
25000, 6250, 12500, 15000, 43750, 32500, 25000, 10000, 43750, 37500, 25000, 12500,
6250.

Calculamos la proporcin muestral: p =
n
x
donde x = n de elementos que cumplen con
la caracterstica en estudio.

p = 67 . 0
24
16
= x= n de das cuya produccin de clorofila oscila de
12500 a 37250.

P:
1
2 /

N
n N
z p
o
67 . 0

= = p P
Q= 1- p = 1 0.67 = 0.33

2 / o
Z 7900 . 0
2
98 . 0
2
= =
o
Tabla normal = z = 2.33

P:
1 50
24 50
24
) 33 . 0 )( 67 . 0 (
33 . 2 67 . 0



0.67 0.16

0.67 0.16 , 0.67 + 0.16
9

0.51 , 0.83

P ( 83 . 0 51 . 0 < < p ) = 0.98
Al 0.98 de confiabilidad, la proporcin de das cuya produccin de clorofila oscila de
12500 - 37250 oscila de 0.51 - 0.83

PRUEBA DE HIPOTESIS PROPORCION

Hiptesis Cientfica:- la proporcin de das cuya produccin de clorofila oscila
de 600 25000 es igual a 0.50

Hiptesis Estadstica:-
0
H P = 0.50

Solucin: trabajar para: = 0.98

1.
0
H P = 0.50

0
H P = 0.50

2. 05 . 0 = o
RR/
0
H RR/
0
H
3.
n
PQ
P p
Z

= 33 . 2
2 /
=
o
z 0 33 . 2
2 /
=
o
z
RA/
0
H
4. = :
1
H
05 . 0 = o
Z

= 0.9800

= 4900 . 0
2
0.9800
=
Para 0.4900 Normal =
2 / o
Z = 2.33

RA/
0
H : -2.33 <z < 2.33
RR/
0
H : 33 . 2 s z 33 . 2 > z

5. En base a la informacin de la muestra anterior

= =
n
x
p
das
oscilade produccion dediascuya n
24
2500 600


p = 5417 . 0
24
13
=

10

n
PQ
P p
Z
c

= = 41 . 0
24
) 50 . 0 )( 50 . 0 (
05000 5417 . 0
=





6.
tabla
Z vs
c
Z
2.33 >0.41
c
Z e RA/
0
H
7. Se acepta
0
H

8. la proporcin de das cuya produccin de clorofila oscila de 6000 25000 es
igual a 0.50.


ESTIMACION Y PRUEBA DE HIPOTESIS DE UN PROMEDIO
POBLACIONAL CUANDO n <30 y
2
o DESCONOCIDA

La empresa Elctrica Pizza estaba considerada la distribucin a nivel Nacional
de su producto que ha tenido xito a nivel local, y para ello recab datos de
venta proforma. Las ventas mensuales promedio (en miles de dlares) de sus
20 de 60 distribuidores actuales. En base a esta informacin y para un =
0.99.

a) Estime el promedio poblacional.
b) Pruebe la hiptesis estadstica referida a que el promedio poblacional es:
8 . 5 = ; 7 < . Ambos para = 0.95

Ventas por distribuidor:

5.8, 3.8, 7.7, 3.7, 5.0, 4.5, 6.5, 5.8, 6.6, 7.5, 8.5, 3.4, 6.8, 7.5, 5.8, 5.2, 9.8, 8.0, 8.7, 6.4.

35 . 6 = x , s = 1.7656

n = 20, N= 60, varianza poblacional =
2
o , desconocida

Si n = 20 < 30 y ?
2
= o , se usa, la distribucin t de student


:
) 1 , 2 /
(

n
t x
o

1 3

N
n N s


)
2
1 20 , 01 . 0
(
) 1 , 2 / (
= t t
n o


= 861 . 2
) 19 , 005 . 0 (
= t (tabla t, Pg. 18)

11
:
1 60
20 60
20
7656 . 1
) 861 . 2 ( 35 . 6




6.35 0.93

6.35 0.93 , 6.35 + 0.93

5.42 , 7.28

P ( 99 . 0 ) 28 . 7 42 . 5 = < <

La posibilidad de que el promedio de ventas por distribuidor en la empresa
Electric Pizza asuma valores de 5.42 7.28, es de 0.99.

Prueba de hiptesis para 8 . 5 = , = 0.95

1
0
H : 8 . 5 =


a
H : 8 . 5 =

2 05 . 0 = o

3 n = 20 < 30 y
2
o desconocido, usamos t

4 05 . 0 = o
a
H : = RA/
0
H
RR/
0
H RR/
0
H
t


) 1 , 2 / (

n
t
o
0
) 1 , 2 / ( n
t
o

-2.093 2.093
) 1 , 2 / ( n
t
o
=
21
) 1 20 , 05 . 0
(

t = 093 . 2
) 19 , 025 . 0 (
= t (tabla t de student Pg. 18)

5 39 . 1
20 / 7656 . 1
8 . 5 35 . 6
/
=

=
n x
x
t
c



6
tabla
t vs
c
t
2.093 > 1.39 E t
c
RA/
0
H

7 Aceptamos
0
H

8 El promedio de ventas por distribuidor es de 5800 dlares

12
Prueba de hiptesis para 70 < , = 0.95

1
0
H : 0 . 7 =

a
H 0 . 7 >

2 05 . 0 = o

3 n = 20 < 30 y
2
o desconocido, usamos t

4 05 . 0 = o

RA/
0
H
RR/
0
H RR/
0
H
t


) 1 , 2 / (

n
t
o
0
) 1 , 2 / ( n
t
o

-2.093 2.093

) 1 , 2 / ( n
t
o
=
21
) 1 20 , 05 . 0
(

t = 1.729 (tabla t de student Pg. 18)

5 65 . 1
20 / 7656 . 1
0 . 7 35 . 6
/
=

=
n s
x
t
c




6
tabla
t vs
c
t
1.729 > -1.65 E t
c
RA/
0
H


7 Aceptamos
0
H

8 El promedio de ventas por distribuidor en la empresa Electric Pizza es
inferior o igual a 7000 dlares.



DIFERENCIAS DE MEDIAS

Estimacin y Prueba de Hiptesis:-
La informacin siguiente muestra la produccin fitoplanctnica (clorofila)
por estanques (
2 1
, E E ) fertilizados con Nutrilake y superfosfato triple de fsforo
(SPT). Se desea estudiar la diferencia de medias poblacionales, contando con
muestras 15
1
= n
( 1 tan
1
que Es E = ) Y 19
2
= n ( 2 tan
2
que es E = ).
Para = 0.90

13
La informacin es:

26
1
= N
15
1
= n ;

6250, 25000, 25000, 37250, 30000, 125000, 37500,
37250, 43750, 50000, 12500, 43750,37500, 250000,
28400.

26
2
= N
19
2
= n

25600, 10000, 12500, 50000, 30000, 37500, 10000,
26100, 30000, 350000, 43750, 57500, 12500, 6250,
10000, 12500, 12500, 6250, 32500.



? , 30 15
2
1
= < = o n ; ? , 30 18
2
2
= < = o n usamos t

:
2 1
(
2 1
x x ) ( 2 ,
2 1 2 /
+ n n t
o
)
2 1
x x o


2 1 x x
o = )
1 1
(
2 1
2
n n
s
c
+

2
) 1 ( ) 1 (
2 1
2
2
2
1
2
+
+
=
n n
s n s n
s
c c
c


En
1
n , 00000 . 30110
1
= x

44328 . 12676
1
= s , 2 . 160692214
2
1
= s

En ,
2
n 21053 . 24234
2
= x

92389 . 15614
2
= s , 243825848
2
2
= s

2 19 15
) 243825848 )( 1 19 ( ) 2 . 160692214 )( 1 15 (
2
+
+
=
s
s

6 . 840180476
2
=
c
s

596 . 10011 )
19
1
15
1
( 6 . 840180476
2 1
= + =
x x
o

14
) 596 . 10011 )( 6944 . 0 ( ) 21053 . 24234 00000 . 30110 (
2 1
=

= 0.90, 10 . 0 = o

6944 . 0 ) 32 , 05 . 0 ( ) 2 19 15 ,
2
10 . 0
) 2 , 2 / (
2 1
= = + =
+
t t
n n o


: 5875.79 6952.05

5875.798 6952.05 , 5875.79 + 6952.05
-1076.26 12827.84

P ( 90 . 0 ) 84 . 12872 26 . 1076
2 1
= < <

La probabilidad de la diferencia en produccin de clorofila en los dos estanques
fertilizados oscila de 0 12872.84, al 0.90.


Prueba de hiptesis comparativo de varianzas poblacionales

Comparar las varianzas que corresponde a la produccin de clorofila en dos
estanques fertilizados
1.
0
H :
2
2
2
1
o o =

2
2
2
1
: o o =
a
H

2. 05 . 0 = o

3. 30 15
1
< = n y ?
2
1
= o
30 19
2
< = n Y ?
2
2
= o
Usamos la prueba
) 2 , 1 ; 2 / ( v v
F
o


4. calculamos las regiones de acepcin y de rechazo de la
0
H

= :
a
H
05 . 0 = o
F
RR/
0
H RA/
0
H RR/
0
H


) 2 , 1 ; 2 / 1 ( v v
F
o
0
) 2 , 1 ; 2 / ( v v
F
o


I
F
s
F


62 . 2
) 19 , 15 ; 025 . 0 (
= = F F
S

15
43 . 0
78 . 2
1 1
) 19 ; 025 . 0 (
= =
=
F
F
I
;
Explicacin del
1
F

86 . 2
) 15 , 15 ; 025 . 0 (
= F
76 . 2
) 15 , 20 ; 025 . 0 (
= F
5 0.10
4 x
2.86-0.08 = 2.78

43 . 0
) 15 , 19 ; 025 . 0 (
= F
43 . 0
78 . 2
1
= =
I
F



RR/
0
H RA/
0
H RR/
0
H


43 . 0 =
I
F 62 . 2 =
S
F


5) 40 . 0
) 1 19 )( 243825848 ( 19
) 1 15 )( 2 . 160692214 ( 15
) 1 (
) 1 (
2
2
2 2
1
2
1 1
=

=
n S n
n S n
F
c


40 . 0 =
c
F

6)
I c
F F <
0.40 < 0.43
c
F e RR/
0
H

7) Se acepta
a
H

8) Existe diferente variabilidad en la produccin de clorofila en los estanques 1 y 2
fertilizados al 0.95 de confiabilidad


PRUEBA DE HIPOTESIS COMPARATIVO DE MEDIAS
POBLACIONALES

Se toman como muestras 6 mujeres y 10 hombres fumadores. Se desea saber
si el nmero de cigarrillos que consumen los hombres diariamente es superior
al de las mujeres. Los datos brindaron en promedio 8 cigarrillos en el grupo de
mujeres y 11 en el de los hombres; las desviaciones tpicas son 2.1 y 1.8
respectivamente. Al nivel del 5% Se puede llegar a la conclusin de que los
hombres fuman ms que las mujeres?
16



x = mujeres
y = hombres
y x
H = :
0

y x a
H < :
Para probarlas, de primera intencin se realiza el comparativo de varianzas
poblacionales.
Si dichas varianzas son iguales, procedemos a realizar el comparativo de
medias poblacionales.

Comparativo de varianzas poblacionales para el ejercicio precedente

1)
0
H :
2 2
y x
o o =

a
H :
2 2
y x
o o =
2) 05 . 0 = o

3) 6 =
x
n , ?
2
=
x
o 10 =
y
n ?
2
=
y
o
Usamos la distribucin F, donde:

) 1 (
) 1 (
2
2

=
y y y
x x x
n S n
n S n
F

4) 05 . 0 = o
" :" =
a
H
F


RR/
0
H RA/
0
H RR/
0
H


18 . 0 =
I
F 07 . 4 =
S
F

07 . 4
) 025 . 0 ; 10 , 6 (
= = f F
S


18 . 0
46 . 5
1 1
) 025 . 0 ; 6 , 10 (
= = =
F
F
I


RA/
0
H : 0.18 < F < 4.07

RR/
0
H : F s 0.18 F > 4.07

5) 45 . 0
) 1 10 ( ) 8 . 1 ( 10
) 1 6 ( ) 1 . 2 ( 6
2
2
=

=
c
F
17

6)
tabla
F vs
c
F
RA: 0.18 < F < 4.07 VS 0.45

C
F e RA/
0
H

7) Se acepta
0
H

8) Las varianzas son estadsticamente iguales (no existe diferencia
significativa entre ellas) con una confiabilidad del 95%

Dado que las varianzas son iguales, realizaremos el comparativo de medias.

Solucin:

1)
0
H :
y
x
=

a
H :
y x
<
2) 05 . 0 = o

3) 6 =
x
n , ?
2
=
x
o 10 =
y
n ?
2
=
y
o
Se usa la
) 2 2 1 , ( +n n
t
o

761 . 1
) 14 , 05 . 0 ( ) 2 10 6 , 05 . 0 (
= =
+
t t


4) 05 . 0 = o
" :" =
a
H
F



RR/
0
H RA/
0
H



) 14 , 05 . 0 (
t
- 1.761

5)
)
1 1
(
( ) (
2
)
y x
c
y x y x
c
n n
s
x x
t
+

=



2
) 1 ( ) 1 (
2 2
2
+
+
=
y x
y y x x
y
n n
s n s n
s

66 . 3
2 10 6
) 8 . 1 )( 1 10 ( ) 1 . 2 )( 1 6 (
2 2
2
=
+
+
=
c
S

18

Datos:

8 =
x
X 04 . 3
10
1
6
1
( 66 . 3
0 ) 11 8 (
=
+

=
c
t
1 . 2 =
y
s
11 =
y
X
8 . 1 =
y
s

6)
tabla
t vs
c
t
-1.761 < - 3.04
c
t e RA/
0
H
Se acepta
0
H

7) Se rechaza
a
H

8) Al 0.95 de confiabilidad, no existe diferencia significativa entre el
promedio de cigarrillos que fuman hombres y mujeres, en el estudio
realizado.

MUY IMPORTANTE

Hay muchos casos en que las varianzas poblacionales son desiguales o no se
puede comprobar su igualdad. En estos casos se ha elaborado procedimientos
aproximados, entre ellos la t de student con ciertos grados de laboral,
mediante la aplicacin de la siguiente frmula:

( ) ( )
|
|
.
|

\
|

+
|
|
.
|

\
|

+
=
1
/
1
/
/ /
2
2
2
1
1
2
2
2
1
2
n
n S
n
n S
n S n S
y
x
y x
v

APLICACIN

Consideremos los datos sobre dos tipos de amortiguadores para vehculos
MAZDA, las pruebas de duracin resultaron en dos muestras aleatorias, de
tamao 16 y 12 respectivamente, las primeras con una duracin de 22.6
meses , y su desviacin tpica de 7 meses, mientras que en el segundo es de
18.2 meses y desviacin tpica de 5.2 meses.

No hay ninguna prueba de que las varianzas respecto a la duracin sean
iguales. Probar que la duracin no presenta diferencia significativa, al nivel del
5%.

Solucin

19
Calcularemos en primer lugar los grados de libertad.
13
1 12
) 12 / ) 2 ( 5 (
1 16
) 16 / 7 (
12
) 2 ( 5
16
7
2 2
2 2
=

|
|
.
|

\
|
+
= v

Con un nivel de significacin del 5%, el valor de 16 . 2
) 13 , 025 . 0 (
= t

1)
y x
H = :
0

y x a
H = :

2) 05 . 0 = o

3) 6 =
x
n , ?
2
=
x
o 12 =
y
n ?
2
=
y
o

4) 05 . 0 = o
" :" =
a
H
F


RR/
0
H RA/
0
H RR/
0
H



) 13 , 025 . 0 (
t
) 13 , 025 . 0 (
t
- 2. 16 2. 16
RA/
0
H : - 2.16 < t < 2.13

RR/
0
H : t s - 2.16 t > 2.16




5) 91 . 1
12
04 . 27
16
79
0 ) 2 . 18 6 . 22 (
( ) (
2
2
1
2
)
=
+

=
+

=
n
S
n
S
x x
t
y
x
y x y x
c



6) 16 . 2
) 13 , 025 . 0 (
= t vs 91 . 1 =
c
t
= 1.91 < 2.16
c
t e RA/
0
H


7) Se rechaza
a
H

8) La diferencia no es significativa al nivel del 5%

20


PRUEBA DE HIPOTESIS CON RESPECTO A LA VARIANZA
POBLACIONAL

En gran parte, por no decir en su totalidad, las unidades dedicadas a la
inferencia estadstica van encaminadas hacia el promedio; sin embargo las
inferencias realizadas con la varianza pueden constituirse en medidas ms
importantes que el promedio, pues este ltimo, vale la pena recordar, es un
punto de estimacin, siendo aquel valor que consideramos tpico, porque no
siempre lo va a ser, dado que depende del grado de variabilidad para ser
representativa del conjunto de observaciones.

Se hace referencia a la prueba de hiptesis de una varianza con base en una
muestra aleatoria. Partimos suponiendo que se tiene una poblacin normal con
media uy varianza
2
o desconocida.

La simbologa que se usa en el proceso ser:

0
2
0
: o o = H Lo que equivale
0
H : 1
2
0
2
=
o
o

0
2
: o o =
a
H ,
2
0
2
: o o >
a
H ;
2
0
2
: o o <
a
H

Que tambin pueden ser presentados como:

a
H : 1
2
0
2
=
o
o
,
a
H : 1
2
2
0
>
o
o
,
a
H : 1
2
0
2
<
o
o


Para la realizacin de esta prueba se emplea la estadstica Chi-cuadrado con
n -1 grados de libertad y la variante estadstica est dada de la siguiente
manera:

2
0
2 2
2
) 1 (
o
S n
X

=

Aplicacin:

Docimar (probar) la hiptesis de que 8 = o dado que 10 = S para una muestra
de tamao 20.

Solucin:

1)
0
H : 1
2
0
2
=
o
o

0
H : 1
8
2
2
=
o
1
64
2
=
o

1
64
:
2
=
o
a
H

21
2) 05 . 0 = o

3) La muestra es aleatoria, la poblacin es normal usamos la Chi-
cuadrado con n-1 grados de libertad.

Usamos la Chi-cuadrado con n- 1,
2
1 n
X

4) RA/
0
H y RR/
0
H


RR/
0
H RA/
0
H RR/
0
H



v o
v
, 2 /
2
|
|
.
|

\
| X

v o
v
, 2 / 1
2

|
|
.
|

\
| X

0.469 1.73

RA/
0
H = 0.469 < 73 . 1
2
<
v
k
RA/
0
H : 469 . 0 ) (
2
s
v
k o 73 . 1 ) (
2
>
v
k


5)
v
2
x
= 56 . 1
64
100
64
2
= =
s


6)
|
|
.
|

\
|
v
2
x
e RA/
0
H

7) Aceptamos
0
H

8) Se puede afirmar al nivel del 5% que la varianza de la muestra, puede
corresponder a una poblacin cuya varianza es 64.


ESTIMACION DE PARAMETROS

Establezca los lmites para o con una confianza de 95%

Siendo:
s = 10 100
2
= s 19 = v n = 20

Solucin:
469 . 0
19 1 , 025 . 0
2
=
|
|
.
|

\
|
+
v
x
73 . 1
97519 . 00
=
|
|
.
|

\
|
v
x


22
0.469 73 . 1
2
< <
v
x
siendo
2
2 2
o v
S x
=
Tenemos: 0.469 73 . 1
2
2
< <
o
S
0.469 <
2
100
o
<1.73


73 . 1
1
100 469 . 0
1
2
> >
o

73 . 1
100
469 . 0
100
2
> > o o >
469 . 0
100
>
73 . 1
100


14.60 >o >7.60 7.60 < 60 . 14 < o

1
o Asume valores de 7.60 14.60 al 95% de la confiabilidad.



DIFERENCIA DE PROPORCIONES

ESTIMACION DE PARMETROS Y PRUEBA DE HIPTESIS

Se realiz un estudio sobre la cantidad de plomo en sangre en mujeres
purperas ciudad de Mxico, aos 2005 y 2006, se trabaj con una poblacin
de 102 mujeres en el ao 2005( 102
1
= N ) y con 120 mujeres en el ao 2006 (
120
2
= N ). Para efectos de estudio comparativo sobre la cantidad de plomo en
sangre superior a 11 dl g / en mujeres purperas, se trabaja con una muestra
de 30 mujeres purperas ( 30
1
= n ) en el ao 2005 y con una muestra aleatoria
de 38 mujeres ( 38
2
= n ) en el ao 2006.

Sobre esta investigacin. Ser diferente la proporcin de mujeres purperas
con cantidad de plomo en sangre superior a 11 dl g / en los dos aos de
realizada la investigacin en ciudad Mxico?

La informacin est dada por:















30
1
= n (Ao 2005)

10.0, 12.9, 6.9, 6.4, 11.6, 9.1,
17.0, 23.3, 10.0, 11.5, 11.7,
7.2, 5.6, 12.4, 4.6, 8.8, 15.9,
8.2, 7.6, 7.9, 10.3, 5.3, 5.1,
12.3, 11.5, 20.0, 4.9, 5.1,
11.4, 5.9
38
2
= n (Ao 2006)

9.2, 10.5, 6.4, 12.4, 14.2, 9.7,
6.8, 7.8, 5.2, 9.2, 5.9, 10.5,
6.8, 5.1, 13.3, 21.0, 12.7,
23.1, 9.8, 2.9, 7.4, 18.9, 9.8,
8.5, 21.0, 7.1, 8.5, 13.1, 10.7,
5.5, 14.5, 14.4, 6.9, 8.8, 9.4,
7.4, 12.9, 11.0
23
ESTIMACIN PARA LA DIFERENCIA DE PROPORCIONES

x = mujer purpera con plomo en sangre superior a 11 dl g /

37 . 0
30
11
1
1
1
= = =
n
x
p 29 . 0
38
11
2
2
2
= = =
n
x
p


Para un = 94%

:
2 1
p p
2 / 2 1 o
Z p p
2
2 2
1
1 1
n
Q P
n
Q P
+
0.37 0.29 1.88
38
) 71 . 0 )( 29 . 0 (
30
) 63 . 0 )( 37 . 0 (
+
Si = 0.94, 4700 . 0
2
94 . 0
2
= =
o
z= 1.88 (tabla normal Pg. 19)
: 0.08 0.22

P ( 30 . 0 14 . 0
2 1
< < P P ) = 0.94

Al 0.94 de confiabilidad la diferencia de proporciones de mujeres purperas en
la ciudad de Mxico en los aos 2005 2006 de plomo en sangre es superior
a 11 dl g / , oscila de 0 0.30

Prueba de hiptesis Diferencia de Proporciones

1.
0
H :
2 1
P P =
a
H
2 1
P P =

2. 02 . 0 = o , = 0.98

3. 30
1
= n , 38
2
= n ?
2
1
=
p
o ?
2
2
=
p
o
Se usa la normal

4. 02 . 0 = o
= :
a
H RR/
0
H RA/
0
H RR/
0
H
Z


2 / o
z 0
2 / o
z
- 2.33 2.33
= 0.98 /2 = 4900 . 0
2
98 . 0
= 2.33 tabla normal


RA/
0
H : - 2.33 < z < 2.33
24
RR/
0
H : z s -2.33 o z > 2.33

5.
n
Q P
n
Q P
P P p p
Z
c
2 2
1
1 1
2 1 2 1
) ( ) (
+

= = 07 . 6
38
) 71 . 0 )( 29 . 0 (
30
) 63 . 0 )( 37 . 0 (
0 ) 29 . 0 37 . 0 (
=
+



6.
tabla
Z vs
c
Z
2.33 < 6.07
c
Z E RR/
0
H


7. Se rechaza
0
H . Se acepta
a
H

8. la proporcin de mujeres purperas cuya concentracin de plomo en sangre
superior a 11 dl g / ciudad de Mxico 2005 es diferente de la proporcin
de mujeres con igual caracterstica en el ao 2006, al 98% de confiabilidad.


DISTRIBUCIN NORMAL

Es sin duda la ms conocida y usada de todas. Corresponde a una distribucin
de variable continua que se extiende sobre un campo de variabilidad infinito y
est dado por la funcin de densidad normal.

F(x)= 1
| |
2
/ 2 /
1 x x
x
e
o

(I)
x
2
2to

Donde:

media
x
= ; | | o o > < = = talque x E
x
,

ianza x var
2
= o ; 0
2
>
x
o

e = 2.71828 ; 14159 . 3 = t


La grfica de la expresin (I) es la siguiente:










25


















x x
o 3
x x
o 2
x x
o
x

x x
o +
x x
o 2 +
x x
o 3 +
% 68
% 95

% 99


rea bajo la curva o probabilidad. Esta se calcular por medio de tablas
estadsticas.

x N (
x
x x
o , )

Distribucin Normal Estandarizada (Z)


Z =
x
x

x
o


Z N ( 1 , 0
2
= =
z z
o ) ; 1 =
z
o












26












0.34135 0.34135

-3 -2 -1 0 +1 +2 +3
% 27 . 68
% 45 . 95

% 73 . 99


=Confiabilidad o probabilidad

= o Error o nivel de significacin

Calcularemos algunos tipos de probabilidades para usarlos al realizar
estimacin de parmetros y prueba de hiptesis.

1. Dada el rea o probabilidad calcular el valor Z.

Un rea o probabilidad bajo la curva normal, se define:









0
1
z
P ( , 0 z z s s )= /2


Calcular el valor de Z, dadas las reas: 0.3413, 0.4788, 0.4969.

Para determinarlas:

P ( , 0 z z s s )= 0.3413, v a la tabla normal

27
(Pg. 19) tablas estadsticas, encontramos:



x .00---------------------------------------------------.09




1.0




0.3413

En la tabla, para 0.3413, a la izquierda del valor z = 1.0, para 0.3413,
0 . 1
1
= z

P (
1
0 z z s s )= 0.4788

Para determinar z, ubicamos el rea en la tabla y luego observamos al
lado izquierda que existe 2.0 y hacia arriba (en la misma columna de
0.4788) encontramos .03 el valor de
1
z es 2.03.

P (
1
0 z z s s ) = 0.4969

Con el mismo procedimiento precedente, . 74 . 2
1
= Z

Si tenemos el rea o probabilidad total, como determinamos el valor de
1
z ?

Para = 0.95 cunto vale
1
Z .

Tenemos: P (
1 1
z z z s s )==0.95
De acuerdo al mensaje de la tabla, responde a P (
1
0 z z s s ) = 2 / o , por
tanto, para esta cara, tenemos P (
1
0 z z s s ) = /2=0.95/2; P (
1
0 z z s s )
= 0.4750; para 0.4750 en la tabla, 96 . 1
1
= Z

Para ,=0.98, ?
1
= z
P (
1
0 z z s s )= 4900 . 0 2 / 98 . 0 =

Podemos advertir que 0.4900 no la encontramos en la tabla, Cmo se
acta? Se toma el rea que ms cercana est a la buscada. Por defecto
o por exceso.

En este caso los ms cercanos son: 0.4901 (defecto) y 0.4904 (exceso),
de las dos reas, la ms cercana es 0.4901, para esta rea el valor de
33 . 2
1
= z , el cual ser asignado como valor de 4900 . 0
1
= z
Para 0.98, 33 . 2
1
= z

28

Z

.00

.03
0.0

1.0

2.0
.
.
.




0.4788



2. Dado Z calcular el rea o probabilidad.

Calcular la probabilidad, dado los valores de z.

P ( 09 . 2 0 s s z ) ? = En la tabla el rea es: 0.4817

Para P ( 97 . 0 0 s s z )= cual es el rea, tabla, rea = 0.3340. Que es el
valor de 2 / o Donde el valor de 2 / o ; si deseamos el valor o , el rea
obtenida se multiplicar por 2, as, 0.3340*2 = 0.6680.

97 . 0
1
= z , 6680 . 0 = o

P ( 0 58 . 2 s s z ) = cul es el rea?

P ( 0 58 . 2 s s z ) = P ( 58 . 2 0 s s z ) =, en la tabla 2 / o = 0.4951,
P ( 0 58 . 2 s s z )= 0.4951.

Si deseamos el rea total baja la curva: P ( 58 . 2 58 . 2 s s z )=
0.4951*2=0.9902 (rea total).

Para: ( 0 90 . 2 s s z )= 0.4981 encontramos en la tabla 0.4981. rea
total: 0.4981*2= 0.9972= P ( 90 . 2 90 . 2 s s z )