Vous êtes sur la page 1sur 18

77

CAPITULO 7: ESTADISTICA INFERENCIAL



7.1 INTRODUCCIN

Es evidente que un conocimiento previo por parte del investigador de las caractersticas de la
realidad de la poblacin mejora o debe mejorar los resultados inferenciales que se pueden obtener
de la obtencin de una muestra; parece claro que si bien el mtodo de seleccin aleatoria conlleva
los mejores resultados, quiz el adecuar la manera de extraer la muestra a las posibles distintas
naturalezas de las poblaciones puede mejorar el rendimiento, aunque slo fuere a nivel de costos.
No es por tanto lo mismo intentar conocer la altura media de los habitantes de un pas, que el
nmero de errores en una gran contabilidad, dado que la naturaleza de su universo y por tanto el
comportamiento poblacional son distintos. Es por ello, que para distintas "naturalezas" del
problema han de plantearse distintas soluciones, si bien todas, o casi todas, pasan por la
aleatoriedad; de ah que se establezcan diversas "tcnicas" o "mtodos" de muestreo, de los que
brevemente enumeramos algunos.

El objetivo de la estadstica inferencial es obtener la informacin acerca de una poblacin,
partiendo de la informacin que contiene una muestra. El proceso que se sigue para seleccionar
una muestra se denomina Muestreo.

Las ventajas que nos brinde el muestreo son:
- Los operativos son menores.
- Posibilita analizar un mayor nmero de variables.
- Permite controlar las variables en estudio.

7.2 TIPOS DE MUESTREO

- Muestreo Probabilstico: Cuando el muestreo o proceso para seleccionar una muestra es
aleatorio. As definimos una muestra probabilstica a una muestra extrada de una poblacin de
tal manera que todo elemento de la poblacin conocida pueda ser incluida en la muestra. Puede
ser a su vez:

A. MUESTREO ALEATORIO SIMPLE: (M.A.S.): Es aquel muestreo aleatorio en el que la
probabilidad de que un elemento resulte seleccionado se mantiene constante a lo largo de
todo el proceso de obtencin de la misma. La tcnica del muestreo puede asimilarse a un
modelo de extraccin de bolas de una urna con devolucin (reemplazamiento) de la bola
extrada. Un mismo dato puede, en consecuencia, resultar muestreado ms de una vez. Cada
eleccin no depender de las anteriores y, por tanto, los datos muestrales sern
estocsticamente independientes.

B. MUESTREO ALEATORIO SISTEMTICO. Esta tcnica consiste en extraer elementos de la
poblacin mediante una regla sistematizadora que previamente hemos creado (sencillamente
cada K elementos). As; numerada la poblacin, se elige (aleatoriamente) un primer elemento
base, partiendo de ste se aplica la regla para conseguir los dems hasta conseguir el tamao
muestral adecuado. Este procedimiento conlleva el riesgo de dar resultados sesgados si en la
poblacin se dan periodicidades o rachas.

C. MUESTREO ALEATORIO ESTRATIFICADO: Consiste en considerar categoras tpicas
diferentes entre s (estratos) que poseen una gran homogeneidad interna (poca varianza
interna) y no obstante son heterogneos entre s (mucha varianza entre estratos). La muestra
se distribuye (se extrae de) entre los estratos predeterminados segn la naturaleza de la
poblacin (ejemplo: sexo, lugar geogrfico, etc.). Dicha distribucin-reparto de la muestra se
denomina afijacin ; que puede ser de varias formas :
- Afijacin simple: a cada estrato le corresponde igual nmero de elementos (extracciones)
muestrales.
- Afijacin proporcional: La distribucin se hace de acuerdo con el peso (tamao) relativo de
cada estrato.
78
- Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo
que se considera la proporcin y la desviacin tpica.
D. MUESTREO POR CONGLOMERADOS: La unidad muestral es un grupo de elementos de la
poblacin que forman previsiblemente una unidad de comportamiento representativo. Dicha
unidad es el conglomerado cuyo comportamiento interno puede ser muy disperso (varianza
grande) pero que presumiblemente poseer un comportamiento prximo a otros
conglomerados (varianza entre conglomerados, pequea). Los conglomerados se estudian en
profundidad hasta conseguir el tamao muestral adecuado.

E. OTROS TIPOS DE MUESTREO. Es evidente que los planteados no son las nicas tcnicas
de muestreo. Existen otras como las no aleatorias: Cuotas, Intencional, Incidental, bola de
nieve, etc. Y otras aleatorias y complicadas como el muestreo por superpoblaciones, y que en
este curso no podemos desarrollar.

7.3 ESTIMACION DE INTERVALO

La "estimacin por intervalo" consiste en determinar un par de valores a y b, tales que constituidos
en intervalo [a ,b] ; y para una probabilidad 1-o prefijada (nivel de confianza) se verifique en
relacin al parmetro u a estimar se cumpla:
o 0 = e 1 ]) , [ ( b a P en otros trminos: o 0 = s s 1 ) ( b a P .

Podemos considerar el nivel de confianza (1-o ) que hemos prefijado para la expresin anterior
como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partir
de la muestra incluya el verdadero valor del parmetro a estimar. Refleja la "confianza" en la
"construccin" del intervalo y de que ste tras concretar la muestra contendr el valor a estimar.
De ah que en trminos numricos dicho nivel o probabilidad haya de tomar un valor alto (0.9,
0.95, 0.99).

Evidentemente el complementario al nivel de confianza; es decir o, nivel de significacin supondr
las probabilidades de cometer el error de no dar por incluido el verdadero valor del parmetro a
estimar en un intervalo en el que realmente si est. De ah y dado que se trata de un error posible
a cometer, su cuantificacin en trminos de probabilidad sea muy pequea (0.1, 0.05, 0.005,..).

En relacin a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza prefijado la amplitud
del intervalo de estimacin ser tambin mayor y por tanto la estimacin ser menos precisa.


La siguiente tabla presenta las diferentes frmulas que ayudaran a crear los intervalos.

79


Para la distribucin Normal utilice la siguiente tabla:

Nivel de confianza o o/2
2
o
Z
90% 0.1 0.05 1.645
95% 0.05 0.025 1.96
99% 0.01 0.005 2.576


Ejemplo N 001

En poblacin cuya distribucin se desconoce se obtiene una muestra (m.a.s.) de 2000 valores de
la que resulta una media de 225 y una desviacin tpica de 10. Suponiendo que la varianza
muestral coincide con la poblacional, estimar un intervalo para la media de la poblacin con un
nivel de confianza del 95%.

Tendramos 1-o =0.95 luego o =0.05; S=10=o (muestra grande n>30); n=2000, para una
poblacin normal.
95 . 0 ) (
2 2
= + s s
n
Z x u
n
Z x P
o o
o o

el resultado sera : e [224,56 , 225,44] con el 95 % de confianza.

80


Ejemplo N 002

Las ventas diarias de cierta oficina comercial se supone que siguen una distribucin normal. Para
estimar el volumen medio de ventas por da se realiza una muestra de 10 das escogidos al azar,
resultando que la media de las ventas de esos 10 das es S/. 100 con una desviacin tpica de S/.
4. Dar un intervalo de estimacin para el volumen medio de ventas por da con una confianza del
95 %.

Conocemos que segn la informacin que poseemos, estamos ante: Distribucin normal;
n=10 (muestra pequea); S=4(poblacional desconocida); media muestral=100;
Para 1-o =0.95, luego o =0.05 con lo que 26 . 2 ) 9 (
2
= gl t
o
(segn tabla T)
95 . 0 ) (
2 2
= + s s
n
S
t x u
n
S
t x P
o o

El resultado sera: e [S/.96,99 ; S/.103,01] con el 95 % de confianza.


Ejemplo N 003

Se quiere obtener un intervalo de confianza para el valor de las ventas medias por hora que se
producen en un kiosco. Para ello realizamos una muestra consistente en elegir al azar las ventas
que se realizaron durante 1000 horas distintas; muestra cuyos resultados fueron: ventas medias
por hora S/. 4000, y varianza de dicha muestra S
2
/. 4000. Obtener dicho intervalo con un nivel de
confianza del 95.5 %.

Queremos construir un intervalo para la media con las siguientes caractersticas:

Tamao muestral=n=1000, con muestreo aleatorio simple, la poblacin no es normal ni
conocemos su varianza.
El resultado de la muestra es 4000 = x , S
2
=4000.

Si bien se trata de un intervalo para la media con varianza desconocida y poblacin no normal,
dado que el tamao muestral es grande podemos suponer normalidad y tomar como varianza
poblacional a la muestral as:
95 . 0 ) (
2 2
= + s s
n
z x u
n
z x P
o o
o o

El resultado sera: e [S/.399,08 ; S/.4003,92] con el 95 % de confianza.


7.4 DETERMINACION DEL TAMAO DE LA MUESTRA

Cuando se necesita informacin para realizar estudios con datos estadsticos y no se puede
contar un censo, porque es muy caro, o porque demora mucho o no se cuenta con el personal
adecuado; entonces ser necesario obtener una muestra, ahora. Pero viene la pregunta: cul
ser el nmero adecuado mnimo del tamao de la muestra? En principio existe todo un proceso
para obtener una muestra representativa de la poblacin. Si el mtodo es aleatorio o
probabilistico, entonces el nmero adecuado de los elementos de la muestra, se pueden calcular
usando las siguientes frmulas.

1. CUANDO EL ESTUDIO ES DE CARCTER CUALITATIVO
a. Cuando se supone que N es muy grande o cuando el muestreo es con reposicin:
2
2
E
PQ Z
n
o
=
81
b. Cuando la poblacin es finita (se conoce N) o el muestro es sin reposicin.
PQ Z E N
PQ NZ
n
2 2
2
) 1 (
o
o
+
=
Donde:
P=Proporcin de xito; que se conoce por estudios anteriores o similares.
Q=(1-P). Proporcin de fracaso.
Zo=Valor que se obtiene de la distribucin normal, para un nivel de significacin a.
Generalmente se toma:
Z=1.96 para un nivel de significancia del 5%.
Z=2.575 para un nivel de significancia del 1%.
E=Error de estimacin. Valor que lo determina el investigador. Se sugiere valores en torno
al 5%.
N= Nmero de los elementos de la poblacin.

Nota:
Si no se conoce P, se puede adoptar las siguientes decisiones:
i) Tomar una muestra piloto y calcular el valor de P.
ii) Considerar el valor de P=0.5, lo cual dar el nmero de elementos de la muestra el
mayor posible.


2. CUANDO EL ESTUDIO ES DE CARCTER CUANTITATIVO
a) Cuando no se conoce el tamao N de la poblacin o ste es infinito:
2
2 2
E
Z
n
o
o
=

b) Cuando el tamao N de la poblacin es finito:
2 2 2
2 2
) 1 ( o
o
o
o
Z E N
NZ
n
+
=
Ejemplos N 004

Se van a realizar un gran y desconocido nmero de ensayos para calibrar la resistencia media a la
rotura de un determinado azulejo en una partida de 10 000,000 unidades. Si deseamos
cometer un error inferior a 10 kg/cm
2
, y por ensayos anteriores conocemos que la varianza en la
rotura ha sido de 40 (kg/cm
2
)
2
, Qu nmero de ensayos hemos de realizar si hemos decidido
trabajar con un nivel de confianza del 95%?

Si suponemos un gran nmero de ensayos, suponemos, tambin, que el tamao muestral es
grande, por lo que podemos establecer normalidad. Los datos serian los siguientes: o=95%,
E
2
=10 kg/cm
2
,o
2
=40(kg/cm
2
)
2
.
Utilizando la frmula siguiente:
2
2 2
E
Z
n
o
o
= , tenemos:
15 36 . 15
10
) 40 )( 96 . 1 (
2
~ = = n muestras de azulejos.

Ejemplo N 005

Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesor
decidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si el
error que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel de
confianza del 95%.

Tenemos los siguientes datos:
82
N=100, E=3%, o=95%, p=0.5. q=1-p=0.5

Utilizando la frmula tenemos:
91 51 . 91
) 5 . 0 )( 5 . 0 ( ) 96 . 1 ( ) 03 . 0 )( 1 100 (
) 5 . 0 )( 5 . 0 ( ) 96 . 1 )( 100 (
) 1 (
2 2
2
2 2
2
=
+
=
+
=
PQ Z E N
PQ NZ
n
o
o
alumnos.

Ejemplo N 006

Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesor
decidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si el
error que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel de
confianza del 95%.

El tamao de la poblacin es pequeo con N=100, E=3, o=95%, p=0,5 q=1-p=0.5.

Utilizando la frmula tenemos:
91 51 . 91
) 5 . 0 )( 5 . 0 ( ) 96 . 1 ( ) 03 . 0 )( 1 100 (
) 5 . 0 )( 5 . 0 ( ) 96 . 1 )( 100 (
) 1 (
2 2
2
2 2
2
=
+
=
+
=
PQ Z E N
PQ NZ
n
o
o
alumnos.


7.5 CONSTRASTE DE HIPTESIS

El problema del contraste de hiptesis consiste bsicamente en comprobar cotejar, decidir, en
definitiva, sobre la veracidad de una hiptesis prefijada previamente como supuestamente cierta.
En trminos estadsticos, la o las hiptesis que formulamos lo sern lgicamente sobre la
poblacin. Bien afectando a algn parmetro de sta, lo que da origen a los contrastes
paramtricos o bien a otras caractersticas de la mismas que no lo sean estrictamente, lo que
origina contrates "no" paramtricos.

La solucin estadstica del problema de contrastacin se basar en los datos muestrales y la base
estadstica (probabilstica) de la que arrancar el contraste, de algn estadstico muestral.

Pasemos a definir los principales conceptos implicados en nuestro problema:

Regin crtica: Ser aquella regin del campo de variacin del estadstico tal que si contiene al
valor evaluado del mismo con los datos muestrales nos llevar a rechazar la hiptesis. La
designaremos por R
1


Regin de aceptacin: Es la regin complementaria de la anterior. Si el valor evaluado del
estadstico pertenece a ella No rechazamos la hiptesis (las hiptesis nunca se aceptan de forma
definitiva, slo se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nueva
informacin que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por
R
0
. Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.

Una hiptesis estadstica (paramtrica): Es una conjetura sobre el valor concreto que tiene en
realidad. El establecer una hiptesis sobre un parmetro u, supone dividir los posibles valores del
parmetro en dos grupos disjuntos tales que unos son hipotticamente ciertos (u
0
) y los otros (u
1
)
no lo son. A la hiptesis que se desea contrastar se la denomina "hiptesis nula", siendo, por
tanto, el valor o valores u
0
que hipotticamente consideramos reales, dicha hiptesis viene
expresada como H
0
. Alternativamente y consecuentemente se establece la denominada
"hiptesis alternativa" (H
1
) compuesta sta por el valor o valores u
1
que en consecuencia de la
eleccin y de la complementariedad de los de la hiptesis nula, son los que, en principio, no
consideramos cmo hipotticamente reales.

83
El hecho de que las hiptesis, tanto la nula cmo la alternativa puedan recoger en sus
planteamientos uno o varios valores, da lugar a hiptesis de carcter simple, si el nmero de
valores plausibles e hipotticos es de uno en ambas, o bien a hiptesis compuestas si dicho valor
no es nico en alguna de ellas.

Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hiptesis
puede plantearse como un problema de decisin, en el que evidentemente existe la posibilidad de
fracasar o acertar en la eleccin o decisin a la hora de concluir que la hiptesis, bien nula o bien
alternativa, son rechazables o no.

El problema de decisin: rechazo/no rechazo, vendra expresado en las siguientes opciones en
forma de tabla:

Hiptesis/Accin No Rechazamos Rechazamos
Es cierta Correcto Error Tipo I
Es falsa Error Tipo II Correcto

- Si la hiptesis nula (H
0
) es cierta y nuestra decisin es no rechazarla, la decisin ha sido
correcta.
- Si la hiptesis nula (H
0
) es cierta y nuestra decisin es rechazarla, la decisin provoca un
error. Dicho error se denomina error tipo I.
- Si la hiptesis nula (H
0
) es falsa y nuestra decisin es no rechazarla, la decisin provoca
un error. Dicho error se denomina error tipo II.
- Si la hiptesis nula (H
0
) es falsa y nuestra decisin es rechazarla, la decisin ha sido
correcta.

Ejemplo:

Enunciado 1:
La altura del estudiante de la Universidad Nacional de Tumbes es 1,65 m.
Planteando las Hiptesis tenemos:
H
0
: =1.65
H
1
: >1.65, <1.65 = 1.65

Enunciado 2:
El promedio ponderado de los alumnos de la Escuela de contabilidad de la Universidad Nacional
de Tumbes es 13.5.
Planteando las Hiptesis tenemos:
H
0
: =13.5
H
1
: >13.5, <13.5 = 13.5

Enunciado 3:
El porcentaje de alumnos de escuelas de la Regin que tienen caries es mayor que 0.7.
Planteando las Hiptesis tenemos:
H
0
: p>0.7
H
1
: p<0.7

PRUEBA UNILATERALES Y BILATERALES

Dependiendo de cmo se formulen H
0
y H
1
, las pruebas pueden ser:

a) Pruebas Unilaterales o de una cola: Que puede ser:
- Prueba de cola inferior o de lado izquierdo: cuyo caso la hiptesis en general toma la
siguiente forma:
Ho: u=u
0
, H
1
: u<u
0
84
Donde u es el parmetro de la poblacin estadstica sobre la cual se esta haciendo la
prueba de hiptesis.

Ejemplo:
1) H
0
: =1.65
H
1
: <1.65

2) H
0
: =13.5
H
1
: <13.5

- Prueba de cola superior o de lado derecho: cuyo caso la hiptesis en general toma la
siguiente forma:
Ho: u=u
0
, H
1
: u>u
0
Donde u es el parmetro de la poblacin estadstica sobre la cual se esta haciendo la
prueba de hiptesis.

Ejemplo:
1) H
0
: =1.65
H
1
: >1.65

2) H
0
: =13.5
H
1
: >13.5

b) Pruebas de dos colas o bilateral: Que puede ser:
Ho: u=u
0
, H
1
: u= u
0

Ejemplo:
1) H
0
: =1.65
H
1
: = 1.65

2) H
0
: =13.5
H
1
: = 13.5


PROCEDIMIENTO PARA UNA PRUEBA DE HIPOTESIS
Los pasos a seguir son:
1. Formular la hiptesis nula H
0
y la alternativa H
1
, de acuerdo al problema.
2. Escoger un nivel de significacin o riesgos o.
3. Elegir la estadstica de prueba apropiada, cuya distribucin por muestreo sea conocida en
el supuesto de que H
o
es cierta.
4. En base a o y H
1
, determinar el valor (o los valores) crticos y con ello se establecen las
regiones de aceptacin o rechazo.
5. Calcular los valores de la prueba estadstica a partir de una muestra aleatoria de tamao n,
Ho y reemplazarlos en la estadstica de prueba elegida en el paso 3, para hallar el valor
experimental.
6. Tomar la decisin de aceptar H
o
si el valor experimental cae en la regin de aceptacin y
rechazarla si dicho valor cae en la regin crtica o de rechazo.
7. Opcional: Si se rechaza H
0
, se puede hallar un intervalo de confianza para el parmetro de
inters.







85
PRUEBA DE HIPOTESIS SOBRE LA MEDIA POBLACIONAL
Caso A: Cuando la varianza poblacional es conocida.

Deseamos contrastar la hiptesis de que el parmetro poblacional u = toma un determinado
valor =0 . Conocemos que la poblacin se distribuye normalmente y conocemos tambin su
varianza , o bien si nos es desconocida, el tamao muestral es lo suficientemente grande
cmo para poder utilizar la muestral cmo poblacional.

Hemos determinado un nivel de significacin para la realizacin del contraste y vamos a
plantearlo en el supuesto de realizar una muestra aleatoria de tamao n.
As: conocemos que
(

n
u N x
o
, de lo que deducimos que ] 1 , 0 [ N
n
u x

o
de forma que
la hiptesis nula es: H
0
: =
0.
El estadstico est dado por:
n
u x
Z
o
0

= .

Ejemplo N 000

De 100 observaciones de una poblacin normal se obtiene que x = 5 y que S=2.Contrastar
con un nivel de significacin del 5% la hiptesis de que la media de la poblacin sea 7.

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
:
0
=7
H
1
:
0 =
7
2. El nivel de significancia es del 5%. (o=5%)
3.
n
u x
Z
o
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica: 10
100
2
7 5
=

= Z
6. Dado que Z=-10 y no pertenece a la regin de aceptacin estamos en condiciones de
rechazar la hiptesis nula, luego aceptar la alternativa :
0 =
7.


Ejemplo N 00z

86
Un empresario est considerando la posibilidad de ampliar su negocio mediante la adquisicin
de un pequeo bar. El dueo actual del bar afirma que el ingreso diario del establecimiento
sigue una distribucin normal de media 675 soles y una desviacin estndar de 75 soles. Para
comprobar si deca la verdad, tom una muestra de treinta das y sta revel un ingreso diario
promedio de 625 soles. Utilizando un nivel de significacin del 10 %. Hay evidencia de que el
ingreso diario promedio sea menor del que afirma el presente dueo?.

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
:
0 >
675
H
1
:
0
<675
2. El nivel de significancia es del 10%. (o=10%)
3.
n
u x
Z
o
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica: 65 . 3
30
75
675 625
=

= Z
6. Dado que Z=-3.65 y no pertenece a la regin de aceptacin estamos en condiciones de
rechazar la hiptesis nula, luego aceptar la alternativa:
0
<7.


Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequea.

Deseamos contrastar la hiptesis de que el parmetro poblacional u = toma un determinado
valor =0 . Desconocemos la varianza de la poblacin y, dado que el tamao muestral es
pequeo, no podemos utilizar la muestral en su lugar.

Hemos determinado un nivel de significacin para la realizacin del contraste y vamos a plantearlo
en el supuesto de realizar una muestra aleatoria de tamao n.

As: conocemos que
1

n
t
n
s
u x
de forma que la hiptesis nula es: H
0
: =
0.

El estadstico est dado por:
n
s
u x
t
0

= .

Ejemplo 2.

Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71
metros con desviacin tpica de 0,02 .Contrastar la hiptesis de que la estatura media nacional
sea de 1.75 metros si utilizamos un nivel del significacin del 5%. Se supone normalidad

87
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
:
0
=1.75
H
1
:
0 =
1.75
2. El nivel de significancia es del 5%. (o=5%).
3.
n
s
u x
t
0

=
4. Establecemos la regin de aceptacin y de rechazo:
Utilizamos la tabla T.


5. Realizamos la prueba estadstica: 25 . 8
17
02 . 0
75 . 1 71 . 1
=

= t
6. Dado que t=-8.25 y no pertenece a la regin de aceptacin estamos en condiciones de
rechazar la hiptesis nula, luego aceptar la alternativa:
0
=1.75.



PRUEBA DE HIPOTESIS PARA LA PROPORCIN POBLACIONAL: p

Se trata de efectuar una prueba de hiptesis acerca de la proporcin de elementos con cierto
atributo en una poblacin, hiptesis de la forma:
H
0
: p=p
0.
H
1
: p= p
0.

H
0
: psp
0.
H
1
: p>p
0.

H
0
: p>p
0.
H
1
: p<p
0.
El estadstico est dado por:
n
p p
p P
Z
) 1 (
0 0
0

=
Donde
n
x
P = (proporcin muestral)

Tiene una distribucin N(0,1) cuando n>30.

Ejemplo 4.

Una empresa de publicidad desea comprobar si un determinado programa de televisin es
visto por el 30% de la audiencia potencial .Para ello se escoge al azar una muestra de 200
familias resultando que de ellas 50 lo ven asiduamente. Contrastar la hiptesis con un nivel de
significacin del 5%.

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: p=0.3
88
H
1
: p
=
0.30
2. El nivel de significancia es del 5%. (o=5%).
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica:
25 . 0
200
50
= = P
54 . 1
200
) 3 . 0 1 ( 3 . 0
30 . 0 25 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=-1.54 y pertenece a la regin de aceptacin estamos en condiciones de
acepta la hiptesis nula, es decir: p=0,3

Ejemplo

Un fabricante de refrescos sin burbujas desea sacar al mercado una variedad de su producto que
tenga burbujas. Su director comercial opina que al menos el 50 % de los consumidores ver con
buenos ojos la innovacin. Se realiza un sondeo de mercado y resulta que de 100 consumidores
encuestados 40 son favorables a la innovacin.

a) Contrastar la hiptesis del director comercial frente a la alternativa de que el % de aceptacin
es inferior, con un nivel de significacin del 1%.

b) Si el aceptable la hiptesis de que el % de aceptacin del nuevo producto es inferior o igual al
30 % el fabricante decidir no fabricarlo. Si es aceptable el criterio del director comercial
entonces s fabricarn el refresco con burbujas. Y si ninguna de las 2 hiptesis es aceptable
procedern a hacer otro sondeo. Para tomar esta decisin trabajarn con un nivel de
significacin del 5 %. Por qu optarn?.






Para el punto a)
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: ps0.5
H
1
: p>0.5
2. El nivel de significancia es del 1%. (o=1%).
89
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica:
4 . 0
100
40
= = P
2
100
) 5 . 0 1 ( 5 . 0
5 . 0 4 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=-2 y pertenece a la regin de aceptacin estamos en condiciones de aceptar
la hiptesis nula, es decir: ps0,5.


Para el punto b)

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: ps0.3
H
1
: p>0.3
2. El nivel de significancia es del 1%. (o=1%).
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica:
90
4 . 0
100
40
= = P
18 . 2
100
) 3 . 0 1 ( 3 . 0
3 . 0 4 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=2.18 y pertenece a la regin de aceptacin estamos en condiciones de
aceptar la hiptesis nula, es decir: ps0,3. Por lo tanto se recomiendo no fabricar el
refresco.



ESTIMACIN DE UNA DIFERENCIA ENTRE DOS MEDIAS DE POBLACIONES NORMALES
(Poblacin 1 y 2)

Para encontrar el intervalo de la diferencia de la media de dos poblaciones se considera que las
muestras tomadas de las poblaciones son independientes.

SI SE CONOCE LAS DESVIACIONES ESTNDAR POBLACIONALES (
1
o Y
2
o ).
El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior: ( )
2
2
2
1
2
1
2 1
n n
z x x
tabla
o o
+ - ;
Lmite superior: ( )
2
2
2
1
2
1
2 1
n n
z x x
tabla
o o
+ - +
Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
1
n : es el tamao de la muestra tomada de la poblacin 2
1
x : es la media de la muestra tomada de la poblacin 1
2
x : es la media de la muestra tomada de la poblacin 2
1
o : es la desviacin estndar de la poblacin 1
2
o : es la desviacin estndar de la poblacin 2
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

SI NO SE CONOCE LAS DESVIACIONES ESTNDAR POBLACIONALES (
1
o Y
2
o ).

El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior:
2 1
2 ; 2 1
1 1
* *
2 1
n n
s t x x
p n n gl tabla
+
+ =
;
Lmite superior:
2 1
2 ; 2 1
1 1
* *
2 1
n n
s t x x
p n n gl tabla
+ +
+ =

Donde:
2 ; =n gl tabla
t : es el valor t de la tabla t de Student, con 2
2 1
+ n n grados de libertad

Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales,
2
c
s
representa entonces la varianza comn y se calcula:
91
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
p


ESTIMACIN DE UNA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES
(Poblacin 1 y 2). (Caso de muestras grandes)

El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior: ( )
2
2 2
1
1 1
2 1


n
Q P
n
Q P
z p p
tabla
-
+
-
- ;
Lmite superior: ( )
2
2 2
1
1 1
2 1


n
Q P
n
Q P
z p p
tabla
-
+
-
- +
Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
2
n : es el tamao de la muestra tomada de la poblacin 2
1

P : es la proporcin en la muestra tomada de la poblacin 1;


1 1

1

P Q =
2

P : es la proporcin en la muestra tomada de la poblacin 1;


2 2

1

P Q =
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE MEDIAS DE POBLACIONES CON
DISTRIBUCIN NORMAL (Con muestras independientes).

Aqu se tiene entonces: ( )
2
1 1 1
; ~ o N X y ( )
2
2 2 2
; ~ o N X

En este caso las hiptesis son de la forma:
1.
2 1
2 1 0
:
:


=
=
a
H
H
2.
2 1
2 1 0
:
:


<
=
a
H
H
3.
En forma equivalente se puede plantear las hiptesis:
1.
0 :
0 :
2 1
2 1 0
=
=


a
H
H
2.
0 :
0 :
2 1
2 1 0
<
=


a
H
H
3.
0 :
0 :
2 1
2 1 0
>
=


a
H
H


CASO EN QUE SE CONOCEN LAS VARIANZAS POBLACIONALES (
2
1
o Y
2
2
o )
El valor calculado es:
2
2
2
1
2
1
2 1
n n
x x
z
calc
o o
+

=
Los valores crticos son: Hiptesis tipo 1:
tabla
z y
tabla
z , Hiptesis tipo 2:
tabla
z , Hiptesis tipo
3:

CASO EN QUE NO SE CONOCEN LAS VARIANZAS POBLACIONALES (
2
1
o Y
2
2
o )

Si se considera que:
2
2
2
1
o o =
2 1
2 1 0
:
:


>
=
a
H
H
tabla
z
92
El valor calculado es:
2 1
2 1
1 1
n n
s
x x
t
p
calc
+

=
Donde:
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
p

2
1
s y
2
2
s ; son las varianzas de las muestras sacadas de la poblacin 1 y 2 respectivamente
1
x y
2
x ; son las medias de las muestras sacadas de la poblacin 1 y 2 respectivamente
Los valores crticos son:
Hiptesis tipo 1:
2 ;
2 1
+ =

n n gl tabla
t y
2 ;
2 1
+ = n n gl tabla
t
Hiptesis tipo 2:
2 ;
2 1
+ =

n n gl tabla
t
Hiptesis tipo 3:
2 ;
2 1
+ = n n gl tabla
t

SI SE CONSIDERA QUE:
2
2
2
1
o o =
El valor calculado es:
2
2
2
1
2
1
2 1
n
s
n
s
x x
t
calc
+

=
Los valores crticos son los mismos anteriores, pero, los grados de libertad estn dados por:
2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+
+
|
|
.
|

\
|
+
|
|
.
|

\
|
+
=
n
s
n n
s
n
n
s
n
s
gl


Ejemplo: Dos fabricantes A y B producen un artculo similar, cuyas vidas tiles tienen
desviaciones estndar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida
til de estos artculos se extrae una muestra aleatoria de 60 artculos de cada fabricante
encontrndose la duracin media de 1.230 horas para la marca A y de 1.190 horas para la marca
B. Se puede concluir a un nivel de significacin del 5% que los artculos de marca A tienen
mayor duracin media que los artculos de marca B?

Se tiene una prueba de hiptesis para la diferencia de dos medias con varianzas poblacionales
conocidas.
Datos: 645 , 1 z 90 ; 120 ; 190 . 1 ; 230 . 1 ; 60
tabla
2 2
2
2 2
1 2 1 2 1
= = = = = = = o o x x n n
En este problema, si bien es cierto, no se dice que las poblaciones sean normales, se tiene que
los tamaos de muestra son grandes, por lo que la estadstica de prueba:

Tiene una distribucin aproximadamente normal estndar, por lo que se puede usar lo presentado
en el punto 4.1.
0 :
0 :
2 1
2 1 0
>
=


a
H
H

2
2
2
1
2
1
2 1
n n
x x
z
calc
o o
+

=
93
El valor calculado es: 07 , 2
60
90
60
120
190 . 1 230 . 1
2 2
2
2
2
1
2
1
2 1
=
+

=
+

=
n n
x x
z
calc
o o

Valor critico: 645 , 1 =
tabla
z
La regin de rechazo es entonces: | | = ; 645 , 1 RR

Por lo tanto se rechaza Ho, se acepta Ha. Se puede decir que existen evidencias significativas, al
nivel de significacin del 5%, para decir que la duracin media de los artculos de marca A es
mayor a los de marca B.


PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE PROPORCIONES (Muestras grandes).
En este caso las hiptesis son de la forma:
1.
2 1
2 1 0
:
:
P P H
P P H
a
=
=
2.
2 1
2 1 0
:
:
P P H
P P H
a
<
=
3.
2 1
2 1 0
:
:
P P H
P P H
a
>
=


En forma equivalente se puede plantear las hiptesis:
1.
0 :
0 :
2 1
2 1 0
=
=
P P H
P P H
a
2.
0 :
0 :
2 1
2 1 0
<
=
P P H
P P H
a
3.
0 :
0 :
2 1
2 1 0
>
=
P P H
P P H
a


El valor calculado es:
( )
|
|
.
|

\
|
+ -

=
2 1
2 1
1 1


n n
P P
P P
z
calc

Donde:
2 1
2 2 1 1

n n
P n P n
P
+
- + -
=
Los valores crticos son:
Hiptesis tipo 1:
tabla
z y
tabla
z
Hiptesis tipo 2:
tabla
z
Hiptesis tipo 3:

Ejemplo:

Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada poblacin
revel que 120 hombres y 120 mujeres estaban a favor de cierto candidato. Se puede concluir a
un nivel de significacin del 5% que la proporcin de hombres a favor del candidato es mayor que
la proporcin de mujeres?

Aqu se tiene una prueba de hiptesis para diferencias de proporciones con muestras grandes.
Si denotamos con 1 a la poblacin de hombres y con 2 a la de mujeres, se tiene:
1 Plantear las hiptesis de inters
tabla
z
94
2 1
2 1 0
:
:
P P H
P P H
a
>
=

2 Calcular la estadstica de prueba (valor calculado), bajo Ho:
El valor calculado es:
( )
76 , 2
400
1
300
1
66 , 0 34 , 0
3 , 0 4 , 0
1 1


2 1
2 1
=
|
.
|

\
|
+ -

=
|
|
.
|

\
|
+ -

=
n n
P P
P P
z
calc

Donde: 34 , 0
400 300
3 , 0 400 4 , 0 300

2 1
2 2 1 1
=
+
- + -
=
+
- + -
=
n n
P n P n
P

3 Construir la regla de decisin y decidir
El valor crtico es: 645 , 1 =
tabla
z
La regin de rechazo (RR) es: | | = ; 645 , 1 RR
Por lo tanto se rechaza Ho, se acepta Ha
Se puede decir entonces que existen evidencias suficientes, a un 5% de significacin, para decir
que la proporcin de hombres a favor del candidato es mayor que el de las mujeres, en esa
poblacin

Vous aimerez peut-être aussi