Vous êtes sur la page 1sur 19

UNIDAD III:INFERENCIA ESTADSTICA

TEMA

PRUEBAS DE HIPTESIS
Contenidos
11.1.Introduccin
11.2.Elementos de las pruebas de hiptesis
11.3.Prueba de hiptesis para una media poblacional
11.3.1. Caso: muestra grande
11.3.2. Caso: muestra pequea
11.4.Prueba de hiptesis para la diferencia entre dos medias
poblacionales
11.4.1. Muestras independientes
11.4.1.1. Caso de muestras grandes
11.4.1.2. Caso de muestras pequeas
11.4.2. Muestras apareadas
11.5.Pruebas de hiptesis para una proporcin poblacional
11.5.1. Prueba de hiptesis para un conteo
11.5.2. Prueba de hiptesis para una proporcin
11.6.Pruebas de hiptesis para dos proporciones poblacionales

11.1. INTRODUCCIN
Al iniciar el estudio de los mtodos estadsticos (descriptivos e inferenciales) se indic que a
travs de la inferencia estadstica se poda llegar a generalizaciones respecto de las caractersticas de
una poblacin, utilizando las observaciones empricas de una muestra tomada al azar.
Una vez introducidas las nociones de distribucin de probabilidad de una variable aleatoria y de
que los estadgrafos son variables aleatorias y por tanto tienen en el muestreo una distribucin de
probabilidades, se est en condiciones de desarrollar los mtodos de inferencia estadstica que permiten
resolver dos grandes grupos de problemas relacionados con: a) la estimacin de parmetros
poblacionales a partir del conocimiento de una muestra y b) probar si un enunciado afirmativo (hiptesis
o suposicin) acerca de un parmetro poblacional, o ms de uno, puede sostenerse o no frente a la
evidencia emprica aportada por una o ms muestras aleatorias.
La gran importancia de la inferencia estadstica radica en que proporciona herramientas para
actuar, pese a desconocer cuales son las verdaderas caractersticas de la poblacin, solamente a costa
de tomar conciencia de la existencia de una condicin de incertidumbre. Esto ya fue analizado al estimar
un parmetro poblacional tanto en forma puntual (error de estimacin) como intervalar (nivel de
confianza).
En este captulo se introducirn las denominadas pruebas de hiptesis. Como primera idea se
dir que todo el mundo toma decisiones en su vida diaria, algunas son de fundamental importancia y
otras son menos significativas. Pero en todos los casos se acta de acuerdo a un patrn que consiste en
ponderar alternativas y optar por alguna de ellas, con base al conocimiento disponible, tras lo cual se
suele llevar a la prctica algn tipo de accin, como por ejemplo se emprende un viaje, se hace una
compra, se asiste a una reunin y otras.
En el campo de las ciencias experimentales, es tan importante el papel que desempea la
Estadstica en la toma de decisiones que se la suele definir como la ciencia para el estudio de las
decisiones frente a la incertidumbre". En otras palabras, se puede decir que se llaman decisiones
estadsticas a las decisiones que se toman con respecto a las poblaciones, a partir del conocimiento
incompleto. Por ejemplo, a partir de los datos del muestreo se puede decidir si una nueva variedad tiene
mayor rendimiento que otra de uso tradicional, o si el agregado de un conservante mejora la vida til de
un alimento o si un hbitat es ms favorable para la vizcacha que otro, etc.
En el campo de la investigacin, por lo general los procesos de toma de decisiones comienzan
con la identificacin de un problema de inters, siguen con el planteo de dos hiptesis que postulan
puntos de vista opuestos y, con base a informacin emprica se concluye con el rechazo de una de ellas
y el sostenimiento de la otra. En Estadstica las dos hiptesis mutuamente excluyentes reciben el
nombre de hiptesis nula e hiptesis alternativa, y se expresan en forma simblica. Un ejemplo de
esto ltimo puede ser, respectivamente:
y H1: 1 2
Ho: 1 = 2
14
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


El anlisis estadstico de los datos muestrales permitir discernir con bases probabilsticas, cul
es la hiptesis que encuentra apoyo o sostenibilidad. En el campo cientfico los investigadores partirn
del enunciado de una hiptesis en trminos del problema de inters, que es la hiptesis de
investigacin, hiptesis cientfica o hiptesis de trabajo   y que, por lo general, coincide con la
hiptesis estadstica alternativa. Las hiptesis son proposiciones provisionales y exploratorias y, por
tanto, su valor de veracidad o falsedad depende crticamente de las pruebas empricas. En este sentido,
la concepcin de reproducibilidad de los resultados es fundamental para confirmar una hiptesis como
explicacin de un fenmeno. As, cuando resulte un valor muestral observado de la media  prximo al
de la media poblacional de la correspondiente distribucin en el muestreo (valor supuesto o hipottico),
esto es cuando resulta un valor mtrico que responde a la variabilidad esperada por azar, no se podr
contradecir a lo enunciado en la hiptesis nula (hiptesis verosmil) y habr que tomar una decisin
desfavorable a la hiptesis de investigacin. Los procedimientos que llevan a sostener o descartar la
hiptesis nula, perjudicando o favoreciendo respectivamente el sostenimiento de la hiptesis alternativa,
son denominados pruebas de hiptesis.
Para la toma de decisin en una prueba de hiptesis existen dos alternativas muy utilizadas, a
saber: a) uno tradicional que se basa en utilizar el denominado valor crtico del estadgrafo de la
prueba de hiptesis de acuerdo a su distribucin de probabilidades en el muestreo y, b) uno ms
moderno que ha cobrado popularidad a travs de los software estadsticos que emplea el valor p, que
se refiere a la probabilidad condicional de que el valor tomado por el estadgrafo muestral se deba al
azar. Una tercera alternativa es emplear una estimacin paramtrica bajo enfoque de prueba de
hiptesis.
En este captulo se presentarn las pruebas de hiptesis referidas a las medias y a las
proporciones de una o dos poblaciones. En los siguientes captulos sern tratadas pruebas de hiptesis
para resolver otros tipos de problemas.

11.2. ELEMENTOS DE LAS PRUEBAS DE HIPTESIS


Las pruebas de hiptesis constituyen un procedimiento estadstico slido y riguroso para emitir
juicios probables acerca de una poblacin y, al mismo tiempo, conocer la magnitud y la probabilidad de
los errores en los que se puede incurrir al expresar los correspondientes juicios finales. Por ejemplo, se
suele afirmar que el hbito de fumar causa cncer; an as, se conocen muchos casos de personas que
pese a haber fumado diariamente gran cantidad de cigarrillos jams padecieron cncer, llegando a
alcanzar edades muy avanzadas, as como hay muchos casos de personas que jams fumaron y
murieron a causa del cncer. Entonces, hasta qu grado es posible afirmar que el cigarrillo produce
cncer? Para averiguarlo se necesita realizar un experimento bajo la hiptesis de investigacin que los
fumadores son ms propensos a morir por cncer que los no fumadores, y aplicar una prueba de
hiptesis a datos de una muestra aleatoria de fumadores y otra de no fumadores, asumiendo a la luz de
los resultados o evidencia emprica un cierto margen de riesgo de equivocarse en las conclusiones.
Por ejemplo si, sobre la base de datos de una muestra, un ingeniero tiene que tomar una
decisin acerca de que un cierto plan de fertilizacin aumenta el verdadero rendimiento promedio () de
un cultivo hortcola al menos en 3000 kg/ha, entonces puede realizar una prueba de hiptesis con una
muestra de cultivos para corroborar o desmentir sus sospechas. Lo mismo si un fabricante de una lnea
de productos alimentarios destinada a lactantes quiere decidir la fabricacin de un nuevo producto si se
demuestra que el 80% de los lactantes que consuman el nuevo producto aumentan significativamente su
peso. O bien si un viticultor que produce uvas para consumo en fresco en una zona inserta en un
entorno natural tiene prdidas importantes a causa de la depredacin de los pjaros, insectos y
alimaas. En los tres casos los problemas pueden conducir a postular una hiptesis para someterla a
prueba, las que respectivamente seran: el rendimiento medio del cultivo con el plan de fertilizacin es
cuando menos de 3.000 kg/ha superior a cuando el plan no se aplica, el 80% de los lactantes que
consumen el nuevo producto durante cierto perodo alcanzan mayor peso que si consumen otro
producto, las prdidas de uva por accin de los pjaros, insectos y alimaas superan un cierto nivel
econmico.
Definicin 11.1
Una hiptesis es una aseveracin o conjetura con respecto a un problema de inters.
Para aplicar una prueba de hiptesis hay que traducir la problemtica a dos enunciados
complementarios conocidos como hiptesis estadsticas.
Definicin 11.2
Una hiptesis estadstica es una aseveracin o conjetura con respecto a una o ms poblaciones. En
el anlisis estadstico es usual el planteo de un par de hiptesis: la hiptesis nula y la hiptesis
alternativa. Las hiptesis estadsticas se plantean formalmente en notacin simblica.
15
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


Definicin 11.3.
La hiptesis estadstica nula, simbolizada como Ho, es la hiptesis que se somete a prueba. Por lo
general, es una afirmacin acerca de que un parmetro poblacional tiene un valor especfico (o bien no
se diferencia de un valor referencial).
Definicin 11.4.
La hiptesis estadstica alternativa, simbolizada como H1, es una afirmacin sobre el mismo
parmetro poblacional considerado en la hiptesis nula, que especifica que el mismo tiene un valor
diferente, de alguna manera, al postulado en la hiptesis nula.
En el contexto de las ciencias experimentales, la hiptesis alternativa concuerda con la hiptesis de
investigacin, porque representa lo que el investigador espera demostrar como verdadero, dado que
expresa el enunciado explicativo de su interpretacin acerca de un fenmeno aleatorio de inters. La
hiptesis de investigacin se plantea en trminos del problema en cuestin.
Una hiptesis nula referida a un parmetro poblacional siempre se establecer de modo que
especifique un valor exacto del parmetro, en tanto que la hiptesis alternativa permite la posibilidad de
que el parmetro tome varios valores (mayor al especificado, menor al especificado o, bien diferente al
especificado). Adems la hiptesis alternativa suele ser la afirmacin que el experimentador desea
demostrar que es verdadera, de modo que el deseo profundo de ste es que la prueba de hiptesis le
ayude a demostrar a travs de la evidencia muestral que la hiptesis nula no puede sostenerse, lo cual
implicar una probable veracidad de la hiptesis alternativa, que enuncia la interpretacin o creencia
acerca de la realidad.
Definicin 11.5.
Una prueba de hiptesis es un proceso que permite tomar una decisin entre dos hiptesis opuestas:
Ho y H1. Estas hiptesis se plantean de modo que una es la negacin de la otra (de esta forma una de
ellas siempre resulta verdadera y la otra siempre es falsa). En la prctica la hiptesis nula, Ho, se somete
a prueba esperando poder demostrar que su ocurrencia es muy improbable, lo cual implicar que la otra
hiptesis, H1, es probablemente la verdadera.
La idea bsica de la prueba de hiptesis es que los hechos (datos muestrales) aporten la
evidencia para refutar Ho, o sea que la hiptesis nula es la afirmacin que puede resultar refutada por la
realidad. El resultado deseado de la persona que realiza la prueba, se expresa en la hiptesis alternativa
bajo la conviccin de que los hechos demostrarn la factibilidad del enunciado hipottico o teora del
investigador, porque demostrarn la improbable veracidad de hiptesis nula.
El planteamiento formal de la hiptesis nula est vinculado a una estructura probabilstica que
hace referencia a la probabilidad de que se tomen decisiones que lleven a una conclusin errnea. Las
pruebas estadsticas se aplican bajo el supuesto de que la hiptesis nula es un enunciado verdadero.
Frente a la evidencia muestral que proporciona una informacin incompleta acerca de la poblacin, se
puede tomar la decisin de no sostener la hiptesis nula (no aceptar o rechazar Ho) o bien sostenerla
(aceptar Ho). Pero los estados de la naturaleza pueden ser: la hiptesis nula realmente es verdadera o
bien la hiptesis nula realmente es falsa. Luego la combinacin de las dos posibles decisiones con los
dos posibles estados de la naturaleza, arrojan cuatro posibles resultados (Tabla 11.1).
Tabla 11.1: Cuatro resultados posibles en una prueba de hiptesis
Decisin

Hiptesis nula (en la realidad)


Verdadera

Falsa

Aceptar H0

Se toma una decisin correcta de tipo A

Se comete un Error tipo II

No aceptar H0

Se comete un Error tipo I

Se toma una decisin correcta de tipo B

Una decisin correcta de tipo A ocurre cuando la hiptesis nula es verdadera y se decide a su
favor. Una decisin correcta de tipo B ocurre cuando la hiptesis nula es falsa y la decisin es en
oposicin a la hiptesis nula.
Definicin 11.6.
Se comete un error de tipo I cuando no se acepta la hiptesis nula Ho, siendo que esta era verdadera,
es decir que se toma incorrectamente una decisin contra ella. A la no aceptacin de la hiptesis nula
cuando es verdadera se lo denomina error de tipo I.
Definicin 11.7.
Se comete un error de tipo II cuando se acepta la hiptesis nula Ho siendo que esta era falsa, es decir
que se toma incorrectamente una decisin a favor de ella. La aceptacin de la hiptesis nula cuando no
es verdadera se llama error de tipo II.

16
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


Por ejemplo, se sospecha que un detergente de primera marca es mejor que otro de segunda
marca y se desea probar ambos productos, porque de no ser as se tomara la decisin de comprar el
detergente ms barato. La idea el detergente de primera marca es mejor que el detergente de segunda
marca es la razn para realizar la prueba, por lo que se vuelve la hiptesis del investigador (hiptesis
estadstica alternativa). De este modo las hiptesis en trminos del problema son:
H0: No hay diferencia en el desempeo de los detergentes.
H1: el detergente de primera marca es mejor que el detergente de segunda marca
Los cuatro posibles resultados y las acciones consiguientes sern:
Tabla 11.2: Cuatro posibles resultados y las acciones resultantes del ejemplo
Condicin del estado de la naturaleza
Decisin

Aceptar H0

No aceptar H0

La hiptesis nula es verdadera


Veracidad de la situacin:
no hay diferencia entre los detergentes
Decisin correcta de tipo A

La hiptesis nula es falsa


Veracidad de la situacin:
el detergente de primera marca es mejor.
Decisin incorrecta: Error tipo II

Conclusin: se determin que no hay Conclusin: se determin que no hay


diferencia entre los detergentes.
diferencia.
Accin: el consumidor compra el Accin: el consumidor compra el
detergente de segunda marca, ahorra
detergente de segunda marca, ahorra
dinero y obtiene los mismos resultados.
dinero pero obtiene peores resultados.
Decisin incorrecta: Error tipo I
Decisin correcta de tipo B
Conclusin: se determin que el Conclusin: se determin que el
detergente de primera marca es mejor.
detergente de primera marca es mejor.
Accin: el consumidor compra el Accin: el consumidor compra el
detergente de 1 marca, gasta dinero
detergente de 1 marca y, aunque gasta
extra sin obtener mejores resultados.
ms, obtiene mejores resultados.

La verdad o falsedad de una hiptesis estadstica nunca se sabe con absoluta certidumbre a
menos que se examinara a toda la poblacin, situacin poco prctica en la mayora de los casos,
adems de onerosa y de requerir mayores tiempos. En su lugar se toma una muestra aleatoria de la
poblacin de inters, y los datos observados se usan para proporcionar evidencia que puede resultar
directamente a favor o no de la hiptesis nula Ho, e indirectamente con relacin a la hiptesis planteada
por el investigador. En otras palabras, la evidencia de la muestra que es consistente con la hiptesis Ho
conduce al rechazo de la hiptesis del investigador, mientras que la evidencia que resulta inconsistente
con la hiptesis Ho lleva al apoyo de la hiptesis del investigador.
La aceptacin de una hiptesis nula Ho simplemente implica que los datos observados no dan
suficiente evidencia para rechazarla. Puesto de otra forma, la aceptacin significa que hay una alta
probabilidad de obtener la informacin muestral observada bajo el hecho de que la hiptesis Ho es
verdadera. En tanto que la no aceptacin de una hiptesis nula Ho implica que hay suficiente evidencia
muestral para refutarla.
Recuerde:
En una prueba de hiptesis nunca se tiene la certeza de haber tomado una decisin correcta.
A la luz de lo que acontece interesa controlar la probabilidad de cometer un error al tomar
decisiones basadas en pruebas de hiptesis.
Las probabilidades asociadas a los diferentes tipos de errores en las pruebas de hiptesis son las
denominadas probabilidades (con relacin a un error de tipo I) y (con relacin a un error de tipo II).
Cuadro 11.3. Probabilidades asignadas a los errores tipo I y II.
Hiptesis nula
Decisin
Es verdadera
Es falsa
No rechazar H0
Rechazar H0

Decisin correcta de tipo A


Probabilidad(A) = 1

P(Error tipo II)=

P(Error tipo I)=


Nivel de significancia

Decisin correcta de tipo B



   = 1 
Potencia de una prueba

Por convencin, los valores de probabilidad de mayor uso para y son 0.01 y 0.05. La
probabilidad asignada a cada error depende de la gravedad de stos. Mientras ms grave es un error,
menos se desea que ocurra; en consecuencia, se le asigna una menor probabilidad. Cmo se
controlan los errores? y son probabilidades de errores, cada una bajo condiciones separadas, y no
pueden combinarse. As, no es posible determinar una sola probabilidad para tomar una decisin
incorrecta. De manera semejante, las dos decisiones correctas son distintas y ajenas, y cada una tiene
17
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


su propia probabilidad; 1 es la probabilidad de tomar la decisin correcta cuando la hiptesis nula es
verdadera, y 1 es la probabilidad de tomar la decisin correcta cuando la hiptesis nula es falsa. La
forma de controlar en forma simultnea ambos errores, esto es reducir la probabilidad de cometerlos, es
aumentando el tamao muestral.
Definicin 11.8.
A 1 se le denomina potencia de la prueba estadstica, ya que mide la capacidad de una prueba
de hiptesis para rechazar una hiptesis nula falsa, lo que es una caracterstica muy importante
La decisin de rechazar o no rechazar la H0 se basa en la informacin que contiene una muestra
extrada de la poblacin de inters. Esta informacin toma la forma de estadgrafo de prueba o valor-p.
Cmo se decide entre rechazar o no rechazar la H0? El conjunto entero de valores que el estadgrafo
de prueba puede asumir se divide en dos regiones:
- un conjunto consta de los valores que apoyan la hiptesis alternativa y conducen al rechazo de la
hiptesis nula, sta es la regin de rechazo;
- el otro est constituido por valores que apoyan la hiptesis nula y se designa con el nombre de
regin de aceptacin.
De esta manera se establece una regla de decisin. Tal regla especifica los criterios para rechazar o no
rechazar la H0, y se sustenta en tres elementos:
1. El nivel de significancia
2. La distribucin de probabilidad de un estadgrafo de prueba
3. El valor crtico del estadgrafo de prueba que define las dos regiones.
Regin de aceptacin

Regin de rechazo

(Acepto H0)

(Rechazo H0)

Valor crtico

Definicin 11.9.
En forma general, el valor crtico es el primer valor lmite de la regin crtica (o regin de rechazo).
Definicin 11.11
El estadgrafo de prueba es la variable aleatoria cuyo valor se calcula a partir de los datos muestrales y
que se utiliza para tomar la decisin de no rechazo o rechazo de la H0 cuando se observa en qu
regin se encuentra su valor.
La regla de decisin debe establecerse antes de recolectar los datos. Una vez tomada la
muestra, se calcula el valor muestral del estadgrafo de prueba (evidencia aportada por los datos
muestrales) y se lo compara con el valor crtico, tomando finalmente la decisin estadstica.
La toma de decisin ser en base a lo siguiente:
a) si el estadgrafo de prueba cae dentro de la regin de rechazo, se rechaza la hiptesis nula.
b) si el estadgrafo de prueba est en la regin de aceptacin, no se rechaza de hiptesis nula.
La comparacin del valor calculado del estadgrafo de prueba con el valor crtico para tomar la
decisin de rechazar o aceptar la hiptesis nula nos lleva a una dificultad relacionada a los distintos
niveles de significancia que la prueba de hiptesis puede tomar. Los diferentes investigadores pueden
fijar distintos niveles de significancia arribando a conclusiones diferentes (por ejemplo, para la misma
prueba de hiptesis puede rechazarse la hiptesis nula con un nivel de significancia de 0,05 pero
aceptarla con un nivel de significancia de 0,01). Adems, el valor del estadgrafo de prueba no nos da
suficiente informacin contra la hiptesis nula. Por esto es que muchos investigadores utilizan el valor de
probabilidad observado o valor p, para evitar ambigedades.
Definicin 11.12
El valor-p o valor observado de probabilidad de una prueba estadstica, es el valor ms pequeo al cual
H0 sera rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto de datos
dado. Una vez que se ha determinado el valor p, la toma de decisin a un nivel particular de
significancia resulta de comparar el valor p con :
1.  
 
 
!  "  #$"% " 
2.  
 >  "
 
!  "  #$"% " 
Un valor p pequeo indica que el valor observado del estadgrafo de prueba est lejos del valor
hipottico. Esto es una fuerte evidencia de que H0 es falsa y debe rechazarse. Si los valores p son
grandes, entonces significa que el estadgrafo de prueba observado no est lejos del valor hipottico y
no apoya el rechazo de H0.

18
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


Se acostumbra llamar a los datos significativos cuando ! es rechazada y no significativos, de lo contrario. El
valor p es entonces el nivel ms pequeo al cual los datos son significativos.
Para completar una prueba de hiptesis es necesario escribir una conclusin que describa
cuidadosamente el significado de la decisin relativa al propsito de la misma.
La conclusin en trminos estadsticos ser:
a) si la decisin es rechazar la H0, entonces la conclusin debe verbalizarse ms o menos como la
muestra aporta suficiente evidencia al nivel de significancia para demostrar que (se completa con la
expresin estadstica correspondiente a la hiptesis alternativa)
b) si la decisin es no rechazar la H0, entonces la conclusin debe verbalizarse ms o menos como la
muestra no aporta suficiente evidencia al nivel de significancia para demostrar que (se completa
con la expresin estadstica correspondiente a la hiptesis alternativa)
Al escribir la decisin y la conclusin recuerde que:
1) la decisin se toma sobre H0,
2) conclusin es una afirmacin acerca de la confirmacin, o no, del argumento de H1.
Esto es consistente con la actitud de todo el procedimiento de la prueba de hiptesis. La
hiptesis nula es la afirmacin que est en juicio, y por tanto la decisin debe versar sobre ella. El
argumento de la hiptesis alternativa es el pensamiento que ocasion hacer la prueba (hiptesis de
investigacin o de trabajo). En consecuencia, al escribir la conclusin debe contestarse la cuestin que
condujo a la hiptesis alternativa.
PASOS DE LA PRUEBA DE HIPTESIS
Paso 1:

Paso 2:

Paso 3:
Paso 4:
Paso 5:

Plantear el problema
a. Identificar el parmetro poblacional de inters
b. Establecer la hiptesis cientfica
c. Establecer las hiptesis estadsticas (hiptesis nula H0 e hiptesis alternativa H1)
Especificar los criterio de prueba
a. Comprobar los supuestos de la prueba
b. Elegir el nivel de significancia
c. Identificar la distribucin de probabilidad y elegir el estadgrafo de prueba a utilizar
d. Determinar la regla de decisin: valor(es) crtico(s) y las regiones de aceptacin y de
rechazo
Recolectar y presentar la evidencia muestral
a. Recolectar la informacin muestral
b. Calcular el valor del estadgrafo de prueba muestral
Tomar la decisin
a. Comparar el valor crtico con el valor muestral
b. Tomar la decisin estadstica
Dar las conclusiones
a. Escribir la conclusin estadstica.
b. Escribir la conclusin en trminos del problema.

Finalmente, antes de entrar en las diferentes aplicaciones de pruebas de hiptesis,


complementaremos la descripcin de las hiptesis:
1. La hiptesis nula especifica un valor particular de un parmetro de la poblacin. Por ejemplo,
el parmetro proporcin, H0: = 0,5.
2. La hiptesis alternativa puede asumir tres formas. Cada una de ellas determinar una
ubicacin especfica de la(s) regin(es) crtica(s), como se muestra en el cuadro 11.3.
3. Para muchas pruebas de hiptesis, el signo de H1 apunta en la direccin que est localizada
la regin crtica. (Piense en el signo de desigualdad como si fuese al mismo tiempo menor
que y mayor que, apuntando as ambas direcciones.)
Cuadro 11.4: Clases de pruebas de hiptesis de acuerdo a en la hiptesis alternativa

H 1 : < 0.5
Regin Crtica

Diagrama ilustrativo de las


reas de la distribucin de
probabilidad del estadgrafo en
el muestreo

H 1 : 0.5

Una regin del lado


Dos regiones, la mitad de
izquierdo
cada lado
Prueba de una cola o
Prueba de dos colas o
unilateral a la izquierda
bilateral

/2

/2

H 1 : > 0.5
Una regin del lado
derecho
Prueba de una cola o
unilateral a la derecha

19
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA

11.3. PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL


11.3.1.

Caso: muestra grande

Podemos aplicar la prueba para muestras grandes para una hiptesis acerca de una media
poblacional. El parmetro que se desea probar es , cuyo estimador puntual es la media muestral

x , y la desviacin estndar de la distribucin muestral de x es

n . Se indica un resumen de

los primeros pasos de la prueba en el siguiente recuadro


Prueba estadstica para en una muestra grande
1. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: H 0 : = 0
Hiptesis Alternativa:
Prueba de una cola
H1 : > 0

Prueba de dos colas


H1 : 0

(o H1 : < 0 )
2. Nivel de significancia:

3.. Estadgrafo de prueba:

z=

x 0

x 0

Supuesto: Las
as n observaciones en la muestra se seleccionaron al azar de la poblacin y n es grande, es
decir n 30 .
4. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
z > z

Prueba de dos colas

(o bien z < z cuando

z > z /2 o bien z < z /2

H1 : < 0 )

O cuando el valor p <

%

%

Ejemplo 11.1. Una planta qumica local ha producido un promedio diario de 880 toneladas de un
producto qumico durante los ltimos aos. A la gerente de control de calidad le gustara saber si este
promedio ha cambiado en los meses recientes. Selecciona al azar 50 das de la base de datos y
calcula el promedio y desviacin estndar de los n=50 prod
producciones con x = 871t y s=21t,
respectivamente. Pruebe la hiptesis apropiada con = 0,05 .
Solucin
1) Hiptesis estadsticas:
estadsticas

! : (

= 880
+ : ( , 880
2) Nivel de significancia  = 0,05
3) Estadgrafo de prueba: La estimacin puntual para es  . Entonces,

z=

x 0

x 0

Como se desconoce la varianza poblacional, la desviacin estndar poblacional se estima con


la desviacin estndar muestral con buena aproximacin, ya que " 5 30.
4) Regla de decisin
%

Valor crtico de z
!,!/0 = 1,96 y !,340 = 1
1,96
Se rechaza la hiptesis nula si !,!/0 7  7 !,340

20
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


5) Clculo:
Al usar s para aproximar , se obtiene

z=

x 0
s

871 880
21 50

= 3.03

6) Decisin
Para = 0,05 , la regin de rechazo se compone de los valores de z>1.96 y z<
z<-1.96.
1.96. Como el valor
muestral calculado con el estadgrafo de prueba z, es igual a 3.03, este valor cae en la regin de
rechazo, por lo que se rechaza la hiptesis nula de igualdad de la media a un valor determinado.
7) Conclusin
La muestra aporta evidencia suficiente,
suficiente para
ra un nivel de significancia de 0,05, para decir que el promedio
de produccin para un producto qumico es distinto a 880 toneladas
toneladas.
Se puede decir, con un nivel de significancia
significancia de 0,05, que la produccin del producto qumico ha
cambiado.

11.3.2. Caso: muestra pequea con varianza poblacional desconocida


Al igual que en el caso anterior, se
se indica un resumen de llos primeros pasos de la prueba en el
siguiente recuadro
Prueba estadstica para en una muestra pequea
2. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: H 0

: = 0

Hiptesis Alternativa:
Prueba de una cola
H1 : > 0

(o H1 : < 0 )
2. Nivel de significancia:

Prueba de dos colas


H1 : 0

3.. Estadgrafo de prueba:

t=

x 0
s

Supuesto:: la muestra es seleccionada al azar de una poblacin normalmente distribuida.


4.. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
t > t
(o bien t < t cuando

Prueba de dos colas

t > t /2 o bien t < t /2

H1 : < 0 )

O cuando el valor de p <

Los valores crticos de t,

%:

%:

t y t / 2 se basa en (n-1)
1) grados de libertad. Estos valores tabulados se encuentran

en la tabla de distribucin de Student.

Ejemplo 11.2. Un nuevo proceso para producir diamantes sintticos slo puede funcionar a un nivel
rentable si el peso promedio de los diamantes que se obtengan es mayor que 0,5 quilates. Para evaluar
la rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,46
0,46; 0,61; 0,52; 0,48; 0,57 y
0,54 quilates. Las
as seis mediciones proporcionan suficiente evidenci
evidencia
a de que el peso promedio de los
diamantes que se obtienen con este proceso sobrepasa los 0,5 quilates?
1)
) Hiptesis estadsticas:
89 :#
! : ( = 0,5 89 :#
: (
>
0,5 89 :#
89 :#
+
2) Nivel de significancia  = 0,05
3)
) Estadgrafo de prueba: Se supone que la poblacin de la cual provienen los pesos de los diamantes
sigue una distribucin normal y se desconoce la desviacin estndar poblacional. Entonces
:=

 (
#"

>:; 0; 1; " 1

Donde n -1 = 5 grados de libertad


21
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


4) Regla de decisin
%:

2,015

Valor crtico de t
:!,340;0@A = 2,015
Se rechaza la hiptesis nula si : 7 :!,340;0@A

5) Clculos
Y el estadgrafo de prueba es un estadstico t con (n
(n-1) = (6-1) = 5 grados de libertad. Con su
calculadora usted puede verificar que la media y la desviacin estndar de los seis pesos del diamante
son 0,53 y 0,0559, respectivamente. El valor calculado del estadgrafo de prueba es entonces

t=

x 0
s

0.53 0.5
0.0559

= 1,32

6) Decisin
Al igual que con las pruebas para muestras grandes, el estadgrafo de prueba proporciona la
evidencia para rechazar o aceptar H0 dependiendo de qu tan lejos quede t del centro de la distribucin.
Si se elige un nivel de significancia de 5% ( =0,05), debe utilizar los valores crticos de t de la tabla de
distribucin de Student para determinar la regin de rechazo en la cola derecha. Como el valor muestral
del estadgrafo de prueba (1,32), no cae en la regin de rechazo (Grfico 11.3),, no se puede rechazar la
H0. Los datos no proporcionan evidencia
evidencia suficiente de que el peso promedio de los diamantes sea mayor
que 0,5 quilates.
%:

Grfico 11.3: Regin de Rechazo de la hiptesis nula para el ejemplo 11.2.

Bajo un nivel de significancia del 5% no se rechaza la hiptesis nula por se


ser : = 1,32 7 :!,340;0@A .
7) Conclusin
La muestra no aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el
peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0,05 quilates.
Ejemplo 11.3. Se dise un nuevo sistema para el control del inventario de un pequeo fabricante, con
el propsito de reducir el mismo a menos de 3000 motores por da. Se llev a cabo un muestreo del
inventario en reserva al final de cada uno de ocho das, seleccionados al
aleatoriamente;
eatoriamente; los resultados se
muestran en la siguiente tabla. Con los datos hay evidencia suficiente que seale que el promedio del
nmero diario de motores en el inventario es menor que 3000?
Nmero de motores
2905
2895
2725
3005
2835
2835
3065
2605
1) Hiptesis estadsticas

H 0 : = 3000
H 1 : < 3000
2) Nivel de significancia = 0,05
x
t=
3) Estadgrafo de prueba
s n
4) Regla de decisin
%:

0,05

Si tenemos un = 0,05 y se coloca 0,05 en la cola inferior de la distribucin


t, obtenemos el valor crtico para n=8 mediciones (o bien n 1 =7 grados de
libertad) como t c = 1,895 . Por lo tanto se rechazar la H0 si t m < 1.895 .

tc=-1,895

5) Clculos
Puede verificarse que la media y la desviacin estndar muestral para las n=8 mediciones de la
tabla, son = 2858 .75 y s = 146.77 . Sustituyendo los valores en el estadgrafo de prueba, obtenemos:

t=

x
s

2858.75 3000
146.77

= 2.72
22

Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


6) Decisin
Ya que el valor observado de t muestral se localiza en la regin de rechazo, hay evidencia suficiente
para rechazar la H0.
7) Conclusin
La muestra aporta suficiente evidencia, con un nivel de significancia de 0,05
0,05, para decir que el
nuevo sistema de control de inventario reduce el nmero promedio de motores en existencia por da,
hasta menos de 3000. Adems, habr confianza razonable en haber tomado la decisin correcta.
Ahora, si los resultados de este ejemplo se quieren dar a conocer, qu valor
valor-p aparecera en el
informe?
El valor-p para esta prueba, es la probabilidad de observar un valor del estadgrafo t por lo menos
tan contradictorio a la hiptesis
iptesis nula como el valor observado para este conjunto de datos, a saber, un
valor de t 2.72 . A diferencia de la tabla de las reas bajo la curva normal, la tabla para la distribucin
de t no da las reas correspondientes a varios valores de t, sino que proporciona los valores
correspondientes a las reas de la cola inferior,, iguales a 0,10; 0,05; 0,025.

Valor-p
-2,72

Grfico 11.4. Valor p para la prueba del ejemplo 11.3

11.4. PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS MEDIAS


POBLACIONALES
11.4.1. Muestras independientes
11.4.1.1. Caso de muestras grandes

Prueba estadstica para DE DF  con muestras grandes


3. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: ! : DE DF  = M
Hiptesis Alternativa:
Prueba de una cola
Prueba de dos colas

DF  > 0
+ : DE DF  7 0
+ : DE

o
2. Nivel de significancia:
3.. Estadgrafo de prueba:

=

DE
+ : 

DF  , M

+ /  CDE DF G + /  0


=
HIJ KIL 
H/ H/
N + O /
"+ "/

Supuesto: las muestras aleatorias e independientes se seleccionan de dos poblaciones y "+ 5 30 y "/ 5 30
4.. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
z > z

Prueba de dos colas

(o bien z < z cuando

z > z /2 o bien z < z /2

H1 : ( 1 2 ) < D0 )

O cuando el valor- p <

%

%

En el recuadro se plantean
plantea los pasos para la
a prueba de hiptesis de la diferencia de medias de
muestras grandes independientes. Los datos los conformarn dos muestras, una para cada poblacin.
La idea bsica es simple. Se calcular la diferencia de las medias muestrales. Si la diferencia se
encuentra alejada de 0, se concluir
concluir que las medias poblacionales son diferentes. Si la diferencia se
23
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


aproxima a 0, se concluir que las medias poblacionales podran ser iguales. Estas caractersticas se
analizarn en el ejemplo 11.4.
expectativas salariales anuales de su personal de
Ejemplo 11.4. Una compaa desea comparar las expectativas
ventas femenino y masculino, segn su nuevo plan de compensaciones de ventas ms comisin. Se
pidi a n1=40 vendedoras y n2=40 vendedores, muestreados al azar, predijeran sus ingresos anuales
bajo el nuevo plan. Las medias muestrales y las desviaciones muestrales resultaron

x1 = $31083

x 2 = $29745

s1 = $2312

s 2 = $2569

Proporcionan los datos evidencia que indique una diferencia en el promedio del ingreso anual esperado
entre vendedores y vendedoras? Realice la prueba con =0.05
5.
Solucin
1) Hiptesis
Hiptesis cientfica: El ingreso anual entre las vendedoras y los vendedores es diferente.
Hiptesis estadsticas:
s:
H 0 : 1 = 2 ,
es decir, 1 2 = D0 = 0

H 1 : 1 2 ,
es decir, D0 0.
2) Nivel de significancia:  = 0,05
3) Estadgrafo de prueba: Bajo el supuesto de normalidad de ambas poblaciones y que las muestras
son aleatorias, grandes e independientes,
independientes, se estiman las varianzas poblacionales con las varianzas
varia
muestrales #+/ y #// . El estadgrafo de prueba tiene distribucin normal con ( = 0 y H = 1:
( x x 2 ) D0
z= 1
12
n1
%

22
n2

4) Regla de decisin
Valor crtico de z
!,!/0 = 1,96 y !,340 = 1
1,96
Se rechaza la hiptesis nula si !,!/0 7  7 !,340

5) Clculo:

z=

( x1 x 2 ) D0

12
n1

22
n2

(31083 29745) 0
2312 2 2569 2
+
40
40

= 2,45

6) Decisin
z<-1.96.
1.96. Como el valor
Para = 0,05 , la regin de rechazo se compone de los valores de z>1.96 y z<
muestral calculado con el estadgrafo de prueba z, es igual a 2,45, este valor cae en la regin de
rechazo, por lo que se rechaza la hiptesis nula de igualdad de las medias.
7) Conclusin
Las muestras aportan evidencia suficiente,
suficiente con un nivel de significancia de 0,05
0,05, de que las medias son
diferentes.
Se puede decir, con un nivel de
d significancia de 0,05, que las expectativas salariales anuales entre las
vendedoras y los vendedores son diferentes bajo el nuevo plan.

11.4.1.2. Caso de muestras pequeas


El marco del problema que consideramos ahora es idntico al que se analiz para una prueba
prue
con muestras grandes. Se seleccionan muestras aleatorias independientes de n1 y n2 mediciones de dos
poblaciones con medias y varianzas 1, 12 y 2 , 22 . El objetivo es inferir la dif
diferencia (1 2 ) entre las
dos medias de poblacin.
La prueba con muestras pequeas,
pequeas en relacin con una diferencia entre medias poblacionales,
se basa en la suposicin que ambas poblaciones se distribuyen normalmente y que tienen adems
varianzas iguales, es decir, 12 = 22 = 2 . La prueba se resume en el cuadro siguiente.

24
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


Prueba estadstica para DE DF  con muestras pequeas
4. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: ! : DE DF  = M
Hiptesis Alternativa:
Prueba de una cola
Prueba de dos colas

DF  > 0
: D

DF  7 0
+
E
+ : DE

o
2. Nivel de significancia:
3.. Estadgrafo de prueba:

:=

Donde

DE
+ : D

+ /  CDE DF G
1
1
#U R O "
"+
/

DF  , M

+ /  0
1
1
#U R O "
"+
/

"+ 1#+/ O "


 / 1#//
#U = N
"+ O "/ 2

Supuesto: las muestras aleatorias e independientes se seleccionan de dos poblaciones normalmente


distribuidas. Las varianzas poblacionales son iguales.
4.. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
t > t

Prueba de dos colas

(o bien t < t cuando

t > t /2 o bien t < t /2

H1 : ( 1 2 ) < D0 )

O cuando el valor de p <

%:

%:

t y t / 2 se basa en "+ O "/ 2 grados de libertad. Estos valores tabulados se

Los valores crticos de t,

encuentran en la tabla de distribucin de Student.

Ejemplo 11.5. Se lleva a cabo un experimento para comparar el desgaste de abrasivos de dos
materiales laminados. Se prueban 12 piezas del material 1 y 10 pie
piezas
zas del material 2 exponindolas a
una mquina para medir el desgaste. La muestra del material 1 da un desgaste promedio codificado de
85 unidades con una desviacin estndar muestral de 4; en tanto que la muestra del material 2 tiene un
desgaste promedio de 81 y una desviacin estndar muestral de 5. Podramos concluir, con un nivel de
significancia de 0,05, que el desgaste abrasivo del material 1 excede al del material 2? Suponga que las
poblaciones son aproximadamente normales y con varianzas iguales.
Solucin
1) Hiptesis
Hiptesis cientfica: El
El material laminado 1 tiene un desgaste abrasivo mayor que el del material
laminado 2
Hiptesis estadsticas:
H 0 : 1 = 2 ,
es decir, 1 2 = D0 = 0

H 1 : 1 > 2 ,

es decir, D0 > 0.

2) Nivel de significancia:  = 0,05


3) Estadgrafo de prueba

:=

I J KI L KCDE DF G
J

PQ RS TS
J
L

I J KI L K!
J

PQ RS TS
J
L

Siendo:#U

=R

VJ K+PJL TVL K+PLL


VJ TVL K/

25
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA

4) Regla de decisin
%:

05 y "+ O "/ 2 = 12 O 10 2 = 20
Valor crtico de t, para  = 0,05
:!,30;/! = 1,725
Se rechaza la hiptesis nula si : 7 :!,30;/!
1,725

5) Clculos
#U = N

:=

"+ 1#+/ O "/ 1#//


1116 O 9
12 14/ O 10 15/
925
401
=N
=N
=N
= _20,05 = `, `a
"+ O "/ 2
12 O 10 2
20
20

+ /  CDE DF G
#U R

1
1
O
"+ "/

 81 0
85

1
1
4,48R O
4
12 10

11
4,48R
60

4
4
=
= F, Mb
4,480,43 1,926

6) Decisin
Con un nivel de significancia de 0,05, se rechaza la hiptesis nula de que las medias del desgaste
abrasivo de los dos materiales son iguales.
7) Conclusin
La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el desgaste
desg
abrasivo medio del material laminado 1 es mayor que el del material laminado 2
2.

11.4.2. Muestras pareadas


Los procedimientos mencionados precedentemente para comparar dos medias poblacionales se
basan en la relacin que hay entre dos conjuntos de datos muestrales, provenientes cada uno de
poblaciones distintas. Cuando estn implicadas muestras apareadas implica que los datos pueden
parearse como resultado de la aplicacin de estudios denominados antes y despus, de una misma
unidad de anlisis o de la correspondencia efectuada entre dos objetos semejantes entre s
s, a fin de
obtener pares correspondientes. Los datos que integran las parejas se comparan d
directamente
irectamente entre
s, usando la diferencia de sus valores numricos. La diferencia resultante se denomina diferencia
pareada X = YE YF . El inicio de la
l prueba se
e resume en el cuadro siguiente

Prueba estadstica para DX con muestras pequeas


5. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: ! : ([ = M
Hiptesis Alternativa:
Prueba de una cola

2. Nivel de significancia:
3.. Estadgrafo de prueba:

+ : DX > 0
+ : DX 7 0

:=

Prueba de dos colas


+ : DX

,M


 ([  ([
= #
=#
[
[
#[\
]
]
"
"

Donde n es el nmero de diferencias por parejas y #[\ es el error tpico de la variable promedio de la
diferencia. Supuesto:: se seleccionan aleatoriamente las n diferencias por parejas de una poblacin
con distribucin normal.
4.. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
t > t

Prueba de dos colas

(o bien t < t cuando

t > t /2 o bien t < t /2

H1 : ( 1 2 ) < D0 )
O cuando el valor de p <

%:

%
%:

Los valores crticos de t, :^ y :^/ se basa en " 1 grados de libertad. Estos valores tabulados se
encuentran en la tabla de distribucin de Student.
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

26

UNIDAD III:INFERENCIA ESTADSTICA


Ejemplo 11.6. Un fabricante quiere comparar la resistencia al desgaste de dos tipos diferentes de
neumticos, A y B, para los automviles. Para hacer la comparacin, se asignaron aleatoriamente un
neumtico de tipo A y el otro tipo B a 6 automviles y se montaron las ruedas traseras de dichos
dich
vehculos. Luego de un nmero especificado de kilmetros se registr el grado de desgaste para cada
par de neumticos. Estas mediciones se encuentran en la tabla 11.3. Presentan los datos evidencia
suficiente para indicar una diferencia en el desgaste promedio de los dos tipos de neumticos?
Tabla 11.3. Datos de desgaste de los neumticos
Automvil
Neumtico A
Neumtico B
1
125
133
2
64
65
3
94
103
4
38
37
5
90
102
6
106
115

Debido a que los automviles, conductores y condiciones son los mismos para cada neumtico de un
conjunto de datos pareados, tiene sentido utilizar una tercera variable, la diferencia pareada X. Las dos
muestras dependientes de datos se combinarn en un conjunto
conjunto de valores , donde  =  f.
 =f
8
1
9
-1
1
12
9

Automvil
1
2
3
4
5
6

1) Hiptesis
Hiptesis cientfica: No hay diferencia en el desgaste de los neumticos A y B
Hiptesis estadstica:
! : ([ = M
+ : DX , M
2) Nivel de significancia  = 0,05
3) Estadgrafo de prueba

 ([  ([  0
= #
=#
[
[
#[\
]
]
"
"

Valor crtico de t para  2 = 0,025 y g = 6 1 = 5


:!,!/0 = 2,571 y :!,340 = 2,571
571
Se rechaza la hiptesis nula si :!,!/0 7 : 7 :!,340

4) Regla de decisin
%:

-2,571

:=

2,571

5) Clculo del estadgrafo de prueba


Los estadgrafos muestrales necesarios son: la media de las diferencias y la desviacin estndar de las
diferencias. Entonces:
 38
 =
=
= 6,33
33
"
6
Cd G
#[ = N
= _26,27
_ 27 = 5,13
"1
/

El estadgrafo de prueba resulta

 ([ 6,33 0
:= #
=
= h, MF
[
5,13
]
e
"
6

6) Decisin
Con un nivel de significancia  = 0,05,, se rechaza la hiptesis nula.
7) Conclusin
La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que los
neumticos A y B tienen desgastes diferentes bajo las mismas condiciones de uso.

27
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA

11.5. PRUEBAS DE HIPTESIS PARA UNA PROPORCIN POBLACIONAL


Varios de los mtodos utilizados en la inspeccin muestral, en el control de la calidad y en la
verificacin de confiabilidad se fundamentan en pruebas de la hiptesis nula de que una proporcin es
igual a una constante determinada.
Pueden aplicarse pruebas exactas con base en la distribucin binomial, pero se considerarn
aqu las pruebas aproximadas para grandes muestras que se basan en la aproximacin normal a la
distribucin binomial.

11.5.1.

Prueba de hiptesis para un conteo (x)

Se probar la hiptesis nula = 0 contra una de las alternativas < 0 , > 0 o 0


mediante la aplicacin del estadgrafo, que es un valor de una variable aleatoria, y tiene
aproximadamente una distribucin normal estndar:

z=

x n

z =

n (1 )

Ejemplo 11.7. Suponga que un nutricionista afirma que al menos el 75% de los nios de preescolar de
cierto pas tienen dietas deficientes en protenas y que un estudio de muestra revela que esto es cierto
en 206 nios de una muestra de 300 nios de preescolar. Demuestre la afirmacin para el nivel de
significancia 0,05.
1) Hiptesis
Hiptesis cientfica
Hiptesis estadsticas:

H 0 : = 0,75

H 1 : < 0,75
2) Nivel de significancia: = 0,05
3) Estadgrafo de prueba:

z=

x n
n (1 )

4) Regla de decisin
%

Se rechaza la hiptesis nula si z m < 1.645 , obteniendo el valor de la tabla


de F(z).

0,05
zc= -1,645

5) Clculos

z=

x n
n (1 )

206 [300(0,75)]
300(0,75)(0,25)

= 2.53

6) Decisin
Como zm=-2.53 es menor que zc=-1.645, se debe rechazar la hiptesis nula.
7) Conclusin
Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0,05, para decir que por
lo menos el 75% de los nios de preescolar de un pas dado tienen dietas deficientes en protenas.

11.5.2.

Prueba de hiptesis para una proporcin

( )

Cuando se extrae una muestra aleatoria de n ensayos idnticos de una poblacin binomial, la
proporcin muestral p tiene una distribucin aproximadamente normal si n es grande, con media (i = j
y error tpico

p =

(1 )
n

La hiptesis respecto a que la proporcin en la poblacin posee un cierto atributo j, se prueba


segn la forma general y se formula como:

H 0 : = 0
Contra una alternativa de una o de dos colas

H a : > 0 o bien,

H a : < 0 o bien,

Ha : 0
28

Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


El estadgrafo de prueba se construye usando p , el mejor estimador de la proporcin poblacional
verdadera . La
a proporcin muestral p se estandariza, por medio de la media y el error estndar
hipotticos, para formar un estadgrafo
estad
de prueba z. A continuacin se resume esta prueba para una
muestra grande.
Prueba estadstica para en una muestra grande
6. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: H 0 : = 0
Hiptesis Alternativa:
Prueba de una cola
H1 : > 0

Prueba de dos colas

H1 : 0

(o H1 : < 0 )
2.. Nivel de significancia:

3.. Estadgrafo de prueba:

=

j

Rj1 j
"

Donde  =
V
Supuesto:: El muestreo satisface los supuestos de un experimento binomial y n es bastante grande para que
la distribucin muestral de p se puede aproximar mediante una distribucin normal ( n 0 > 5 y

n(1 0 ) > 5 ).
4.. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
z > z

Prueba de dos colas

(o bien z < z cuando

z > z /2 o bien z < z /2

Ha : < 0 )

O cuando el valor de p <

%

%
%

Ejemplo 11.7. Segn informacin reciente,


reciente la obesidad es un problema creciente en el pas en grupos
de todas las edades. En el ao 2002 se report que 1276 de una muestra de 4115 adultos fueron
encontrados obesos (ndice corporal mayor a 30). Una encuesta realizada 4 aos antes revel que el
20% de los adultos encuestados se consideraron obesos. Sugieren los datos ms recientes que la
proporcin verdadera de adultos obesos es ms de 1,5 veces el porcentaje de la encuesta? Tome en
cuenta un nivel de significancia de 0,10.
1) Hiptesis
Hiptesis cientfica
Hiptesis estadsticas:

H 0 : = 0,30

H 1 : > 0,30
2) Nivel de significancia: = 0,10
3) Estadgrafo de prueba:

z=

(1 )
n

4) Regla de decisin
%

Se rechaza la hiptesis nula si z m > 1,28 , obteniendo el valor de la tabla


de F(z).
0,
0,10

0,05
zc= -1,645

zc= 1,28

29
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


5) Clculos
 1276
= =
= 0,31
" 4115
=

j

Rj1 j
"

0,31 0,30

R0,300,70
4115

0,010
= E, `M
0,0071

6) Decisin
Como zm=1,40 es mayor a 1,28 se rechaza la hiptesis nula.
7) Conclusin
Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0,10, para decir que la
proporcin de obesos adultos que result en el informe es mayor al 30%, es decir que ha aumentado
ms de 1,5 veces la proporcin con respecto a los encuestados 4 aos antes.

11.6. PRUEBAS
DE
POBLACIONALES

HIPTESIS

PARA

DOS

PROPORCIONES

Existen muchos problemas en los cuales debemos decidir si una diferencia observada entre dos
proporciones de muestra se puede atribuir a la oportunidad o si esto es indicativo de que las
proporciones verdaderas correspondientes son desiguales. Por ejemplo, quizs queramos decidir
sobre la base de los datos de muestras si en realidad existe una diferencia entre las proporciones de
personas a quienes se les aplican vacunas contra la influenza y a quienes no se les aplican, quienes
en realidad contraen la enfermedad, o quizs deseemos verificar sobre la base de muestras si dos
fabricantes de equipo electrnico envan a las distribuidoras las mismas proporciones de aparatos
defectuosos.
El mtodo que se aplicar para demostrar si una diferencia observada entre dos proporciones de
una muestra se puede atribuir a la oportunidad o si es estadsticamente significativa, se basa en la
teora siguiente: si x1 y x2 son los nmeros de aciertos obtenidos en n1 ensayos de un tipo y n2 de otro,
todos los ensayos son independientes y las probabilidades correspondientes de lograr un acierto son,
respectivamente, 1 y 2 , entonces la distribucin de muestreo de
desviacin estndar

1 (1 1 ) 2 (1 2 )
n1

n2

x1 x2
tiene la media 1 2 y la

n1 n2

Es costumbre referirnos a esta desviacin estndar

como el error tpico de la diferencia entre dos proporciones.


Cuando se demuestra la hiptesis nula 1 = 2 = , contra una hiptesis alternativa adecuada,
la media de la distribucin de muestreo de la diferencia entre las dos proporciones de muestra es

1 2 =0 y su desviacin estndar puede escribirse como


estimarse combinando los datos y sustituyendo por

p=

1 1
+
n1 n 2

(1 )

donde suele

la proporcin de muestra combinada

x1 + x 2
. Siendo as con relacin a muestras grandes, la distribucin de muestreo de la diferencia
n1 + n 2

entre dos proporciones se puede calcular muy aproximadamente con una distribucin normal, con base
en el estadgrafo

z=

x1 x 2

n1 n 2
1
1
p(1 p) +
n1 n 2

con p =

x1 + x 2
n1 + n 2

30
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA

Prueba estadstica para 1 2 de dos muestras grandes


7. 1. Planteo de Hiptesis
a) Hiptesis cientfica
b) Hiptesis estadsticas
Hiptesis nula: H 0 : 2 = 1 o equivalente H 0
Hiptesis Alternativa:
Prueba de una cola
H1 : (1 2 ) > 0

: ( 1 2 ) = 0

Prueba de dos colas


H1 : ( 1 2 ) 0

(o H1 : (1 2 ) < 0)
2.. Nivel de significancia: =
3.. Estadgrafo de prueba:

z=

( p1 p 2 ) 0
1 (1 1 ) 2 (1 2 )
n1

( p1 p 2 )
(1 ) (1 )
+

n1

n2

n2

x1 x 2

n1 n 2
1 1
p(1 p) +
n1 n 2

p1 = x1 / n1 y p 2 = x 2 / n 2 . Puesto que no se conoce el valor comn de 1 = 2 =


x1 + x 2
(utilizado en el error estndar), se estima por p =
n1 + n 2
Donde

Supuesto:: las muestras se seleccionan de una manera aleatoria e independiente en las dos
poblaciones binomiales, y n1 y n2 son lo suficientemente grandes para que la distribucin de
muestreo de ( p1 p2 ) pueda ser aproximada mediante una distribucin normal. Es decir, n1 p1 ,

n1 q1 , n 2 p 2 y n 2 q 2 deben ser mayores a 5.


4. Regla de decisin: rechazo la H0 cuando
Prueba de una cola
z > z

Prueba de dos colas

(o bien z < z cuando

z > z /2 o bien z < z /2

H a : ( 1 2 ) < 0)

O cuando el valor de

<

%

%

Ejemplo 11.8. Para demostrar la efectividad de un nuevo medicamento que alivia el dolor, a 80
pacientes de una clnica se les dio una pastilla que contiene el medicamento y a otros 80 se les
administr un placebo. En el nivel de significancia 0,01, qu podemos conclui
concluirr acerca de la efectividad
de la droga, si del primer grupo 56 de los pacientes sintieron un efecto benfico mientras que en el otro
grupo, 38 pacientes tambin sintieron un efecto benfico?
1) Hiptesis
Hiptesis cientfica
Hiptesis estadsticas

H 0 : 1 = 2

H1 : 1 > 2
2) Nivel de significancia: = 0,01
3) Estadgrafo de prueba:

z=

x1 x 2

n1 n 2
1
1
p(1 p) +
n1 n 2

31
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012

UNIDAD III:INFERENCIA ESTADSTICA


4) Regla de decisin
%

Se rechaza la hiptesis nula si z m > 2,33 , obtenido el valor de la tabla de


F(z).
0,
0,01

0,05
zc= -1,645

zc= 2,33

5) Clculo del valor muestral del estadgrafo de prueba


Al sustituir en la frmula p =

x1 + x 2
56 + 38
los valores correspondientes se obtiene p =
= 0.5875
n1 + n 2
80 + 80

Reemplazando en el estadgrafo de prueba obtenemos el valor muestral de z

z=

x1 x 2

n1 n 2
1
1
p(1 p) +
n1 n 2

56 38

80 80

(0.5875)(0.4125) 1 + 1
80 80

= 2.89

6) Decisin
Como zm=2.89 excede a zc=2.33, se debe rechazar la hiptesis nula.
7) Conclusin
La muestra aporta evidencia suficiente, con un nivel de significancia de 0,01, para decir que existe
una diferencia entre los grupos de pacientes frente al efecto benfico de la droga.

32
Ctedra de Clculo
culo Estadstico y Biometra Facultad de Cien
iencias Agrarias UNCUYO / Ciclo 2012