Vous êtes sur la page 1sur 43

Pruebas de hiptesis sobre la media

de una poblacin: Muestra pequea




Por lo general, no se conoce la verdadera desviacin
estndar de una poblacin. La prueba t es adecuada para
las pruebas de hiptesis en las cuales se utiliza la
desviacin estndar de la muestra (s) para estimar el
valor de la desviacin estndar de la poblacin. La
prueba t se basa en la distribucin t (con un nmero de
grados de libertad, df = n -1) y en la suposicin de que la
poblacin tiene una distribucin aproximadamente
normal. Conforme crece el tamao de la muestra, la
suposicin de normalidad de la poblacin se vuelve
menos importante.
La distribucin t es una familia de distribuciones (una
para cada nmero de grados de libertad, df). Cuando
los df son pequeos, la distribucin t es ms plana y
ms dispersa que la distribucin normal, pero para una
mayor cantidad de grados de libertad, los integrantes
sucesivos de la familia se acercan cada vez ms a la
distribucin normal. Cuando el nmero de grados de
libertad se acerca a infinito, las dos distribuciones se
vuelven idnticas.
Los siguientes casos representan los tipos de situaciones en los
que la media de una muestra y la desviacin estndar son la nica
informacin que tenemos al evaluar el valor de una hiptesis para
la media poblacional:
1.- Un asesor de inversiones afirma que sus clientes tienen
una media de 340 acciones burstiles. En una muestra de 50
clientes, la media del nmero de acciones posedas es 315,
con una desviacin estndar de 83.2 acciones.

2.- Una Cmara de Comercio dice que la media del nmero
de aos de educacin general de los integrantes de la fuerza
laboral local es de al menos 10 aos. Una empresa que
considera la ciudad para instalar una planta nueva encuentra
que una muestra de 60 trabajadores tiene una media de 8.4
aos de educacin general, con una desviacin estndar de
2.7 aos.
El estadstico de la prueba se calcula del modo siguiente:

Estadstico de prueba, prueba t para la media muestral:
;
donde
el error estndar estimado de la media muestral, =
= la media de la muestra
= la media poblacional de la hiptesis
n = el tamao de la muestra
Prueba de dos colas para la media,
desconocida
Ejemplo
El gerente de crdito de una gran tienda de departamentos afirma que la media del saldo para los
clientes con crdito en la tienda es de 410 dlares. Un auditor independiente selecciona una muestra
aleatoria de 18 cuentas y encuentra una media de saldo de = $511.33 y una desviacin estndar de
s = $183.75. Si la declaracin del gerente no es apoyada por estos datos, el auditor pretende examinar
todos los saldos de las cuentas de crdito. Si se supone que la poblacin de saldos de crdito tiene
una distribucin aproximadamente normal, qu accin debe emprender el auditor?
Solucin
Formular las hiptesis nula y alternativa
El saldo medio real es $410
El saldo medio real es algn otro valor
Para evaluar la afirmacin del gerente, es adecuada una prueba de dos colas, porque es una
afirmacin no direccional que puede rechazarse a causa de un resultado extremo en cualquier
direccin. El centro de distribucin de la hiptesis para la media muestral, para muestra de n = 18,
ser = $410.
Seleccionar el nivel de significancia
Para esta prueba, utilizaremos el nivel de significancia de 0.05. La suma de las reas de las dos colas
ser de 0.05.
Seleccionar el estadstico de prueba y calcular su valor
El estadstico de prueba es , y se usar la distribucin t para describir la distribucin
muestral de la media para las muestras de n = 18. El centro de la distribucin es = $410, lo cual
corresponde a t = 0.000. Como se desconoce la desviacin estndar de la poblacin, se emplea s para
estimar . La distribucin muestral tiene un error estndar estimado de:

y el valor calculado de t ser:

I dentificar los valores crticos para el estadstico de prueba y plantear la regla de decisin
Para esta prueba, = 0.05, y el nmero de grados de libertad es df = (n 1) o (18 1) = 17. Al
consultar la tabla de la distribucin t, se encuentra que los valores crticos para el estadstico de
prueba son t = -2.110 y t = +2.110. La regla de decisin se plantea como Rechazar H
0
si t calculada
es < -2.110 o > +2.110, de lo contrario, no rechazar.
Comparar los valores calculado y crtico y llegar a
una conclusin para la hiptesis nula

El estadstico calculado para la prueba, t = 2.340,
excede el lmite superior y cae dentro de esta zona de
rechazo. Se rechaza H
0
.

Tomar la decisin correspondiente

El resultado sugiere que la media del saldo de las
cuentas es un valor diferente a 410 dlares. El auditor
debe examinar todos los saldos de las cuentas de
crdito.
Pruebas de una cola para la media, desconocida
Ejemplo: La Chekzar Rubber Company, en dificultades financieras por la mala reputacin de la
calidad del producto, sac una campaa de anuncios donde declara que la duracin media de los
neumticos Chekzar en carretera es de al menos 60 000 millas. Escpticos, los editores de una revista
para consumidores compran 36 neumticos y los prueban en carretera. La duracin media de los
neumticos en la muestra es = 58 341.69 millas, con una desviacin estndar muesrtral de s = 3
632.53 millas.
Formular las hiptesis nula y alternativa
Debido a la naturaleza direccional de la afirmacin del anuncio y al
escepticismo de los editores con respecto a su veracidad, las
hiptesis nula y alternativa son:
millas La duracin media de los neumticos es de al
menos de 60 000 millas
millas. La duracin media de los neumticos es menor
a 60 000 millas.
Seleccionar el nivel de significancia
Para esta prueba, utilizaremos el nivel de significancia de 0.01.
Seleccionar el estadstico de prueba y calcular su valor
El estadstico de prueba es t = , y se usar la distribucin t
para describir la distribucin muestral de la media para las
muestras de n = 36. El centro de la distribucin es el valor ms
bajo posible para el cual H
0
puede ser verdadera, es decir, = 60
000 millas. Como se desconoce la desviacin estndar de la
poblacin, se usa s para estimar . La distribucin muestral tiene un
error estndar estimado de:
millas
y el valor calculado de t es:

I dentificar el valor crtico para el estadstico de prueba y plantear
la regla de decisin
Para esta prueba, se especific como 0.01. El nmero de grados
de libertad es df = (n 1), o (36 1) = 35. Al consultar en la tabla,
se encuentra que este valor crtico es t = -2.438. (Aunque el valor
listado es positivo, recuerde que la distribucin es simtrica). La
regla de decisin se plantea como Rechazar H
0
si la t calculada es
menor que -2.438, de lo contrario, no rechazar.
Comparar los valores calculado y crtico y llegar a una
conclusin para la hiptesis nula
El estadstico calculado para la prueba t = -2.739, es menor que el
valor crtico, t = -2.438, y cae dentro de la regin de rechazo de la
prueba. La hiptesis nula, millas, debe ser rechazada.
Tomar la decisin correspondiente
El resultado de la prueba sustenta las dudas de los editores con
respecto a la afirmacin del anuncio de Chekzar. La revista puede
ejercer presin legal sobre Chekzar o con sus lectores, para que
modifique su anuncio.
Pruebas de hiptesis con dos poblaciones
Las hiptesis nula y alternativa Las hiptesis expresadas en trminos de
expresadas en trminos de las la distribucin muestral de la diferencia
medias poblacionales entre las medias muestrales

Prueba de dos colas:

(
Prueba de cola izquierda


Prueba de cola derecha:


La prueba de z para comparar las medias de dos muestras independientes
La prueba z se presenta aqu como una alternativa de la prueba t
con varianzas desiguales cuando n
1
y n
2
son 30. Adems de no
requerir suposiciones respecto a la forma de las distribuciones
poblacionales, ofrece la ventaja de una simplicidad ligeramente
mayor y evita la complicada frmula de correccin de los df
utilizada en la prueba t con varianzas desiguales; por lo tanto,
puede ser til para quienes no disponen de una computadora y un
software para estadstica. Esta prueba ha sido popular durante
muchos aos como mtodo para comparar las medias de dos
muestras grandes, independientes, cuando se desconocen y , y
de dos muestras independientes de cualquier tamao cuando se
conocen y y las dos poblaciones tienen una distribucin
normal. Igual que la prueba t con varianzas desiguales, la prueba z
no supone que son iguales las desviaciones estndar poblacionales,
y se utilizan s
1
y s
2
para estimar las respectivas desviaciones
estndar poblacionales y .
Prueba z para comparar las medias de dos muestras
independientes, y , son desconocidas y cada n 30:

donde y = las medias muestrales 1 y 2.
= la diferencia hipottica entre las medias poblacionales.
n
1
y n
2
= los tamaos de las muestras 1 y 2.
s
1
y s
2
= las desviaciones estndar de las muestras 1 y 2.
I ntervalo de confianza para
; con = (1- coeficiente de confianza)
Ejemplo
Un centro de empleo universitario ha recopilado datos
que comparan los sueldos iniciales de dos grupos de
estudiantes graduados cuyos apellidos comienzan, en un
grupo, con las letras de la A a la M y en el otro, con las
letras de la N a la Z. Para una muestra de 30 estudiantes
en la categora A-M, el sueldo inicial promedio fue de 37
233.33 dlares, con una desviacin estndar de 3 475.54
dlares. Para una muestra de 36 estudiantes cuyos
apellidos comienzan con N a Z, el sueldo inicial
promedio fue de 35 855.81 dlares, con una desviacin
estndar de 2 580.02 dlares.
Solucin
Para este estudio, la hiptesis nula es que no hay diferencia entre
las medias de las poblaciones, o . Como la intencin de la
prueba es no direccional, la hiptesis nula puede rechazarse por
una diferencia extrema en cualquier direccin, y la hiptesis
alternativa es . Para poner a prueba la hiptesis nula,
utilizaremos el nivel de significancia de 0.02. Las hiptesis nula y
alternativa tambin pueden plantearse del modo siguiente:
Los salarios iniciales son iguales para ambas
poblaciones
Los salarios iniciales no son iguales.
Para estos datos, el valor calculado del estadstico de la prueba z, se obtiene
as,

Para el nivel de significancia de 0.02, los valores crticos sern z = -2.33 y z
= +2.33. La regla de decisin ser rechazar la hiptesis nula de las medias
de las poblaciones iguales si la z calculada es menor que -2.33 o mayor que
+2.33. Como el valor calculado del estadstico de prueba, z = 1.80, cae
dentro de la regin de no rechazo, la hiptesis nula no puede rechazarse con
el nivel de significancia de 0.02. A partir de este anlisis, no podemos
concluir que las personas con apellidos en la primera parte del alfabeto
reciban salarios iniciales diferentes que aquellas cuyos apellidos estn al
final del alfabeto.
Con base en los datos de la muestra, tambin determinamos el
intervalo de confianza de 98% para ( ). Esto corresponde a =
0.02 y, para la mejor precisin posible, utilizando la tabla normal
tomamos z = 2.33, el intervalo ser:

o de -408.47 a
+3163.51
La diferencia hipottica (cero) est dentro del intervalo de
confianza de 98%, de modo que tenemos una confianza de 98% de
que las medias de las poblaciones pueden ser iguales.
La prueba t con varianzas combinadas para comparar las medias de dos
muestras independientes
Pueden surgir situaciones en las que nos gustara examinar si la
diferencia entre las medias de dos muestras independientes es lo
bastante grande para garantizar que se rechace la posibilidad de que sus
medias poblacionales sean iguales. En este tipo de situacin, la
conclusin alternativa es que la diferencia entre las medias muestrales es
lo suficientemente pequea para haber ocurrido por casualidad, y que las
medias poblacionales en realidad pueden ser iguales. Los siguientes son
ejemplos tpicos en los que es til tal prueba de hiptesis:

En la comparacin de la resistencia a la tensin de las barras de acero
obtenidas mediante dos mtodos de produccin diferentes.

Para determinar si un nuevo modelo de impresora funciona ms rpido
que el modelo que se quiere comprar.

Al evaluar la afirmacin de un inventor de que su diseo de cojinete
mejora la duracin de un motor en comparacin con uno convencional.
Al utilizar la prueba t suponemos que:
1) las desviaciones estndar poblacionales (que se desconocen) son iguales
2) las poblaciones tienen una distribucin al menos aproximadamente
normal.
Estadstico de prueba para comparar las medias de dos muestras
independientes, se supone que y son iguales:

donde:
y = las medias de las muestras 1 y 2
= diferencia hipottica entre las medias poblacionales
y = los tamaos de las muestras 1 y 2
y = las desviaciones estndar de las muestras 1 y 2.
y
I ntervalo de confianza para

con .
Ejemplo
Algunos empresarios que desarrollan un programa de repaso de contabilidad
dirigido a personas que se preparan para presentar el examen de Contador
Pblico Certificado (CPA) consideran dos formatos posibles para realizar las
sesiones de repaso. Una muestra aleatoria de 10 estudiantes se capacita con el
formato 1, y luego se registra su nmero de errores en un examen tipo. Otra
muestra aleatoria de 12 personas se capacita segn el formato 2 y, asimismo,
sus errores se registran en el mismo examen. Para los primeros 10 estudiantes,
los desempeos individuales son: 11, 8, 8, 3, 7, 5, 9, 5, 1 y 3 errores,
respectivamente; para el segundo grupo de 12 estudiantes capacitados, los
desempeos individuales son: 10, 11, 9, 7, 2, 11, 12, 3, 6, 7, 8 y 12 errores,
respectivamente. Para el nivel de significancia de 0.10, los formatos de repaso
tienen la misma eficacia en la capacitacin de personas para el examen de
CPA?
Comparacin de dos medias cuando las muestras son dependientes
Hay ocasiones en las que necesitamos poner a prueba hiptesis
concernientes a muestras que no son independientes. Por ejemplo,
tal vez necesitamos examinar la productividad de los empleados
antes y despus de un cambio en el diseo de su puesto de trabajo,
o comparar las velocidades de lectura de las personas que
participan en un curso de lectura rpida antes y despus del curso.
En tales casos, en realidad no tenemos dos muestras diferentes de
personas, sino mediciones de antes y despus de las mismas
personas. Como resultado, slo habr una variable: la diferencia
registrada para cada persona.
Las hiptesis nula y alternativa ser una de las siguientes, con el valor calculado del
estadstico de la prueba como se aprecia aqu:
Hiptesis nula Hiptesis alternativa Tipo de prueba
Dos colas
Cola izquierda
Cola derecha
Estadstico de prueba para comparar las medias de
observaciones pareadas
; donde:
d =(x
1
x
2
), es la diferencia entre las dos mediciones para cada
persona o unidad de la prueba.
= la diferencia promedio, =
n = el nmero de pares de observaciones
s
d
= la desviacin estndar de d, o
df = n 1
I ntervalo de confianza para

Ejemplo
Al investigar la manera de aumentar la productividad en las oficinas, el
vicepresidente de una compaa adquiri 12 teclados ergonomtricos y los
distribuy entre una muestra de secretarias. Si los teclados aumentan la
productividad de manera sustancial, el vicepresidente planea sustituir todos los
teclados actuales por los modelos nuevos. Antes de entregar los teclados, cada
uno de los 12 integrantes de la muestra escribi un documento comn con su
viejo teclado, y se midi el nmero de palabras por minuto. Despus de recibir
los nuevos teclados y de dedicar algunas semanas a familiarizarse con ellos,
cada empleado escribi el mismo documento con el modelo ergonomtrico.
La siguiente tabla contiene el nmero de palabras por minuto que escribi cada
persona en cada prueba.
Personas
x
1
, Palabras/Minuto
con teclado viejo
x
2
,
Palabras/Minuto
con teclado
nuevo
Diferencia
d =(x
1
- x
2
)
Diferencia
al cuadrado
1 25.5 43.6 -18.1 327.61
2 59.2 69.9 -10.7 114.49
3 38.4 39.8 -1.4 1.96
4 66.8 73.4 -6.6 43.56
5 44.9 50.2 -5.3 28.09
6 47.4 53.9 -6.5 42.25
7 41.6 40.3 1.3 1.69
8 48.9 58.0 -9.1 82.81
9 60.7 66.9 -6.2 38.44
10 41.0 66.5 -25.5 650.25
11 36.1 27.4 8.7 75.69
12 34.4 33.7 0.7 0.49

-78.7
=
1407.33
=

Solucin
Como el vicepresidente no quiere reemplazar los teclados
actuales a menos que el modelo ergonomtrico sea
claramente superior, el nfasis de la prueba est en el
modelo nuevo y es adecuada una prueba de una cola. Se
utilizar el nivel de 0.025 para examinar si el teclado nuevo
aumenta de manera significativa la velocidad de escritura.
Para cada persona de la muestra, la diferencia de velocidad
entre la primera y la segunda medicin es d = (x
1
- x
2
)
palabras por minuto.
Hiptesis nula
La escritura con el teclado ergonomtrico no es ms rpida que
con el teclado actual.
Hiptesis alternativa
El teclado ergonomtrico es ms rpido.
La media de la muestra y la desviacin estndar para d se calculan de la
siguiente manera:


y el estadstico de prueba se calcula como

El nmero de grados de libertad para la prueba es df =(n 1) = (12 1) =
11. Para el nivel de significancia de 0.025 en una prueba de cola izquierda,
el valor crtico para el estadstico de prueba es t = -2.201. La regla de
decisin es, Rechazar la hiptesis nula si el valor calculado del estadstico
de la prueba es menor que t = -2.201; de lo contrario, no rechazar.
Como se puede apreciar, el valor calculado del estadstico de la prueba es
menor que el valor crtico y cae en la regin de rechazo para la prueba.
Como resultado, se rechaza la hiptesis nula y concluimos que el teclado
ergonomtrico aumenta la velocidad de escritura. Para completar el
objetivo de su prueba, el vicepresidente debe adquirir teclados para todas
las secretarias.
Con base en los datos de la muestra, tambin determinaremos el
intervalo de confianza de 95% para . Esto corresponde a = 0.05. Con df
= 11 y t = 2.201, el intervalo ser
o de -12.277 a -0.839
Comparacin de dos proporciones muestrales
Las siguientes son algunas situaciones posibles:
1.- Comparar el porcentaje de piezas defectuosas entre embarques de dos proveedores diferentes.
2.- Determinar si la proporcin de pacientes con dolor de cabeza que sienten alivio con un nuevo
medicamento es significativamente mayor que quienes emplean aspirina.
3.- Comparar el porcentaje de alumnos de ltimo ao de enseanza media enrolados en el servicio
militar que vieron la versin A de una pelcula sobre el reclutamiento comparado con quienes vieron
la versin B.
En esta seccin, las pruebas suponen que ambos tamaos de muestras son grandes (cada uno
) .Adems, n
1
p
1
, n
1
(1 p
1
), n
2
p
2
y n
2
(1 p
2
), todos deben ser 5. (Estos requisitos son
necesarios para que la distribucin normal utilizada sea una aproximacin cercana a la distribucin
binomial). Igual que la comparacin de medias de muestras independientes, las pruebas relacionadas
con proporciones pueden ser direccionales o no direccionales.
Estadstico de la prueba para comparar proporciones de dos muestras independientes
1.- Cuando la diferencia hipottica es cero (lo usual)
; donde:
= las proporciones muestrales
= los tamaos de las muestras
= la estimacin combinada de la proporcin poblacional, con

2.- Cuando la diferencia hipottica es (
0
0

I ntervalo de confianza para

Ejemplo
En un estudio de 10 aos patrocinado por el National Heart,
Lung and Blood Institute, 3806 hombres de mediana edad con
niveles altos de colesterol, pero sin problemas cardacos
detectados, se dividieron en dos grupos. Los integrantes del
primero recibieron un nuevo medicamento diseado para reducir
los niveles de colesterol, mientras que los del segundo recibieron
diariamente dosis de un placebo. Adems de reducir los niveles
de colesterol, el medicamento pareca eficaz para reducir la
incidencia de infartos cardacos. Durante los 10 aos, 155
integrantes del primer grupo sufrieron un infarto, mientras que
del grupo con placebos, 187 sufrieron un infarto.
Solucin
Suponiendo que los 3806 participantes se dividieron de manera
aleatoria en dos grupos, haba 1903 hombres en cada grupo. As,
las proporciones muestrales de infartos dentro de los dos grupos
son p
1
= 155/1905 = 0.0815 y p
2
= 187/1903 = 0.0983. Dado que la
intencin del estudio era evaluar la eficacia del nuevo
medicamento, la prueba de hiptesis ser direccional. En trminos
de las proporciones poblacionales, las hiptesis nula y alternativa
son y . Las hiptesis tambin se pueden expresar
como:
Hiptesis nula
Los usuarios del nuevo medicamento tienen una menor
probabilidad de sufrir un infarto
Hiptesis alternativa
Los usuarios del nuevo medicamento tienen cuando menos la
misma probabilidad de sufrir un infarto.
Para poner a prueba la hiptesis nula, utilizaremos el nivel de significancia
de 0.05. La estimacin combinada de las proporciones poblacionales (que
se suponen iguales) se calcula como:
= 0.0899
El valor calculado del estadstico de la prueba, z, es:

Para el nivel de 0.05 en esta prueba de cola izquierda, el valor crtico de z
es z = -1.645. La regla de decisin es, Rechazar H
0
si el valor calculado
del estadstico de la prueba es < - 1.645; de lo contrario, no rechazar.
Como se puede apreciar, el valor calculado del estadstico de la prueba, z =
-1.81, es menor que el valor crtico y cae dentro de la regin de rechazo.
Con un nivel de significancia de 0.05, se rechaza la hiptesis nula y
concluimos que el nuevo medicamento es eficaz.
Usando la tabla de distribucin normal y buscando el rea del punto
medio a z = -1.81, encontramos que el rea es 0.4649. Restando este valor
de 0.5000, el rea de una cola (0.5000 0.4649) es 0.0351. Este es el valor
de p aproximado para la prueba.
Con base en los datos de la muestra, tambin construimos el
intervalo de confianza de 90% para . Con z = 1.645, esto
ser:

= (0.0815 0.0983) 1.645
o de
-0.0320 a - 0.0016
(Introduccin a la Estadstica para negocios), Ronald M. Weiers, Quinta edicin

Vous aimerez peut-être aussi