Por lo general, no se conoce la verdadera desviacin estndar de una poblacin. La prueba t es adecuada para las pruebas de hiptesis en las cuales se utiliza la desviacin estndar de la muestra (s) para estimar el valor de la desviacin estndar de la poblacin. La prueba t se basa en la distribucin t (con un nmero de grados de libertad, df = n -1) y en la suposicin de que la poblacin tiene una distribucin aproximadamente normal. Conforme crece el tamao de la muestra, la suposicin de normalidad de la poblacin se vuelve menos importante. La distribucin t es una familia de distribuciones (una para cada nmero de grados de libertad, df). Cuando los df son pequeos, la distribucin t es ms plana y ms dispersa que la distribucin normal, pero para una mayor cantidad de grados de libertad, los integrantes sucesivos de la familia se acercan cada vez ms a la distribucin normal. Cuando el nmero de grados de libertad se acerca a infinito, las dos distribuciones se vuelven idnticas. Los siguientes casos representan los tipos de situaciones en los que la media de una muestra y la desviacin estndar son la nica informacin que tenemos al evaluar el valor de una hiptesis para la media poblacional: 1.- Un asesor de inversiones afirma que sus clientes tienen una media de 340 acciones burstiles. En una muestra de 50 clientes, la media del nmero de acciones posedas es 315, con una desviacin estndar de 83.2 acciones.
2.- Una Cmara de Comercio dice que la media del nmero de aos de educacin general de los integrantes de la fuerza laboral local es de al menos 10 aos. Una empresa que considera la ciudad para instalar una planta nueva encuentra que una muestra de 60 trabajadores tiene una media de 8.4 aos de educacin general, con una desviacin estndar de 2.7 aos. El estadstico de la prueba se calcula del modo siguiente:
Estadstico de prueba, prueba t para la media muestral: ; donde el error estndar estimado de la media muestral, = = la media de la muestra = la media poblacional de la hiptesis n = el tamao de la muestra Prueba de dos colas para la media, desconocida Ejemplo El gerente de crdito de una gran tienda de departamentos afirma que la media del saldo para los clientes con crdito en la tienda es de 410 dlares. Un auditor independiente selecciona una muestra aleatoria de 18 cuentas y encuentra una media de saldo de = $511.33 y una desviacin estndar de s = $183.75. Si la declaracin del gerente no es apoyada por estos datos, el auditor pretende examinar todos los saldos de las cuentas de crdito. Si se supone que la poblacin de saldos de crdito tiene una distribucin aproximadamente normal, qu accin debe emprender el auditor? Solucin Formular las hiptesis nula y alternativa El saldo medio real es $410 El saldo medio real es algn otro valor Para evaluar la afirmacin del gerente, es adecuada una prueba de dos colas, porque es una afirmacin no direccional que puede rechazarse a causa de un resultado extremo en cualquier direccin. El centro de distribucin de la hiptesis para la media muestral, para muestra de n = 18, ser = $410. Seleccionar el nivel de significancia Para esta prueba, utilizaremos el nivel de significancia de 0.05. La suma de las reas de las dos colas ser de 0.05. Seleccionar el estadstico de prueba y calcular su valor El estadstico de prueba es , y se usar la distribucin t para describir la distribucin muestral de la media para las muestras de n = 18. El centro de la distribucin es = $410, lo cual corresponde a t = 0.000. Como se desconoce la desviacin estndar de la poblacin, se emplea s para estimar . La distribucin muestral tiene un error estndar estimado de:
y el valor calculado de t ser:
I dentificar los valores crticos para el estadstico de prueba y plantear la regla de decisin Para esta prueba, = 0.05, y el nmero de grados de libertad es df = (n 1) o (18 1) = 17. Al consultar la tabla de la distribucin t, se encuentra que los valores crticos para el estadstico de prueba son t = -2.110 y t = +2.110. La regla de decisin se plantea como Rechazar H 0 si t calculada es < -2.110 o > +2.110, de lo contrario, no rechazar. Comparar los valores calculado y crtico y llegar a una conclusin para la hiptesis nula
El estadstico calculado para la prueba, t = 2.340, excede el lmite superior y cae dentro de esta zona de rechazo. Se rechaza H 0 .
Tomar la decisin correspondiente
El resultado sugiere que la media del saldo de las cuentas es un valor diferente a 410 dlares. El auditor debe examinar todos los saldos de las cuentas de crdito. Pruebas de una cola para la media, desconocida Ejemplo: La Chekzar Rubber Company, en dificultades financieras por la mala reputacin de la calidad del producto, sac una campaa de anuncios donde declara que la duracin media de los neumticos Chekzar en carretera es de al menos 60 000 millas. Escpticos, los editores de una revista para consumidores compran 36 neumticos y los prueban en carretera. La duracin media de los neumticos en la muestra es = 58 341.69 millas, con una desviacin estndar muesrtral de s = 3 632.53 millas. Formular las hiptesis nula y alternativa Debido a la naturaleza direccional de la afirmacin del anuncio y al escepticismo de los editores con respecto a su veracidad, las hiptesis nula y alternativa son: millas La duracin media de los neumticos es de al menos de 60 000 millas millas. La duracin media de los neumticos es menor a 60 000 millas. Seleccionar el nivel de significancia Para esta prueba, utilizaremos el nivel de significancia de 0.01. Seleccionar el estadstico de prueba y calcular su valor El estadstico de prueba es t = , y se usar la distribucin t para describir la distribucin muestral de la media para las muestras de n = 36. El centro de la distribucin es el valor ms bajo posible para el cual H 0 puede ser verdadera, es decir, = 60 000 millas. Como se desconoce la desviacin estndar de la poblacin, se usa s para estimar . La distribucin muestral tiene un error estndar estimado de: millas y el valor calculado de t es:
I dentificar el valor crtico para el estadstico de prueba y plantear la regla de decisin Para esta prueba, se especific como 0.01. El nmero de grados de libertad es df = (n 1), o (36 1) = 35. Al consultar en la tabla, se encuentra que este valor crtico es t = -2.438. (Aunque el valor listado es positivo, recuerde que la distribucin es simtrica). La regla de decisin se plantea como Rechazar H 0 si la t calculada es menor que -2.438, de lo contrario, no rechazar. Comparar los valores calculado y crtico y llegar a una conclusin para la hiptesis nula El estadstico calculado para la prueba t = -2.739, es menor que el valor crtico, t = -2.438, y cae dentro de la regin de rechazo de la prueba. La hiptesis nula, millas, debe ser rechazada. Tomar la decisin correspondiente El resultado de la prueba sustenta las dudas de los editores con respecto a la afirmacin del anuncio de Chekzar. La revista puede ejercer presin legal sobre Chekzar o con sus lectores, para que modifique su anuncio. Pruebas de hiptesis con dos poblaciones Las hiptesis nula y alternativa Las hiptesis expresadas en trminos de expresadas en trminos de las la distribucin muestral de la diferencia medias poblacionales entre las medias muestrales
Prueba de dos colas:
( Prueba de cola izquierda
Prueba de cola derecha:
La prueba de z para comparar las medias de dos muestras independientes La prueba z se presenta aqu como una alternativa de la prueba t con varianzas desiguales cuando n 1 y n 2 son 30. Adems de no requerir suposiciones respecto a la forma de las distribuciones poblacionales, ofrece la ventaja de una simplicidad ligeramente mayor y evita la complicada frmula de correccin de los df utilizada en la prueba t con varianzas desiguales; por lo tanto, puede ser til para quienes no disponen de una computadora y un software para estadstica. Esta prueba ha sido popular durante muchos aos como mtodo para comparar las medias de dos muestras grandes, independientes, cuando se desconocen y , y de dos muestras independientes de cualquier tamao cuando se conocen y y las dos poblaciones tienen una distribucin normal. Igual que la prueba t con varianzas desiguales, la prueba z no supone que son iguales las desviaciones estndar poblacionales, y se utilizan s 1 y s 2 para estimar las respectivas desviaciones estndar poblacionales y . Prueba z para comparar las medias de dos muestras independientes, y , son desconocidas y cada n 30:
donde y = las medias muestrales 1 y 2. = la diferencia hipottica entre las medias poblacionales. n 1 y n 2 = los tamaos de las muestras 1 y 2. s 1 y s 2 = las desviaciones estndar de las muestras 1 y 2. I ntervalo de confianza para ; con = (1- coeficiente de confianza) Ejemplo Un centro de empleo universitario ha recopilado datos que comparan los sueldos iniciales de dos grupos de estudiantes graduados cuyos apellidos comienzan, en un grupo, con las letras de la A a la M y en el otro, con las letras de la N a la Z. Para una muestra de 30 estudiantes en la categora A-M, el sueldo inicial promedio fue de 37 233.33 dlares, con una desviacin estndar de 3 475.54 dlares. Para una muestra de 36 estudiantes cuyos apellidos comienzan con N a Z, el sueldo inicial promedio fue de 35 855.81 dlares, con una desviacin estndar de 2 580.02 dlares. Solucin Para este estudio, la hiptesis nula es que no hay diferencia entre las medias de las poblaciones, o . Como la intencin de la prueba es no direccional, la hiptesis nula puede rechazarse por una diferencia extrema en cualquier direccin, y la hiptesis alternativa es . Para poner a prueba la hiptesis nula, utilizaremos el nivel de significancia de 0.02. Las hiptesis nula y alternativa tambin pueden plantearse del modo siguiente: Los salarios iniciales son iguales para ambas poblaciones Los salarios iniciales no son iguales. Para estos datos, el valor calculado del estadstico de la prueba z, se obtiene as,
Para el nivel de significancia de 0.02, los valores crticos sern z = -2.33 y z = +2.33. La regla de decisin ser rechazar la hiptesis nula de las medias de las poblaciones iguales si la z calculada es menor que -2.33 o mayor que +2.33. Como el valor calculado del estadstico de prueba, z = 1.80, cae dentro de la regin de no rechazo, la hiptesis nula no puede rechazarse con el nivel de significancia de 0.02. A partir de este anlisis, no podemos concluir que las personas con apellidos en la primera parte del alfabeto reciban salarios iniciales diferentes que aquellas cuyos apellidos estn al final del alfabeto. Con base en los datos de la muestra, tambin determinamos el intervalo de confianza de 98% para ( ). Esto corresponde a = 0.02 y, para la mejor precisin posible, utilizando la tabla normal tomamos z = 2.33, el intervalo ser:
o de -408.47 a +3163.51 La diferencia hipottica (cero) est dentro del intervalo de confianza de 98%, de modo que tenemos una confianza de 98% de que las medias de las poblaciones pueden ser iguales. La prueba t con varianzas combinadas para comparar las medias de dos muestras independientes Pueden surgir situaciones en las que nos gustara examinar si la diferencia entre las medias de dos muestras independientes es lo bastante grande para garantizar que se rechace la posibilidad de que sus medias poblacionales sean iguales. En este tipo de situacin, la conclusin alternativa es que la diferencia entre las medias muestrales es lo suficientemente pequea para haber ocurrido por casualidad, y que las medias poblacionales en realidad pueden ser iguales. Los siguientes son ejemplos tpicos en los que es til tal prueba de hiptesis:
En la comparacin de la resistencia a la tensin de las barras de acero obtenidas mediante dos mtodos de produccin diferentes.
Para determinar si un nuevo modelo de impresora funciona ms rpido que el modelo que se quiere comprar.
Al evaluar la afirmacin de un inventor de que su diseo de cojinete mejora la duracin de un motor en comparacin con uno convencional. Al utilizar la prueba t suponemos que: 1) las desviaciones estndar poblacionales (que se desconocen) son iguales 2) las poblaciones tienen una distribucin al menos aproximadamente normal. Estadstico de prueba para comparar las medias de dos muestras independientes, se supone que y son iguales:
donde: y = las medias de las muestras 1 y 2 = diferencia hipottica entre las medias poblacionales y = los tamaos de las muestras 1 y 2 y = las desviaciones estndar de las muestras 1 y 2. y I ntervalo de confianza para
con . Ejemplo Algunos empresarios que desarrollan un programa de repaso de contabilidad dirigido a personas que se preparan para presentar el examen de Contador Pblico Certificado (CPA) consideran dos formatos posibles para realizar las sesiones de repaso. Una muestra aleatoria de 10 estudiantes se capacita con el formato 1, y luego se registra su nmero de errores en un examen tipo. Otra muestra aleatoria de 12 personas se capacita segn el formato 2 y, asimismo, sus errores se registran en el mismo examen. Para los primeros 10 estudiantes, los desempeos individuales son: 11, 8, 8, 3, 7, 5, 9, 5, 1 y 3 errores, respectivamente; para el segundo grupo de 12 estudiantes capacitados, los desempeos individuales son: 10, 11, 9, 7, 2, 11, 12, 3, 6, 7, 8 y 12 errores, respectivamente. Para el nivel de significancia de 0.10, los formatos de repaso tienen la misma eficacia en la capacitacin de personas para el examen de CPA? Comparacin de dos medias cuando las muestras son dependientes Hay ocasiones en las que necesitamos poner a prueba hiptesis concernientes a muestras que no son independientes. Por ejemplo, tal vez necesitamos examinar la productividad de los empleados antes y despus de un cambio en el diseo de su puesto de trabajo, o comparar las velocidades de lectura de las personas que participan en un curso de lectura rpida antes y despus del curso. En tales casos, en realidad no tenemos dos muestras diferentes de personas, sino mediciones de antes y despus de las mismas personas. Como resultado, slo habr una variable: la diferencia registrada para cada persona. Las hiptesis nula y alternativa ser una de las siguientes, con el valor calculado del estadstico de la prueba como se aprecia aqu: Hiptesis nula Hiptesis alternativa Tipo de prueba Dos colas Cola izquierda Cola derecha Estadstico de prueba para comparar las medias de observaciones pareadas ; donde: d =(x 1 x 2 ), es la diferencia entre las dos mediciones para cada persona o unidad de la prueba. = la diferencia promedio, = n = el nmero de pares de observaciones s d = la desviacin estndar de d, o df = n 1 I ntervalo de confianza para
Ejemplo Al investigar la manera de aumentar la productividad en las oficinas, el vicepresidente de una compaa adquiri 12 teclados ergonomtricos y los distribuy entre una muestra de secretarias. Si los teclados aumentan la productividad de manera sustancial, el vicepresidente planea sustituir todos los teclados actuales por los modelos nuevos. Antes de entregar los teclados, cada uno de los 12 integrantes de la muestra escribi un documento comn con su viejo teclado, y se midi el nmero de palabras por minuto. Despus de recibir los nuevos teclados y de dedicar algunas semanas a familiarizarse con ellos, cada empleado escribi el mismo documento con el modelo ergonomtrico. La siguiente tabla contiene el nmero de palabras por minuto que escribi cada persona en cada prueba. Personas x 1 , Palabras/Minuto con teclado viejo x 2 , Palabras/Minuto con teclado nuevo Diferencia d =(x 1 - x 2 ) Diferencia al cuadrado 1 25.5 43.6 -18.1 327.61 2 59.2 69.9 -10.7 114.49 3 38.4 39.8 -1.4 1.96 4 66.8 73.4 -6.6 43.56 5 44.9 50.2 -5.3 28.09 6 47.4 53.9 -6.5 42.25 7 41.6 40.3 1.3 1.69 8 48.9 58.0 -9.1 82.81 9 60.7 66.9 -6.2 38.44 10 41.0 66.5 -25.5 650.25 11 36.1 27.4 8.7 75.69 12 34.4 33.7 0.7 0.49
-78.7 = 1407.33 =
Solucin Como el vicepresidente no quiere reemplazar los teclados actuales a menos que el modelo ergonomtrico sea claramente superior, el nfasis de la prueba est en el modelo nuevo y es adecuada una prueba de una cola. Se utilizar el nivel de 0.025 para examinar si el teclado nuevo aumenta de manera significativa la velocidad de escritura. Para cada persona de la muestra, la diferencia de velocidad entre la primera y la segunda medicin es d = (x 1 - x 2 ) palabras por minuto. Hiptesis nula La escritura con el teclado ergonomtrico no es ms rpida que con el teclado actual. Hiptesis alternativa El teclado ergonomtrico es ms rpido. La media de la muestra y la desviacin estndar para d se calculan de la siguiente manera:
y el estadstico de prueba se calcula como
El nmero de grados de libertad para la prueba es df =(n 1) = (12 1) = 11. Para el nivel de significancia de 0.025 en una prueba de cola izquierda, el valor crtico para el estadstico de prueba es t = -2.201. La regla de decisin es, Rechazar la hiptesis nula si el valor calculado del estadstico de la prueba es menor que t = -2.201; de lo contrario, no rechazar. Como se puede apreciar, el valor calculado del estadstico de la prueba es menor que el valor crtico y cae en la regin de rechazo para la prueba. Como resultado, se rechaza la hiptesis nula y concluimos que el teclado ergonomtrico aumenta la velocidad de escritura. Para completar el objetivo de su prueba, el vicepresidente debe adquirir teclados para todas las secretarias. Con base en los datos de la muestra, tambin determinaremos el intervalo de confianza de 95% para . Esto corresponde a = 0.05. Con df = 11 y t = 2.201, el intervalo ser o de -12.277 a -0.839 Comparacin de dos proporciones muestrales Las siguientes son algunas situaciones posibles: 1.- Comparar el porcentaje de piezas defectuosas entre embarques de dos proveedores diferentes. 2.- Determinar si la proporcin de pacientes con dolor de cabeza que sienten alivio con un nuevo medicamento es significativamente mayor que quienes emplean aspirina. 3.- Comparar el porcentaje de alumnos de ltimo ao de enseanza media enrolados en el servicio militar que vieron la versin A de una pelcula sobre el reclutamiento comparado con quienes vieron la versin B. En esta seccin, las pruebas suponen que ambos tamaos de muestras son grandes (cada uno ) .Adems, n 1 p 1 , n 1 (1 p 1 ), n 2 p 2 y n 2 (1 p 2 ), todos deben ser 5. (Estos requisitos son necesarios para que la distribucin normal utilizada sea una aproximacin cercana a la distribucin binomial). Igual que la comparacin de medias de muestras independientes, las pruebas relacionadas con proporciones pueden ser direccionales o no direccionales. Estadstico de la prueba para comparar proporciones de dos muestras independientes 1.- Cuando la diferencia hipottica es cero (lo usual) ; donde: = las proporciones muestrales = los tamaos de las muestras = la estimacin combinada de la proporcin poblacional, con
2.- Cuando la diferencia hipottica es ( 0 0
I ntervalo de confianza para
Ejemplo En un estudio de 10 aos patrocinado por el National Heart, Lung and Blood Institute, 3806 hombres de mediana edad con niveles altos de colesterol, pero sin problemas cardacos detectados, se dividieron en dos grupos. Los integrantes del primero recibieron un nuevo medicamento diseado para reducir los niveles de colesterol, mientras que los del segundo recibieron diariamente dosis de un placebo. Adems de reducir los niveles de colesterol, el medicamento pareca eficaz para reducir la incidencia de infartos cardacos. Durante los 10 aos, 155 integrantes del primer grupo sufrieron un infarto, mientras que del grupo con placebos, 187 sufrieron un infarto. Solucin Suponiendo que los 3806 participantes se dividieron de manera aleatoria en dos grupos, haba 1903 hombres en cada grupo. As, las proporciones muestrales de infartos dentro de los dos grupos son p 1 = 155/1905 = 0.0815 y p 2 = 187/1903 = 0.0983. Dado que la intencin del estudio era evaluar la eficacia del nuevo medicamento, la prueba de hiptesis ser direccional. En trminos de las proporciones poblacionales, las hiptesis nula y alternativa son y . Las hiptesis tambin se pueden expresar como: Hiptesis nula Los usuarios del nuevo medicamento tienen una menor probabilidad de sufrir un infarto Hiptesis alternativa Los usuarios del nuevo medicamento tienen cuando menos la misma probabilidad de sufrir un infarto. Para poner a prueba la hiptesis nula, utilizaremos el nivel de significancia de 0.05. La estimacin combinada de las proporciones poblacionales (que se suponen iguales) se calcula como: = 0.0899 El valor calculado del estadstico de la prueba, z, es:
Para el nivel de 0.05 en esta prueba de cola izquierda, el valor crtico de z es z = -1.645. La regla de decisin es, Rechazar H 0 si el valor calculado del estadstico de la prueba es < - 1.645; de lo contrario, no rechazar. Como se puede apreciar, el valor calculado del estadstico de la prueba, z = -1.81, es menor que el valor crtico y cae dentro de la regin de rechazo. Con un nivel de significancia de 0.05, se rechaza la hiptesis nula y concluimos que el nuevo medicamento es eficaz. Usando la tabla de distribucin normal y buscando el rea del punto medio a z = -1.81, encontramos que el rea es 0.4649. Restando este valor de 0.5000, el rea de una cola (0.5000 0.4649) es 0.0351. Este es el valor de p aproximado para la prueba. Con base en los datos de la muestra, tambin construimos el intervalo de confianza de 90% para . Con z = 1.645, esto ser:
= (0.0815 0.0983) 1.645 o de -0.0320 a - 0.0016 (Introduccin a la Estadstica para negocios), Ronald M. Weiers, Quinta edicin