Académique Documents
Professionnel Documents
Culture Documents
Materia:
Estadística
Título:
Prueba de hipótesis de una y dos colas
Integrantes:
Vasconez Cueva Nathaly
Guzmán Valdez Alberto
Alejandro del Rosario Genesis
Zambrano Mera Jefferson
Profesor:
Casquete Baidal Nubia Elizabeth
Año 2018-2019
CICLO II
2
Tabla de Indice
TABLA DE INDICE ------------------------------------------------------------------------------ 2
ESTIMACIÓN E INTERVALOS DE CONFIANZA-------------------------------------- 3
Objetivos de la unidad ---------------------------------------------------------------------------- 3
Desviación estándar poblacional desconocida ----------------------------------------------- 3
Intervalo de confianza de una proporción --------------------------------------------------- 6
Elección del tamaño adecuado de una muestra --------------------------------------------- 7
¿Cómo determinar el tamaño de una muestra? --------------------------------------------- 7
¿De qué depende el tamaño muestral? -------------------------------------------------- 7
Tamaño de la muestra para calcular una media poblacional -------------------------- 10
Tamaño de la muestra para calcular la proporción de una población --------------- 10
Factor de corrección de una población finita ---------------------------------------------- 11
PRUEBAS DE HIPÓTESIS DE UNA MUESTRA --------------------------------------- 12
Cinco pasos para probar una hipótesis ----------------------------------------------------- 13
Pruebas de significancia de una y dos colas ------------------------------------------------ 14
Pruebas de la media de una población: se conoce la desviación estándar
poblacional ---------------------------------------------------------------------------------------- 16
Prueba de una cola ------------------------------------------------------------------------------ 19
Valor p en la prueba de hipótesis ------------------------------------------------------------ 20
Prueba de la media poblacional: desviación estándar de la población desconocida
------------------------------------------------------------------------------------------------------- 22
3
Objetivos de la unidad
Las circunstancias específicas para la construcción de este intervalo son los siguientes:
Intervalo para µ
• La distribución t se extiende más y es más plana por el centro que la distribución normal
estándar (vea la gráfica 9-1). Sin embargo, conforme se incrementa el tamaño de la
muestra, la distribución t se aproxima a la distribución normal estándar, pues los errores
que se cometen al utilizar s para estimar disminuyen con muestras más grandes.
Para crear un intervalo de confianza de la media poblacional con una desviación estándar
desconocida:
Ejemplo
Los puntos extremos del intervalo de confianza son 0.256 y 0.384. ¿Cómo interpretar este
resultado? Si repitiéramos este estudio 200 veces, calculando el intervalo de confianza de
95% con cada media de la muestra y la desviación estándar, 190 intervalos incluirían la
media poblacional. Diez intervalos no la incluirían. Éste es el efecto del error muestral.
Otra interpretación es concluir que la media poblacional se encuentra en este intervalo.
El fabricante puede estar seguro (95% seguro) de que la profundidad media de las cuerdas
6
oscila entre 0.256 y 0.384 pulgadas. Como el valor de 0.30 se encuentra en este intervalo,
es posible que la media de la población sea de 0.30 pulgadas.
PROPORCIÓN MUESTRAL p =X /n
b) Sólo hay dos posibles resultados (lo normal es referirse a uno de los resultados como
éxito y al otro como fracaso).
d) Las pruebas son independientes. Esto significa que el resultado de la prueba no influye
en el resultado de otra. 2. Los valores n y n(1 - ) deben ser mayores o iguales que 5.
Esta condición permite recurrir al teorema central del límite y emplear la distribución
normal estándar, es decir, z, para completar un intervalo de confianza.
Ejemplo:
¿Puede concluir que la proporción necesaria de miembros del BBA favorece la fusión?
¿Por qué?
Los puntos extremos del intervalo de confianza son 0.782 y 0.818. El punto extremo más
bajo es mayor que 0.75. Así, es probable que se apruebe la propuesta de fusión, pues el
estimador del intervalo incluye valores superiores a 75% de los miembros del sindicato.
margen de error pequeño requiere de una muestra más grande y de más tiempo y dinero
para recolectarla. Un margen de error más grande permitirá tener una muestra más
pequeña y un intervalo de confianza más amplio.
1. Realice un estudio piloto. Éste es el método más común. Suponga que desea un
cálculo aproximado de la cantidad de horas que trabajan a la semana los estudiantes
matriculados en la Facultad de Administración de la University of Texas. Para probar la
validez del cuestionario, se aplica a una pequeña muestra de estudiantes. A partir de esta
pequeña muestra se calcula la desviación estándar de la cantidad de horas que trabajan y
se utiliza este valor como la desviación estándar de la población.
3. Emplee un enfoque basado en el intervalo. Para aplicar este enfoque necesita conocer
o contar con un cálculo de los valores máximo y mínimo de la población. Recuerde, del
capítulo 3, en el que se explicó la regla empírica, que se podía esperar que casi todas las
observaciones se encontraran a más o menos 3 desviaciones estándares de la media, si la
10
distribución seguía la distribución normal. Por consiguiente, la distancia entre los valores
máximo y mínimo es de 6 desviaciones estándares. Puede calcular la desviación estándar
como un sexto del rango. Por ejemplo, la directora de operaciones del University Bank
desea un cálculo aproximado del número de cheques que expiden cada mes los estudiantes
universitarios. Ella cree que la distribución del número de cheques es normal. La cantidad
mínima de cheques expedidos cada mes es de 2, y la máxima, de 50. El rango de la
cantidad de cheques que se expiden por mes es de 48, que se determina al restar 50 - 2.
El estimador de la desviación estándar es entonces de 8 cheques mensuales: 48/6.
Para calcular una media poblacional, se puede expresar la interacción entre estos tres
factores y el tamaño de la muestra se expresa con la fórmula siguiente. Note que esta
fórmula es el margen de error que se utiliza para calcular los puntos extremos de los
intervalos de confianza para estimar una media poblacional.
donde:
n es el tamaño de la muestra.
1. El margen de error.
donde:
n es el tamaño de la muestra.
es la proporción de la población.
Las elecciones del estadístico z y el margen de error E son las mismas que para calcular
la media poblacional. Sin embargo, en este caso la desviación estándar de la población de
una distribución normal está representada por (1 ). Para encontrar el valor de una
proporción de la población, podemos hallar un estudio similar o conducir un estudio
piloto. Si no se puede encontrar un valor confiable, entonces se debe usar un valor de de
0.50. Observe que (1 ) tiene el mayor valor utilizando 0.50 y, por lo tanto, sin una buena
estimación de la proporción de la población, se sobrestima el tamaño de la muestra. Esta
diferencia no afectará el estimador de la proporción de la población.
Las poblaciones de las que se han tomado muestras hasta ahora han sido muy grandes o
infinitas. ¿Qué sucedería si la población de la que se toma la muestra no fuera muy
grande? Es necesario realizar algunos ajustes en la forma de calcular el error estándar de
las medias muéstrales y del error estándar de las proporciones muéstrales.
Una población con un límite superior es finita. Por ejemplo, hay 12 179 estudiantes en la
matrícula de la Eastern Illinois University; hay 40 empleados en Spence Sprockets;
Chrysler ensambló 917 Jeeps Wrangler en la planta de Alexis Avenue el día de ayer; o
había 65 pacientes programados para cirugía en St. Rose Memorial Hospital en Sarasota
el día de ayer. Una población finita puede ser muy pequeña; puede constar de todos los
12
estudiantes registrados para este curso. También puede ser muy grande, como todas las
personas de la tercera edad que viven en Florida.
Este ajuste recibe el nombre de factor de corrección de una población finita. Con
frecuencia se le abrevia FCP, el cual es:
Una hipótesis es una declaración relativa a una población. A continuación, se utilizan los
datos para verificar lo razonable del enunciado.
En el análisis estadístico se establece una afirmación, una hipótesis, se recogen datos que
posteriormente se utilizan para probar la aserción. Entonces, una hipótesis estadística es:
Afirmación relativa a un parámetro de la población sujeta a verificación.
El primer paso consiste en establecer la hipótesis que se debe probar. Ésta recibe el
nombre de hipótesis nula, la cual se designa H0, y se lee “H subíndice cero”. La letra
mayúscula H representa la hipótesis, y el subíndice cero implica que “no hay diferencia”.
Por lo general se incluye un término no en la hipótesis nula, que significa que “no hay
cambio”.
Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza
la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define
la ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad
de que ocurran en una hipótesis nula verdadera es muy remota.
Valor crítico Punto de división entre la región en que se rechaza la hipótesis nula y
aquella en la que se acepta.
En la gráfica 10-1 se describe una prueba de una cola. La región de rechazo se localiza
sólo en la cola derecha (superior) de la curva. Por ejemplo, suponga que el departamento
de empaque de General Foods Corporation se preocupa porque algunas cajas de Grape
Nuts exceden considerablemente el peso. El cereal se empaca en cajas de 453 gramos,
por lo que la hipótesis nula es H0: µ ≤ 453, que se lee: “la media poblacional (µ) es igual
o menor que 453”. Por consiguiente, la hipótesis alternativa es H0: ˃ 453, que se lee: “µ
15
es mayor que 453”. Observe que la condición de igualdad siempre aparece en H0 y jamás
en H1.
En este caso, las hipótesis nula y alternativa se escriben H0: µ ≥ 60 000 y H1: µ ˂ 60 000.
En resumen, una prueba es de una cola cuando la hipótesis alternativa, H1, indica una
dirección, como:
H0: el ingreso medio anual de las corredoras de bolsa es menor o igual a $65 000.
H1: el ingreso medio anual de las corredoras de bolsa es mayor a $65 000 anuales.
H0: el ingreso medio anual de las corredoras de bolsa es de $65 000 anuales.
H1: el ingreso medio anual de las corredoras de bolsa no es igual a $65 000 anuales.
Si se rechaza la hipótesis nula y se acepta H1 en el caso de las dos colas, el ingreso medio
puede ser significativamente mayor o inferior a $65 000 anuales. Para dar cabida a estas
dos posibilidades, el área de 5% de rechazo se divide con equidad en las dos colas de la
distribución muestral (2.5% cada una).
Paso 1: Se establecen las hipótesis nula y alternativa. La hipótesis nula es: “la media de
la población es de 200”. La hipótesis alternativa es: “la media es diferente de 200” o “la
media no es de 200”. Estas dos hipótesis se expresan de la siguiente manera:
17
H0: µ = 200
H1: µ ≠ 200
Ésta es una prueba de dos colas, pues la hipótesis alternativa no indica dirección alguna.
En otras palabras, no establece si la producción media es mayor o menor a 200. El
vicepresidente sólo desea saber si la tasa de producción es distinta de 200.
Por lo tanto, la regla de decisión es: rechazar la hipótesis nula y aceptar la hipótesis
alternativa (que indica que la media de la población no es 200) si el valor z calculado no
se encuentra entre 2.58 y -2.58. La hipótesis nula no se rechaza si z se ubica entre 2.58 y
-2.58.
Para ilustrar la prueba de una cola, suponga que el vicepresidente desea saber si hubo un
incremento de la cantidad de unidades que se armaron. ¿Puede concluir, debido al
mejoramiento de los métodos de producción, que la cantidad media de escritorios que se
ensamblaron en las pasadas 50 semanas fue superior a 200? Observe la diferencia al
formular el problema. En el primer caso deseaba conocer si había una diferencia en la
cantidad media armada; en cambio, ahora desea saber si hubo un incremento. Como se
investigan diferentes cuestiones, se plantea la hipótesis de otra manera. La diferencia más
importante se presenta en la hipótesis alternativa. Antes se enunció la hipótesis alternativa
como “diferente de”; ahora se enuncia como “mayor que”. En símbolos:
Los valores críticos en una prueba de una cola son diferentes a los de una prueba de dos
colas en el mismo nivel de significancia. En el ejemplo anterior, se dividió el nivel de
significancia a la mitad y se colocó una mitad en la cola inferior y la otra en la cola
superior. En una prueba de una cola, toda la región de rechazo se coloca en una cola. Vea
la gráfica 10-5. En el caso de la prueba de una cola, el valor crítico es de 2.33, que se
calcula:
Cuando se desea probar una hipótesis, se compara el estadístico de la prueba con un valor
crítico. Se toma la decisión de rechazar la hipótesis nula o de no hacerlo. Así, por ejemplo,
si el valor crítico es de 1.96 y el valor calculado del estadístico de prueba es de 2.19, la
decisión consiste en rechazar la hipótesis nula.
La determinación del valor p no sólo da como resultado una decisión respecto de H0, sino
que brinda la oportunidad de observar la fuerza de la decisión. Un valor p muy pequeño,
como 0.0001, indica que existe poca probabilidad de que H0 sea verdadera. Por otra parte,
un valor p de 0.2033 significa que H0 no se rechaza y que existe poca probabilidad de
que sea falsa. ¿Cómo calcular el valor p? Para ilustrarlo se recurre al ejemplo en el que
se probó la hipótesis nula relativa a que la cantidad de escritorios producidos a la semana
en Fredonia fue de 200. No se rechazó la hipótesis nula, pues el valor z de 1.55 cayó en
la región comprendida entre 2.58 y 2.58. Se decidió no rechazar la hipótesis nula si el
valor calculado de z caía en esta región. La probabilidad de hallar un valor z de 1.55 o
21
Un valor p es una manera de expresar la probabilidad de que H0 sea falsa. Pero, ¿cómo
interpretar un valor p? Ya se mencionó que si el valor p es menor que el nivel de
significancia, se rechaza H0; si es mayor que el nivel de significancia, no se la rechaza.
Asimismo, si el valor p es muy grande, es probable que H0 sea verdadera. Si el valor p es
pequeño, es probable que H0 no lo sea. El siguiente recuadro permite interpretar los
valores p.
Ejemplo:
Ho: u <= 80
H1: u > 80
¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de
significancia 0.02.
H0: µ = 43
H1: µ ≠ 43
La hipótesis alternativa no señala una dirección, así que se trata de una prueba de dos
colas. Hay 11 grados de libertad, que se calculan por medio de n - 1 = 12 - 1 = 11. El
valor t es de
2.718, que se determina con el apéndice B.2 en el caso de una prueba de dos colas con un
nivel de significancia de 0.02 y 11 grados de libertad. La regla de decisión es: se rechaza
la hipótesis nula si el valor calculado de t se localiza a la izquierda de -2.718 o a la derecha
de