Académique Documents
Professionnel Documents
Culture Documents
Temas:
Prueba de Hipótesis
Prueba de Hipótesis para Media Poblacional
Prueba de Hipótesis para Proporciones
Prueba de Hipótesis para Media Poblacional con Muestras Pequeñas
Tipos de Errores
Prueba de Hipótesis diferencias entre Grandes y Pequeñas
Distribución de Fischer
Análisis de Varianza
Cátedra: Estadística II
Catedrático: Ing. Galo Litardo García, Mgs.
Integrantes:
Arévalo Lozada Verónica Lisseth
Desimavilla Remache Mariuxi Yolanda
Hablich Sánchez Francisco Alejandro
Marcillo Castillo Roxana Elizabeth
Paredes Baque Karina Cecibel
Santillán Icaza Johnny
Vega García Luis Enrique
1
Índice
Introducción………………...…….…………………………………………………….. 3
Justificación……………………………………………..……………………………… 4
Objetivos……………….……………………………………………………………….. 5
Objetivo General
Objetivo Especifico
Prueba de Hipótesis…………………………………………………………………….. 5
Tipos de Errores……………………………………………………………………….. 30
Conclusión…………………………………………………………………….………. 48
Citas…………………………………………………………………………………… 49
Anexos
2
Introducción
hay que definir los términos de hipótesis estadística y pruebas de hipótesis estadísticas.
Después se muestran los pasos para llevar a cabo una prueba de hipótesis estadística.
describen los posibles errores que se deben al muestreo en las pruebas de hipótesis.
3
Justificación
hipótesis y desarrollar ejercicios prácticos para poder mostrar todos los análisis
4
Objetivos
Objetivo General
hipótesis.
Objetivo Específicos
de hipótesis.
siguiente diagrama aparecen los pasos. Analizaremos con detalle cada uno de ellos.
5
1 Procedimiento de cinco pasos para probar una hipótesis
El primer paso consiste en establecer la hipótesis que se debe probar. Ésta recibe
la hipótesis, y el subíndice cero implica que “no hay diferencia”. Por lo general se
incluye un término no en la hipótesis nula, que significa que “no hay cambio”.
Por ejemplo, la hipótesis nula que se refiere a la cantidad media de millas que recorre
Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de la
muestra, no es posible decir que la hipótesis nula sea verdadera. En otras palabras, el
hecho de no rechazar una hipótesis no prueba que H 0 sea verdadera, sino que no
rechazamos H0 .
Para probar sin lugar a dudas que la hipótesis nula es verdadera, sería necesario conocer
el parámetro poblacional. Para determinarlo, habría que probar, entrevistar o contar cada
muestra de la población.
6
La hipótesis alternativa se acepta si la información de la muestra ofrece
¿ o> o ≠.
H 1 : µ<60.000 .
H 1 : µ>60.000
H 1 : µ ≠60.000
se conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se trata
No existe ningún nivel de significancia que se aplique a todas las pruebas. Se toma la
decisión de utilizar el nivel de 0.05 (expresado con frecuencia como nivel de 5%), nivel
cumplía con las normas cuando se debió aceptar. Al rechazar la hipótesis nula, se
7
Error tipo I Rechazar la hipótesis nula, H 0 cuando es verdadera.
La probabilidad de cometer otro tipo de error, conocido como error tipo II, se expresa
Investigador
Hipótesis nula No rechaza Ho Rechaza Ho
estadísticos de prueba.
verdadera.
rechazo define la ubicación de todos esos valores que son tan grandes o tan pequeños
que la probabilidad de que ocurran en una hipótesis nula verdadera es muy remota.
8
En la gráfica se presenta la región de rechazo de una prueba de significancia:
Se aplica una prueba de una sola cola (este hecho también se explicará más
adelante).
El valor 1.65 separa las regiones en que se rechaza la hipótesis nula y en la que
se acepta.
Valor Crítico Punto de división entre la región en que se rechaza la hipótesis nula y
9
información de la muestra, se calcula que z tiene un valor de 2.34, se rechaza la
porque 2.34 se localiza en la región de rechazo; es decir, más allá de 1.65. Se rechaza la
hipótesis nula porque es poco probable que un valor z tan alto se deba al error de
muestreo (azar).
hipótesis nula no se habría rechazado. Un valor calculado tan bajo no se atribuye al azar,
rechazar H 0 ”.
hipótesis nula se rechace cuando en realidad no se debe rechazar (error tipo I).
Asimismo, existe una posibilidad definible de que la hipótesis nula se acepte cuando
10
Prueba de Hipótesis para Media Poblacional
Ho: µ = k
H1: µ ≠ k
Ho: µ ≤ k
H1: µ > k
Ho: µ ≥ k
H1: µ < k
En las distribuciones en el muestreo se vio que para el caso de la media, hay tres
Ejemplo No. 1
Un fabricante surte los ejes traseros para los camiones del Servicio Postal de
Estados Unidos. Estos ejes deben soportar 80,000 libras por pulgada cuadrada en
pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción de
11
manera significativa. La larga experiencia indica que la desviación estándar de la
resistencia de sus ejes es 4,000 libras por pulgada cuadrada. El fabricante selecciona una
muestra de 100 ejes de la producción, los prueba y encuentra que la capacidad de carga
Datos:
problema como:
Ho: µ = 80,000 ← Hipótesis nula: la media real es 80,000 libras por pulgada cuadrada
H1: µ = 80,000 ← Hipótesis alternativa: la media real no es 80,000 libras por pulgada
cuadrada
media
σ
ơx =
√n
4000
ơx =
√100
12
4000
ơx =
10
ơx = 400
las dos regiones sombreadas que contienen, cada una, 0.025 del área.
La región de aceptación de 0.95 contiene dos áreas iguales de 0.475 cada una.
apropiado para 0.475 del área bajo la curva es 1.96. Ahora podemos determinar los
= 80,000 + 784
13
4 Prueba de hipótesis de dos colas al nivel de significancia de 0.05; muestra la región de aceptación y la media y la
media de la muestra
= 80,000 - 784
la variable original (libras por pulgada cuadrada). En la siguiente sección veremos otra
el fabricante debe aceptar la hipótesis nula porque no hay diferencia significativa entre
la media hipotética de 80,000 y la media observada de los ejes de la muestra. Con base
en esta muestra, el fabricante debe aceptar que la corrida de producción satisface los
requerimientos de carga.
14
Prueba de hipótesis usando la escala estandarizada
crítico que define la frontera entre las regiones de aceptación y de rechazo. Veamos con
probabilidad normal estándar, para encontrar que ± 1.96 son los valores z que
encuentra nuestra observación. Entonces hay dos escalas de medición, la escala original
ambas escalas. Observe que nuestra media muestral de 79,600 libras por pulgada
cuadrada está dada en la escala sin procesar, pero los valores críticos z de ± 1.96
están dados en la escala estandarizada. Como estos dos números se dan en dos escalas
valor observado de x (79,600) cayó entre los límites inferior y superior de la región de
15
5 Pruebe de hipótesis de dos colas al nivel de significancia de 0.05, que muéstrala región de aceptación y la media
de la muestra en las escalas sin procesar y estandarizar
x−μ Ho
Z=
σx
79,600−80,000
Z=
400
Z =−1,00
Observe que el valor cae entre ± 1.96 de los límites inferior y superior de la región de
aceptación de esta escala. Una vez más concluimos que se debe aceptar H0: el
fabricante debe aceptar que la corrida de producción reúne los requisitos de carga.
16
¿Cuál es la diferencia entre los dos métodos que acabamos de utilizar para probar
nuestras hipótesis?
Sólo en que definimos las unidades (o escala de medición) de manera distinta en cada
método.
Sin embargo, los dos métodos siempre llevarán a las mismas conclusiones. Algunas
Ejercicio No. 2
Para una prueba de una cola para una media, suponga que un hospital usa
La acción del medicamento es tal que el cuerpo tolera dosis excesivas sin sufrir daño.
Por otra parte, las dosis insuficientes no producen el efecto médico deseado e interfieren
que necesita al mismo fabricante durante varios años y sabe que la desviación estándar
n = 50 ← Tamaño de muestra
17
Si el hospital establece un nivel de significancia de 0.10 y nos pregunta si las dosis de
utilizar la distribución normal. (De la tabla Anexo No. 1) podemos determinar que el
valor de z para el 40% del área bajo la curva es 1.28, de modo que el valor crítico para
El hospital desea saber si las dosis reales son de 100 cc o si, por el contrario, las dosis
son demasiado pequeñas. El hospital debe determinar que las dosis contienen más de
una cierta cantidad, o debe rechazar el envío. Ésta es una prueba de cola izquierda, que
significancia de 0.10. También note que la región de aceptación consta del 40% en el
lado izquierdo de la distribución y todo el lado derecho (50%), para un área total del
90%
18
6 Prueba de hipótesis de cola izquierda a nivel de significancia de 0.10
σ
ơx =
√n
2
ơx =
√500
2
ơx =
7,07
19
7 Prueba de hipótesis de cola izquierda al nivel de significancia de 0.10; muestra la región de aceptación y la media
muestral estandarizada
x−μ Ho
Z=
σx
99.75−100
Z=
0.2829
Z =−0.88
Al colocar el valor estandarizado en la escala z se observa que esta media muestral cae
Por tanto, el hospital debe aceptar la hipótesis nula, porque la media observada de la
muestra no es significativamente menor que la media hipotética de 100 cc. Con base en
esta muestra de 50 dosis, el hospital debe concluir que las dosis de la entrega son
suficientes.
Ejemplo No. 3:
20
Una empresa eléctrica fabrica baterías de celular que tienen una duraciónque se
distribuye de forma aproximadamente normal con una media de 800 horas y una
¿Muestran los datos suficiente evidencia para decir que la duración media no es 800?
Datos:
n = 31
_
x = 788 hrs
δ = 40 hrs
Solución:
Prueba de hipótesis.
Nivel de significancia
a = 0.04,
Calcular el error estándar de la media y para ello emplearemos la expresión del error
σ
estándar: δ x =
√n
21
40
δ x =
√31
40
δ x =
5,5678
Como α = 0.04 y es una prueba de hipótesis para un extremo, en este caso, el extremo
izquierdo, entonces el nivel de significancia está contenido en este extremo, por lo que
LI = µHo – Z* ơx
22
9 Prueba de Hipótesis a una cola inferior
Comprobemos con:
x−μ
Z=
δx
788−800
Z=
7,184
12
Z=
7,184
Z =−1,67
se concluye con un nivel de significancia del 0.04 que la duración media de las baterías
no ha cambiado.
23
Las pruebas de proporciones son adecuadas cuando los datos que se están analizando
de población
Niveles de significación
valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al diseñar una
regla de decisión, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la
que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido
rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una
Ejercicio No. 4
director de recursos humanos le dice al presidente que el 80%, o sea el 0.8, de los
150 empleados y en su juicio se da cuenta que sólo el 70% de la muestra llena los
24
p = 0.8
q = 0.2
Datos: n = 150
p
= 0.7
q
= 0.3
= 0.05
σ ρ̄=
√ pH 0 qH 0
n
Sustituyendo valores:
α p̄=
√ (. 8 )( .2 )
150
α p̄= √ 0 . 0010666 α p̄= 0 . 0327
En este caso, la compañía quiere saber si la verdadera proporción es mayor o menor que
la supuesta proporción. Por consiguiente, es apropiada una prueba de dos extremos para
cada una de las cuales contiene 0.025 del área. La región de aceptación de 0.95 se
ilustra como dos áreas de 0.475 cada una. Puesto que la muestra es mayor que 30,
podemos calcular que el valor correspondiente de Z para 0.475 del área bajo la curva es
25
Lc = PH0 Z
Lc = 0.8 1.96(0.0327)
0 . 7−0. 8 −0 .1
Z= Z= Z=−3 . 058 δ p̄
0 . 0327 0 .0327
Podemos concluir que existe una diferencia significativa entre la supuesta proporción de
Ejercicio No. 5
26
El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en
lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las
Ejercicio No. 6
27
Un artículo reciente, publicado en el diario USA today, indica que solo a uno de
cada tres egresados de una universidad les espera un puesto de trabajo. En una
28
La distribución t de student fue descubierta por William S. Gosset en 1908.
Gosset era un estadístico empleado por la compañía de cervezas Guinness con quien
tenía un contrato que estipulaba que no podía usar su nombre en sus publicaciones.
x = media muestral
Grados de libertad
gl=n−1
Ejercicio No. 7
29
Un supervisor desea probar que el promedio de calificaciones (media:µ) en las
= 1.40.
α=0.05
Formulación de la hipótesis:
H0 = 12
H1 < 12
Si se utiliza α= 0.05 y el valor critico de ttabulado para una cola, según la Tabla
“DISTRIBUCION t DE STUDENT”.
la H1.
30
Se tiene los siguientes datos:
n = 25
= 11.916
µ = 12
S = 1.40
Como el valor calculado del estadístico t=-0.3 es menor que el valor t abulado t (0.05; 24):
12 puntos.
13 Grafico de Estadístico t
Tipos de Error
Error tipo I
Error tipo II
31
El error de tipo I también denominado error de tipo alfa (α) o falso positivo, es el
error que se comete cuando el investigador no acepta la hipótesis nula siendo ésta
verdadera en la población.
conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe.
error que se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa
probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se
formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula
del otro.
El error de tipo II se comete cuando la hipótesis nula es falsa y, como consecuencia del
contraste se acepta.
La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro.
Muchos estadísticos están adoptando un tercer tipo de error, de tipo III, que
Ejemplo No. 8:
Se tienen dos cajas, caja A y caja B. La caja A tiene 40 fichas con el número 1;
50 fichas con el número 10 y 10 fichas con el número 100. La caja B tiene 40 fichas con
el número 100; 50 fichas con el número 10 y 10 fichas con el número 1. Se elige una
H0: La caja es la A
H1: La caja es la B
Se establece la regla de decisión: Rechazar la hipótesis nula si la ficha es de 100.
Respuesta:
α= 10/100.
α= 0.10.
Respuesta:
β = 60/100. β0.60.
Respuesta:
valores grandes de fichas. Por lo tanto este es un test de una cola ó unilateral.
Valor_p = P(de lo observado ó más extremo, bajo H0). Valor_p = P(sacar una
Valor_p = 0.60.
¿Cuál es la decisión y la conclusión?
Respuesta:
Ejemplo No. 9
“Comer para tener huesos sanos significa ingerir suficientes alimentos ricos en
calcio y vitamina D”, es la campaña que han estado siguiendo los consultorios de la
fuente más común es la leche y otros productos lácteos. Por ejemplo, tomar un vaso de
34
leche, significan 300 miligramos (mg) de calcio, y para un Adulto con edades entre 19 y
origen del Adulto, para resolver este problema, se plantea la siguiente hipótesis:
Ho: El Adulto proviene de un lugar Urbano. H1: El Adulto proviene de un lugar Rural.
Respuesta:
Rechazamos Ho para valores grandes (4 ó más vasos diarios), es decir a la derecha, por
Respuesta:
35
α = P(rechazar H0/ H0 es Verdadera).
α = P(que la persona tome 4 vasos de leche diario y sea del área Urbana).
α = 3/100 = 0.03.
Respuesta:
Β = P(que la persona toma menos de 4 vasos de leche diario y sea del área Rural).
β = Proporción de personas que toman menos de 4 vasos de leche del área Rural.
β = 68/100 = 0.68.
Respuesta:
Valor_p = P(que una persona del área Urbana tome 3 vasos de leche ó más)
Este valor_p es mayor que alfa = 0.03, por lo tanto no se rechaza H0.
Ejemplo No.10:
36
El buen hábito de higiene bucal que deben tener las personas para una dentadura
Universidad de Talca, y para ello, su estudio se centra en niños de 7 años de edad que
Pero el alumno cuando completa sus fichas, no siempre registra el nombre del colegio al
cual asiste el niño, y con la información previa propone el siguiente test de hipótesis:
Respuesta:
α = P(el niño realiza a lo más 1 cepillado diario y que asiste al colegio A).
α = (2+3)/(2+3+7+9+10+14+16) = 5/61.
α = 0.0820.
37
Existe una probabilidad del 8.20% de afirmar que el niño asiste al colegio B cuando en
Respuesta:
β = P(al niño realiza más de 1 cepillado diario y que asiste al colegio B).
β = 0.5088.
Existe una probabilidad del 50.88% de afirmar que el niño asiste al colegio A cuando en
Si el niño realiza 3 cepillados diarios, ¿A cuál colegio asiste? ¿Qué tipo de error
podría cometer?
Respuesta:
Si el niño realiza 3 cepillado diarios, no se rechaza H0, es decir, el niño asiste al colegio
A.
es la decisión y conclusión?
Respuesta:
Valor_p = P(el niño realiza a lo más 3 cepillado diarios y que asiste al colegio A).
Valor_p = 0.3443.
Para todo valor de α mayor ó igual al 34.43%, se rechaza H0, es decir, con α = 8.20%
38
Pruebas de hipótesis, diferencias entre grande y pequeñas
normalmente en cierto periodo, con una media de 200 y una desviación estándar de 16.
Sin embargo meseros jóvenes han sido contratados recientemente y se han establecido
Solución
39
Paso 1:
Ho: µ = 200
H1: µ ≠ 200
Paso 2:
0.01
α= =0.05→ zo=2.58
2
Paso 3:
x−µ
Z= ơ
√n
Paso 4:
Paso 5:
x−µ 203.5−200
= =2.18
Z= ơ 16
√n √ 100
40
Como cae en la región de aceptación, por lo tanto se acepta Ho y se concluye que la
media no ha cambiado.
cuarto de hotel es de 305 días. Un elemento fue modificado para que tenga mayor
media era de 311 días con una desviación estándar de 12 días. Al nivel de significación
Solución:
Paso 1:
Ho: µ = 305
Paso 2:
Paso 3:
x−µ
t= ơ
√n
Paso 4:
41
Paso 5:
x−µ 311−305
= =2.22
t= ơ 12
√n √ 20
entre dos valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo
Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico,
cuyas teorías estadísticas hicieron mucho más precisos los experimentos científicos.
El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor estadístico de prueba que ocurría si Ho fuera
42
verdadera, a un nivel de significación seleccionado. Antes de proceder a efectuar
Características de la distribución F
de muestra y número de muestras. Por tanto, existe una distribución F que se aplica
cuando se toman cinco muestras de seis observaciones cada una, al igual que una
sería poco práctico hacer una extensa tabulación de distribuciones. Por tanto, como se
Por otra parte, grandes diferencias entre los valores medios de la muestra, acompañadas
grandes de la razón F.
Anexo No. 4) depende del número de grados de libertad que estén asociados a ella.
43
población. La estimación intermediante de variancia (numerador) comprende la división
numerador.
Se obtiene el valor tabular, localizando los grados de libertad del numerador n1 (que se
listan en la parte superior de la tabla) así como los del denominador n2 (que se listan en
una de las columnas laterales de la tabla) que corresponden a una situación dada.
Utilizando el nivel de significancia de 0.05 para n1=7 y n2=3 grados de libertad, el valor
de F es 8.89
44
Determinar la varianza de cada muestra, utilizando la formula
mediante la fórmula
Razón F
Ejemplo No. 13
finalidad es determinar si existen diferencias reales entre las cuatro muestras. Emplear
45
Tabla No 5
Solución:
46
Se llena la siguiente tabla para calcular las varianzas muestrales:
47
Para calcular la varianza de las medias aritméticas se calcula la media aritmética de las
medias aritméticas la cuales
Tabla No. 3
Se remplaza los datos de la tabla para calcular varianza de las medias aritméticas
Decisión:
Como Fprueba es menor que Ftabla Ho se aprueba, por lo tanto no existen diferencias reales
en los pasos de las 4 muestras, es decir, todas las proporciones de la población son
48
Conclusión
Para la realización de una prueba de hipótesis existe tres métodos para probarlo la cual
todos ellos conducen a la misma decisión cuando se usan los mismos estándares de
probabilidad y riesgo.
49
Citas
Bibliografía
Triola, M. F. (2004). Estadística - Novena Edición .
Wathen, L. M. (2012). Estadística aplicada a los negocios y la economía -
Decimoquinta Edición.
Betz, M.A. & Gabriel, K.R., "Type IV Errors and Analysis of Simple Effects", Journal
of Educational Statistics, Vol.3, No.2, (Summer 1978), pp. 121–144.
50
Anexo No. 1
51
Anexo No. 2
52
Anexo No. 3
53
54
55
Anexo No. 5
Cuestionarios
1.- ¿Cuáles son los pasos para establecer una prueba de hipótesis?
Formulas la hipótesis
Nivel de significancia
Errores de tipo I y II
56
3.- ¿Cuántas Tipo de Error estadístico existe y cuáles son?
Existen 3 y son:
Muchos estadísticos están adoptando un tercer tipo de error, de tipo III, que
La diferencia se basa que en la de muestra grande deben ser mayores (>) o (=) iguales a
muestras.
57
58
59
60