Vous êtes sur la page 1sur 47

Foro - Fase-3- Pruebas de Hipótesis y Anova.

Diego Sebastian Martinez

GRUPO No. 212064_67

ALVARO ALBERTO HUERTAS CABRERA


TUTOR

UNIVERSIDAD ABIERTA Y A DISTANCIA -UNAD-


CURSO INFERENCIA ESTADISTICA
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
2019
de Hipótesis y Anova.

an Martinez

212064_67

UERTAS CABRERA
R

Y A DISTANCIA -UNAD-
A ESTADISTICA
S, TECNOLOGÍA E INGENIERÍA
9
    ¿Cuáles son las partes por las que está conformada una prueba de
hipótesis?
Hipotesis estadisctica: Proposicion o supocision, mediante la cual se verifica caracteristicas en una o
mas poblaciones.

Hipotesis nula: constituye una parte esencial de cualquier diseño de investigación y siempre es
puesta a prueba, aunque sea indirectamente.

Hipotesis alternativa: La hipótesis alternativa indica que un parámetro de población es más pequeño,
más grande o diferente del valor hipotético de la hipótesis nula. La hipótesis alternativa es lo que
usted podría pensar que es cierto o espera probar que es cierto.

  ¿Como decide el investigador si debe de rechazar o aceptar H

Si las pruebas de significación generan 95% o 99% de probabilidad de que los resultados no se
ajusten a la hipótesis nula, entonces ésta es rechazada en favor de la alternativa.
De lo contrario, se acepta la hipótesis nula. Éstos son los únicos supuestos correctos y es incorrecto
rechazar o aceptar la H1.

La aceptación de la hipótesis nula no significa que sea cierta. Sigue siendo una hipótesis y debe
cumplir el principio de falsabilidad, de la misma manera que el rechazo de la hipótesis nula no prueba
la alternativa.

  ¿A qué se le conoce como error tipo I?

Se define el error tipo I cuando se rechaza la hipótesis nula, siendo que la misma se ha debido
aceptar. La probabilidad de cometer este error se denota normalmente con la letra  (alfa)y en
términos probabilísticos se expresa como una probabilidad condicional en la que= P(rechazar Ho |
Ho es verdad). El valor de  es precisamente el nivel de significación que se utiliza en la teoría de
Neyman – Pearson.

Definición y características principales del análisis de varianza

Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más
poblaciones son iguales. Los ANOVA evalúan la importancia de uno o más factores al
comparar las medias de la variable de respuesta en los diferentes niveles de los factores. La
hipótesis nula establece que todas las medias de la población (medias de los niveles de los
factores) son iguales mientras que la hipótesis alternativa establece que al menos una es
diferente.

  ¿Cuándo y como aplicar un análisis de varianza?


Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al menos un factor
categórico con dos o más niveles. Los análisis ANOVA requieren datos de poblaciones que
sigan una distribución aproximadamente normal con varianzas iguales entre los niveles de
factores. Sin embargo, los procedimientos de ANOVA funcionan bastante bien incluso
cuando se viola el supuesto de normalidad, a menos que una o más de las distribuciones
sean muy asimétricas o si las varianzas son bastante diferentes. Las transformaciones del
conjunto de datos original pueden corregir estas violaciones.
una prueba de

aracteristicas en una o

ación y siempre es

lación es más pequeño,


lternativa es lo que

o aceptar H0?

resultados no se
va.
rectos y es incorrecto

a hipótesis y debe
hipótesis nula no prueba

misma se ha debido
n la letra  (alfa)y en
que= P(rechazar Ho |
utiliza en la teoría de

de varianza

dias de dos o más


o o más factores al
les de los factores. La
s de los niveles de los
que al menos una es

anza?
a y al menos un factor
s de poblaciones que
s entre los niveles de
stante bien incluso
de las distribuciones
ransformaciones del
iones.
PRUEBA DE HIPOTESIS
Datos
Tamaño de la muestra = 202
Media Muestral Promedio= 1.9554455446
Desviación estandar= 0.6932474948
Promedio horas laboradas 3.2
Paso 1: Describir la hipótesis
Ho: La temperatura esta en un promedio de 3,2
Ha: La temperatura esta en un promedio mayor de 3,2

Escrito en forma simbólica:

Ho : µ = 3.2
Ha : µ ≠ 900.000
3.2 PRUEBA BILATERAL

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a= 0.05

Paso 3: Estadístico de prueba (o calculado)

Ingreso mensual
promedio

�   Media muestral 1.9554455446


m Media poblacional 3.200
s Desviacion E. de la muestra 0.6932474948
n Tamano de la muestra 202

z= -25.5153353
Paso 4: Estadístico teórico (tablas)

se debe hallar el valor teorico de Z mediante la distribucion normal estandar inv.

Zteorico= 1.645
Paso 5: Tomar la decisión

con un intervalo de confianza del 95% podemos deducir que la hipotesis alternativa no es aceptada.
S

promedio de 3,2
medio mayor de 3,2 Situación Problema: Use la información que hay en
“muestra” para calcular:

c. Una PH para probar si la media del porcentaje proteína del


tipo de leche ultra alta temperatura es mayor o igual a 3,2.
RAL (Prueba Unilateral izquierda)

trabajar
a hipotesis alternativa no es aceptada.
ón que hay en
:

centaje proteína del


ayor o igual a 3,2.
da)
Fase 3 Pruebas de Hipotesis
Datos
Tamaño de la muestra = 23
Cantidad de proveedores sin prueba de peroxidasa 21
p) % proveedores con prueba de peroxidasa mayor del 90% 91%
(P) Proporción= 90%
Paso 1: Describir la hipótesis
Ho: Prueba de proveedores con peroxidasa mayor al 90%
Ha: Prueba de proveedores con peroxidasa menor al 90%

Escrito en forma simbólica:

Ho : P ≤ 0,8
Ha: P > a 0,8 Unilateral derecha

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba (o calculado)


Proporción de la
p- P muestra 91%
Zprueba= Proporción
P(1- P) Poblacional 90%
n

Zprueba= 0.21

Paso 4: Estadístico teórico (tablas)

Zteórico= 1.645

Paso 5: Tomar la decisión

Con una significancia del 5% se acepta la hipotesis nula ya que el Zprueba es menor que Zteórico
Con una significancia del 5% se acepta la hipotesis nula ya que el Zprueba es menor que Zteórico

Conclusión:
Con una significancia del 5% se rechaza que el porcentaje de proveedores del Departamento 1 con
prueba de peroxidasa es positiva mayor al 90%
a. Una PH para la proporción, para probar si él % de proveedores del departamento
1 con prueba de peroxidasa es positiva es mayor al 90%. (Prueba Unilateral
derecha)

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
Fase 3 Pruebas de Hipotesis

Datos
MEDIA POBLACIONAL

MEDIAS MUESTRALES
DENSIDAD DE LOS PROVEEDORES DEL DEPARTAMENTO 3, CON LECHE DENSIDAD DE LOS PROVEEDORES DEL DEPARTAMENTO 3,
PASTEURIZADA CON LECHE ULTRA

Media muestral= 1.8424 Media Muestral=


Desviación muestral= 1.16321 Desviación Muestral =
Tamaño de muestra( n1)= 23 Tamaño de muestra(n2)=

el promedio del % solidos totales para el tipo de leche pasteurizada no es igual al tipo de
H0: leche ultra alta temperatura

el promedio del % solidos totales para el tipo de leche pasteurizada no es igual al tipo de
Ha: leche ultra alta temperatura

Ho : �_1= �_2
Ha : �_1 ≠ �_2

Donde
BILATERAL
�_1: promedio de densidad para el tipo de leche
pasteurizada.
�_2: promedio de densidad para el tipo de leche
esterilizada.

Paso 2: Establecer el nivel de significancia con el que se va a trabajar

a= 0.05

Paso 3: Estadístico de prueba (o calculado)

Zprueba= -0.04

Paso 4: Estadístico teórico (tablas)


Zteórico= -1.95996398 1.95996

Paso 5: Tomar la decisión


Con una significacion del 5% se rechaza la hipotesis nula teniendo en cuenta que el valor de Z PRUEBA es Mayor Zteorico. Ademas el valor del
P-VALOR es (0) Menor al nivel de significancia 0,05.

Conclusión:
Con una significacia del 5% el promedio del % solidos totales para el tipo de leche pasteurizada no es
igual al tipo de leche ultra alta temperatura
c. Una PH para la diferencia de medias, para probar que el promedio del % solidos
totales para el tipo de leche pasteurizada es igual al tipo de leche ultra alta
temperatura en el departamento 3.

ROVEEDORES DEL DEPARTAMENTO 3,


CON LECHE ULTRA

1.8734
1.1660
3

urizada no es igual al tipo de

urizada no es igual al tipo de

ERAL

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0

Mayor Zteorico. Ademas el valor del


p-valor 0
alfa 0.05
eche pasteurizada no es
l promedio del % solidos
po de leche ultra alta
.
Fase 3 Pruebas de Hipotesis
Datos
PROVEEDORES DEPARTAMENTO 1 PROVEEDORES DEPARTAMENTO 2 TOTAL
n1= 21 n2= 28 49

DEPARTAMENTO 1, PEROXIDA POSITIVA DEPARTAMENTO 2, PEROXIDASA POSITIVA


X1= 2 X2= 4
P1= 10% P2= 14%
Proporción Ponderada Pc
PC= 12%
1-PC= 88%

Paso 1: Describir la hipótesis


% de proveedores con peroxidasa positiva en el departamento 1 es igual al % de proveedores con
Ho: peroxidasa positiva en el departamento 2
% de proveedores con peroxidasa positiva en el departamento 1 es DIFERENTE al % de proveedores con
Ha:
peroxidasa positiva en el departamento 2
Escrito en forma simbólica:
Ho : P1 = P2 (R)
Ha: P1 ≠ P2 (A)

Donde
BILATERAL
P1: % proveedores con fosfatasa
negativa en el departamento 2
P2: . % prveedores con peroxidasa
positiva en el departamento 3

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a= 0.05

Paso 3: Estadístico de prueba (o calculado)

P1 - P2
Zprueba=
PC (1- PC ) PC (1- PC )
+
n1 n2

Zprueba= -0.05 = -0.5032196083


0.0946287602
Paso 4: Estadístico teórico (tablas)

Zteórico= -1.960 1.960


Paso 5: Tomar la decisión

con una significancia del 5% se acepta la hipotesis nula ya que le valor de Z es menor que el
Zteorico positivo.

Conclusión:

con una significancia del 5% se recahaza la hipotesis nula


a. Una PH para la diferencia de proporciones, para probar que él % de proveedores
con peroxidasa positiva en el departamento 1 es igual al % de proveedores con
peroxidasa positiva en el departamento 2. (Prueba Bilateral)

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0

alfa 0.04
p-valor 0
TIPO DE MUESTREO: Sistemático

Muestreo en que los n elementos de la muestra se seleccionan tomando aleatoriamente un número


primero que va a formar parte de la muestra.

Características:
1) Una lista completa de la población
2) La población ordenada y la muestra también estará ordenada
Esta es la forma o cada cuanto se selecciona un elemento
F= N/n
F= fracción sistemática (o cada cuanto se toma el elemento de la población)
N= Tamaño de la población
n= Tamaño de la muestra (Calculado ya anteriormente)

F N/n
N 1810
n 202
F 8.96

F= 9
Alea= 7
Fijo= 7

Nº Muestra Densidad (g/ml) Crioscopia (°C) % Proteína

9 79 1.03 -0.54 3.2


32 286 0.96 -0.53 3.2
38 340 1.05 -0.53 3.3
40 358 0.96 -0.53 3.2
44 394 0.92 -0.53 3.2
52 466 1.04 -0.56 3.1
53 475 1.03 -0.54 3.1
56 502 1.02 -0.53 3.1
61 547 1.03 -0.54 3.3
64 574 1.07 -0.52 3.3
70 628 1.02 -0.53 3.2
71 637 1.06 -0.51 3
76 682 1.06 -0.52 3.2
80 718 1.02 -0.54 3.2
88 790 0.99 -0.51 3.2
89 799 1.04 -0.53 3.1
101 907 1.04 -0.54 3.3
102 916 1.07 -0.52 3.2
105 943 1.03 -0.55 3.1
110 988 1 -0.56 3.3
123 1105 1.02 -0.54 3.2
135 1213 1.1 -0.55 3.2
141 1267 1.06 -0.55 3.2
148 1330 1 -0.54 3.3
157 1411 1.06 -0.51 3
161 1447 1 -0.54 3.2
166 1492 1.07 -0.52 3.3
175 1573 1.04 -0.55 3.2
179 1609 0.99 -0.56 3.2
187 1681 1.02 -0.51 3.1
194 1744 1.07 -0.54 3.2
196 1762 1.03 -0.5 3.1
oriamente un número i, que designará, en una lista o población de N elementos, al

aracterísticas:

% Sólidos
% Grasa Células somáticas (células/ml de leche)
totales
3.1 11.8 1889448
3 12.2 1923260
3 11.9 1898840
2.9 11.9 1891039
3 11.9 1891876
3.1 11.7 1884574
3 11.7 1896122
2.8 12.4 1894280
2.9 11.8 1918166
3 12.3 1900484
3.2 11.5 1881564
3.1 12.0 1901718
3 11.7 1910362
3 12.0 1882723
3 11.9 1907021
2.7 12.1 1884828
3.1 11.9 1912498
3 11.8 1895404
2.8 11.5 1906653
3 11.8 1906368
2.9 11.9 1906545
3.1 11.0 1902306
3.1 11.9 1889071
2.9 11.7 1910383
3.1 12.1 1881778
3.1 11.9 1895331
2.9 12.1 1904029
2.8 11.5 1889638
2.9 11.3 1892506
2.9 11.7 1904410
3.2 12.2 1888156
3 11.6 1903831
Peroxidasa Fosfatasa Tipo de leche

2 2 2
2 2 1
2 2 1
2 2 1
2 1 2
1 2 1
2 2 1
2 2 1
2 2 3
2 2 1
2 2 1
2 2 1
2 2 1
2 2 1
2 2 1
2 2 1
1 2 3
2 2 1
2 2 4
2 2 4
2 2 1
2 2 1
2 2 4
1 2 1
2 1 4
2 2 1
2 2 2
2 2 1
2 2 1
2 2 1
2 2 1
2 2 1
Temperatura de
Temperatura Costo Prueba de yodo recepcion
2 732 2 1
3 878 2 2
2 870 2 1
2 444 2 2
2 677 2 1
3 669 2 1
1 667 2 2
2 822 2 1
3 585 2 1
1 718 2 2
2 1000 2 1
1 1080 2 1
2 799 2 1
2 717 2 1
2 811 2 1
1 933 2 2
1 771 2 1
2 632 1 1
3 276 2 2
2 695 2 2
1 931 2 1
3 429 2 1
3 626 2 1
2 815 1 2
2 696 2 1
2 891 2 1
2 774 2 1
3 624 2 1
2 933 2 1
3 688 2 1
2 1270 2 2
1 881 2 1
Satisfacción departamentos

2 3
4 3
1 3
2 3
2 3
2 3
2 3
2 3
2 3
2 3
1 3
2 3
5 3
2 3
2 3
2 3
2 3
1 3
2 3
2 3
1 3
1 3
2 3
1 3
2 3
5 3
2 3
2 3
2 3
3 3
2 3
2 3
a. Evaluar si el “costo” depende del “departamento” del cual es recibida la leche. La organiz
debe ser así:

Departamento 1 Departamento 2

Costo promedio proveedor 1 Costo promedio proveedor 6

Costo promedio proveedor 2 Costo promedio proveedor 7

Costo promedio proveedor 3 Costo promedio proveedor 8

Costo promedio proveedor 4 Costo promedio proveedor 9

Costo promedio proveedor 5 Costo promedio proveedor 10

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta
Departamento 1 23
Departamento 2 32
Departamento 3 32

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados
Entre grupos 52714.1754903784
Dentro de los grupos 3246063.77853261
Total 3298777.95402299

CONCLUSION: con una significancia del 5%, se acepta la hipotesis nula, es decir
ecibida la leche. La organización de los datos a trabajar
sí:

epartamento 2 Departamento 3
Ho:
Ha:
to promedio proveedor 6 Costo promedio proveedor 11
Observación

to promedio proveedor 7 Costo promedio proveedor 12 1


2
to promedio proveedor 8 Costo promedio proveedor 13 3
4
to promedio proveedor 9 Costo promedio proveedor 14 5

o promedio proveedor 10 Costo promedio proveedor 15 Media =


Varianza=
Desviación=
n=
Suma=

Suma Promedio Varianza


17359 754.7391304348 46326.2016
22631 707.21875 34829.2087
24334 760.4375 37005.8669

Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F


2 26357.0877451892 0.68205541 0.5083543381 3.1051566079
84 38643.6164111025
86

, se acepta la hipotesis nula, es decir las horas laboradas no dependen de la escolaridad.


Evaluar si el “costo” depende del “departamento” del cual es recibida la leche.
Evaluar si el “costo” no depende del “departamento” del cual es recibida la leche.

Departamento 1 Departamento 2 Departamento 3 Total

8 7 2
6 7 3
3 2 6
1 2 4
7 2 5

5 4 4 4.3333333333
8.5 7.5 2.5
2.92 2.74 1.58
5 5 5 15
25 20 20 65
PRUEBA TUKEY
Media del grupo 1 5

n del grupo 1 5
Media del grupo 2 4
n del grupo 2 5
Media del grupo 3 4
n del grupo 3 5
CME (Cuadrado medio del error) 38643.616411
Estadístico Q de Tukey 3.08
Comparación del grupo 1 con el 2
Diferencia absoluta 1
Error estándar de la diferencia 87.913157617
Amplitud cítrica 270.77252546
Medias del grupo 1 y 2 son No diferente
Comparación del grupo 1 con el 3
Diferencia absoluta 1
Error estándar de la diferencia 87.913157617
Amplitud cítrica 270.77252546
Medias del grupo 1 y 3 son No diferente
Comparación del grupo 2 con el 3
Diferencia absoluta 0
Error estándar de la diferencia 87.913157617
Amplitud cítrica 270.77252546
Medias del grupo 2 y 3 son No diferente
Referencias

• Sánchez, J. T. (2017). 212064 OVI3 pruebas no paramétricas [OVI]. Colombia. Recuperado de


http://hdl.handle.net/10596/10538

• Espejo, M. I., Fernández, P. F., & López, S. M. (2016). Inferencia estadística: teoría y problemas (2a. ed.).
Madrid, ESPAÑA: Servicio de Publicaciones de la Universidad de Cádiz. pp. 107-124. Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=144&docID=11245681&tm=1498266131704

• Güeto, L. R. (2018). Base de datos Inferencia Estadística_474.xls. Colombia.Recuperado de


https://docs.google.com/spreadsheets/d/1_Y0fd_J34NNICb6cnZyPdH9Pk1yy4sCKD3HAk91zSyc/edit#gid=80594
7158

• Sánchez, J. T. (2017). Formato_Ejemplo Paso 4-Pruebas no paramétricas.xlsx. Colombia. Recuperado de


https://drive.google.com/file/d/0B1mha95hD80CTWhUOGRNS01yS1k/view?usp=sharin

• Sánchez, J. T. (2017). Formato_Ejemplo_Prueba de rango con signo de Wilcoxon.xlsx. Colombia. Recuperado


de https://drive.google.com/file/d/0B1mha95hD80CUXJvVXdDY0J1U0U/view?usp=sharing
as

[OVI]. Colombia. Recuperado de

cia estadística: teoría y problemas (2a. ed.).


de Cádiz. pp. 107-124. Recuperado de
action?

.xls. Colombia.Recuperado de
cnZyPdH9Pk1yy4sCKD3HAk91zSyc/edit#gid=80594

paramétricas.xlsx. Colombia. Recuperado de


NS01yS1k/view?usp=sharin

n signo de Wilcoxon.xlsx. Colombia. Recuperado


DY0J1U0U/view?usp=sharing