Académique Documents
Professionnel Documents
Culture Documents
INFERENCIA ESTADÍSTICA
FASE 4 ANOVA
Grupo 26
2 2 1 1 698 2 1
1 2 1 3 865 2 2
2 2 1 1 786 1 1
2 2 1 2 941 1 2
2 2 1 1 746 2 1
2 2 1 2 699 2 1
2 2 1 1 403 2 1
2 2 1 2 859 2 1
2 2 1 1 645 2 1
2 2 1 1 708 2 1
2 2 1 1 451 2 1
2 2 1 2 509 2 1
1 2 1 2 853 2 1
2 2 1 3 385 2 1
2 2 1 2 622 2 1
Satisfacción Departamento
2 3
2 3
1 3
2 3
3 3
1 3
2 3
2 3
1 3
1 3
2 3
1 3
2 3
2 3
2 3
Evaluar si el costo depende del departamento del cual fue recibida la leche, teniendo en cuent
departamentos 1, 2 y 3. La organización de los datos a trabajar debe ser así:
Departamento 1 Departamento 2
n del grupo 3 5
Departamento 3
Ho
Ha
RESUMEN
Grupos
Departamento 1
Departamento 2
Departamento 3
ANÁLISIS DE VARIANZA
Origen de las variaciones
Entre grupos
Dentro de los grupos
Total
conclusion:
Departamento 1 Departamento 2 Departamento 3
618284.933333333 14
Con una significacia del 5% se acepta la hipotesisi nula ya que el p-valor (0,355018789) es mayor que el nivel de significancia (0
que nos dice que el costo promedio en los tres departamentos es igual. Podemos decir que el costo no depende del departame
Probabilidad Valor crítico para F 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:
0.3650187888 3.8852938347 𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥�, 𝑒�𝑡𝑜�𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0
Usamos ANOVA de un factor cuando queremos saber si las medias de una variable son diferen
Condiciones:
§ En ANOVA de un factor solo se relacionan dos variables: una variable dependiente (o a e
§ La variable dependiente es cuantitativa (escalar) y la variable independiente es categóric
§ Se pide que las variables sigan la distribución normal, aunque como siempre esto es difí
También que las varianzas (es decir, las desviaciones típicas al cuadrado) de cada grupo de la variable independie
Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F y su significación.
La significación de F se interpretará como la probabilidad de que este valor de F se deba al aza
El resultado es el siguiente:
En la tercera columna se observan las medias para cada grupo de clase social. Si nos fijamos
El valor de F es 137,477 y la significación es 0,000. Al ser la significación menor de
4. ¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué
cada vez que cambian los grados de libertad, ya sea en el numerador o en el denominador; se crea una nueva distr
s de una variable son diferentes entre los niveles o grupos de otra variable. Por ejemplo, si comparamos el número d
a variable dependiente (o a explicar) y una variable independiente (que en esta técnica se suele llamar factor)
e independiente es categórica (nominal u ordinal).
e como siempre esto es difícil de cumplir en investigaciones sociales.
a grupo de la variable independiente sean similiares (fenómeno que se conoce como homocedasticidad). Aunque esto es lo ideal, en la rea
minado F y su significación. El estadístico F o F-test (se llama F en honor al estadístico Ronald Fisher) se obtiene al
ste valor de F se deba al azar. Siguiendo un nivel de confianza del 95%, el más utilizado en ciencias sociales, cuand
arianza. De ejemplos.
stán relacionadas y por tanto que hay diferencias significativas entre los grupos
as variables, lo que significa que las medias de la variable dependiente difieren o varían mucho entre los grupos de l
comparo las medias de números de hijos entre los diversos niveles educativos: sin estudios, primarios, secundarios y universitarios. Utilizar
variable cuantitativa (escalar) que va de 0 hasta 8 o más hijos. Esta será la variable dependiente o a explicar
ndependiente o factor. Las categorías o grupos de la clase social son: clase baja, clase trabajadora, clase media ba
nos dirigimos a Opciones y marcamos la opción de Descriptivos
clase social. Si nos fijamos en las medias del número de hijos en cada grupo de clase social, podemos observar qu
ser la significación menor de 0,05 es que las diferencias de media de hijos entre los grupos de la clase social son si
arianza se pudo llegar a las siguientes conclusiones: El Análisis de la varianza y sus procedimientos, se aplican en to
actores que se establecen en las diferentes poblaciones o analizar, el comportamiento de ésta misma para todos los
ste o no diferencias estadísticas significativas entre medias cuando se tiene más de dos muestras o más de dos gru
alor crítico de F con los resultados del estadístico de prueba y allí poder tomar decisiones de rechazar o no la hipóte
ueba se basa en una muestra única, obtenida a partir de cada población. El análisis de varianza puede servir para de
tre las medias de las muestras se deben a la variación casual en el muestreo (y por tanto, que los valores medios de
caso de cada muestra.
si comparamos el número de hijos entre los grupos o niveles de clase social: los que son clase baja, clase trabajad
Aunque esto es lo ideal, en la realidad cuesta de cumplir, e igualmente se puede aplicar ANOVA
Ronald Fisher) se obtiene al estimar la variación de las medias entre los grupos de la variable independiente y dividi
en ciencias sociales, cuando la significación de F sea menor de 0,05 es que las dos variables están relacionadas.
undarios y universitarios. Utilizaré los datos de la Encuesta Mundial de Valores realizada entre 2010 y 2014 en 58 países del mundo.
pendiente o a explicar
rabajadora, clase media baja, clase media alta, y clase alta.
ocial, podemos observar que a medida que aumenta la clase social desciende la media del número de hijos. Las pe
pos de la clase social son significativas. Aunque aparentemente podamos pensar que las diferencias no son exagera
edimientos, se aplican en todas las ciencias tanto puras como sociales, tales como: en la Geografía, Matemática, E
e ésta misma para todos los niveles en función de las poblaciones estudiadas.
muestras o más de dos grupos en el mismo planteamiento.
s de rechazar o no la hipótesis nula
arianza puede servir para determinar si las diferencias entre las medias muestrales revelan las verdaderas diferenci
o, que los valores medios de población son iguales). Si se rechaza la hipótesis nula, se concluiría que las diferencia
n clase baja, clase trabajadora, clase media-baja, clase media-alta y clase alta. Es decir, vamos a comprobar media
riable independiente y dividirla por la estimación de la variación de las medias dentro de los grupos. El cálculo del es
iables están relacionadas.
a Geografía, Matemática, Economía, Política, Administración, Contaduría, Educación, Industrias, Medicinas, Agricul
lan las verdaderas diferencias entre los valores medios de cada una de las poblaciones, o si las diferencias entre lo
concluiría que las diferencias entre los valores medios de la muestra son demasiado grandes como para deberse ún
, vamos a comprobar mediante ANOVA si la variable “número de hijos” está relacionada con la variable “clase socia
los grupos. El cálculo del estadístico F es algo complejo de entender, pero lo que hace es dividir la variación entre l
s, las de clase trabajadora (working class) 1,88 hijos, las de clase media-baja (lower middle class) 1,78, las de clase
epende de nuestro criterio, sino de la significación de F. Este es el objetivo de aplicar ANOVA de un factor: valorar es
dustrias, Medicinas, Agriculturas, en la Ingeniería y al Gobiernos, entre otras. El análisis de la varianza nos permite
o si las diferencias entre los valores medios de la muestra son más indicativas de una variabilidad de muestreo.
ndes como para deberse únicamente a la casualidad (y por ello, no todas las medias de población son iguales).
con la variable “clase social”. Concretamente, se analizará si la media del número de hijos varía según el nivel de c
es dividir la variación entre los grupos por la variación dentro de los grupos. Si las medias entre los grupos varían mu
ddle class) 1,78, las de clase media alta 1,70 hijos y las de clase alta (upper class) tienen de media 1,69 hijos.
OVA de un factor: valorar estadísticamente si las diferencias de medias son significativas o no.
de la varianza nos permite decidir cuál es la alternativa más adecuada que permita llevar a una solución satisfactor
ariabilidad de muestreo.
población son iguales).
s entre los grupos varían mucho y la media dentro de un grupo varía poco, es decir, los grupos son heterogéneos en
n de media 1,69 hijos.
ar a una solución satisfactoria del problema de investigación.
grupos son heterogéneos entre ellos y similares internamente, el valor de F será más alto, y por tanto, las variables
o, y por tanto, las variables estarán relacionadas. En conclusión, cuanto más difieren las medias de la variable depe
s medias de la variable dependiente entre los grupos de la variable independiente, más alto será el valor de F. Si hac
alto será el valor de F. Si hacemos varios análisis de ANOVA de un factor, aquel con F más alto indicará que hay más
ás alto indicará que hay más diferencias y por tanto una relación más fuerte entre las variables.
Evaluar si el “% solidos totales” depende de “satisfacción” que se
tiene del proveedor en el departamento 3, teniendo en cuenta los departamentos 1, 2 y 3. La organ
los datos a trabajar debe ser así:
Satisfacciòn 1 "Muy
Escolaridad 2 "Aceptable
satisfecho"
% Solidos totales Promedio 1 Solidos totales Promedio 6
% Solidos totales Promedio 2 Solidos totales Promedio 7
% Solidos totales Promedio 3 Solidos totales Promedio 8
% Solidos totales Promedio 4 Solidos totales Promedio 9
% Solidos totales Promedio 1 Solidos totales Promedio 10
Ho
Ha
RESUMEN
Grupos
Columna 1
Columna 2
Columna 3
ANÁLISIS DE VARIANZA
Origen de las variaciones
Entre grupos
Dentro de los grupos
Total
conclusion:
Escolaridad 3
Satisfacciòn 1 Escolaridad 2
"Nada
"Muy satisfecho" "Aceptable
satisfecho"
11.3 11.7 12
12 11.7 12.4
11.7 11.6 11.6
11.2 11.8 11.9
12.1 11.8 11.6
1.276 14
Con una significacia del 5% se acepta la hipotesis nula ya que el p-valor (0,45730304134072) es mayor que el nivel de significan
Lo que nos dice % solidos totales promedio en los tres tipos de satisfacciòn es igual. Podemos decir que % solidos totales no d
del tipo de satisfacciòn.
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:
n del grupo 3 5
CME(Cuadrado medio del error) 56131629.9333333
Ho
Ha
RESUMEN
Grupos
Tipo de leche 1 (pasteurizada)
ANÁLISIS DE VARIANZA
Origen de las variaciones
Entre grupos
Dentro de los grupos
Total
conclusion:
Tipo de leche 2
Tipo de leche 3
Tipo de leche 1 (Ultra-Alta
(esterilizada)
(pasteurizada) pasteurizada)
725144450.933333 14
Con una significancia del 5%, se acepta la hipotesis nula, ya que el p-valor (0,6424) es mayor al nivel de significancia. Por lo tan
los tres tipos de leche en el departamentos 1 son iguales, lo que implica, que los tipos de leche no depende del departamen
Probabilidad Valor crítico para F
0.6423714469 3.8852938347
nivel de significancia. Por lo tanto, los promedios de
he no depende del departamento 1
Evaluar si el “% grasa” depende de la “temperatura” en el
departamento 6. La organización de los datos a trabajar debe ser así
n del grupo 3 5
Temperatura baja
% grasa proveedor 11
% grasa proveedor 12
% grasa proveedor 13
% grasa proveedor 14
% grasa proveedor 15
Temperatura Temperatura
alta media
RESUMEN
Grupos Cuenta Suma
Columna 1 5 15.2
Columna 2 5 14.9
Columna 3 5 15.2
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Entre grupos 0.012 2
Dentro de los grupos 0.172 12
Total 0.184 14
conclusion:
con una significancia del 5% se acepta la hipotesis nula, lo cual indica que el % grasa no
el % grasa no depende de la temperatura de la leche.
Temperatura
baja
3.1
3.1
3.1
2.8
3.1
ra son iguales
peraturas son diferentes
Promedio Varianza
3.04 0.003
2.98 0.022
3.04 0.018
hipotesis nula, lo cual indica que el % grasa no es diferente en las tres temperaturas. Por lo tanto
de la leche.
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖𝑜�:
Gutiérrez,H. (2013). Capítulo 4: Elementos de Inferencia Estadística Control estadístico de la calidad y Seis
Sigma.(3a. ed.) McGraw-Hill Interamericana. Pp.72- 90. Recuperado
de http://bibliotecavirtual.unad.edu.co:2053/?il=280
Matus, R., Hernández, M., & García, E. (2010). Estadística. México, D.F., MX: Instituto Politécnico Nacional. Pp.
65-84. Recuperado
Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva, teoría de la
probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones
Espejo, M. I., Fernández, P. F., & López, S. M. (2016). Inferencia estadística: teoría y problemas (2a. ed.).
Madrid, ESPAÑA: Servicio de Publicaciones de la
l
calidad y Seis
de la
as (2a. ed.).