Académique Documents
Professionnel Documents
Culture Documents
> temp<-manzanas$Temp
> proveedor<-manzanas$proveedor
> tabla<-aov(apples~temp+proveedor)
> summary(tabla)
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> TukeyHSD(tabla)
$temp
$proveedor
> regimen<-peso.regimen$Regimen
> familia<-peso.regimen$Familia
> tabla<-aov(peso~regimen+familia)
> summary(tabla)
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tarea 5 corregida.
Problema 1.
Niveles del factor principal: 4 diferentes temperaturas (50F, 55F, 60F, 70F)
Factores externos: Proveedor de las manzanas, tipo de manzana, tamao de las manzanas, tipo de transporte de las manzanas,
tiempo de traslado de las manzanas, tiempo de almacenamiento, ventas de las manzanas, etc.
Bloques: solo se controla el proveedor de las manzanas, as los bloques son 5 (Puebla, Chihuahua, EEUU, Durango, Coahuila)
Poblaciones: son 4. Pi: Todas las manzanas que se sometieron a almacenamiento por 1 mes a una temperatura i
Parmetros de prueba: 4. i= nmero promedio de manzanas podridas despus de 1 mes de almacenamiento a una temperatura i
Estadsticos descriptivos
El mnimo ms pequeo es 3 y pertenece a la T60, el mximo alto es 14 y pertenece a T50. Las medias de T50, T55 y T70 se parecen,
la media ms pequea es 5 a T60, el mnimo de 5 pertenece a T55 y T70. El rango intercuartlico de T50 y T70 es de 3. La dispersin
de los datos con respecto a la media (desviacin estndar) de T55 y T60 es parecida.
Diagrama de cajas.
En el diagrama de cajas se observa que para T50 los datos tienen los valores ms altos repecto a las otras temperaturas, segn su
propia distribucin la mitad de los datos esta entre 8-12 manzanas podridas. Para la T55 se observa un dato atpico. Para la T60 se
observa una distribucin simetrica con mediana en 5 y el mnimo mas pequeo en 3. Para la T70 la mediana se observa en 7, la mitad
de los datos se encuentran entre 5-7.
Para poder concluir que las 4 poblaciones se distribuyen normal, con varianzas iguales y posteriormente poder aplicar ANOVA se
realizan las pruebas de suposicin de normalidad y suposicin de igualdad de varianzas.
Decisin: No se rechaza H0 al ser el valor p para cada poblacin mayor que 0.05
H0: Las medias poblacionales son iguales para las 4 poblaciones (T50=T55=T60=T70). No hay diferencia en los tratamientos.
Ha: Al menos una media de una de las 4 poblaciones es distinta. Al menos 1 tratamiento tiene un efecto en la variable respuesta.
> tabla<-aov(manzanas~temp+proveedor)
Decisin: Se rechaza H0 al ser el valor p=0.0103 (como se observa arriba) menor que 0.05
Conclusin: Existe diferencia entre los tratamientos. El nmero de manzanas podridas despus de un mes de almacenamiento es
distinto para las temperaturas estudiadas.
Al existir diferencia entre los tratamientos se har una prueba de comparaciones mltiples para observar esta diferencia.
> TukeyHSD(tabla)
$temp
El tratamiento con menos manzanas podridas es a una T60F y el tratamiento con ms manzanas podridas es T50F. La temperatura
de almacenamiento donde se obtiene el menor nmero de manzanas podridas es a 60F.
Problema2.
Tratamientos: 3 (A; B, C)
Factores externos: edad del nio, perodo de tiempo de la toma del rgimen vitamnico, talla (m/cm), familia de origen, antecedentes
ginecoobstetricos, antecedentes peditricos, vacunas, etc.
Poblaciones: 3, Pi= todos los nios que tomaron el rgimen vitamnico i por un perodo de 2 aos
Donde i= A, B, C
Parmetros de prueba: 3
i= el promedio de peso ganado (lb) por los nios que tomaron el rgimen vitamnico i por un perodo de 2 aos.
Donde i= A, B, C
Estadsticos descriptivos.
Las medias son parecidas y muy cercanas, al parecer los datos se dispersan de forma similar con respecto a la media para A, B y C, el
mnimo de para A es casi el mismo que para C, el mximo para A y C es muy parecido, la mediana para A y B es casi la misma. El
tercer cuartil para A, B y C es de 10.2 y 10.6 respectivamente, como se observa cercanos.
Diagrama de cajas.
En B hay un dato atpico con valor de 12 y los valores de B tienden a esta por arriba de la mediana 9.4. Para A la distribucin parece
ser simtrica y parece que su rango contiene a B (excepto el dato atpico). Para C la distribucin no parece ser tan simtrica los datos
tienden a estar por debajo de la mediana 10.1 y el mximo de C tiende a estar por encima del mximo de A pero por debajo del
mximo atpico de B. Las medianas se parecen siendo menor la de A y mayor la de C. El rango de C parece contener al rango de B
(excepto al dato atpico 12)
Para poder concluir que las 3 poblaciones se distribuyen normal, con varianzas iguales y posteriormente poder aplicar ANOVA se
realizan las pruebas de suposicin de normalidad y suposicin de igualdad de varianzas.
A 21 14 W = 0.9301225 0.5519420
B 21 14 W = 0.9292869 0.5448508
C 21 14 W = 0.9491349 0.7218175
Decisin: No se rechaza H0 al ser el valor p para cada poblacin mayor que 0.05
A 0.2838291 2 0.8676954
B
C
Al cumplirse las dos suposiciones de normalidad e igualdad de varianzas podemos aplicar ANOVA.
H0: Las medias poblacionales son iguales para las 3 poblaciones (A=B=C). No hay diferencia en los tratamientos.
Ha: Al menos una media de una de las 3 poblaciones es distinta. Al menos 1 tratamiento tiene un efecto en la variable respuesta.
> regimen<-peso.regimen$Regimen
> familia<-peso.regimen$Familia
> tabla<-aov(peso~regimen+familia)
> summary(tabla)
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Decisin: No se rechaza H0 al ser el valor p=0.5289 (como se observa arriba) mayor que 0.05
Conclusin: No hay diferencia significativa entre los tratamientos sobre la variable respuesta peso ganado (lb). Se concluye que
ningn rgimen vitamnico es mejor o peor para ganar peso, es decir, con los tres regmenes vitamnicos A, B y C el peso ganado en
libras en nios es el mismo en un perodo de 2 aos.