Vous êtes sur la page 1sur 8

> apples<-manzanas$manzanas.

> temp<-manzanas$Temp

> proveedor<-manzanas$proveedor

> tabla<-aov(apples~temp+proveedor)

> summary(tabla)

Df Sum Sq Mean Sq F value Pr(>F)

temp 3 93.75 31.250 5.906 0.0103 *

proveedor 4 2.50 0.625 0.118 0.9735

Residuals 12 63.50 5.292

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> TukeyHSD(tabla)

Tukey multiple comparisons of means

95% family-wise confidence level

Fit: aov(formula = apples ~ temp + proveedor)

$temp

diff lwr upr p adj

55-50 -3 -7.319386 1.3193855 0.2200364

60-50 -6 -10.319386 -1.6806145 0.0066637

70-50 -4 -8.319386 0.3193855 0.0728120

60-55 -3 -7.319386 1.3193855 0.2200364

70-55 -1 -5.319386 3.3193855 0.8999502

70-60 2 -2.319386 6.3193855 0.5370193

$proveedor

diff lwr upr p adj

2-1 0.50 -4.684683 5.684683 0.9977737

3-1 0.25 -4.934683 5.434683 0.9998547

4-1 -0.25 -5.434683 4.934683 0.9998547

5-1 0.75 -4.434683 5.934683 0.9895065

3-2 -0.25 -5.434683 4.934683 0.9998547

4-2 -0.75 -5.934683 4.434683 0.9895065

5-2 0.25 -4.934683 5.434683 0.9998547

4-3 -0.50 -5.684683 4.684683 0.9977737

5-3 0.50 -4.684683 5.684683 0.9977737

5-4 1.00 -4.184683 6.184683 0.9699148


> peso<-peso.regimen$peso

> regimen<-peso.regimen$Regimen

> familia<-peso.regimen$Familia

> tabla<-aov(peso~regimen+familia)

> summary(tabla)

Df Sum Sq Mean Sq F value Pr(>F)

regimen 2 1.218 0.609 0.672 0.5289

familia 6 21.219 3.537 3.902 0.0214 *

Residuals 12 10.875 0.906

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tarea 5 corregida.

Problema 1.

Unidad experimental: porcin de 30manzanas.

Variable respuesta: nmero de manzanas podridas.

Factor principal: Temperatura (F)

Niveles del factor principal: 4 diferentes temperaturas (50F, 55F, 60F, 70F)

Tratamientos: 4 (50F, 55F, 60F, 70F)

Factores externos: Proveedor de las manzanas, tipo de manzana, tamao de las manzanas, tipo de transporte de las manzanas,
tiempo de traslado de las manzanas, tiempo de almacenamiento, ventas de las manzanas, etc.

Bloques: solo se controla el proveedor de las manzanas, as los bloques son 5 (Puebla, Chihuahua, EEUU, Durango, Coahuila)

Poblaciones: son 4. Pi: Todas las manzanas que se sometieron a almacenamiento por 1 mes a una temperatura i

Donde i= 50F, 55F, 60F, 70F

Parmetros de prueba: 4. i= nmero promedio de manzanas podridas despus de 1 mes de almacenamiento a una temperatura i

Donde i= 50F, 55F, 60F, 70F

Estadsticos descriptivos

Varia Media Varianza Desviacin Mnimo Mximo Mediana Inter Cuartiles


ble estndar cuartilico
Rango
T50 11 6.0 2.449490 8 14 12 3 0%: 8 25%: 9 50%: 12 75%: 12
100%: 14
T55 8 3.5 1.870829 5 10 8 1 0%: 5 25%: 8 50%: 8 75%: 9
100%: 10
T60 5 2.5 1.581139 3 7 5 2 0%: 3 25%: 4 50%: 5 75%: 6
100%: 7
T70 7 4.5 2.121320 5 10 7 3 0%: 5 25%: 5 50%: 7 75%: 8
100%: 10

El mnimo ms pequeo es 3 y pertenece a la T60, el mximo alto es 14 y pertenece a T50. Las medias de T50, T55 y T70 se parecen,
la media ms pequea es 5 a T60, el mnimo de 5 pertenece a T55 y T70. El rango intercuartlico de T50 y T70 es de 3. La dispersin
de los datos con respecto a la media (desviacin estndar) de T55 y T60 es parecida.
Diagrama de cajas.

En el diagrama de cajas se observa que para T50 los datos tienen los valores ms altos repecto a las otras temperaturas, segn su
propia distribucin la mitad de los datos esta entre 8-12 manzanas podridas. Para la T55 se observa un dato atpico. Para la T60 se
observa una distribucin simetrica con mediana en 5 y el mnimo mas pequeo en 3. Para la T70 la mediana se observa en 7, la mitad
de los datos se encuentran entre 5-7.

Para poder concluir que las 4 poblaciones se distribuyen normal, con varianzas iguales y posteriormente poder aplicar ANOVA se
realizan las pruebas de suposicin de normalidad y suposicin de igualdad de varianzas.

Shapiro-Wilk Normality Test


H0: Cada una de las poblaciones se distribuye normal con media y varianza 2
Ha: Al menos una poblacin no se distribuye normal

Variable Name Length NAs Statistic p-value


T50 5 0 W = 0.9250895 0.5632889
T55 5 0 W = 0.9075758 0.4531606
T60 5 0 W = 0.9867622 0.9671739
T70 5 0 W = 0.9100248 0.4677392

Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: No se rechaza H0 al ser el valor p para cada poblacin mayor que 0.05

Conclusin: Las 4 poblaciones se distribuyen normal con media y varianza 2

Bartlett test of homogeneity of variances


H0: Las varianzas de las 4 poblaciones son iguales
Ha: Al menos una varianza de una poblacin es distinta

Variables Bartlett's K-squared df p-value


T50 0.7367493 3 0.864528
T55
T60
T70
Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: No se rechaza H0 al ser el valor p= 0.864528 mayor que 0.05

Conclusin: Las 4 poblaciones tienen varianzas iguales


Al cumplirse las dos suposiciones de normalidad e igualdad de varianzas podemos aplicar ANOVA.

H0: Las medias poblacionales son iguales para las 4 poblaciones (T50=T55=T60=T70). No hay diferencia en los tratamientos.

Ha: Al menos una media de una de las 4 poblaciones es distinta. Al menos 1 tratamiento tiene un efecto en la variable respuesta.

> tabla<-aov(manzanas~temp+proveedor)

Df Sum Sq Mean Sq F value Pr(>F)

temp 3 93.75 31.250 5.906 0.0103 *

proveedor 4 2.50 0.625 0.118 0.9735

Residuals 12 63.50 5.292

Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: Se rechaza H0 al ser el valor p=0.0103 (como se observa arriba) menor que 0.05

Conclusin: Existe diferencia entre los tratamientos. El nmero de manzanas podridas despus de un mes de almacenamiento es
distinto para las temperaturas estudiadas.

Al existir diferencia entre los tratamientos se har una prueba de comparaciones mltiples para observar esta diferencia.

> TukeyHSD(tabla)

Tukey multiple comparisons of means

95% family-wise confidence level

Fit: aov(formula = manzanas ~ temp + proveedor)

$temp

diff lwr upr p adj

T55-T50 -3 -7.319386 1.3193855 0.2200364

T60-T50 -6 -10.319386 -1.6806145 0.0066637

T70-T50 -4 -8.319386 0.3193855 0.0728120

T60-T55 -3 -7.319386 1.3193855 0.2200364

T70-T55 -1 -5.319386 3.3193855 0.8999502

T70-T60 2 -2.319386 6.3193855 0.5370193

El tratamiento con menos manzanas podridas es a una T60F y el tratamiento con ms manzanas podridas es T50F. La temperatura
de almacenamiento donde se obtiene el menor nmero de manzanas podridas es a 60F.
Problema2.

Unidad experimental: nios

Variable respuesta: peso ganado (lb)

Factor principal: Rgimen vitamnico

Niveles del factor principal: 3 (A, B, C)

Tratamientos: 3 (A; B, C)

Factores externos: edad del nio, perodo de tiempo de la toma del rgimen vitamnico, talla (m/cm), familia de origen, antecedentes
ginecoobstetricos, antecedentes peditricos, vacunas, etc.

Bloques: solo se controla la familia de origen as se forman 7 bloques (1, 2, 3, 4, 5, 6, 7)

Poblaciones: 3, Pi= todos los nios que tomaron el rgimen vitamnico i por un perodo de 2 aos

Donde i= A, B, C

Parmetros de prueba: 3

i= el promedio de peso ganado (lb) por los nios que tomaron el rgimen vitamnico i por un perodo de 2 aos.

Donde i= A, B, C

Estadsticos descriptivos.

Variable Mean Varianza sd Mnimo Mximo Mediana Inter Quartiles


Quartile
Rango
A 9.242857 2.182857 1.477450 7.3 11.2 9.1 2.15 0%: 7.30 25%: 8.20 50%: 9.10
75%: 10.35 100%: 11.20
B 9.785714 1.388095 1.178175 8.3 12.0 9.4 1.00 0%: 8.3 25%: 9.2 50%: 9.4
75%: 10.2 100%: 12.0
C 9.714286 1.778095 1.333452 7.9 11.5 10.1 1.95 0%: 7.90 25%: 8.65 50%: 10.10
75%: 10.60 100%: 11.50

Las medias son parecidas y muy cercanas, al parecer los datos se dispersan de forma similar con respecto a la media para A, B y C, el
mnimo de para A es casi el mismo que para C, el mximo para A y C es muy parecido, la mediana para A y B es casi la misma. El
tercer cuartil para A, B y C es de 10.2 y 10.6 respectivamente, como se observa cercanos.
Diagrama de cajas.

En B hay un dato atpico con valor de 12 y los valores de B tienden a esta por arriba de la mediana 9.4. Para A la distribucin parece
ser simtrica y parece que su rango contiene a B (excepto el dato atpico). Para C la distribucin no parece ser tan simtrica los datos
tienden a estar por debajo de la mediana 10.1 y el mximo de C tiende a estar por encima del mximo de A pero por debajo del
mximo atpico de B. Las medianas se parecen siendo menor la de A y mayor la de C. El rango de C parece contener al rango de B
(excepto al dato atpico 12)

Para poder concluir que las 3 poblaciones se distribuyen normal, con varianzas iguales y posteriormente poder aplicar ANOVA se
realizan las pruebas de suposicin de normalidad y suposicin de igualdad de varianzas.

Shapiro-Wilk Normality Test


H0: Cada una de las poblaciones se distribuye normal con media y varianza 2
Ha: Al menos una poblacin no se distribuye normal

Variable Name Length NAs Statistic p-value

A 21 14 W = 0.9301225 0.5519420

B 21 14 W = 0.9292869 0.5448508

C 21 14 W = 0.9491349 0.7218175

Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: No se rechaza H0 al ser el valor p para cada poblacin mayor que 0.05

Conclusin: Las 3 poblaciones se distribuyen normal con media y varianza 2

Bartlett test of homogeneity of variances


H0: Las varianzas de las 3 poblaciones son iguales
Ha: Al menos una varianza de una poblacin es distinta

Variables Bartlett's K-squared df p-value

A 0.2838291 2 0.8676954
B
C

Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: No se rechaza H0 al ser el valor p= 0.8676954 mayor que 0.05

Conclusin: Las 3 poblaciones tienen varianzas iguales

Al cumplirse las dos suposiciones de normalidad e igualdad de varianzas podemos aplicar ANOVA.

H0: Las medias poblacionales son iguales para las 3 poblaciones (A=B=C). No hay diferencia en los tratamientos.

Ha: Al menos una media de una de las 3 poblaciones es distinta. Al menos 1 tratamiento tiene un efecto en la variable respuesta.

> regimen<-peso.regimen$Regimen

> familia<-peso.regimen$Familia

> tabla<-aov(peso~regimen+familia)

> summary(tabla)

Df Sum Sq Mean Sq F value Pr(>F)

regimen 2 1.218 0.609 0.672 0.5289

familia 6 21.219 3.537 3.902 0.0214 *

Residuals 12 10.875 0.906

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Regla de decisin: Rechazar H0 si el valor p es menor que el nivel de significancia =0.05

Decisin: No se rechaza H0 al ser el valor p=0.5289 (como se observa arriba) mayor que 0.05

Conclusin: No hay diferencia significativa entre los tratamientos sobre la variable respuesta peso ganado (lb). Se concluye que
ningn rgimen vitamnico es mejor o peor para ganar peso, es decir, con los tres regmenes vitamnicos A, B y C el peso ganado en
libras en nios es el mismo en un perodo de 2 aos.

Vous aimerez peut-être aussi