Vous êtes sur la page 1sur 35

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Unidad 3. Introduccin al Diseo Experimental


Objetivos

Diferenciar

grupos

de

una

poblacin

de

datos

usando

diseos

experimentales y pruebas de varianzas ANDEVA. Hacer inferencias y valorar los modelos de ANDEVA en la solucin de problemas experimentales de la vida real y profesional. Desarrollar capacidades del trabajo en equipo al momento de realizar investigaciones experimentales.

Contenido Unidad 3.Introduccin al diseo Experimental ........................................................ 1 3.1 Experimentacin, conceptos bsicos ............................................................. 1 3.2 Modelos ANDEVA.......................................................................................... 3 3.3 Andeva uni factorial, anova one way, diseo DCA. ...................................... 8 3.4 ANDEVA para un Diseo BCA .................................................................... 17 3.5 Diseo de Cuadro Latino ............................................................................. 24 3.6 Diseo en Cuadro Greco Latino................................................................... 30 3.7 Anlisis de la varianza de dos factores con interaccin ............................... 31

3.1 Experimentacin, conceptos bsicos


Investigar en condiciones controladas y con un diseo predefinido es un experimento.

Un experimento, es una investigacin en condiciones controladas. Es la forma ms comn de investigar en las ingenieras. Al controlar las condiciones de

investigacin el nmero de repeticiones es menor que en una investigacin de tipo descriptivo. Para entrar al mundo de la experimentacin es necesario manejar algunos conceptos bsicos como:

Luis Mara Dicovskiy Riobo, 2010

Pgina 1

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Unidad Experimental es la mnima unidad donde se aplican los tratamientos, puede ser una persona o una comunidad, una planta o una parcela. Es la unidad donde se toma el dato. El tamao y nmero de elementos vara segn los objetivos de la investigacin. Factor de un experimento es una variable independiente nominal o categrica; es una variable cuyos niveles son configurados por el experimentador , es el tema del experimento. Un experimento puede tener ms de un factor en estudio. Cada valor o tipo del factor se llama Tratamiento o Grupo, estos suelen ser las nuevas tecnologas a evaluar, lo que propone como novedoso el investigador. Tratamientos Testigos son tratamientos de referencia, sirven para comparar los tratamientos propios del experimento. Pueden ser de dos tipos: Absoluto y Relativo. A veces un experimento lleva ambos testigos. El tratamiento absoluto, puede ser no aplicar tratamiento, permite medir la variable dependiente, ante la ausencia de las tecnologas que se estn probando. El tratamiento relativo puede ser la tecnologa tradicional, lo que se hace de manera corriente, me permite valorar la mejora que producen las nuevas tecnologas, tomando como referencia lo que se hace de forma tradicional. Repeticin Es el nmero de veces que ocurre cada tratamiento. Para poder hacer estadstica debe haber repeticiones Para tener confiabilidad en los resultados de un experimento, el nmero mnimo de repeticiones no debera ser menor a cuatro. Tamao de un experimento: es el nmero de unidades experimentales del experimento, n. Cuando el nmero de repeticiones por tratamiento es el mismo valor, n es igual al nmero de tratamientos por el nmero de repeticiones, n=r t. Diseo del experimento. Es el arreglo espacial y en el tiempo de los tratamientos. Cuando ms complicado es el diseo, ms grados de libertad pierde modelo, pero se controla mejor el error experimental si se conocen las direcciones de los gradiente de las causas de perturbacin. En este sentido hay un equilibrio dinmico, un diseo ms complejo y que no tiene un mejor el control del error
Luis Mara Dicovskiy Riobo, 2010 Pgina 2

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

puede ser ms ineficiente que un diseo simple. No hay un diseo mejor que otro, el investigador debe descubrir cul es el mejor diseo para su experimento y este depender de la irregularidad del rea experimental, del nmero de tratamientos y de la orientacin espacial de las causas que perturban el experimento. El diseo ms simple de todos es el Diseo Completamente al Azar, DCA, sin embargo el diseo ms utilizado en la agricultura en el de Bloques completos al azar, BCA. Un diseo experimental ms complicado no garantiza un mejor control del error experimental.

Ejercicio 6.1 Se hizo un experimento de evaluacin de la durabilidad en horas, de 4 tipos de mquinas: A, B C y D. La mquina D es la que usa comercialmente la gente y las mquinas A, B y C son nuevos prototipos que se acaban de disear. El experimento tiene 5 repeticiones, hay 5 mquinas iguales de cada tipo. Cada unidad experimental era una mquina. Diga: Cul es el factor en estudio? Cuntas unidades experimentales tiene el experimento? Cul es la variable dependiente, de investigacin? Cules son los tratamientos experimentales, nuevas tecnologas? Cul es el tratamiento testigo?

3.2 Modelos ANDEVA


La tcnica del Anlisis de la Varianza (ANDEVA) es una de las tcnicas ms utilizadas en los anlisis de los datos de los diseos experimentales. Se utiliza cuando queremos contrastar ms de dos medias, por lo que puede verse como una extensin de la prueba t para diferencias de dos medias.

El ANDEVA usado para analizar experimentos, es un mtodo muy flexible que permite construir modelos estadsticos para el anlisis de los datos

experimentales. Bsicamente es un procedimiento que permite dividir la varianza de la variable dependiente, generalmente variable continua, en dos o ms componentes, cada uno de los cuales puede ser atribuido a una fuente (variable o
Luis Mara Dicovskiy Riobo, 2010 Pgina 3

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

factor) identificable y la otra al error experimental. Las variables independientes son generalmente nominales, son los Factores en estudio y hacen grupos o tratamientos.

Los modelos que permite construir el ANDEVA pueden ser reducidos al cociente entre dos varianzas, el numerador es la varianza del modelo como los tratamientos, bloques, etc. y el denominador es la varianza de los errores. Por ejemplo en un caso de Andeva unifactorial anova one way el valor F calculado es
2 2

El ANDEVA est basado en ciertos supuestos, unos ms posibles que otros Es evidente que cuantos ms factores introduzcamos se espera que quede menos cantidad de variacin residual (error) por explicar. Pero siempre quedar alguna variacin residual.

Suposiciones del Anlisis de Varianza En cada ocasin que se realice un anlisis de varianza (ANDEVA), rutinariamente deben examinarse los datos para determinar si estos indican alguna desviacin de los supuestos que rigen dicho anlisis. Por lo tanto, es recomendable realizar un anlisis de las suposiciones en las que se basa el ANDEVA junto con el anlisis mismo. Slo despus de hacer este anlisis de suposiciones y que stas se cumplan razonablemente, se puede expresar con cierta confianza la validez de los resultados estadsticos.

Las suposiciones en las que se basa el ANDEVA son las siguientes: Los errores de los datos son normales. Varianzas son homogneas. Independencia de medias y varianzas Aditividad del modelo

Luis Mara Dicovskiy Riobo, 2010

Pgina 4

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Normalidad de los errores: Es relativamente fcil hacer pruebas de normalidad de los errores con programas estadsticos computacionales, ya sea con un grfico QQ plot o la prueba de normalidad de Shapiro Wilks. En la primera prueba el valor r de correlacin debe ser mayor a 0.95 y en la segunda prueba el valor p de la prueba de hiptesis debe ser mayor a 0.05, estar en H 0. El programa INFOSTAT puede calcular los errores de cada dato y hace ambas pruebas. Sin embargo este requisito no es tan importante como la Independencia de las Observaciones, pues en general el ANDEVA es una prueba robusta. Esto quiere decir que, aunque los errores de las observaciones no sean normales, las medias de los tratamientos son aproximadamente normales debido al Teorema Central del Lmite. Sin embargo, si los errores de los datos son extremadamente no-normales, es posible transformar los datos para cubrir este requisito, o bien emplear mtodos no paramtricos.

Homogeneidad de varianzas de los diferentes tratamientos: Esta prueba resulta fundamental, pues cualquier situacin de heterogeneidad de las varianzas de los diferentes tratamientos invalida las inferencias realizadas. Pueden existir poblaciones muy homogneas y, en el caso de que existiese una poblacin heterognea, sera posible no detectar diferencias entre estas poblaciones homogneas por el efecto de la contribucin a la varianza de esta poblacin heterognea.

Para corroborar o refutar las afirmaciones hechas respecto de la hiptesis de la homogeneidad de las varianzas de los grupos o tratamientos respecto de a la variable dependiente se dispone del estadstico de Levene de homogeneidad de varianzas. Este funciona como un estadstico F de la distribucin F de Fisher. La H0 consiste en suponer que las varianzas de los distintos grupos son iguales. Se rechazar esta H0 en el caso de que la significacin del estadstico de Levene sea menor que 0,05. El estadstico de Levene se puede hacer realizando una ANDEVA con los errores en valor absoluto, INFOSTAT calcula este tipo de error.
Luis Mara Dicovskiy Riobo, 2010 Pgina 5

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Independencia de promedios y varianzas: Que un promedio mayor no tenga independencia entre medias y varianzas es un caso especial de falta de homogeneidad de varianzas. En algunos datos existe una relacin definida entre las medias y sus varianzas, por ejemplo el nmero de hojas de plantas de tomate de un mes y de tres meses, en ambos casos no solo hay diferencias de promedios sino tambin de varianzas, a ms edad mayor promedio y varianza. Este problema se puede manejar con un buen diseo del experimento. Sin embargo esta relacin suele ser la causa ms comn de heterogeneidad de varianza. Una correlacin positiva entre medias y varianzas es una forma de detectar el problema, cuando se observa un amplio rango entre las medias. El estadstico de Levene tambin detecta este problema. Aditividad del modelo Para cada diseo experimental existe un modelo matemtico, denominado modelo lineal aditivo, este modelo es para el caso de un diseo completamente aleatorio es = que expresa que el valor de cualquier unidad experimental est compuesta por la media general, ms o menos el efecto de tratamiento y ms o menos un termino de error caracterstico de cada dato . En este modelo los trminos se suman, si esto no ocurre as, el ANDEVA nos puede llevar a conclusiones y toma de decisiones incorrectas. Este problema puede ocurrir por un mal diseo del experimento, por ejemplo si se prueban diferentes dosis de fertilizante, pero cada dosis se prueba en una especie de planta diferente, resultando una interaccin entre dosis de fertilizante y especie de planta, lo que rompe el modelo aditivo. Qu hacer cuando el modelo no funciona? La violacin o falta de apego a cualquiera de estas suposiciones indica que los resultados podran no tener validez. Dependiendo del tipo de problema, puede haber solucin o no al objetivo buscado en el experimento. El dilema ms fuerte con el que ha de luchar el experimentador es el de la falta de homogeneidad de

Luis Mara Dicovskiy Riobo, 2010

Pgina 6

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

varianzas, ya que si esto ocurre, no podemos saber si las diferencias entre los tratamientos se deben a promedios diferentes o varianzas diferentes. La falta de normalidad no es tan importante, pues la prueba ANDEVA es robusta a este problema y, en casos extremos, se puede optar por el uso de transformaciones. En general para los casos en que los supuestos de normalidad, homogeneidad, independencia de medias-varianzas o aditividad no se cumplen, puedo usar transformaciones de datos, las ms usadas son: Logaritmo Log (x), til cuando los datos crecen en sentido exponencial o cuando las desviaciones estndares de las muestra sean aproximadamente proporcionales a los promedios o hay evidencia de efectos principales multiplicativos de los tratamientos en vez de aditividad. La transformacin + 0.5 til cuando los nmeros observados son

pequeos 0-10, por ejemplo son acontecimientos pocos comunes, tienen una posibilidad muy baja de ocurrir en cualquier individuo. Estos datos tienden a seguir una distribucin de Poisson. La transformacin /100 cuando los datos son expresados en por ciento o son proporciones de la muestra total. Por lo general estos datos tienen una distribucin binomial y no de una distribucin normal como se espera. Como ltimo recurso, ante datos dudosos de anlisis se puede usar el uso de mtodos de estadstica no paramtrica. Es importante mencionar que el empleo de estadstica no paramtrica o el uso de transformaciones no eliminan el problema de la falta de aleatoriedad de las unidades experimentales, errores por un mal diseo del experimento o por una mala toma de datos, es decir, la ejecucin incorrecta de un experimento no tiene ms remedio que repetir el experimento corrigiendo los errores por falta de diseo o mal manejo.

Luis Mara Dicovskiy Riobo, 2010

Pgina 7

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

3.3 Andeva uni factorial, anova one way, diseo DCA.


Anova one way es como se le llama en lengua inglesa al Andeva Unifactorial y como comnmente aparece citado en la bibliografa. Este es el modelo ms simple y ms usado de ANDEVA, tiene un Factor, variable que genera grupos o

tratamientos y una variable dependiente continua. Este es un modelo que funciona bien Equilibrado no Equilibrado. El modelo supone que las repeticiones de los distintos tratamientos estn distribuidas al azar dentro del experimento y que no necesariamente cada grupo o tratamiento tiene igual nmero de repeticiones. El diseo de este modelo estadstico se llama Diseo Completamente aleatorio y generalmente funciona bien controlando el error experimental cuando no hay perturbaciones externas con algn sentido definido, como viento, tipos de suelo diferentes, variaciones trmicas, etc.

El Diseo Completamente Aleatorio, DCA, supone que las diferentes unidades experimentales del experimento se encuentran al azar dentro del rea experimental y al mismo tiempo. El DCA se utiliza mucho en investigaciones sociales, cuando se posee informacin de variables dependientes continuas como peso, altura, edad o ingresos y variables nominales que hacen grupos como nivel social procedencia sexo etc. Tambin se usa mucho en experimen tacin en laboratorios, donde se tiene un buen control de aquellos factores que puedan perturbar la investigacin. El modelo supone que se debe disponer de los resultados de k muestras aleatorias independientes, cada una de tamao n k, de k diferentes poblaciones; y lo que interesa probar es la hiptesis que las medias de esas k poblaciones son todas iguales

ANOVA ONE WAY : Modelo Estadstico supuesto, es Lineal:

= = Valor de la n-esima observacin ubicada en el tratamiento i. = Promedio General

Luis Mara Dicovskiy Riobo, 2010

Pgina 8

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

= Efecto del tratamiento i que es igual a , la media del tratamiento i


menos la media general. Estos efectos puede tener valor positivo o negativo y el modelo supone que hay variacin entre los tratamientos, por los tanto se puede calcular su variancia,
2

= Error o Variacin de las observaciones ubicada en la repeticin j y


tratamiento i. El valor del error puede ser negativo o positivo. Se cumple que la suma y promedios de los errores son iguales a 0. Sin embargo es posible
2 calcular la variancia,

Tipo de Hiptesis en un ANOVA ONE WAY H0: 1= 2= 3= k, se supone que la variancia de los tratamientos es semejante a la
2 2 variancia del error, por lo tanto la relacin / debe ser un valor pequeo, cercano a

uno. HA: no todos los son iguales, al menos el menor y mayor promedios son
2 2 diferentes. Esto supone que la relacin / es un valor relativamente grande, ya

que la variancia de los tratamientos es varias veces mayor a la variancia del error. Nivel de significacin: 0.05 0.01 Estadstico de Prueba:
2 2 = /

Regla de Decisin: Si valor Fcalculado es mayor que el valor frontera tomado de una tabla de distribucin Ftabla se rechaza Ho, ya que el Fcalculado est en zona de rechazo de la hiptesis nula, Ho de la distribucin F. El valor de F de frontera se busca en una tabla de valores F, donde el valor de las columnas son los grados de libertad de los tratamientos y los de las filas son los grados de libertad del error. Si se usa un programa estadstico el anlisis de hiptesis se hace con el P valor. Si P 0.05 se est en H0.
Pgina 9

Luis Mara Dicovskiy Riobo, 2010

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Si P< 0.05 se est en HA. FCalculado

Modelo de ANDEVA Causa de Variacin Grados de Suma de Cuadrados Libertad GL Tratamientos t 1 Error (n -1) (t 1)
2 1 2 1

Cuadrado Medio, CM S2
2

SC

SC
total

2 2

- SCtratamientos

Total n 1

Estadsticos que verifican calidad de los datos, R2 y CV. Al interpretar un ANDEVA es importante medir que tan bueno fue el modelo estadstico aplicado y si el error experimental fue controlados por el diseo experimental. Para este tipo de anlisis disponemos de dos coeficientes fciles de calcular el coeficiente de determinacin, R 2, y el coeficiente de variacin aplicado al error CV . El coeficiente de Determinacin, R2: Este coeficiente muestra que proporcin de la variacin total de los datos est siendo explicada por el modelo adoptado, R 2 es un valor entre 0 y 1; a ms cerca de 1 mejor funciona el modelo. El R 2 se construye con la suma de cuadrados de la tabla ANDEVA de la siguiente manera: 2 = . En el caso de

un DCA la suma de cuadrados del modelo, SC Modelo, es la suma de cuadrados de los tratamientos. En el caso de un BCA (bloques completos al azar), la SC Modelo es igual a la SCTratamientos + SCBloques. En una caso de un cuadro latino, CL, la SCModelo es igual a la SCTratamientos + SCFilas + SCcolumnas .
Luis Mara Dicovskiy Riobo, 2010 Pgina 10

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

El Coeficiente de Variacin, CV, aplicado a un experimento. El Coeficiente de Variacin, CV, se puede aplicar para medir la variacin interna de los tratamientos, variacin que se refleja en la variancia del error o cuadrado medio del error. Un experimento mal manejado puede presentar mucha variacin entre las repeticiones de un mismo tratamiento, esto es error experimental. El CV tambin est en dependencia de la variable que se mide o pesa. Si la variable est bien controlada el CV deber ser menor a 20 %, incluso en laboratorio se pueden exigir CV menores al 10 %. Sin embargo en investigacin social descriptiva o en variables biolgicas no controladas como es una plaga, es comn que los CV sean grandes. El investigador debe explicar la causa de esta variacin. La forma de clculo es: =

100

Un Ejemplo de ANDEVA uni factorial Una tesis de estudiantes evalu 4 tipos de abono, uno con base de pulpa de caf, otro con base de abono de lombriz, lombrihumus, y se utilizaron 2 testigos, uno con la dosis de fertilizacin qumica tradicional, testigo relativo y otra con tierra sin abono extra, testigo absoluto. La variable de produccin fue grs. promedio del peso seco de las plntulas de caf a los 6 meses de siembra por unidad experimental, el ensayo tuvo cuatro repeticiones. A continuacin se muestran los datos obtenidos.

Tabla de Datos. Peso en onzas. Parte area plntula de caf. Tratamiento/ Bloques Pulpa caf Abono de lombriz Qumico Tierra I 1.00 1.65 1.69 0.58 4.92 II 0.90 1.59 1.52 0.60 4.61 III 1.16 2.00 1.40 0.60 5.16 IV 0.98 1.65 1.46 0.46 4.55

tratam
4.04 6.89 6.07 2.24 19.24

X
1.01 1.72 1.52 0.56

repeticion es

Luis Mara Dicovskiy Riobo, 2010

Pgina 11

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Tabla de ANDEVA
Causa de Variacin Grados de Libertad Suma de Cuadrados Cuadrado Medio, CM S2 FCalculada

Tratamientos Error Total

4 1 = 3 15- 3 = 12 16 1 = 15

3.28 0.20 3.48

3.28/ 3 =1.09 0.2/12 =0.017

1.09/0.02=6 5.18

P valor 0.00

Suma de Cuadrados Total =

= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 / 16) = 26.61 19.242 / 16 = 26.61 23.13 = 3.48
2 1 2

Suma de cuadrados de los Tratamientos =

= ((4.04)2 + (6.89)2 + (6.07)2 + (2.34)2 )/ 4 (19.242 / 16) = (106.11 / 4) 23.13= 3.28

Interpretacin La prueba resulta en HA: no todos los son iguales Ya que la F calculada 65.18 > F Tabla 3.49 (con 3 y 12 grados de libertad)

El Diseo Completamente Al azar, DCA se resuelve estadsticamente con un ANDEVA unifactorial, ANOVA ONE WAY

Luis Mara Dicovskiy Riobo, 2010

Pgina 12

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Verificacin del modelo.


Para realizar un estudio de normalidad y homogeneidad de las variancias es necesario calcular los errores y hacer pruebas de normalidad y homocedasticidad. Con los programas Excel o INFOSTAT se pueden calcular los errores de cada valor observado de la manera: = ( ) Media Total 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 Media Tratamiento 1.01 1.01 1.01 1.01 1.72 1.72 1.72 1.72 1.52 1.52 1.52 1.52 0.56 0.56 0.56 0.56 Efecto Tratamiento -0.19 -0.19 -0.19 -0.19 0.52 0.52 0.52 0.52 0.32 0.32 0.32 0.32 -0.64 -0.64 -0.64 -0.64 Error Absoluto 0.01 0.11 0.15 0.03 0.07 0.13 0.28 0.07 0.17 0.00 0.12 0.06 0.02 0.04 0.04 0.1

Tratamiento Peso Pulpa caf 1.00 Pulpa caf 0.90 Pulpa caf 1.16 Pulpa caf 0.98 Lombrihumus 1.65 Lombrihumus 1.59 Lombrihumus 2.00 Lombrihumus 1.65 Qumico 1.69 Qumico 1.52 Qumico 1.40 Qumico 1.46 Tierra 0.58 Tierra 0.6 Tierra 0.6 Tierra 0.46

Error -0.01 -0.11 0.15 -0.03 -0.07 -0.13 0.28 -0.07 0.17 0.00 -0.12 -0.06 0.02 0.04 0.04 -0.1

Luis Mara Dicovskiy Riobo, 2010

Pgina 13

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Cuantiles observados(RDUO_gr planta)

0.28

Grfico QQ plot de errores

0.16

0.04

-0.08

-0.20 -0.20

-0.08

0.04 Cuantiles de una Normal

0.16

0.28

En el Grfico QQ plot de los residuos se observa que stos se distribuyen cercanos a la recta de regresin de la normal, lo que hace suponer que los residuos se distribuyen de manera normal. Tambin el programa hace regresin de los residuos y la recta normal y esta fue d: r =0.95, valor suficiente para aceptar la normalidad. Valores de la prueba Shapiro-Wilks para verificar normalidad por prueba de hiptesis. Variable Rduo gr planta n 16 Media D.E. W* 0.00 0.12 0.89 p (una cola) 0.10

La prueba de normalidad de Shapiro Wilks para los errores del modelo, realizado con el programa INFOSTAT, confirma que stos se distribuyen de manera normal. Se acepta la H0 de normalidad de los errores ya que el valor calculado p de 0.10 es mayor al valor de 0.05.

Para verificar la homogeneidad de las variancias, se hizo la prueba de Levene, que consiste en hacer un ANDEVA de los valores promedios de los errores de los tratamientos en valor absoluto.

Cuadro de Anlisis de la Varianza de los errores en valor absoluto F.V. SC gl CM F p-valor


Pgina 14

Luis Mara Dicovskiy Riobo, 2010

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Abono 0.02 Error Total 0.06 0.08

3 12 15

0.01 1.10 0.01

0.39

Como el p valor de 0.39 es mayor al valor de 0.05 concluyo que se ocurre H 0, las variancias de los errores absolutos de los diferentes tratamientos son iguales, por lo tanto en este experimento se cumple la homogeneidad de variancias.

0.29 0.22

Grfico de Residuos Absolutos por tratamiento

RABS_peso

0.14 0.06 -0.01

Pulpa

Lombrihumus

Qumico

Tierra

Calidad de los datos El coeficiente de determinacin fue bastante alto, lo que explica que el modelo funcion bastante bien explicar la variacin total de los datos, el 2 = 3.28 3.48 = 0.94 es un valor muy alto. El coeficiente de variacin tuvo un valor bastante aceptable para un experimento de fertilizacin a campo, este fue: = 0.017 1.2 100 = 11 %

Ejercicio 6.2 En un estudio socioeconmico se tuvo 75 datos, correspondientes a muestras de diferentes ciudades de cada pas. Donde la variable dependiente estudiada fue caloras ingeridas por da y la variable dependiente es Pas, en total 8 pases. En este caso la Hiptesis nula a responder es: La cantidad promedio de caloras diarias ingeridas por persona es igual en todas las regiones
Luis Mara Dicovskiy Riobo, 2010 Pgina 15

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

econmicas del mundo? A continuacin se muestra la tabla incompleta de ANDEVA. Tabla de Anlisis de Variancia, ANDEVA. Causa De variacin Suma de Grados de Cuadrado Cuadrados Libertad Medio Entre Grupos 1,445 7 Error, dentro del grupo 5,382 67 Total 74 Completar la tabla de ANDEVA? Construya las 2 hiptesis correspondientes? Interprete y comente los resultados?

Ejercicio 6.3 Se quera saber si los estudiantes utilizan la teora explicada en el aula al resolver problemas prcticos. Se hizo un experimento con 12 estudiantes, se formaron 3 grupos, A-B-C, de cuatro estudiantes cada uno. A cada grupo se les dio un ejercicio matemtico semejante para resolver de manera individual. A los cinco minutos al grupo B se le dio un papel con una informacin terica adicional y al grupo C se les dio un papel con dos informaciones. Cada estudiante resolva el problema de manera individual. La variable dependiente fue el tiempo medido en segundos. Los datos obtenidos fueron los siguientes: Grupo/ Segundos para resolver A. Testigo B. Un informacin adicional C. Dos informaciones adicionales E.1 242 176 155 E.2 206 129 106 E.3 300 128 122 E.4 282 190 115

Construya las 2 hiptesis correspondientes? Resolver la tabla de ANDEVA? Interprete y comente los resultados? Verifique el modelo. Son los errores normales, y las variancias de los grupos homogneas?

Luis Mara Dicovskiy Riobo, 2010

Pgina 16

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

3.4 ANDEVA para un Diseo BCA


El diseo de bloques completamente al azar, BCA, es un diseo ampliamente utilizado a campo en centros experimentales agronmicos. Es ideal para evaluar variedades, distancias de siembra, control de plagas, etc. Este diseo permite controlar al menos el principal gradiente de error que posee el rea experimental. El diseo. Un bloque es (en Estadstica) un grupo de observaciones que pueden y deben ser analizadas e interpretadas slo de modo conjunto. Se dice que un bloque es un bloque completo cuando todos sus elementos componentes tienen valores vlidos y estn representados todos los tratamientos.

Un bloque puede estar fijado o establecido por el investigador de modo arbitrario. En este caso, se dice que ese bloque es un bloque no aleatorio. Pero puede que este bloque est fijado, configurado o seleccionado segn la ley estadstica del azar, en cuyo caso se dice que el bloque es un bloque aleatorio.

El BCA exige que en cada bloque se encuentren todos los tratamientos, de ah el nombre de bloques completos y que los bloques se ubiquen de manera transversal al gradiente que perturba de mayor grado el rea experimental, por ejemplo: pendiente de suelos, vientos, riego, luz, etc. De esta manera se trata de reducir la suma de cuadrados del error, es decir reducir la varianza del error y as poder explicar con el modelo la variacin ocurrida en el rea experimental. El punto dbil del modelo es que se pierden grados de libertad del error por lo tanto sino se reduce la suma de cuadrados del error el BCA pierde precisin frente a un DCA.

En nuestras condiciones se recomienda usar cuando hay menos de 15 tratamientos, ya que con un nmero mayor de tratamientos es muy difcil de manejar a campo, an experimentos de 10 tratamientos son difciles de

Luis Mara Dicovskiy Riobo, 2010

Pgina 17

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

implementar sin aumentar el error experimental a niveles que hacen dudar de los resultados. El BCA es el diseo ms utilizado en la experimentacin agrcola

El Modelo Estadstico, lineal.

= = Valor de la j observacin ubicada en el i tratamiento. = Promedio General = Efecto del tratamiento i = Efecto del Bloque j = Variacin o error de las observaciones ubicada en el bloque j, utilizando el
tratamiento i.

Desde el punto estadstico el modelo es semejante al utilizado para resolver un diseo completamente aleatorio, DCA, solo que se le agrega una nueva causa de variacin, que en este caso son los bloques. El modelo supone que no existe interaccin entre los bloques y que los efectos son fijos sin importar los tratamientos, esto quiere decir que un tratamiento dado no puede ser de los mejores promedio en un bloque y ser de los peores en otro.

Al realizar el experimento lo que se espera es que haya diferencias significativas entre los bloques, que estos absorban error experimental. Sin embargo esta

prueba solo es referencial ya que desde un punto de vista estricto de diseo, los bloques no tienen repeticiones. ANDEVA bifactorial sin interaccin es el modelo estadstico para anlisis de un diseo B.C.A

Anlisis de Varianza
Luis Mara Dicovskiy Riobo, 2010 Pgina 18

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Hiptesis: Sobre los tratamientos Ho: 1= 2=..... = k, HA: no todas los k son iguales Sobre los bloques Ho: 1= 2=..... = j, HA: no todas j son iguales Nivel de significacin: 0.05 0.01 Estadstico de Prueba: Ftratamientos = S2tratam/S2error ; Fbloques= S2bloque/S2error Regla de Decisin: Si Fcalculado es mayor que la Ftabla se rechaza Ho

Tabla de ANDEVA de un BCA


Causa de Variacin Grados de Libertad Tratamientos t 1
1 2 1 2

Suma de Cuadrados

Cuadrado Medio, CM S2

FCalculado

2 2

Bloques

b 1

2 1

Error (n -1) SC (t 1) (b -1) Total n 1

bloq

2 2

total

- SC

tratam

- SC

Donde:
Luis Mara Dicovskiy Riobo, 2010 Pgina 19

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

i es cualquier tratamiento j es cualquier bloque t es el nmero de tratamientos b es el nmero de bloques n es el nmero de unidades experimentales, es igual a b x t.

Un Ejemplo Para comparar diseos se analiza el mismo ejemplo anterior pero considerando que las repeticiones tuvieron un diseo de bloques

Tabla de ANDEVA Causa de Variacin Grados de Libertad 4 1 = 3 4 1 = 3 Suma de Cuadrados Cuadrado Medio, CM S2 Tratamientos 3.28 1.09 Tratamiento Bloques 0.06 0.02 70.07 FCalculada

Error

15- 3 - 3= 9 16 1 = 15

0.14

0.16

Bloques
Total 3.48

1.29

Suma de cuadrado Total =

= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 / 16) = 26.61 19.242 / 16 = 26.61 23.13 = 3.48
Luis Mara Dicovskiy Riobo, 2010 Pgina 20

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Suma de cuadrados de los Tratamientos =

2 1

= ((4.04)2 + (6.89)2 + (6.07)2 + (2.34)2 )/ 4 (19.242 / 16) = (106.11 / 4) 23.13= 3.28 Suma de cuadrados de Bloques =
1 2 1

= (4.922 + 4.612 + 5.162 + 4.552 / 4) (19.242 / 16) = (96.12 / 4) 23.13 = 0.06 Suma de cuadrados del Error = S.C total S.C tratamientos S.C bloques

3.48 -3.28- 0.06= 0.14

Cuadrado Medio de los tratamientos = S.C tratamientos / G.L tratamientos 3.28 / 3 = 1.09

Cuadrado Medio de los bloques= S.C 0.06 / 3 = 0.02

bloques

/ G.L bloques

Cuadrado Medio del error = S.C error / G.L error 0.14 / 9 = 0.016 Ftratamientos = C.M tratamientos / C.M error 1.09 / 0.016 = 68.12 (la variancia de los tratamientos es 68.12 veces mayor que la variancia del error) Fbloques = C.M bloques / C.M error
Luis Mara Dicovskiy Riobo, 2010 Pgina 21

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

0.02/ 0.016 = 1.25

Interpretacin de la prueba de hiptesis. Siendo Fcalculada = 68.12 > Ftabla, 3-9 GL = 0.05 3.86 y 0.01 6.99 El resultado se encuentra en Hiptesis alternativa, es decir al menos uno de los tratamientos es diferente al resto, ahora se debe hacer una prueba de separacin de promedios para conocer el detalle de las diferencias entre los tratamientos. Sin embargo los bloques no son significativos, lo que significa que estos no disminuyeron el error.

Separacin de Promedios Estas pruebas se realizan solamente cuando el resultado del ANDEVA refleja que estamos en HA, es decir al menos los promedios extremos son diferentes. Las pruebas que veremos son: Diferencias significativas mnimas, Prueba de rangos mltiples de Duncan y la Prueba de rangos mltiples de Tukey. Diferencia Significativa Mnima Solo se debe usar para comparar promedios adyacentes, o contra un testigo estndar, donde no se involucren en la comparacin ms de 2 promedios. Esta prueba suele ser poco usada, pero sirve como insumo para realizar la prueba de Duncan que es ms popular.
2( )

DSM0.05 = t0.05

DSM0.05 = 2.262

2(0.016 ) 4

= 0.20

Luis Mara Dicovskiy Riobo, 2010

Pgina 22

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

El valor t de tabla se busca con los grados de libertad del error, en este caso es de 9 y para un alfa del 5 %. El valor DSM de 0.20 gr se contrasta con las diferentes diferencias de promedios respecto al testigo. Si la diferencia de promedios es mayor que el valor DSM, se concluye que estos promedios son diferentes.

Tratamientos

X en gr Diferencia con
el testigo Tierra de 0.56 gr

Diferencias mayores de 0.20 gr Si Si Si

Lombrihumus Qumico Pulpa caf

1.72 1.52 1.01

1.16 0.96 0.45

Conclusiones: el lombrihumus, el fertilizante qumico y la pulpa de caf son mejores estadsticamente que el testigo tierra sin fertilizante.

Prueba de Rangos mltiples de Duncan. Es una prueba muy usada cuando tienen 6 o menos tratamientos, con un nmero mayor generan muchos subgrupos de comparacin, lo que hace difcil la interpretacin de resultados DSM0.05 Duncan = DSM0.05 R

Donde R es un valor extrado de de una tabla de factores studentizados significativos que se elije de acuerdo con el nivel de significacin deseado, con los grados de libertad para el error y con la disposicin relativa de las medias en el arreglo, ver la tabla en Little, T y Hills F. 1989.

Prueba de Rangos mltiples de Tukey Es una prueba muy estricta, robusta, se sugiere usar cuando hay mas de 6 tratamientos o se quieren resultados de separaciones muy confiables.

Luis Mara Dicovskiy Riobo, 2010

Pgina 23

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

DSM Tukey = q , gl error, t *

CM error r

Donde q es un valor tabulado, ver tabla en Daniel (2006), donde se considera: el valor alfa de 0.05, los grados de libertad del error, 9, y el nmero de tratamientos,4. En este ejemplo el valor q es 4.415 DSM Tukey = 4.415 =
0.016 4

= 0.28

Tabla de Diferencias
Tratamientos Lombri humus Lombrihumus Qumico Pulpa caf Tierra 0.20 NS 0.71** 0.52** 1.16** 0.96** 0.45** Qumico Pulpa caf Tierra

Segn este cuadro, los fertilizantes lombrihumus y qumico son iguales y diferentes y mejores a los otros dos tratamientos, pero pulpa de caf es mejor que tierra. En este ejemplo, coinciden en resultados la prueba de Tukey y la prueba DSM, debemos considerar que no siempre sucede as.

3.5 Diseo de Cuadro Latino


El diseo de cuadro latino, CL, es un diseo trifactorial sin interacciones, que es adecuado implementar cuando se pueden encontrar fuentes extraas de perturbacin al experimento en dos sentidos con relativamente pocas repeticiones, lo que significa un menor gasto al momento de hacer experimentos. Un ejemplo de CL en un experimento de agronoma puede considerar como factores de perturbacin el viento de norte a sur y un gradiente de fertilidad de este a oeste.
Luis Mara Dicovskiy Riobo, 2010 Pgina 24

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Este modelo es igual considerar la existencia de bloques dobles, bloques por filas y bloques por columnas. Una Caracterstica importante de este tipo de diseo es su balance, que se logra asignando el mismo nmero de observaciones a cada tratamiento de cada bloque, por esto son diseos en cuadro. El cuadro latino, es un diseo trifactorial sin interacciones que resuelve preguntas de tres factores con pocas repeticiones Un ejemplo de cuadro latino, en nutricin animal, es comparar tres diferentes alimentos A-B-C, donde un bloque son diferentes grupos de animales que comen los alimentos y el otro bloque es el tiempo en que a cada grupo de animales se le aplica los diferentes alimentos. En resumen hay: tres tipos de alimentos y tres tiempos de alimentacin para tres grupos de animales, el experimento podra disponerse segn el patrn siguiente:

Grupo /Tiempo Grupo 1 Grupo 2 Grupo 3

Animales T1

T2

T3

A C B

B A C

C B A

Donde A-B-C son los diferentes tipos de alimentos.

En este caso, cada alimento se aplica una sola vez por cada grupo de animales junto con cada tiempo, y si existiesen efectos sistemticos debido a diferencias entre los animales o entre los tiempos, dichos efectos estaran presentes de igual manera en cada tratamiento, esto es, en cada tipo de alimento.

En este modelo se pueden observar que las diagonales repiten el mismo grupo, ver el caso de la diagonal A-A-A, B-B y C-C. Estas diagonales no son problema en esta caso ya que las columnas son el Factor tiempo, y el tiempo no se perturba diagonalmente, sin embargo si el diseo fuera con filas y columnas en el espacio, por ejemplo filas E-O y columnas NS, las diagonales no son deseables ya que
Luis Mara Dicovskiy Riobo, 2010 Pgina 25

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

pueden ser una fuente de error. En este caso se recomienda sortear filas y columnas de forma independiente.

Un arreglo experimental como el que se describi se denomina cuadrado latino 3X3. Un cuadrado latino n x n es un arreglo cuadrado, los tratamientos aparecen solo una vez en cada fila y en cada columna.

Ej. de Modelo 4x4, es el ms usado

Ej. Modelo 5x5

A B C D

B C D A

C D A B

D E B C

A B C D E

B A D E C

C E A B D

D C E A B

E D B C A

Modelo Estadstico Lineal = = valor de la observacin i ubicada en la columna k con la fila j usando el
tratamiento i.

= Promedio General = Efecto del tratamiento i = Efecto de la columna j = efecto de la fila k = Variacin de las observaciones ubicada en la columna K, con la fila j,
usando el tratamiento i. Anlisis de Varianza Hiptesis:
Luis Mara Dicovskiy Riobo, 2010 Pgina 26

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Sobre los tratamientos Ho: 1= 2=..... = i Ho: 1= 2=..... = j HA: no todas las i , tratamientos, son iguales HA: no todas las j , columnas, son iguales

Sobre el Factor en columna

Sobre el Factor en Fila Ho: 1= 2=..... = k , filas, son iguales. HA: no todas las k son iguales Nivel de significacin: 0.05 0.01 Estadstico de Prueba: F1= St/S2error; F2= Sf/S2error; F3= Sc/S2error Regla de Decisin: Si Fcalculado es mayor que la Ftabla se rechaza Ho

Tabla de ANDEVA de un Cuadro Latino


Causa de Variacin Suma de Cuadrados Grados de Libertad Tratamiento Filas Columnas Error Total SCT SCF SCC SCTot (SCT+SCF+SCC) SCTot t-1 c-1 f-1 Difer. n-1 Cuadrado Medio, CM S2 S2t S2f S2c S2error St/Serror Sf/S2error Sc/S2error FCalculado

Las sumas de cuadrados de las filas, columnas y tratamientos se resuelven con procedimientos similares, como si fueran tres anova one way. El ejemplo: Se quiere estudiar el rendimiento acadmicos de alumnos de la misma carrera Ingeniera en Sistemas en 4 grupos: A, B, C, D, en cuatro

asignaturas: Estadstica, Base de Datos, Economa y Fsica. Para neutralizar el efecto en cadena que una asignatura tiene sobre la otra, el estudio se hace en cuatro momentos, respetando el hecho que en un mismo momento se evalen las cuatro asignaturas. En este modelo pueden considerarse los Momentos como columnas y las asignaturas como filas.
Luis Mara Dicovskiy Riobo, 2010 Pgina 27

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Datos
Asignatura Grupo Momento Nota Asignatura Grupo Momento Nota

Economa Economa Economa Economa Fsica Fsica Fsica Fsica

C D A B D A B C

1 2 3 4 1 2 3 4

82 81 83 77 70 65 67 61

Estadstica Estadstica Estadstica Estadstica B de D B de D B de D B de D

A B C D B C D A

1 2 3 4 1 2 3 4

75 70 73 67 78 76 78 71

Suma de Cuadrados = + + + = . = = + + + = .

+ + + = . + + + = .

= = .

El anlisis de de variancia realizado con INFOSTAT como un ANDEVA trifactorial sin interacciones dio los siguientes p valores. Cuadro de Anlisis de la Varianza de un Cuadro Latino C.V. SC gl CM F p-valor Asignatura 490.75 3 163.58 163.58 <0.0001 Grupo 2.75 3 0.92 0.92 0.4872 Momento 124.25 3 41.42 41.42 0.0002 Error 6.00 6 1.00 Total 623.75 15 Se concluye que hay diferencias significativas para las diferentes asignaturas y diferentes momentos de aplicacin de exmenes ya que el p valor de 0.0001 y
Luis Mara Dicovskiy Riobo, 2010 Pgina 28

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

0.0002 son menores al valor de 0.05. Sin embargo los cuatros Grupos de alumnos tienen un comportamiento semejante.

Ejercicio 6.4 Se evalu 3 niveles de inclusin (10 %, 20 % y 30 %) de un nuevo alimento para rumiantes desarrollado a base de pulpa de caf. El testigo fue 0 % de inclusin. La variable medida fue consumo de materia seca, CMS en un periodo determinado. Cmo no se tenan suficientes ovejas para realizar el experimento, se usaron 4 animales en un diseo de cuadro latino en el tiempo, cada una de estos pas por los cuatro tratamientos de alimentacin. Realizar el ANDEVA como BCA y como Cuadro Latino e Interpretar ambas pruebas de hiptesis. Comentar la diferencias Realizar prueba de separacin de medias por Tukey, DUNCAN y DSM e interpretar. Observar diferencias. Hacer estudios de residuos con pruebas de normalidad por qq plot Hacer estudio de igualdad de varianzas con los residuos absolutos, prueba de Levene. Hacer grficos de barras Concluir los resultados de manera narrativa Datos Tratamiento 0 10 20 30 0 10 20 30 0 10 20 30 0 10 20 Ovejas A B C D B A D C D C B A C D A Tiempo 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 CMS 424.6 427.2 567 774.7 523.3 519.43 444.27 772.56 559 699.1 702.61 734.6 586.2 432 656.78
Pgina 29

Luis Mara Dicovskiy Riobo, 2010

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

30

574

Usando el programa estadstico INFOSTAT se debe realizar: El ANDEVA como Cuadro Latino e Interpretar las pruebas de hiptesis. Pruebas de separacin de medias por Tukey, DUNCAN y DSM e interpretar. Observar diferencias. Estudios de residuos con pruebas de normalidad por qq plot Estudio de igualdad de varianzas con los residuos absolutos, prueba de Levene. Grficos de barras con intervalos de confianza. Concluir los resultados de manera narrativa

3.6 Diseo en Cuadro Greco Latino


El diseo en cuadros Greco Latino, en una extensin del diseo de cuadro latino. Al modelo de tres factores del cuadro latino, tratamiento, filas y columnas, se agrega un nuevo factor que se simboliza con letras griegas. Adems de tener control del error por filas y columnas, tenemos un nuevo factor que son las letras griegas. Este tercer permite controlar la heterogeneidad que no pueden

neutralizar las diagonales del cuadro latino. Este diseo es poco usado y se justifica cuando el rea experimental o los elementos de perturbacin son

extremadamente heterogneos. Ejemplo de un diseo Greco Latino con letras latinas diferenciando los factores columnas y filas y letras griegas como tercer factor que neutraliza las diagonales.

A B C D

B C D A

C D A B

D E B C

Luis Mara Dicovskiy Riobo, 2010

Pgina 30

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

3.7 Anlisis de la varianza de dos factores con interaccin


El diseo bifactorial, es un diseo del tipo factorial, pero con dos factores o temas de estudio, Factor 1 y Factor 2, los cuales pueden tener interaccin entre ellos. Este modelo supone tres pruebas de hiptesis una para el Factor 1, otra para el Factor 2 y la tercera para la interaccin F1xF2, en esta prueba la hiptesis nula es la falta de interaccin. La interaccin responde a la pregunta de si el Factor 1 tiene diferentes comportamientos ante los diferentes valores del Factor 2, por ejemplo ante una prueba de evaluacin de variedades de un cultivo en diferentes ambientes, la interaccin sera que la mejor variedad en un ambiente de alta fertilidad, ya no se comporta como la mejor variedad al cambiar a un ambiente de baja fertilidad. El ANDEVA permite estudiar simultneamente los efectos de dos fuentes de

variacin. En un ANDEVA de dos factores se clasifica a los tratamientos o grupos de acuerdo a dos factores para estudiar simultneamente sus efectos. Este modelo difiere del BCA, en que interesa la interaccin de los dos factores.

El Modelo Estadstico, lineal.

= = Valor del j Factor B ubicada en el i Factor A. = Promedio General = Efecto del Factor A i = Efecto del Factor B j

Luis Mara Dicovskiy Riobo, 2010

Pgina 31

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

= Efecto de la interaccin del Factor A por el Factor B = Variacin de las observaciones ubicada en el Facto B j y el Factor A i.
Anlisis de Varianza Hiptesis de los Factores A y B: Ho: 1A= 2A=..... = iA ; HA: no todas los iA son iguales para el Factor A Ho: 1B= 2B=..... = jB ; HA: no todas jB son iguales para el Factor B Hiptesis de Interaccin Ho: El Factor A no interacta con el Factor B HA: El Factor A interacta con el Factor B Nivel de significacin: 0.05 0.01 Estadstico de Prueba: F1= S2A /S2error; F2= S2B/S2error; F3= S2AB/S2error Regla de Decisin: Si Fcalculado es mayor que la Ftabla se rechaza Ho ANDEVA de un Diseo Bifactorial con interaccin Causa de Variacin Suma de Cuadrados Grados de Libertad Cuadrado Medio, CM S2 Total Tratamientos Totales Factor A Factor B Factor AxB Error Donde: t = nmero tratamientos totales, a = nmero tratamientos del Factor A,
Pgina 32

FCalculado

SCtotal SCtratamientos

n-1 t-1 S2A S2B S2AxB S2A /Serror S2B S2error S2AxB S2error

SCA SCB SCAxB SCError

a-1 b-1 (a-1)(b-1) n-t

Luis Mara Dicovskiy Riobo, 2010

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

b=nmero de tratamientos del Factor B SCAxB = SCtratamientos - SCA- SCB SCError = SCtotal - SCtratamientos

En este modelo la suma cuadrados de los tratamientos totales, SC tratamientos, se descompone en tres sumas de cuadrados, SCA, SCB y SCAxB. Esta forma de resolucin de la suma de cuadrados de la interaccin es vlido para calcular los grados de libertad de la interaccin. Ejemplo de un Anlisis Bifactorial Hay un grupo de 26 Estudiantes, 12 varones y 12 mujeres. A ellos se les pregunt su nota promedio y las horas de estudio semanales, esta ltima variable se codific: 0 a 3 horas, 4 a 6 horas y ms de 6 horas. Responder a las preguntas: Hay diferencias de notas segn sean varn o mujer? Hay diferencias de notas segn sean horas de estudio realizadas? Hay interaccin entre sexo y horas de estudio realizadas? Con una calculadora manual con funcin estadstica realice: 1. Anlisis de variancia bifactorial con interaccin. 2. Un grfico de interacciones 3. Comentar los resultados Tabla de datos Para analizar los datos manualmente se debe hacer las sumatorias por tratamiento. Sexo Varn Varn Varn Mujer Mujer Mujer Horas Repeticiones 0-3 4-6 +6 0-3 4-6 +6 70 78 86 64 80 80 74 75 82 70 81 90 73 80 88 69 73 84 69 76 85 76 79 82 286 309 341 279 313 336 71.50 77.25 85.25 69.75 78.25 84.00
Pgina 33

Luis Mara Dicovskiy Riobo, 2010

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

1,864

77.67

Suma de Cuadrados = + + + = = + + + +

+ + +

= = Resultados. Con el programa estadstico INFOSTAT se obtuvieron los siguientes valores del ANDEVA. ANDEVA de Interacciones. Variable Dependiente: Nota Promedio Cuadro de Anlisis de la Varianza C.V. SC gl Modelo 795.33 5 Sexo 2.67 1 Horas Estudio 784.08 2 Sexo*Horas Estudio 8.58 2 Error 218.00 18 Total 1013.33 23

CM 159.07 2.67 392.04 4.29 12.11

F 13.13 0.22 32.37 0.35

p-valor <0.0001 0.6445 <0.0001 0.7064

Estos resultados dicen que no hay diferencias de notas segn sean los estudiantes varones o mujeres (significacin de 0.64 mayor al 0.05), pero por otro lado si se observa diferencias estadsticas entre las horas de estudio (significacin de 0.0001 menor al 0.05), con esta ltima variable y este resultado se debe hacer una separacin de promedios entre las tres categoras de horas de estudio.
Luis Mara Dicovskiy Riobo, 2010 Pgina 34

Unidad III, Estadstica, Carrera Industrial, Sede UNI Norte.

Grfico de Interacciones Este grfico nos permite observar si hay interaccin con los dos factores, sexo y horas de estudio. Esta interaccin ocurre si las rayas generadas por las variables se cruzan, lo que sera una confirmacin de la existencia de interaccin entre sexo y horas de estudio. Como esto no se observa en el grfico que se muestra a continuacin, se puede concluir que coinciden los resultados del ANDEVA y del grfico. Grfico de Interacciones entre las Variables Sexo y Horas de estudio

Luis Mara Dicovskiy Riobo, 2010

Pgina 35

Vous aimerez peut-être aussi