Académique Documents
Professionnel Documents
Culture Documents
DISEO EXPERIMENTAL Y ANLISIS DE VARIANZA PRINCIPIOS DEL DISEO EXPERIMENTAL 1. INTRODUCCIN Este captulo es una introduccin al planeamiento y conduccin de experimentos en relacin con los objetivos, el anlisis y la eficiencia. Si aceptamos la premisa que el conocimiento nuevo se obtiene muy frecuentemente a travs del anlisis e interpretacin cuidadosa de los datos, entonces es muy importante que se deba dedicar tiempo y esfuerzo considerables al planeamiento y recoleccin de los mismos con el objeto de obtener la mxima informacin con el menor costo de recursos. 2. EXPERIMENTO Es una bsqueda planeada para obtener nuevos conocimientos o para confirmar o no resultados de experimentos previos, con lo que tal indagacin ayuda a la toma de decisiones. Se dispone cada experimento para proporcionar respuestas a una o ms preguntas. Con esto en mente, los investigadores deciden que comparaciones de tratamientos proporcionarn informacin relevante. Entonces realizan un experimento para medir o probar hiptesis que tiene que ver con diferencias entre tratamientos en condiciones comparables. Toman mediciones y observaciones sobre el material experimental. A partir de la informacin obtenida en un experimento que se ha completado con xito, responden a las preguntas planteadas al comienzo. Tales experimentos se clasifican en tres categoras: preliminar, crtico y demostrativo. 2.1 EXPERIMENTO PRELIMINAR El investigador prueba un nmero grande de tratamientos con el objeto de obtener indicios para futuros trabajos. 2.2 EXPERIMENTO CRITICO El investigador compara las respuestas a diferentes tratamientos usando un nmero suficiente de observaciones de las respuestas para obtener seguridad razonable para detectar diferencias significativas. 2.3 EXPERIMENTO DEMOSTRATIVO Se llevan a cabo cuando los trabajos de extensin comparan uno o ms tratamientos nuevos con un patrn. 3. UNIDAD EXPERIMENTAL Y TRATAMIENTO Una unidad experimental, o parcela experimental, es la unidad de material a la cual se aplica un tratamiento; el tratamiento es el procedimiento cuyo efecto se mide y se compara con otros tratamientos. La unidad experimental puede ser un rbol, una parcela o un animal; el tratamiento puede ser un programa de aspersin foliar de insecticida, una frmula de fertilizacin o una racin alimenticia. Cuando se mide el efecto de un tratamiento, se mide en una unidad de muestreo, que es una fraccin de la unidad experimental. 4. ERROR EXPERIMENTAL Es una medida de la variacin existente entre observaciones sobre medidas experimentales tratadas en forma similar. La variacin proviene de dos fuentes principales, primero, existe la variabilidad inherente al material experimental al cual se aplican los tratamientos. Segundo,
1
1.
INTRODUCCION
El sistema SAS es un conjunto de programas de computadora tiles en el anlisis estadstico de datos y la elaboracin de reportes. El anlisis estadstico va desde la simple estadstica descriptiva hasta tcnicas multivariadas complejas. Al hablar de SAS, como un sistema computacional, se debe entender como tal a un grupo de programas cuyo trabajo se realiza conjuntamente, el cual se le llama software. Con el sistema SAS se pueden realizar diferentes tipos de trabajos como: almacenar y recuperar informacin, modificar la informacin existente, manejo de archivos, obtener diferentes tipos de estadsticas de los datos y generar todo tipo de reportes. El SAS es un sistema computacional enfocado al anlisis estadstico de datos y presentacin de reportes; probablemente sea el ms completo que existe en ambas funciones. En este manual solo veremos una parte, que permitir al usuario de SAS iniciarse en el uso del sistema, con lo cual tendr herramientas para el aprendizaje autodidctico en: anlisis de variancia de diseos experimentales y anlisis de regresin y correlacin. 2. CARACTERSTICAS DEL SISTEMA 2.1 EL SISTEMA DE MANEJO DE PANTALLA Para comenzar una sesin de SAS, si el sistema se encuentra en el subdirectorio SAS, primero se cambia la fecha: 1/3/2000. Luego, ir a Programas, buscar SAS System y luego The SAS System for Windows v8 En su pantalla aparecer las ventanas de OUTPUT, LOG y PROGRAM EDITOR. OUTPUT es la ventana de resultados, una vez realizado la ejecucin del trabajo SAS.
4
2.3 EJECUCION DE SAS Cuando se tiene un conjunto de datos, para empezar a introducir estos en el programa SAS colquese en la primera lnea numerada de la ventana PROGRAM EDITOR. Las instrucciones SAS se pueden escribir en cualquier columna de la lnea y se pueden usar tantas lneas como se quiera. Se puede colocar ms de una declaracin de SAS por lnea, siempre y cuando termine en punto y coma (;) cada una de ellas. Para procesar las instrucciones presionar el icono del siguiente smbolo: Se puede retroceder o avanzar una pgina mediante las teclas Page Up o Page Down, respectivamente. El archivo de resultados no lo podemos modificar en el SAS. Si necesitamos modificarlo, primero se graba y luego con un editor o un procesador de textos se podr modificar a nuestro criterio. 2.4 CORRECCION DE ERRORES DE EJECUCION Cuando existen errores en el proceso de ejecucin las instrucciones no se procesan al correr el programa y debe ir a la ventana LOG, para observar los errores. Regresar al PROGRAM EDITOR, buscar recall text y corregir los errores detectados. Antes de
5
EJEMPLO Cuadro 1. Contenido de nitrgeno de plantas de trbol rojo inoculadas con combinaciones de cepas de Rhizobium trifolii y cepas de Rhizobium meliloti, mg. 3DOK1 19,4 32,6 27,0 32,1 33,0 3DOK5 17,7 24,8 27,9 25,2 24,3 TRATAMIENTOS 3DOK4 3DOK7 17,0 20,7 19,4 21,0 9,1 20,5 11,9 18,8 15,8 18,6 3DOK13 14,3 14,4 11,8 11,6 14,2 COMPUESTO 17,3 19,4 19,1 16,9 20,8
INTRODUCCION DE DATOS EN SAS Data pesos; title "Diseo completamente al azar"; options linesize=80 pagesize=60 nodate nonumber; input T R N; cards; 1 1 19.4 1 2 32.6 1 3 27.0 1 4 32.1 1 5 33.0 2 1 17.7 2 2 24.8 2 3 27.9 2 4 25.2 2 5 24.3 3 1 17.0 3 2 19.4 3 3 9.1 3 4 11.9 3 5 15.8
La instruccin means T/Tukey; realiza la prueba de comparacin de medias de Tukey. Puede usar ms de una prueba a la vez. Por ejemplo: means T/Tukey Duncan. Otras pruebas de comparacin de medias son: T, LSD y Scheffe. Tenga presente que en los comandos Class, model y means, los nombres de las variables son los correspondientes a los que se defini en la sentencia input. El comando run le dice a SAS que ejecute las instrucciones previas, tambin indica la terminacin de sesin SAS en esta parte. RESULTADOS EN SAS Diseo completamente al azar OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 T 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 R 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 N 19.4 32.6 27.0 32.1 33.0 17.7 24.8 27.9 25.2 24.3 17.0 19.4 9.1 11.9 15.8 20.7 21.0 20.5 18.8 18.6 14.3 14.4 11.8 11.6
Class Levels Values T 6 123456 Number of observations in data set = 30 Analysis of Variance Procedure
9 10 12 13
8 5
6 7
DF 5
F Value 14.37
Pr > F 0.0001
R-Square 0.749616
14
N Mean 19.88666667
17
18
19
20
21
22
Source T
DF Anova SS 5 847.04666667
23
27
Alpha= 0.05 df= 24 MSE= 11.78867 Critical Value of Studentized Range= 4.373 Minimum Significant Difference= 6.7142
31
30
29
28
Tukey Grouping
Mean
T
9
Los datos encerrados en crculos representan: Para la sentencia Class: 1. 2. 3. 4. El nombre de cada variable de clasificacin en la sentencia CLASS. El nmero de valores o niveles de las variables de clasificacin. Los valores de las variables de clasificacin.
Para la sentencia Model: El nmero de observaciones en el archivo de datos y el nmero de datos excluidos del anlisis debido a valores perdidos, en casos los hubiera. 5. La fuente de variacin del total para la variable respuesta. 6. La suma de cuadrados de todos los efectos especificados en la sentencia Model. En el caso del DCA, esta es la suma de cuadrados de tratamientos, por ser este el nico efecto introducido en la sentencia Model. 7. La fuente de variacin atribuido al error. 8. Los grados de libertad. 9. Las sumas de cuadrados. 10. Los cuadrados medios o varianza. 11. El cuadrado medio del error. 12. El valor estadstico de la prueba de F. 13. La probabilidad de significancia asociada con el estadstico F. En caso de ser este valor Pr>F menor del nivel de seguridad escogido (0,05 0,01), se rechaza la Ho y se concluye que existen diferencias significativas o altamente significativas segn sea el nivel de seguridad escogido (). 14. El coeficiente de determinacin (R2) 15. El coeficiente de variabilidad (C.V.). 16. La raz cuadrada del cuadrado medio del error. 17. El promedio de la variable respuesta. Para cada efecto o fuente de variacin especificada en la sentencia Model, se tiene: 18. 19. 20. 21. 22. 23. Los grados de libertad. Las sumas de cuadrados. Los cuadrados medios. El valor del estadstico de la prueba. La probabilidad de significancia asociada con el estadstico F.
Para la sentencia Means se tiene: Indica la realizacin de la prueba de Tukey. 24. El nivel de seguridad (). 25. Los grados de libertad del error. 26. El cuadrado medio del error. 27. Los valores de la amplitud y lmite de significacin de Tukey para las comparaciones.
10
Cuadro 4. Anlisis de la variancia del estudio de porcentaje de limpieza de lana. F. de V. Tratamientos Error Total G.L. S.C. C.M. 94,524 14,157 Fc. 6,68 Pr > F 0,0002 SIGN. **
1. PRUEBA DE TUKEY El procedimiento de Tukey hace uso de la amplitud estudiantizada y es aplicable a pares de medias; necesita de un solo valor para juzgar la significancia de todas las diferencias, y por lo tanto es rpido y es fcil de usar. Esta prueba no requiere de una prueba previa de F. Para esta prueba se requiere saber los G.L. del error, el CM del error y el nivel de significacin a que se va hacer la prueba. Primero. Determinar Sx Sx =
Segundo. Con los grados de libertad del error y nmero de tratamientos a comparar se va a la tabla de Tukey, encontrndose la Amplitud Estudiantizada Significativa de Tukey o abreviadamente AES(T) AES (T) gl=28, p=7 = no se encuentra en la tabla, por lo que se hace una interpolacin armnica, empleando los recprocos de los GL ms prximos para establecer la regla de tres. Hay valores para 24 y 30, estos son 4,54 y 4,46 respectivamente (nivel 0,05), luego se hace una regla de tres como sigue:
11
La AES (T) 0,05 = 4,54 0,057 = 4,483 Tercero. Multiplicar la AES por Sx para obtener ALS (T) AES x Sx = ALS (T) Para el ejemplo: ALS (T) = (4,483) (1,69) = 7,60 Cuarto. Ordenar los tratamientos en forma decreciente o creciente. Tratam. Promedio Clave 4 29,4 I 7C 32,6 II 2A 33,2 III 1A 34,8 IV 3A 39,0 V 6B 39,4 VI 5B 41,4 VII
Quinto. Hacer todas las comparaciones posibles entre los promedios de los tratamientos. La regla prctica recomendada es restar (o sumar) del valor del promedio ms alto (o ms bajo) la ALS(T) y los valores inferiores (o superiores) al valor encontrado son iguales estadsticamente, y as sucesivamente. Los resultados son: Orden de mrito (Clave) Tratamiento Promedio Significacin I 4A 29,4 a II 7C 32,6 a b III 2A 33,2 a b IV 1A 34,8 a b c V 3A 39,0 b c VI 6B 39,4 b c VII 5B 41,4 c Los tratamientos unidos con la misma letra son iguales estadsticamente. 2. PRUEBA DE DUNCAN Esta prueba tiene en cuenta los rdenes que les toca a los promedios de los tratamientos en comparacin con el ordenamiento general, dando mayores lmites de significacin (mayor exigencia) en las comparaciones de los tratamientos ms apartados en el ordenamiento. Esta prueba no requiere de una prueba previa de F. Primero. Determinacin de Sx . Se hace igual que la prueba de Tukey. Segundo. Con los GL del error y el nmero de tratamientos a comparar (p) se va a la tabla de Duncan para encontrar las Amplitudes Estudiantizadas Significativas de Duncan o abreviadamente AES(D), y en ella se buscan los valores para el nmero de tratamientos a comparar, los cuales se multiplican por Sx para obtener las Amplitudes Lmites de Significacin de Duncan o abreviadamente ALS(D); as para el ejemplo anterior: Valores p AES(D) Sx ALS(D) 2 2,90 1,69 4,9 3 3,04 1,69 5,1 4 3,13 1,69 5,3 5 3,20 1,69 5,4 6 3,26 1,69 5,5 7 3,30 1,69 5,6
12
3. DISEO DE BLOQUE COMPLETO AL AZAR Es aquel diseo donde las unidades experimentales son reunidas en grupos o bloques relativamente homogneos considerando que el nmero de unidades experimentales por bloque originalmente debe ser igual al nmero de tratamientos a estudiar y donde adems se considera que los tratamientos son distribuidos al azar dentro de las unidades experimentales de cada bloque. MODELO ADITIVO LINEAL Yij = + j + i + ij Donde: Yij = Cualquier observacin. = Media poblacional j = Efecto del i-simo bloque (repeticin) i = Efecto del i-simo tratamiento ij = Error experimental i = 1,2, t; donde t = nmero de tratamientos. j = 1,2, r, donde r = nmero de bloques (repeticiones). ESQUEMA DEL DISEO Tratamientos 1 2 3 4 I C (1) A (2) B (3) D (4) Bloques o Repeticiones I D (5) B (6) A (7) C (8) III A (9) C (10) D (11) B (12)
Nmero de restricciones en la aleatorizacin : 1 Naturaleza de la restriccin en la aleatorizacin : un conjunto completo de tratamientos debe ser asignado al azar dentro de cada bloques por separado.
13
DESVENTAJAS
Cuadro 2. Contenido de aceite de semillas de lino Redwing inoculadas en diferentes estados de crecimiento con S. linicola en porcentajes. TRATAMIENTOS Plntula Florecimiento temprano Florecimiento completo Florecimiento completo (1/100) Maduracin Sin inocular INTRODUCCION DE DATOS EN EL SAS Data bloques; title "Diseo de bloque completo al azar"; options nodate; input T R A; cards; 1 1 4.4 1 4.4 3.3 4.4 6.8 6.3 6.4 BLOQUES 2 3 5.9 6.0 1.9 4.9 4.0 4.5 6.6 7.0 4.9 5.9 7.3 7.7 4 4.1 7.1 3.1 6.4 7.1 6.7
14
RESULTADOS EN SAS OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 T R 1 1 1 2 1 3 1 4 2 1 2 2 2 3 2 4 3 1 3 2 3 3 3 4 4 1 4 2 4 3 4 4 A 4.4 5.9 6.0 4.1 3.3 1.9 4.9 7.1 4.4 4.0 4.5 3.1 6.8 6.6 7.0 6.4
15
Class Levels Values T 6 123456 R 4 1234 Number of observations in data set = 24 Diseo de bloque completo al azar Analysis of Variance Procedure Dependent Variable: A Sum of Source DF Squares Model 8 34.79333333 Error 15 19.71625000 Corrected Total 23 54.50958333 R-Square 0.638298 Source T R C.V. 20.73513 Root MSE 1.1464801 Mean Square F Value 4.34916667 3.31 1.31441667 A Mean 5.5291667 Pr > F 0.0219
Mean Square F Value Pr > F 6.33041667 4.82 0.0080 1.04708333 0.80 0.5147
Tukey's Studentized Range (HSD) Test for variable: A Alpha= 0.05 df= 15 MSE= 1.314417 Critical Value of Studentized Range= 4.595 Minimum Significant Difference= 2.6339 Tukey Grouping a a b a b c a b c b c c Mean 7.025 6.700 6.050 5.100 4.300 4.000 T 6 4 5 1 2 3
Realizar el anlisis de variancia, prueba de significacin de Duncan y Tukey. Analysis of Variance Procedure Source Model Error Corrected Total Sum of DF Squares 14 9332.1533333 33 3799.9133333 47 13132.0666667 C.V. 56.28013 Mean Square F Value Pr > F 666.5823810 5.79 0.0001 115.1488889 Root MSE 10.730745 A Mean 19.066667
Mean Square F Value Pr > F 821.1701515 7.13 0.0001 99.7605556 0.87 0.4683
Duncan's Multiple Range Test for variable: A NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 33 MSE= 115.1489 Number of Means 2 3 4 5 6 7 Critical Range 15.44 16.23 16.74 17.11 17.39 17.60 Number of Means 8 9 10 11 12 Critical Range 17.78 17.93 18.05 18.15 18.24 Means with the same letter are not significantly different. Duncan Grouping Mean N T A B CB CBD CEBD CEBD CED ED ED ED ED E 52.825 35.025 28.100 23.450 20.950 20.075 11.650 10.475 7.450 7.250 6.725 4.825 4 4 4 4 4 4 4 4 4 4 4 4 4 8 3 2 6 12 1 7 10 5 11 9
Tukey's Studentized Range (HSD) Test NOTE: This test controls the type I experimentwise error rate, but
17
4. DISEO BCA EN ARREGLO FACTORIAL 2 x 2 x 2 Los experimentos factoriales son aquellos experimentos en los que se estudian simultneamente dos o ms factores, esto se diferencia de los experimentos simples en los que se estudia un solo factor. Un experimento factorial consiste en todas las combinaciones de todos los niveles de los factores, este grupo de combinaciones puede ser llamado tratamiento o combinacin de tratamientos. Es importante anotar que los factoriales no son diseos experimentales, sino un arreglo de tratamientos; ellos deben ser llevados en cualquiera de los diseos, como el Completamente Randomizado, Bloque Completo Randomizado o Cuadrado Latino, por lo tanto, nos referimos a DBCA con arreglo factorial 2x3. Los experimentos factoriales se emplean en todos los campos de la investigacin. Son tiles en investigaciones exploratorias en los que poco se sabe acerca de muchos factores. Por ejemplo consideremos un factorial 3 x 2 que consiste de todas las combinaciones de 3 fungicidas y 2 mtodos de aplicacin. El factor fungicida se denotar por A y el mtodo de aplicacin por B. Usando letras minsculas para denotar los niveles de los factores, las seis combinaciones de tratamientos se generan de la siguiente forma: FACTORES: A: Fungicidas Niveles ao a1 a2 B: Mtodos Niveles b1 b2 Tratamientos o Combinaciones a0b1 aob2 a1b1 a1b2
18
La diferencia entre los resultados de los niveles de A son iguales con b1 y b2 en el caso 1, luego no hay interaccin; mientras que en el caso 2, las diferencias entre a1, a2, a3 varan en b1 con respecto a b2 por lo tanto hay interaccin.
no hay interaccin
si hay interaccin
10 8 6 4 2 0 a1 a2 a3 b1 b2
12 10 8 6 4 2 0 a1 a2 a3 b1 b2
Un factor puede usarse para ampliar el alcance de un experimento para otro factor. Por ejemplo en un estudio de densidad de siembra de un cultivo en vez de dar las diferentes densidades de siembra a una variedad, se pueden dar a tres variedades. Las conclusiones se aplicarn a las tres variedades en lugar de una sola. Requieren mayor nmero de unidades experimentales en relacin con los experimentos simples.
DESVENTAJAS -
19
En los experimentos factoriales de dos factores pueden estudiarse los siguientes efectos (diferencias entre niveles):
(A) Efectos principales de los factores; los que estn dados para un factor en
promedio de los niveles del otro factor.
(B) Efectos simples; los que estn dados para un factor en cada uno de los niveles
del otro factor.
(C) Efecto de interaccin; que est dado por la variacin que tiene un efecto simple
de un factor al pasar de un nivel a otro del factor.
(D) Efectos cruzados; que estn dados por las combinaciones cruzadas de los dos
factores. NOTACIN
20
APLICACIN DE ESTADISTICOS EN LA EVALUACION SENSORIAL CON SAS Cuando se tiene dos niveles del factor A y dos niveles del factor B, se tiene un factorial 2 x 2 22. Cuando se tiene tres niveles del factor A y tres niveles del factor B es un factorial 32 (= 9 combinaciones de tratamientos). Los factores se denotan por letras maysculas. Los niveles se denotan por letras minsculas. La combinacin de los tratamientos est dado por el producto de los niveles.
EJEMPLO: En un experimento de 3 variedades de soya (A): a1 planta alta, a2 planta media y a3 planta baja y tres tipos de cantidad de plantas (B): b1 2 plantas cada 20 cm en surcos de 80 cm de ancho, b2 3 plantas cada 20 cm en surcos de 80 cm de ancho y b3 4 plantas cada 20 cm en surcos de 80 cm de ancho, se obtuvieron los siguientes resultados (dcimos de kg): TRATAMIENTOS A2 B1 B2 B3 10 12 13 9 10 11 12 9 9 12 16 17 15 13 14
Bloques I II III IV V B1 9 10 11 11 14
A1 B2 10 13 15 16 15
B3 10 12 12 13 11
B1 6 7 9 12 10
A3 B2 10 12 14 16 14
B3 9 13 16 19 17
Se pide realizar en anlisis de variancia y la prueba de significacin de Duncan para los efectos principales. INTRODUCCION DE DATOS EN SAS Data peso; title "Diseo BCA con arreglo factorial 3 x 3"; options linesize=80 pagesize=60 nodate nonumber; input R A B T; cards; 1 1 1 9 2 1 1 10 3 1 1 11 4 1 1 11 5 1 1 14 1 1 2 10 2 1 2 13 3 1 2 15 4 1 2 16 5 1 2 15 1 1 3 10 2 1 3 12 3 1 3 12 4 1 3 13 5 1 3 11 1 2 1 10
21
R 5 12345 A 3 123 B 3 123 Number of observations in data set = 45 Analysis of Variance Procedure Source Model Error Sum of DF Squares 12 263.42222222 32 93.15555556 Mean Square 21.95185185 2.91111111 F Value Pr > F 7.54 0.0001
23
Mean Square F Value 35.31111111 12.13 0.08888889 0.03 32.95555556 11.32 14.02222222 4.82
Tukey's Studentized Range (HSD) Test for variable: T NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 32 MSE= 2.911111 Critical Value of Studentized Range= 3.475 Minimum Significant Difference= 1.531 Means with the same letter are not significantly different. Tukey Grouping Mean a a a 12.2667 12.1333 12.1333 N A 15 3 15 2 15 1
Tukey's Studentized Range (HSD) Test for variable: T NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 32 MSE= 2.911111 Critical Value of Studentized Range= 3.475 Minimum Significant Difference= 1.531 Means with the same letter are not significantly different. Tukey Grouping a a b Mean 13.0667 13.0000 10.4667 N B 15 3 15 2 15 1
PAUTAS GENERALES PARA DEDUCIR CONCLUSIONES Si es que en un experimento, resulta significativa la interaccin AB, las conclusiones ms importantes sern las que se deduzcan de los efectos simples de A (en los niveles de B) y de los efectos simples de B (en los niveles de A) que lleguen a alcanzar a la significacin (0,05) y a la alta significacin(0,01).
24
La interpretacin de la aceptacin de una u otra hiptesis es la siguiente: Para el factor A: En caso de aceptarse la hiptesis nula, se interpreta como no probada la variabilidad entre los promedios de los tratamientos de este factor; en caso de aceptarse la hiptesis alternativa, quiere decir que hay variabilidad entre los promedios de los tratamientos, o sea diferencia entre a1, a2, ap. Esta prueba no indica, entre cual o cuales de los promedios hay diferencias significativas, por lo que hay que ir a la prueba de Duncan, Tukey u otras para este fin. Para el factor B: La aceptacin de la hiptesis nula indica que no hay variabilidad probada entre los promedios de los tratamientos del factor B, mientras que la aceptacin de la hiptesis alternativa prueba que hay variabilidad, o sea que hay diferencias entre b1, b2, bp. Para la interaccin AB: La aceptacin de la hiptesis nula indica que no hay interaccin entre los tratamientos de los factores A y B, en cambio la aceptacin de la hiptesis alternativa indica la presencia de interaccin entre ambos factores, pero sin aclarar entre que tratamientos de uno y otro factor. FACTORES FIJOS Y AL AZAR El total de niveles existentes o potenciales del primer factor A lo representamos por P, mientras que el total de niveles de este factor incluidos en el experimento lo representamos por p. Si en un estudio destinado a determinar el grado de susceptibilidad de los trabajadores a una determinada enfermedad, y el experimentador est interesado exclusivamente en hacer este estudio en individuos que trabajan en: (1) el campo, (2) fbricas de cemento, (3) minas de cobre, (4) oficinas, y (5) talleres de mecnica, no estando interesado en ningn otro tipo de trabajador, en estas condiciones la poblacin de tipos de trabajadores de tamao P se reduce de acuerdo a este inters a 5. En este caso decimos que el factor tipo de trabajador es Fijo o que pertenece al modelo I. Pero si el investigador est interesado en estudiar si hay variabilidad en la susceptibilidad entre el innumerable nmero de tipos de trabajadores, y estos 5 tipos
25
27
Class Level Information Class Levels Values R 5 12345 A 3 123 B 3 123 Number of observations in data set = 45 Analysis of Variance Procedure Dependent Variable: T Source Model Error Corrected Total Sum of DF Squares 12 263.42222222 32 93.15555556 44 356.57777778 C.V. 14.01075 Mean Square F Value Pr > F 21.95185185 7.54 0.0001 2.91111111 Root MSE 1.7061979 T Mean 12.177778 Pr > F 0.0001 **
28
Tukey's Studentized Range (HSD) Test for variable: T NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 32 MSE= 2.911111 Critical Value of Studentized Range= 3.475 Minimum Significant Difference= 1.531 Means with the same letter are not significantly different. Tukey Grouping a a a Mean 12.2667 12.1333 12.1333 N A 15 3 15 2 15 1
Tukey's Studentized Range (HSD) Test for variable: T NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 32 MSE= 2.911111 Critical Value of Studentized Range= 3.475 Minimum Significant Difference= 1.531 Means with the same letter are not significantly different. Tukey Grouping a a b EFECTOS SIMPLES EFECTOS SIMPLES DE A EN b1 ------------------------------------- B=1 -------------------------------------Class Level Information Class Levels Values Mean 13.0667 13.0000 10.4667 N B 15 3 15 2 15 1
29
T Mean 10.466667
EFECTOS SIMPLES DE A EN b2 ------------------------------------- B=2 -------------------------------------Analysis of Variance Procedure Class Level Information Class Levels Values
R 5 12345 A 3 123 B 1 2 Number of observations in by group = 15 Analysis of Variance Procedure Dependent Variable: T Sum of Source DF Squares Model 2 8.40000000 Error 12 73.60000000 Corrected Total 14 82.00000000 R-Square 0.102439 Source A DF 2 C.V. 19.05044 Anova SS 8.40000000 Mean Square F Value 4.20000000 0.68 6.13333333 Root MSE 2.4765567 Pr > F 0.5229
T Mean 13.000000
EFECTOS SIMPLES DE A EN b3 ------------------------------------- B=3 -------------------------------------Analysis of Variance Procedure Class Level Information
30
R 5 12345 A 3 123 B 1 3 Number of observations in by group = 15 Analysis of Variance Procedure Dependent Variable: T Source Model Error Corrected Total Sum of DF Squares 2 26.13333333 12 102.80000000 14 128.93333333 C.V. 22.39964 Anova SS 26.13333333 Mean Square F Value Pr > F 13.06666667 1.53 0.2569 8.56666667 Root MSE 2.9268869 T Mean 13.066667
EFECTOS SIMPLES DE B EN a1 ------------------------------------- A=1 -------------------------------------Class Level Information Class Levels Values
R 5 12345 A 1 1 B 3 123 Number of observations in by group = 15 Analysis of Variance Procedure Dependent Variable: T Source DF Model 2 Error 12 Corrected Total 14 R-Square 0.341004 Source B DF 2 Sum of Squares 21.73333333 42.00000000 63.73333333 C.V. 15.41892 Anova SS 21.73333333 Mean Square F Value Pr > F 10.86666667 3.10 0.0819 3.50000000 Root MSE 1.8708287 T Mean 12.133333
R 5 12345 A 1 2 B 3 123 Number of observations in by group = 15 Analysis of Variance Procedure Dependent Variable: T Sum of Source DF Squares Model 2 3.73333333 Error 12 88.00000000 Corrected Total 14 91.73333333 R-Square 0.040698 Source B DF 2 C.V. 22.31879 Anova SS 3.73333333 Mean Square F Value Pr > F 1.86666667 0.25 0.7794 7.33333333 Root MSE 2.7080128 T Mean 12.133333
EFECTOS SIMPLES DE B EN a3 ------------------------------------- A=3 -------------------------------------Class Level Information Class Levels Values R 5 12345 A 1 3 B 3 123 Number of observations in by group = 15
Analysis of Variance Procedure Dependent Variable: T Sum of Source DF Squares Model 2 96.53333333 Error 12 104.40000000 Corrected Total 14 200.93333333 R-Square 0.480425 C.V. 24.04546 Mean Square F Value 48.26666667 5.55 8.70000000 Root MSE 2.9495762 Pr > F 0.0197
T Mean 12.266667
32
La prueba de F no es vlida por cuanto no usa el denominador apropiado (Cuadrado medio del error del modelo completo especificado en la primera sentencia MODEL), sino el correspondiente a un modelo con un solo factor. Se debe considerar el cuadrado medio del error total para la prueba de F, como en el cuadro siguiente: ANLISIS DE VARIANCIA DE EFECTOS SIMPLES F. de V. GL Efectos simples de B Entre B en a1 2 Entre B en a2 2 Entre B en a3 2 Error 32 F0,05(2,32) = 3,30 F0,01(2,32) = 5,34 SC 21,733 3,733 96,533 93,156 CM 10,867 1,867 48,267 2,911 Fc 3,733 * 0,641 ns 16,581 **
Hay probadas diferencias significativas del efecto entre los tres tipos de cantidad de plantas en el rendimiento de las variedades uno de soya; asimismo las tres cantidades de plantas tiene efecto altamente significativo en el rendimiento de la variedad 3 de soya. Ejemplo: Anlisis de variancia de un experimento de 23 a1 a2 BLOQUES b1 b2 b1 b2 c1 c2 c1 c2 c1 c2 c1 c2 I 5 5 4 4 6 3 6 9 II 7 10 7 9 7 7 9 10 III 3 5 3 4 6 5 7 9 IV 3 4 4 3 5 3 4 8 V 2 1 2 0 6 2 4 9
RESULTADOS Analysis of Variance Procedure Source R A B C A*B DF 4 1 1 1 1 Sum of Squares 112.00000000 40.00000000 10.00000000 2.50000000 22.50000000 Mean Square F Value Pr > F 28.00000000 19.60 0.0001 ** 40.00000000 28.00 0.0001 ** 10.00000000 7.00 0.0132 * 2.50000000 1.75 0.1966 ns 22.50000000 15.75 0.0005 **
33
R-Square 0.845857
T Mean 5.25000000
Tukey's Studentized Range (HSD) Test for variable: T Alpha= 0.05 df= 28 MSE= 1.428571 Critical Value of Studentized Range= 2.897 Minimum Significant Difference= 0.7742 Tukey Grouping a b Mean 6.2500 4.2500 N A 20 2 20 1
Tukey's Studentized Range (HSD) Test for variable: T Alpha= 0.05 df= 28 MSE= 1.428571 Critical Value of Studentized Range= 2.897 Minimum Significant Difference= 0.7742 Tukey Grouping Mean N B a 5.7500 20 2 b 4.7500 20 1 Tukey's Studentized Range (HSD) Test for variable: T Alpha= 0.05 df= 28 MSE= 1.428571 Critical Value of Studentized Range= 2.897 Minimum Significant Difference= 0.7742 Tukey Grouping Mean N C A 5.5000 20 2 A 5.0000 20 1
ANALISIS DE VARIANCIA DE EFECTOS SIMPLES F. de V. A en c1 A en c2 B en a1 B en a2 Error GL 1 1 1 1 28 SC 20,00 20,00 1,25 3,25 40,00 CM 20,00 20,00 1,25 3,25 1,429 Fc 14,000 * * 14,000 * * 0,875 ns 2,274 ns
34
3.7 REGRESION Y CORRELACION LINEAL SIMPLE Las relaciones entre variables pueden presentarse en cualquiera de los tres casos siguientes: 1. Una variable X puede influir en una variable Y. Ejemplos, el vigor de plantas influye en el rendimiento, el peso de animal vivo influye en el peso de carcasa. 2. Dos variables pueden estar influenciadas entre s. Ejemplos, precio y produccin de un artculo, nubosidad y horas de sol. 3. Dos variables sin estar influenciadas, pueden estar relacionadas entre s, por estar ambas influenciadas por una tercera variable. Ejemplo, el precio del arroz y papas est influenciado por el aumento del costo de vida. Los casos 1 y 2 se estudian por regresin, y el caso 3 por correlacin. La variable que influye sobre otra se denomina variable independiente y se representa por X, mientras que la variable que es influenciada se denomina variable dependiente y se representa por Y. Por la forma de influencia existen los siguientes tipos de regresin: 1. Regresin lineal, cuando las variaciones de la variable independiente pueden provocar variaciones proporcionales en la variable dependiente. La representacin es una lnea recta. 2. Regresin curvilnea, cuando las variaciones de la variable independiente pueden provocar variaciones no proporcionales en la variable dependiente. Por el nmero de variables independientes, se tiene los siguientes tipos de regresin: 1. Regresin simple, si una variable independiente influye sobre la variable dependiente. 2. Regresin mltiple, si ms de una variable influye en la variable dependiente. REGRESIN LINEAL DE X SOBRE Y Si una caracterstica Y depende cuando menos en parte de otra caracterstica X, decimos que son caractersticas concomitantes. El grado de concomitancia o dependencia se mide con la regresin. La regresin es lineal, cuando al variar los valores de la caracterstica independiente, los valores correspondientes a la variable dependiente tienden a variar con alguna proporcionalidad, en este caso la lnea recta puede representar bastante bien la posicin de todos los puntos fijados. An as, es recomendable comenzar todo estudio de regresin con un diagrama de puntos, que nos de una idea que existe o no regresin, y si esta es lineal o curvilnea. CLCULOS DE LA REGRESIN. 1. Coeficiente de regresin, b:
b=
XY
( X )( Y ) SP XY n = 2 ( X ) SC X x2 n
donde: b: coeficiente de regresin. X : representa los valores de la variable independiente Y: representa los valores de la variable dependiente.
35
34 32
Rendimiento
30 28 26 24 22 20 20 22 24 26 28 30
Precipitacin pluvial
y = 11,083 + 0,71667X
Las caractersticas de la lnea de regresin son: 1. La lnea de regresin es vlida dentro de los valores observados de X. 2. La suma algebraica de las desviaciones de Y con respecto a la lnea de regresin es cero. 3. La lnea de regresin corta al eje de ordenadas Y, a una distancia del origen cero de este eje igual a a MODELO ADITIVO DE LA REGRESIN LINEAL Yi = + Xi + i Donde: = intercepto (interseccin de la lnea de regresin con el eje Y) = coeficiente de regresin (pendiente de la lnea de regresin) Yi = estimacin de la i-sima observacin de la variable independiente. Xi = la i-sima observacin de la variable independiente. i = error aleatorio de la i-sima observacin ANLISIS DE VARIANCIA DE LA REGRESIN
36
SC regresin
SCTotal = y 2
( y) 2
n
Mediante la prueba de F correspondiente al anlisis de la variancia anterior (ANAVARE), se realiza la siguiente prueba de hiptesis sobre la pendiente de la lnea de regresin:
Ho: = 0 Ha: 0 La conclusin a la que se arriba es que podemos afirmar con un nivel de significacin de 0,05, que existe una relacin lineal significativa entre las variables en estudio. 9.3 CORRELACIN LINEAL
Por medio de la correlacin se puede estudiar el grado de asociacin entre dos variables, es el caso de variables, que estn relacionadas, sin que se pueda considerar que una dependa de la otra, sino que ambas dependen de un factor ajeno.
MEDIDA DE LA CORRELACIN
r=
xy x2 n
( x) 2 x y 2 ( y) 2
n
x y n
CARACTERSTICAS DEL COEFICIENTE DE CORRELACIN 1. Los coeficientes son nmero abstractos. 2. El valor de estos coeficientes no puede ser mayor de +1, menor de 1. 3. Si el coeficiente tiene signo positivo, quiere decir que las caractersticas tienden a variar en el mismo sentido. Si el signo es negativo, quiere decir que las caractersticas varan en sentido contrario. 4. La relacin entre las variables en general, es tanto ms estrecha, cuanto el valor del coeficiente de correlacin se acerca a +1 1. 5. Si la relacin es perfecta, el valor de r ser igual a +1 1, segn sea positiva o negativa la relacin. COEFICIENTE DE DETERMINACIN r2 = Coeficiente de determinacin; mide la proporcin de la variacin existente en Y que es explicada por las variaciones de X. 1-r2 = Coeficiente de no determinacin; mide la proporcin de la variacin existente en Y que no es explicada por la variacin de X. EJEMPLO:
37
INTRODUCCION DE DATOS EN SAS data regre; title "Regresin lineal simple"; options linesize=80 pagesize=60 nodate nonumber; input x y; cards; 247 1235 250 1250 235 1175 242 1210 227 1135 236 1178 261 1316 270 1356 234 1168 225 1120 ; proc reg; model y=x; run; REG usa el mtodo de los mnimos cuadrados para obtener los estimadores. MODEL especifica las variables dependientes e independientes en el modelo de regresin lineal. PROC REG invoca el procedimiento que permite realizar la regresin entre las variables especificadas en la sentencia MODEL. RESULTADOS EN SAS Regresin lineal simple Model: MODEL1 Dependent Variable: Y Analysis of Variance
38
0.9989 0.9987
Parameter Estimates Variable DF Parameter Estimate Standard T for H0: Error Parameter=0 -4.021 83.771 Prob > |T| 0.0038 0.0001
INTERCEP 1 X 1
La prueba de F del anlisis de variancia de la regresin se realiza con la siguiente hiptesis: Ho: = 0 Ha: 0 Como Prob > F = 0,0001, es menor que el nivel de significacin = 0,01, se rechaza la Ho y se acepta Ha. Se concluye que, podemos afirmar que existe regresin lineal altamente significativa entre las variables X e Y. El coeficiente de determinacin R-square = 0,9989 se interpreta como que el 99,89% de la variacin de Y es explicada por X. La ecuacin de regresin estimada es: Y = -61,334073 + 5,256012 (X) El error estndar de la estimacin es una medida de la dispersin de los valores observados alrededor de la ecuacin de regresin. El valor calculado de la prueba de t, corresponde a las hiptesis Ha: = 0 y Ha: = 0, respectivamente. EJERCICIO Precipitacin pluvial (X) y rendimiento de trigo (y) de una zona agrcola durante 10 aos. X: Precipitacin pluvial (mm) 23 21 28 27 23 28 27 22 Y: Rendimiento de trigo (kg/parcela) 26 25 29 27 27 32 33 28
39
ANLISIS DE VARIANCIA DE LA REGRESIN LINEAL SIMPLE F. de V. Regresin Error Total G.L. 1 8 9 S.C. 30,816 45,184 76,00 C.M. 30,817 5,648 Fc. 5,456 Pro > F 0,0477 *
Al hacer los clculos con los datos del ejercicio de la regresin lineal simple se tiene r = 0,6368. Este valor se compara con las tablas, con grados de libertad (n-2):
R calculado 0,6368 R tablas 0,05 0,632 0,01 0,769 SIGNIFICACIN *
Asumimos que existe una correlacin lineal entre ambas variables. 3.10 EXPERIMENTOS REPETIDOS Los siguientes datos corresponden a un experimento repetido en 2 estaciones experimentales conducido en un diseo de bloques completos al azar con 5 variedades de trigo (tratamientos) y 4 bloques. Los resultados estn expresados en rendimiento en kg/parcela. Bloque I II III IV Estacin 1 T2 T3 T4 13,4 15,8 14,6 15,3 14,2 16,3 17,2 16,5 15,3 15,2 13,5 15,2 Estacin 2 T3 15,6 13,5 15,4 14,3
Introduccin de datos en SAS: Data peso; Title BCR en aos; Options nodate; Input L T B Y; cards; 1 1 1 12.5 1 1 2 12.5 1 1 3 15.2 1 1 4 12.2 1 2 1 13.4 1 2 2 15.3 1 2 3 17.2 1 2 4 15.2 1 3 1 15.8
40
Number of observations in data set = 40 ANVA Source Model Error Corrected Total DF 15 24 39 Sum of Squares 46.40075000 40.49900000 86.89975000 C.V. 9.053996 Mean Square F Value Pr > F 3.09338333 1.83 0.0898 1.68745833 Root MSE 1.29902207 Y Mean 14.34750000
42
R-Square 0.533957
Tests of Hypotheses using the Anova MS for L*T as an error term Source T DF 4 Anova SS 4.47350000 Mean Square F Value Pr > F 1.11837500 0.22 0.9143
Number of observations in by group = 20 --------------------------------------------- L=1 --------------------------------------------ANVA Source Model Error Corrected Total DF 7 12 19 Sum of Squares 23.85750000 20.85200000 44.70950000 C.V. 8.964338 Anova SS 10.20550000 13.65200000 Mean Square F Value Pr > F 3.40821429 1.96 0.1457 1.73766667 Root MSE 1.31820585 Y Mean 14.70500000
Mean Square F Value Pr > F 3.40183333 1.96 0.1743 3.41300000 1.96 0.1644
Number of observations in by group = 20 --------------------------------------------- L=2 --------------------------------------------ANVA Source DF Sum of Squares Mean Square F Value Pr > F
43
Y Mean 13.99000000
Mean Square F Value Pr > F 2.08600000 1.27 0.3275 2.79325000 1.71 0.2131
ANVA - Localidad 1 F. de V. Bloques Variedades Error Total GL 3 4 12 19 SC 10,2055 13,6520 20,8520 44,7095 CM 3,401833 3,413000 1,737600 Fc 1,96 1,96 Prob > F 0,1743 ns 0,1644 ns
ANVA - Localidad 2 F. de V. Bloques Variedades Error Total GL 3 4 12 19 SC 6,25800 11,17300 19,64700 37,0780 CM 2,086000 2,793250 1,637200 Fc 1,27 1,71 Prob > F 0,3275 ns 0,2131 ns
ANVA COMBINADO F. de V. Bloques (L) L T L*T Error Total GL 6 1 4 4 24 39 SC 16,4635 5,11225 4,47635 20,3515 40,4990 86,8997 CM 2,74391 5,11225 1,11837 5,08780 1,68745 Fc 1,63 3,03 0,22 3,02 Prob > F 0,1832 ns 0,0946 ns 0,6239 ns 0,0379 *
Segn el ANVA de cada localidad no se han encontrado diferencias estadsticas significativas entre los rendimientos promedio de las variedades en estudio en ninguna de las localidades. Sin embargo, en el ANVA combinado se ha encontrado un efecto de interaccin de las localidades sobre el rendimiento promedio de las variedades.
44
BIBLIOGRAFA
1. Crdova Z., M. 2002. Estadstica Inferencial. Aplicaciones. Segunda edicin.
Lima, Per. 2. Muoz Berrocal, M. 1996. Diseos Experimentales. Universidad Nacional Agraria de la Selva. Facultad de Zootecnia. Departamento Acadmico de Ciencia Animal. Tingo Mara, Per. 100 pp. Salinas Flores, Jess y Luis Daza Portocarrero. 1996. Manual del SAS para PC`S. UNALM. Facultad de Economa y Planificacin. Departamento de Estadstica e Informtica. Lima, Per. 113 pp. SAS INSTITUTE. 2004. SAS User`s Guide. 5234 p. Steel, R.G. y J.H. Torrie. 1980. Bioestadstica: Principios y Procedimientos. Segunda edicin. McGraw-Hill. Bogot, Colombia. 621 pp.
3.
4.
5.
45
2 004
CONTENIDO
Pgina 1. INTRODUCCIN .................................................................................. 2. CARACTERSTICAS DEL SISTEMA .................................................... 3. ANLISIS DE DATOS .......................................................................... 3.1 DISEO COMPLETO AL AZAR (DCA) .............................................. 3.2 DISEO DE BLOQUE COMPLETO AL AZAR (DBCA) ...................... 3.3 DISEO JERRQUICO CON IGUAL NUMERO DE SUBMUESTRAS 3.4 CUADRADO LATINO ......................................................................... 3.5 ARREGLOS FACTORIALES............................................................... 3.6 PARCELAS DIVIDIDAS ..................................................................... 3.7 REGRESIN Y CORRELACIN LINEAL SIMPLE............................. 3.8 REGRESIN MLTIPLE ................................................................... 3.9 REGRESIN POLINOMIAL ............................................................... 3.10 EXPERIMENTOS REPETIDOS ........................................................ 3.11 TRANSFORMACIN DE DATOS ..................................................... 1 1 3 3 7 10 12 14 23 25 27 29 31 34
47