Experimentos I. DCA ij i ij e u Y Donde y, denota la j-sima observacin del i-simo grupo en tratamiento; p, es la media de la i-sima poblacin en tratamiento, y e, es el error experimental. ste es un modelo estadstico lineal para la clasificacin de tratamientos de un factor, en un diseo de experimentos totalmente aleatorizado. El modelo tiene cierta tolerancia para la variacin entre las observaciones de un grupo de tratamiento dado. Debido al error experimental, cada observacin se desva de la media de su poblacin p, en una cantidad e,. La varianza del error experimental u2 es la varianza de e,, y se supone que es la misma para toda la poblacin en tratamiento. `..|'' : Se realiz un estudio de ingeniera de trnsito sobre los retrasos en las intersecciones con semforos en las calles de una ciudad. Se usaron tres tipos de semforo: 1) programado, 2) semiactivado y 3) activado. Se usaron cinco intersecciones para cada tipo de semforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehculo permanece detenido en cada interseccin (segundos/vehculo). Los datos son los siguientes: Programado Semiactivado Activado 36.6 17.5 15 39.2 20.6 10.4 30.4 18.7 18.9 37.1 25.7 10.5 34.1 22 15.2 a. Escriba el modelo lineal estadstico para este estudio y explique sus componentes. ij i ij e u Y i u = media del tipo de semforo, ij e = error experimental b. Establezca las suposiciones necesarias para un anlisis de varianza de los datos. ij e Aleatorio, independiente con media 0 y varianza igual para todos los semforos Autor: 2 c. Calcule el anlisis de varianza. Sintaxis SAS: data dbca; input tipo $ rpta; cards; programado 36.6 programado 39.2 programado 30.4 programado 37.1 programado 34.1 semiactivado 17.5 semiactivado 20.6 semiactivado 18.7 semiactivado 25.7 semiactivado 22 activado 15 activado 10.4 activado 18.9 activado 10.5 activado 15.2 ; proc glm; class tipo ; model rpta=tipo; means tipo/tukey; means tipo/duncan; run; Source DF Sum of Squares Mean Square F Value Pr > F Model 2 1202.628000 601.314000 52.35 <.0001 Error 12 137.828000 11.485667 Corrected Total 14 1340.456000 R-Square Coeff Var Root MSE rpta Mean 0.897178 14.44608 3.389051 23.46000 Como Pueden apreciar el P-value es menor a 0.05 entonces rechazamos la hiptesis nula, en otras palabras los tratamientos producen diferentes tiempos, existe efecto de los tratamientos sobre el tiempo promedio de retraso. Como bien saben el R 2 es un indicador de cmo el modelo se justifica es decir de que medida de que este valor es cercano al 100% mejor ser, existen casos en donde es llamativamente bajo, es ah quizs en donde no se cumplen los supuestos del modelo. Autor: 3 d. Pruebe la hiptesis de que no hay diferencia entre las medias de retraso para los tipos de semforo; a un nivel de significacin de .05. Means with the same letter are not significantly different. Tukey Grouping Mean N tipo A 35.480 5 programa B 20.900 5 semiacti C 14.000 5 activado PP18 4NFP18P1t Qu mtodo de comparacin debe usarse? Si bien es cierto que se reporta un buen desempeo en la deteccin de diferencias reales con la prueba de rango de Duncan, este no incluye el ndice de error del experimento, debido a que TUKEY si lo efecta o incluye mucho prefieren su uso. Contrastes: Sirven para hacer comparaciones mltiples entre los distintos tratamientos por ejm: Programado vs activado: contrast "programado vs activado" tipo 1 0 -1; Contrast DF Contrast SS Mean Square F Value Pr > F programado vs activado 1 119.0250000 119.0250000 10.36 0.0074 Por medio de esta Prueba: se pueden observar si existen de manera interna diferencias entre los tratamientos, como se vio inicialmente el P value nos deca que si existan diferencias entre los tratamientos, y con estas prueba reafirmamos eso. (El modo de proceder de esta prueba es la siguiente: si se le asigna letras diferentes, entonces sern los diferentes los tratamientos, si tuviesen letras iguales, son tratamientos similares, que producirn el mismo efecto. Como vemos el P-value es menor a 0.05, entonces rechazamos la hiptesis que indica la igualdad, en otras palabras existe una diferencia entre los tratamientos planteado en este caso programado y activado. Autor: 4 Z. D8CA ij j j ij e p t u Y Donde p es la media general, z, es el efecto del tratamiento y e,es el error experimental. El efecto del bloque p, representa la desviacin promedio de las unidades en el bloque j a partir de la media general. Se supone que los efectos del tratamiento y del bloque son aditivos, Aditividad significa que no existe interaccin entre tratamientos y bloques; tambin se supone que los errores experimentales son independientes, con medias cero y varianza comn d. La suposicin de independencia se justifica a travs de la asignacin aleatoria de los tratamientos a las unidades experimentales. `..|'' .: Se quiere evaluar si las concentraciones de Cianuro manipuladas por los operarios tienen el mismo resultado, se sospecha que los operarios del mismo nivel (puede ser: 1, 2,3 4) no tienen el mismo rendimiento con respecto a los resultados esperados de las concentraciones, por lo que el investigador decide hacer un Diseo de Bloques Completos al Azar (se escoge a 4 operarios, uno de cada nivel y se les hace manipular los 3 tipos de concentraciones de cianuro). Con ste diseo se espera reducir en gran parte la variabilidad causada digamos por la mala capacitacin del personal. a. Escriba el modelo lineal estadstico para este estudio y explique sus componentes. ij j i ij e p t u Y u: es el efecto de la media global , Ti:es el efecto del i-esimo tratamiento y Pj es el efecto del j-esimo bloque. Operario concentracin op1 op2 op3 op4 c1 35,32,40 37,32,40 27,26,28 31,37,40 c2 31,40,42 40,42,41 26,32,31 41,47,30 c3 42,35,30 35,37,40 25,27,30 26,35,40 Autor: 5 b. Calcule el anlisis de varianza. Sintaxis SAS: data dbca; input cc $ op $ rpta; cards; c1 oper-3 27 c1 oper-3 26 c1 oper-3 28 c3 oper-3 25 c3 oper-3 27 c3 oper-3 30 c2 oper-3 26 c2 oper-3 32 c2 oper-3 31 c2 oper-2 40 c2 oper-2 42 c2 oper-2 41 c3 oper-2 35 c3 oper-2 37 c3 oper-2 40 c1 oper-2 37 c1 oper-2 32 c1 oper-2 40 c3 oper-4 26 c3 oper-4 35 c3 oper-4 40 c1 oper-4 31 c1 oper-4 37 c1 oper-4 40 c2 oper-4 41 c2 oper-4 47 c2 oper-4 30 c2 oper-1 31 c2 oper-1 40 c2 oper-1 42 c3 oper-1 42 c3 oper-1 35 c3 oper-1 30 c1 oper-1 35 c1 oper-1 32 c1 oper-1 40 ; proc glm; class cc op; model rpta=cc op; means op/Tukey; means cc/Tukey; run; Source DF Sum of Squares Mean Square F Value Pr > F Model 5 650.722222 130.144444 6.89 0.0002 Error 30 566.500000 18.883333 Corrected Total 35 1217.222222 Autor: 6 Source DF Type I SS Mean Square F Value Pr > F cc 2 87.0555556 43.5277778 2.31 0.1172 op 3 563.6666667 187.8888889 9.95 0.0001 PP18: Los diseos por bloques mejorarn mucho la precisin de las estimaciones de las medias de tratamiento si la reduccin del SC error con el uso de bloques es sustancial, reduccin que se puede eliminar si se reducen los grados de libertad, ya que r - 1 de los grados de libertad deben asignarse al SC bloques. Means with the same letter are not significantly different. Tukey Grouping Mean N op A 38.222 9 oper-2 A A 36.333 9 oper-1 A A 36.333 9 oper-4 B 28.000 9 oper-3 Al ver que no existan diferencias entre las concentraciones de cianuro resulta ms interesante ver las diferencias entre los operarios y vemos que efectivamente hay diferencias pero tambin existe similitud entre los operarios 2,1 y 4, adems estos son diferentes del operario 3. Si bien es cierto que el DCA nos basamos en este cuadro, en el DBCA ya no lo haremos debido a que ahora estamos en presencia de 2 factores que son los tratamientos y los bloques, se desdobla este cuadro en 2, pero de todos modos lo que se puede apreciar del cuadro anterior es el rechazo de la hiptesis nula La interpretacin que podemos obtener de los factores seria: Para el caso de las concentraciones de cianuro (tratamientos) se ve que se acepta la hiptesis nula es decir que no existe un efecto de las concentraciones en las observaciones. Pero en el caso de los operarios (bloques) se observa el rechazo de la hiptesis nula es decir que hay un efecto de los operarios en las observaciones. Autor: 7 Contrast DF Contrast SS Mean Square F Value Pr > F op3 vs op1,2y4 1 542.2592593 542.2592593 28.72 <.0001 Otra manera de ver lo antes ya explicado es por medio de contrastes: contrast "op3 vs op1,2y4" op -1 -1 3 -1; Autor: 8 3. LATIMO El modelo estadstico lineal para un experimento con t tratamientos en un diseo de cuadrado latino de t X t es: Donde y, es la observacin de la unidad experimental en el i-simo rengln y la j-sima columna del diseo. Los efectos respectivos de rengln y columna son p, y v; rk es el efecto del k-simo tratamiento, y las e, son errores experimentales independientes aleatorios con media O y varianza $. Se supone que no hay interaccin entre los tratamientos y las columnas y renglones. La notacin para los totales y las medias de las observaciones para renglones y columnas siguen la convencin usual con y,, = y, para el total de un rengln y y, = Yy,, para el total de una columna. El total del tratamiento estar representado como y,, que implica un suma de observaciones sobre las t unidades experimentales que reciben el tratamiento k. De la misma manera, Yk representar la media de Las observaciones en el k-simo tratamiento. `..|'' J: En la tabla se muestran las observaciones junto con las medias de rengln, columna y tratamiento en un arreglo de cuadrado latino. Los datos se refieren a la cosecha de grano para cada grfica en cientos de libras por acre. Tabla: Cosecha de grano de una variedad de trigo para cinco tasas de siembra en un diseo de cuadrado latino [etiqueta de tratamiento (A, B, C, D o E) en los parntesis enseguida del valor de la cosecha. a. Calcule el anlisis de varianza Sintaxis SAS: data dbca; input renglon $ columna $ trat $ rpta; cards; 1 1 e 59.45 1 2 a 47.28 1 3 c 54.44 1 4 b 50.14 Autor: 9 1 5 d 59.45 2 1 c 55.16 2 2 d 60.89 2 3 b 56.59 2 4 e 60.17 2 5 a 48.71 3 1 b 44.41 3 2 c 53.72 3 3 d 55.87 3 4 a 47.99 3 5 e 59.45 4 1 a 42.26 4 2 b 50.14 4 3 e 55.87 4 4 d 58.74 4 5 c 55.87 5 1 d 60.89 5 2 e 59.45 5 3 a 49.43 5 4 c 59.45 5 5 b 57.31 ; proc glm; class renglon columna trat; model rpta=renglon columna trat; means renglon/tukey; means trat/tukey; run; Source DF Sum of Squares Mean Square F Value Pr > F Model 12 659.9813120 54.9984427 11.65 <.0001 Error 12 56.6309120 4.7192427 Corrected Total 24 716.6122240 Al igual que en el caso de los bloques nuestro inters se centrara en el siguiente cuadro, sin dejar de lado que en este ultimo se observa el rechazo de la hiptesis nula a nivel general. Autor: 10 Source DF Type I SS Mean Square F Value Pr > F renglon 4 99.2035040 24.8008760 5.26 0.0111 columna 4 38.4808240 9.6202060 2.04 0.1527 trat 4 522.2969840 130.5742460 27.67 <.0001 Para el caso del rengln: Means with the same letter are not significantly different. Tukey Grouping Mean N renglon A 57.306 5 5 A B A 56.304 5 2 B A B A 54.152 5 1 B B 52.576 5 4 B B 52.288 5 3 Lo que podemos apreciar es que para el caso de los renglones el P-value es menor a 0.05 es decir que se rechaza la hiptesis nula en trminos del problema el factor rengln si produce efectos sobre la cosecha, para el efecto columna se aprecia lo contrario es decir que factor columna no produce efectos sobre la cosecha, en cambio el factor tratamiento si produce efectos sobre la cosecha. Lo que apreciamos por medio de Tukey es que los renglones 5, 2 y 1 son similares pero tambin lo son 2, 1, 4 y 3. Autor: 11 Para el caso del tratamiento: Means with the same letter are not significantly different. Tukey Grouping Mean N trat A 59.168 5 d A A 58.878 5 e A B A 55.728 5 c B B 51.718 5 b C 47.134 5 a Lo que apreciamos por medio de Tukey es los tratamientos d, e y c son similares pero tambin lo son c y b, se puede apreciar tambin que solo uno es totalmente diferente y es el tratamiento a. Autor: 12 4. FACTOPIAL ijk ij j i ijk e tb b t u Y ) ( Donde u es el promedio general, t es del efecto de factor A, b es el efecto del factor B, (tb) es el efecto de la interaccin. Suposiciones: - existe igualdad entre los tratamientos ... 2 1 t t - existe igualdad entre los tratamientos de los factores A ... 2 1 b b - existe igualdad entre los interacciones ... tb tb `..|'' : Los depsitos de sal se acumulan en los suelos irrigados para cultivos agrcolas y de horticultura. Con el paso del tiempo, la creciente salinidad del suelo impide el desarrollo de las plantas y disminuye las cosechas. Hiptesis de investigacin: Un investigador plante la hiptesis de que la exposicin de las plantas a elevadas cantidades de sales en su medio inhibe el consumo de agua y nutrientes de la planta, lo que impide su crecimiento y desarrollo. Se llev a cabo un experimento con plantas de cebada para medir el efecto del aumento de la salinidad en la cantidad de agua consumida por las plantas. Diseo del tratamiento: Se us un arreglo factorial con "salinidad del medio" y "edad de la planta" en das, como los dos factores. Las plantas se cultivaron en soluciones de nutrientes con 3 niveles de salinidad que expresados como unidades de presin osmtica, fueron de 0,6 y 12 barios y se cosecharon a los 14,21 y 28 das. Diseo del experimento: Cada una de las nueve combinaciones de tratamiento, de salinidad con das, se asign a dos contenedores rplica en un diseo totalmente aleatorizado, los contenedores se colocaron en un cmara de cultivo en un arreglo al azar. Autor: 13 a. calcule el analisis de varianza Sintaxis SAS: data dbca; input dias $ salinidad $ rpta; cards; 14 0 2.2 14 0 3.3 14 6 3.7 14 6 4.5 14 12 2.8 14 12 3.4 21 0 5 21 0 5.7 21 6 5.9 21 6 7.2 21 12 4.5 21 12 5.9 28 0 13.2 28 0 12.4 28 6 9.4 28 6 11 28 12 7.6 28 12 8.3 ; proc glm; class dias salinidad; model rpta=dias salinidad dias*salinidad; run; Source DF Sum of Squares Mean Square F Value Pr > F Model 8 179.7044444 22.4630556 40.27 <.0001 Error 9 5.0200000 0.5577778 Corrected Total 17 184.7244444 Source DF Type I SS Mean Square F Value Pr > F dias 2 151.9877778 75.9938889 136.24 <.0001 salinidad 2 9.5077778 4.7538889 8.52 0.0084 dias*salinidad 4 18.2088889 4.5522222 8.16 0.0046 Autor: 14 Para observar la respuesta Optima: A diferencia de los anteriores modelos si bien es cierto que el anlisis de varianza es til para este caso solo nos servir para observar las significancias de los factores ya que ahora lo que se busca es la mejor respuesta basada en que factor o en que interaccin es por esa razn que usaremos una serie de grficos que nos dirn en que nivel se logra la mejor respuesta aun as vemos que: Existe un efecto de los das sobre el consumo de agua, tambin existe un efecto por parte de la salinidad y de la interaccin de estos mismos factores. Autor: 15 Resultado efectos principales: Es en este nivel donde se logra un mayor consumo de agua en nivel 28 de das. Es en este nivel donde se logra un mayor consumo de agua en nivel 0 de salinidad Autor: 16 `..|'' :: Los investigadores desean conocer como influyen la temperatura y salinidad del agua y la densidad de poblacin del camarn en la tasa de crecimiento de los camarones cultivados en acuarios y si estos factores actan independientemente sobre la poblacin. Diseo del tratamiento: Se us un arreglo factorial con tres factores: "temperatura" (25"C, 35C); "salinidad del agua (lo%, 25%, 40%), y "densidad" de camarones en el acuario (80 camarones140 litros, 160 camarones140 litros). Se consider que si el factor influa en el crecimiento de los camarones stos niveles tenan las posibilidades ms altas de mostrar efectos. Diseo del experimento: El diseo del experimento consisti en tres acuarios rplica para cada una de las 12 combinaciones de tratamiento del factorial 2 x 2 X 3, cada combinacin se asign al azar a tres acuarios en un diseo totalmente aleatorizado. y al principio de la prueba se pusieron camarones en etapa postlarvaria en los 36 acuarios. En la tabla 6.13 se muestra el aumento de peso por camarn en cuatro semanas para cada acuario. Aqu tenemos el grafico de interacciones y vemos en donde se produce el mayor consumo de agua que se da en el nivel de salinidad 0 y en el nivel de das 28. Autor: 17 a. calcule el anlisis de varianza Sintaxis SAS: data dbca; input t $ D $ S $ rpta; cards; 25 80 10 86 25 80 10 52 25 80 10 73 25 80 25 544 25 80 25 371 25 80 25 482 25 80 40 390 25 80 40 290 25 80 40 397 25 160 10 53 25 160 10 73 25 160 10 86 25 160 25 393 25 160 25 398 25 160 25 208 25 160 40 249 25 160 40 265 25 160 40 243 35 80 10 439 35 80 10 436 35 80 10 349 35 80 25 249 35 80 25 245 35 80 25 330 35 80 40 247 35 80 40 277 35 80 40 205 35 160 10 324 Autor: 18 35 160 10 305 35 160 10 364 35 160 25 352 35 160 25 267 35 160 25 316 35 160 40 188 35 160 40 223 35 160 40 281 ; proc glm; class T D S ; model rpta=T D S T*D T*S D*S; run; Source DF Sum of Squares Mean Square F Value Pr > F Model 9 443597.9444 49288.6605 13.67 <.0001 Error 26 93729.0556 3604.9637 Corrected Total 35 537327.0000 Source DF Type I SS Mean Square F Value Pr > F t 1 15376.0000 15376.0000 4.27 0.0490 D 1 21218.7778 21218.7778 5.89 0.0225 S 2 96762.5000 48381.2500 13.42 <.0001 t*D 1 8711.1111 8711.1111 2.42 0.1322 t*S 2 300855.1667 150427.5833 41.73 <.0001 D*S 2 674.3889 337.1944 0.09 0.9110 Para este caso el anlisis de varianza solo nos servir para observar las significancias de los factores ya que ahora lo que se busca es la mejor respuesta basada en que factor o en que interaccin es por esa razn que usaremos una serie de grficos que nos dirn en que nivel se logra la mejor respuesta aun as vemos que: Existe un efecto de la temperatura sobre el aumento de peso, tambin existe un efecto por parte de la densidad y por parte de la salinidad, se observa tambin que existe un efecto de la interaccione entre la temperatura y la salinidad mas no en las interaccin de temperatura densidad y densidad salinidad. Autor: 19 Resultados efectos Principales Lo que se quiere mostrar como se logra el mayor aumento de peso en los distintos niveles, en la temperatura se logra a nivel de 35 en la densidad a nivel de 100 y en la salinidad a nivel de 350. Autor: 20 Resultados Interacciones: Se logra el mayor aumento de peso cuando estamos en temperatura 35 y densidad 80 Se logra el mayor aumento de peso cuando estamos en temperatura 25 y salinidad 25 Autor: 21 b. AMCOVA EL enunciado y la data del problema se encuentran en el documento PDF. Que les envo. Sintaxis SAS: data ancova; input trat $ bloq $ pi pf ; cards; 1 1 20.4 24.6 2 1 27.2 32.6 3 1 26.8 31.7 4 1 22.4 29.1 5 1 21.8 27.0 1 2 19.6 23.4 2 2 32.0 36.6 3 2 26.5 30.7 4 2 23.2 28.9 5 2 24.3 30.5 1 3 25.1 30.3 2 3 33.0 37.7 3 3 26.8 30.4 4 3 28.6 35.2 5 3 30.3 36.4 1 4 18.1 21.8 2 4 26.8 31.0 3 4 28.6 33.8 4 4 24.4 30.2 5 4 29.3 35.0 ; proc glm; class trat bloq ; model pf=trat bloq pi/solution; run; La respectiva interpretacin tambin se encuentra en ese documento.