4.1. Definiciones. Experimento, material experimental, repeticin y error experimental.
Experimento: Prueba o series de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso (los factores que se estudian) o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.
Error experimental: Describe la situacin de no llegar a resultados idnticos con dos unidades experimentales tratadas de igual forma y refleja: (a) errores de experimentacin, (b) errores de observacin, (c) errores de medicin, (d) variacin del material experimental (esto es, entre unidades experimentales), (e) efectos combinados de factores extraos que pudieran influir las caractersticas en estudio, pero respecto a los cuales no se ha llamado la atencin en la investigacin.
4.2. Diseo experimental, Consideraciones fundamentales para su seleccin y aplicacin. Objetivos de un diseo de experimento Proporcionar la mxima cantidad de informacin pertinente al problema bajo investigacin. El diseo, plan o programa debe ser tan simple como sea posible. Proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca de una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material disponible mediante mtodos que permitan disminuir el error experimental. Principios bsicos del diseo de experimentos Repeticin: Viene a ser la reproduccin o rplica del experimento bsico (asignacin de un tratamiento a una unidad experimental). Las principales razones por las cuales es deseable la repeticin son: primero por que proporciona una estimacin del error experimental, siendo tal estimacin confiable a medida que aumenta el nmero de repeticiones, y segundo permite estimaciones ms precisas del tratamiento en estudio. Aleatorizacin: Asignacin al azar de tratamiento a las unidades experimentales. Una suposicin frecuente en los modelos estadsticos de un diseo de experimentos es que: las observaciones o los errores estn distribuidos independientemente, la aleatorizacin hace vlida esta suposicin. Control: Local: Cantidad de balanceo, bloqueo y agrupamiento de las unidades experimentales que se emplean en el diseo estadstico de un experimento. Etapas de un diseo de experimentos a. Enunciado o planteamiento del problema. b. Formulacin de hiptesis. c. Proposicin de la tcnica experimental y el diseo.
d. Examen de sucesos posibles y referencias en que se basan las razones para la indagacin que asegure que el experimento proporcionar la informacin requerida y en la extensin adecuada. e. Consideracin de los posibles resultados desde el punto de vista de los procedimientos estadsticos que se aplicarn, para asegurar que se satisfagan las condiciones necesarias y sean vlidos estos procedimientos. f. Ejecucin del experimento. g. Aplicacin de las tcnicas estadsticas a los resultados experimentales. h. Extraccin de conclusiones con medidas de la confiabilidad de las estimaciones generadas. i. Valoracin de la investigacin completa y contrastacin con otras investigaciones del mismo problema o similares.
4.3. Anlisis de varianza ANOVA. Prueba de supuestos que fundamenta el ANOVA. El anlisis de la varianza, ANOVA 11.1 surge como una generalizacin del contraste para dos medias de la de Student, cuando el nmero de muestras a contrastar es mayor que dos.
Por ejemplo, supongamos que tenemos 3 muestras de diferentes tamaos que suponemos que provienen de tres poblaciones normales con la misma varianza:
Si queremos realizar el contraste podramos en plantearnos como primer mtodo el fijar una
cantidad prxima a cero y realizar los contrastes siguientes con como nivel de significacin:
De modo que se aceptara H 1 y se rechazara H 0 slo si alguna de las hiptesis alternativas H 1 ', H 1 '' H 1 ''' es aceptada y rechazada su correspondiente hiptesis nula. El error de tipo I para este contraste es:
Por ello el nivel de significacin obtenido para este contraste sobre la igualdad de medias de tres muestras no es como hubisemos esperado obtener inicialmente, sino . Por ejemplo, si tomamos un nivel de significacin para cada uno de los contrastes de igualdad de dos medias, se obtendra que el nivel de significacin (error de tipo I) para el contraste de las tres medias es de 1-0,9 3 =0,27, lo que es una cantidad muy alta para lo que acostumbramos a usar.
En consecuencia, no es adecuado realizar el contraste de igualdad de medias de varias muestras mediante una multitud de contrastes de igualdad de medias de dos muestras.
Una tcnica que nos permite realizar el contraste de modo conveniente es la que exponemos en este captulo y que se denomina anlisis de la varianza.
ANOVA con un factor
Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) en el que la variable analizada la hacemos depender de un slo factor de tal manera que las causas de su variabilidad son englobadas en una componente aleatoria que se denomina error experimental:
Vamos a exponer esto con ms claridad. Consideremos una variable sobre la que acta un factor que puede presentarse bajo un determinado nmero de niveles, t. Por ejemplo podemos considerar un frmaco que se administra a t=3 grupos de personas y se les realiza cierta medicin del efecto causado:
Resultado de la medicin Gripe (nivel 1) 5 3 2 5 4 3
Apendicitis (nivel 2) 8 9 6 7 8 9 10 8 10
Sanos (nivel 3) 2 3 2 1 2 3 2
En este caso los factores que influyen en las observaciones son tres: el que la persona padezca la gripe, apendicitis, o que est sana. De modo general podemos representar las t muestras (o niveles) del siguiente modo:
Niveles Observaciones de X tamaos muestrales Nivel x 11 x 12
x 1n1 n 1
Nivel x 21 x 22
x 2n2 n 2
... ... ... Nivel x t1 x t2
x tnt n t
Donde por supuesto, los tamaos de cada muestra n i , no tienen por que ser iguales. En este caso decimos que se trata del modelo no equilibrado.
Observacin
De ahora en adelante asumiremos que las siguientes condiciones son verificadas por las t muestras: Las observaciones proceden de poblaciones normales; Las t muestras son aleatorias e independientes. Adems, dentro de cada nivel las observaciones son independientes entre s. En el modelo de un factor suponemos que las observaciones del nivel i, x ij , provienen de una variable X ij de forma que todas tienen la misma varianza --hiptesis de homocedasticidad:
o lo que es lo mismo,
De este modo es el valor esperado para las observaciones del nivel i, y los errores son variables aleatorias independientes, con valor esperado nulo, y con el mismo grado de dispersin para todas las observaciones.
Otro modo de escribir lo mismo consiste en introducir una cantidad que sea el valor esperado para una persona cualquiera de la poblacin (sin tener en cuenta los diferentes niveles), y considerar los efectos introducidos por los niveles, de modo que:
Resumen ANOVA TABLA ANOVA
Fuentes de Variacin Sumas de Cuadrados Grados de libertad Cuadrados Medios F exp
Entre grupos
SC T r
I 1
CM T r CM T r CM R
Dentro de grupos SC R n I
CM R TOTAL SC T n 1
CM T
Aceptar H 0 si F exp F ;I 1,N I ; Rechazar H 0 si F exp >F ;I 1,N I
SC T = SC T r + SC R
1) SC T: Suma de cuadrados total
2) SC T r: Suma de cuadrados entre tratamientos
3) SC R: Suma de cuadrados dentro de los tratamientos o residual. 1) CM T: Cuadrado medio total: CM T =SC T /(N 1) 2) CM T r: Cuadrado medio entre tratamientos: CM T r =SC T r /(I 1) 3) CM R: Cuadrado medio residual: CM R = SC R/(N I )
Nota: Las expresiones de estas sumas de cuadrados estn dadas en el Apndice.
COEFICIENTE DE DETERMINACIN
R 2 = SC T r
SC T
R 2 : Proporcin de la variabilidad total presente en los datos que es expli- cada por el modelo de anlisis de la varianza.
Especificacin del modelo Con todo lo anterior, el modelo ANOVA de un factor puede escribirse como
y con la siguiente interpretacin: es una constante comn a todos los niveles; es el efecto producido por el i-simo nivel. Al sumarlos todos deben compensarse los efectos negativos con los positivos para que la media comn a todos los niveles sea realmente . Esto implica en particular que los efectos, , de los niveles no son independientes; es la parte de la variable X ij no explicada por ni , y que se distribuye del mismo modo (aunque independientemente) para cada observacin, segn la ley gaussiana:
sta es la condicin de homocedasticidad, y es fundamental en el anlisis de la varianza.
Obsrvese que ahora podemos escribir el contraste de que los diferentes niveles no tienen influencia sobre la observacin de la variable como:
o bien
Observacin
Se utiliza el nombre de anlisis de la varianza ya que el elemento bsico del anlisis estadstico ser precisamente el estudio de la variabilidad. Tericamente es posible dividir la variabilidad de la variable que se estudia en dos partes: La originada por el factor en cuestin; La producida por los restantes factores que entran en juego, conocidos o no, controlables o no, que se conocen con el nombre de error experimental.
Si mediante los contrastes estadsticos adecuados la variacin producida por cierto factor es significativamente mayor que la producida por el error experimental podemos aceptar la hiptesis de que los distintos niveles del factor actan de forma distinta. Para poder aplicar esta tcnica, es necesario que se verifiquen las siguientes condiciones previas: o Independencia: los individuos estudiados han de ser independientes unos de otros. o Aleatoriedad: las muestras o grupos objeto de estudio deben haberse obtenido de forma aleatoria. o Normalidad: las muestras o grupos analizados deben seguir una distribucin Normal. o Homocedasticidad: debe haber igualdad de varianzas en las muestras o grupos estudiados. Cuando se utiliza la tcnica ANOVA se deben cumplir los siguientes supuestos: 1. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. 2. La varianza de los subgrupos debe ser homognea. 3. Las muestras que constituyen los grupos deben ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto, generen estimaciones de varianza independientes, la razn de las varianzas inter e intra no adoptar la distribucin F.
4.6. Diseos En Bloques Completamente Al Azar
HOMOGENEIDAD ENTRE LAS UNIDADES EXPERIMENTALES: En la industria algodonera: l as parcelas de terreno son de la misma calidad e igual superficie.
El error experimental reflejar esta variabilidad entre las parcelas de ter- reno.
El error experimental sea lo ms pequeo posible. Se debe sustraer del error experimental la variabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:
1) Considerar parcelas de terreno muy homogneas.
2) O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo ms homogneo posible y los bloques entre s sean heterogneos.
RECORDEMOS
1) En el diseo completamente aleatorizado asignbamos los tratamientos al azar a las parcelas sin restriccin alguna.
2) En el diseo en bloques aleatorizados primero agrupamos las parcelas en bloques y a continuacin asignamos los tratamientos a las parcelas en cada bloque.
SUPONGAMOS
. . . . . . .
.
.
.
.
.
.
.
i Se realiza una observacin por tratamiento en cada bloque: N = I J obser- vaciones.
La asignacin de los tratamientos a las unidades experimentales en cada bloque se determina aleatoriamente.
Los tratamientos y los bloques son factores de efectos fijos.
No hay interaccin entre los tratamientos y los bloques: (El efecto de un factor no depende del nivel del otro factor): Efectos de los factores son aditivos.
Diseo en bloques aleatorizado
Bloques Tratamientos 1 2 j J 1 y 11 y 12 y 1j y 1J 2 y 21 y 22 y 2j y 2J . . . . . . . i y i1 y i2 y ij y iJ . . . . . . . I y I 1 y I 2 y Ij y IJ
MODELO ESTADSTICO
y ij = + i + j + u ij i = 1, 2, , I ; j = 1, 2, , J
y ij : La variable aleatoria que representa la observacin (i)-sima del bloque (j)-simo.
es un efecto constante. Media global.
i : El efecto producido por el nivel i-simo del factor principal. P
i = 0.
j : El efecto producido por el nivel j -simo del factor secundario o factor de bloque. Se supone que j =0
u ij : Variables aleatorias independientes con distribucin N (0, ).
DOS FACTORES 1) Factor tratamiento factor principal
2) Factor bloque factor secundario
Inters fundamentalmente est centrado en el primero y el factor bloque se introduce en el modelo para eliminar su influencia en la variable respuesta.
OBJETIVO
Estimar los efectos de los tratamientos y de los bloques y contrastar la hiptesis:
F H 0 : i = 0 i vs H 1 : i = 0 por lo menos para algn i F H 0 : j = 0 j vs H 1 : j = 0 por lo menos para algn j
TABLA ANOVA
Tabla ANOVA. Modelo de Bloques Aleatorizados F. V. S.C. de G. L. C. M. F exp Entre tratami. SC T r I 1
CM T r CM T r/C M R Entre bloques SC Bl J 1
CM Bl CM Bl/C M R Residual SC R (I 1)(J 1)
CM R TOTAL SC T I J 1
CM T
SC T = SC T r + SC Bl + SC R
1) SC T : Suma total de cuadrados.
2) SC T r: Suma de cuadrados entre tratamientos.
3) SC Bl: Suma de cuadrados entre bloques
4) SC R: Suma de cuadrados del error o residual. 1) CM T : Cuadrado medio total : CM T = SC T /(N 1) 2) CM T r : Cuadrado medio entre tratamientos: CM T r =SC T r/(I 1) 3) CM Bl : Cuadrado medio entre bloques: CM Bl =SC Bl/(J 1) 4) CM R : Cuadrado medio residual: CM R =SC R/(I 1)(J 1)
Nota: Las expresiones de estas sumas de cuadrados estn dadas en el Apndice.
ANLISIS ESTADSTICO
Contraste de inters: H 0
1 = = I = 0
CM T r
F
= CM R F (I 1),(I 1)(J 1)
Rechazar H 0 a nivel si F (exp) > F ;I 1,(I 1)(J 1)