Vous êtes sur la page 1sur 11

CAPTULO IV: ANLISIS DE VARIANZA

4.1. Definiciones. Experimento, material experimental, repeticin y error experimental.


Experimento: Prueba o series de pruebas en las que se hacen cambios deliberados
en las variables de entrada de un proceso (los factores que se estudian) o sistema
para observar e identificar las razones de los cambios que pudieran observarse en la
respuesta de salida.


Error experimental: Describe la situacin de no llegar a resultados idnticos con dos
unidades experimentales tratadas de igual forma y refleja: (a) errores de
experimentacin, (b) errores de observacin, (c) errores de medicin, (d) variacin
del material experimental (esto es, entre unidades experimentales), (e) efectos
combinados de factores extraos que pudieran influir las caractersticas en estudio,
pero respecto a los cuales no se ha llamado la atencin en la investigacin.

4.2. Diseo experimental, Consideraciones fundamentales para su seleccin y
aplicacin.
Objetivos de un diseo de experimento
Proporcionar la mxima cantidad de informacin pertinente al problema bajo
investigacin.
El diseo, plan o programa debe ser tan simple como sea posible.
Proporcionar mtodos que permitan obtener la mayor cantidad de informacin
vlida acerca de una investigacin, teniendo en cuenta el factor costo y el uso
adecuado del material disponible mediante mtodos que permitan disminuir el
error experimental.
Principios bsicos del diseo de experimentos
Repeticin: Viene a ser la reproduccin o rplica del experimento bsico
(asignacin de un tratamiento a una unidad experimental). Las principales razones
por las cuales es deseable la repeticin son: primero por que proporciona una
estimacin del error experimental, siendo tal estimacin confiable a medida que
aumenta el nmero de repeticiones, y segundo permite estimaciones ms
precisas del tratamiento en estudio.
Aleatorizacin: Asignacin al azar de tratamiento a las unidades experimentales.
Una suposicin frecuente en los modelos estadsticos de un diseo de
experimentos es que: las observaciones o los errores estn distribuidos
independientemente, la aleatorizacin hace vlida esta suposicin.
Control: Local: Cantidad de balanceo, bloqueo y agrupamiento de las unidades
experimentales que se emplean en el diseo estadstico de un experimento.
Etapas de un diseo de experimentos
a. Enunciado o planteamiento del problema.
b. Formulacin de hiptesis.
c. Proposicin de la tcnica experimental y el diseo.

d. Examen de sucesos posibles y referencias en que se basan las razones para
la indagacin que asegure que el experimento proporcionar la informacin
requerida y en la extensin adecuada.
e. Consideracin de los posibles resultados desde el punto de vista de los
procedimientos estadsticos que se aplicarn, para asegurar que se satisfagan
las condiciones necesarias y sean vlidos estos procedimientos.
f. Ejecucin del experimento.
g. Aplicacin de las tcnicas estadsticas a los resultados experimentales.
h. Extraccin de conclusiones con medidas de la confiabilidad de las
estimaciones generadas.
i. Valoracin de la investigacin completa y contrastacin con otras
investigaciones del mismo problema o similares.





4.3. Anlisis de varianza ANOVA. Prueba de supuestos que fundamenta el ANOVA.
El anlisis de la varianza, ANOVA
11.1
surge como una generalizacin del contraste
para dos medias de la de Student, cuando el nmero de muestras a contrastar es
mayor que dos.

Por ejemplo, supongamos que tenemos 3 muestras de diferentes tamaos que
suponemos que provienen de tres poblaciones normales con la misma varianza:



Si queremos realizar el contraste podramos en plantearnos como primer mtodo el fijar una


cantidad prxima a cero y realizar los contrastes siguientes con como
nivel de significacin:





De modo que se aceptara H
1
y se rechazara H
0
slo si alguna de las hiptesis
alternativas H
1
', H
1
'' H
1
''' es aceptada y rechazada su correspondiente hiptesis nula.
El error de tipo I para este contraste es:


Por ello el nivel de significacin obtenido para este contraste sobre la igualdad de
medias de tres muestras no es como hubisemos esperado obtener inicialmente, sino
. Por ejemplo, si tomamos un nivel de significacin para cada uno
de los contrastes de igualdad de dos medias, se obtendra que el nivel de significacin
(error de tipo I) para el contraste de las tres medias es de 1-0,9
3
=0,27, lo que es una
cantidad muy alta para lo que acostumbramos a usar.

En consecuencia, no es adecuado realizar el contraste de igualdad de medias de varias
muestras mediante una multitud de contrastes de igualdad de medias de dos muestras.

Una tcnica que nos permite realizar el contraste de modo conveniente es la que
exponemos en este captulo y que se denomina anlisis de la varianza.

ANOVA con un factor

Se denomina modelo factorial con un factor o ANOVA con un factor al modelo
(lineal) en el que la variable analizada la hacemos depender de un slo factor de tal
manera que las causas de su variabilidad son englobadas en una componente
aleatoria que se denomina error experimental:


Vamos a exponer esto con ms claridad. Consideremos una variable sobre la que
acta un factor que puede presentarse bajo un determinado nmero de niveles, t. Por
ejemplo podemos considerar un frmaco que se administra a t=3 grupos de personas
y se les realiza cierta medicin del efecto causado:

Resultado de la medicin
Gripe (nivel 1) 5 3 2 5 4 3

Apendicitis (nivel 2) 8 9 6 7 8 9 10 8 10

Sanos (nivel 3) 2 3 2 1 2 3 2


En este caso los factores que influyen en las observaciones son tres: el que la
persona padezca la gripe, apendicitis, o que est sana.
De modo general podemos representar las t muestras (o niveles) del siguiente modo:

Niveles Observaciones de X tamaos muestrales
Nivel
x
11
x
12


x
1n1
n
1

Nivel
x
21
x
22


x
2n2
n
2

... ... ...
Nivel
x
t1
x
t2


x
tnt
n
t

Donde por supuesto, los tamaos de cada muestra n
i
, no tienen por que ser iguales.
En este caso decimos que se trata del modelo no equilibrado.

Observacin

De ahora en adelante asumiremos que las siguientes condiciones son verificadas por
las t muestras:
Las observaciones proceden de poblaciones normales;
Las t muestras son aleatorias e independientes. Adems, dentro de cada nivel las
observaciones son independientes entre s.
En el modelo de un factor suponemos que las observaciones del nivel i, x
ij
, provienen
de una variable X
ij
de forma que todas tienen la misma varianza --hiptesis de
homocedasticidad:


o lo que es lo mismo,

De este modo es el valor esperado para las observaciones del nivel i, y los errores
son variables aleatorias independientes, con valor esperado nulo, y con el mismo
grado de dispersin para todas las observaciones.

Otro modo de escribir lo mismo consiste en introducir una cantidad que sea el valor
esperado para una persona cualquiera de la poblacin (sin tener en cuenta los
diferentes niveles), y considerar los efectos introducidos por los niveles, de modo
que:

Resumen ANOVA
TABLA ANOVA

Fuentes de Variacin Sumas de
Cuadrados
Grados de
libertad
Cuadrados Medios F
exp

Entre grupos

SC T r

I 1

CM T r
CM T r
CM R

Dentro de grupos SC R n I

CM R
TOTAL SC T n 1

CM T

Aceptar H
0
si F
exp
F
;I 1,N I
; Rechazar H
0
si F
exp
>F
;I 1,N I

SC T = SC T r + SC R

1) SC T: Suma de cuadrados total

2) SC T r: Suma de cuadrados entre tratamientos

3) SC R: Suma de cuadrados dentro de los tratamientos o residual.
1) CM T: Cuadrado medio total: CM T =SC T /(N 1)
2) CM T r: Cuadrado medio entre tratamientos: CM T
r
=SC T
r
/(I 1)
3) CM R: Cuadrado medio residual: CM R = SC R/(N I )

Nota: Las expresiones de estas sumas de cuadrados estn dadas en el Apndice.

COEFICIENTE DE DETERMINACIN

R
2
=
SC T r

SC T

R
2
: Proporcin de la variabilidad total presente en los datos que es expli- cada
por el modelo de anlisis de la varianza.

Especificacin del modelo
Con todo lo anterior, el modelo ANOVA de un factor puede escribirse como

y con la siguiente interpretacin:
es una constante comn a todos los niveles;
es el efecto producido por el i-simo nivel. Al sumarlos todos deben
compensarse los efectos negativos con los positivos para que la media comn
a todos los niveles sea realmente . Esto implica en particular que los efectos,
, de los niveles no son independientes;
es la parte de la variable X
ij
no explicada por ni , y que se distribuye del
mismo modo (aunque independientemente) para cada observacin, segn la
ley gaussiana:


sta es la condicin de homocedasticidad, y es fundamental en el anlisis de la
varianza.

Obsrvese que ahora podemos escribir el contraste de que los diferentes niveles no
tienen influencia sobre la observacin de la variable como:


o bien


Observacin

Se utiliza el nombre de anlisis de la varianza ya que el elemento bsico del anlisis
estadstico ser precisamente el estudio de la variabilidad. Tericamente es posible
dividir la variabilidad de la variable que se estudia en dos partes:
La originada por el factor en cuestin;
La producida por los restantes factores que entran en juego, conocidos o no,
controlables o no, que se conocen con el nombre de error experimental.

Si mediante los contrastes estadsticos adecuados la variacin producida por cierto
factor es significativamente mayor que la producida por el error experimental
podemos aceptar la hiptesis de que los distintos niveles del factor actan de forma
distinta.
Para poder aplicar esta tcnica, es necesario que se verifiquen las siguientes
condiciones previas:
o Independencia: los individuos estudiados han de ser independientes unos de
otros.
o Aleatoriedad: las muestras o grupos objeto de estudio deben haberse
obtenido de forma aleatoria.
o Normalidad: las muestras o grupos analizados deben seguir una distribucin
Normal.
o Homocedasticidad: debe haber igualdad de varianzas en las muestras o
grupos estudiados.
Cuando se utiliza la tcnica ANOVA se deben cumplir los siguientes supuestos:
1. Las personas de los diversos subgrupos deben seleccionarse mediante el
muestreo aleatorio, a partir de poblaciones normalmente distribuidas.
2. La varianza de los subgrupos debe ser homognea.
3. Las muestras que constituyen los grupos deben ser independientes. Amenos
de que las muestras sean independientes, y que por lo tanto, generen estimaciones
de varianza independientes, la razn de las varianzas inter e intra no adoptar la
distribucin F.



4.6. Diseos En Bloques Completamente Al Azar

HOMOGENEIDAD ENTRE LAS UNIDADES EXPERIMENTALES: En la industria
algodonera: l as parcelas de terreno son de la misma calidad e igual superficie.

El error experimental reflejar esta variabilidad entre las parcelas de ter-
reno.

El error experimental sea lo ms pequeo posible. Se debe sustraer del error
experimental la variabilidad producida por las parcelas de terreno. Para ello, el
experimentador puede:

1) Considerar parcelas de terreno muy homogneas.

2) O bien, formar bloques de terreno de manera que el terreno de cada bloque sea
lo ms homogneo posible y los bloques entre s sean heterogneos.

RECORDEMOS

1) En el diseo completamente aleatorizado asignbamos los tratamientos al azar
a las parcelas sin restriccin alguna.

2) En el diseo en bloques aleatorizados primero agrupamos las parcelas en
bloques y a continuacin asignamos los tratamientos a las parcelas en cada
bloque.

SUPONGAMOS

. . . . . . .

.

.

.

.

.

.

.

i
Se realiza una observacin por tratamiento en cada bloque: N = I J obser-
vaciones.

La asignacin de los tratamientos a las unidades experimentales en cada
bloque se determina aleatoriamente.

Los tratamientos y los bloques son factores de efectos fijos.

No hay interaccin entre los tratamientos y los bloques: (El efecto de un factor
no depende del nivel del otro factor): Efectos de los factores son aditivos.

Diseo en bloques aleatorizado

Bloques
Tratamientos 1 2 j J
1 y
11
y
12
y
1j
y
1J
2 y
21 y
22
y
2j
y
2J
. . . . . . .
i y
i1 y
i2
y
ij
y
iJ
. . . . . . .
I y
I 1 y
I 2
y
Ij
y
IJ



MODELO ESTADSTICO

y
ij
= +
i
+
j
+ u
ij
i = 1, 2, , I ; j = 1, 2, , J

y
ij
: La variable aleatoria que representa la observacin (i)-sima del bloque
(j)-simo.

es un efecto constante. Media global.

i
: El efecto producido por el nivel i-simo del factor principal.
P



i
= 0.


j
: El efecto producido por el nivel j -simo del factor secundario o factor
de bloque. Se supone que
j
=0

u
ij
: Variables aleatorias independientes con distribucin N (0, ).

DOS FACTORES
1) Factor tratamiento factor principal

2) Factor bloque factor secundario

Inters fundamentalmente est centrado en el primero y el factor bloque se
introduce en el modelo para eliminar su influencia en la variable respuesta.

OBJETIVO

Estimar los efectos de los tratamientos y de los bloques y contrastar la hiptesis:

F H
0
:
i
= 0 i vs H
1
:
i
= 0 por lo menos para algn i
F H
0
:
j
= 0 j vs H
1
:
j
= 0 por lo menos para algn j



TABLA ANOVA

Tabla ANOVA. Modelo de Bloques Aleatorizados
F. V. S.C. de G. L. C. M. F
exp
Entre tratami. SC T r
I 1

CM T r CM T r/C M R
Entre bloques SC Bl J 1

CM Bl CM Bl/C M R
Residual SC R
(I 1)(J 1)

CM R
TOTAL SC T
I J 1

CM T

SC T = SC T r + SC Bl + SC R

1) SC T : Suma total de cuadrados.

2) SC T r: Suma de cuadrados entre tratamientos.

3) SC Bl: Suma de cuadrados entre bloques

4) SC R: Suma de cuadrados del error o residual.
1) CM T : Cuadrado medio total : CM T = SC T /(N 1)
2) CM T r : Cuadrado medio entre tratamientos: CM T r =SC T r/(I 1)
3) CM Bl : Cuadrado medio entre bloques: CM Bl =SC Bl/(J 1)
4) CM R : Cuadrado medio residual: CM R =SC R/(I 1)(J 1)

Nota: Las expresiones de estas sumas de cuadrados estn dadas en el Apndice.


ANLISIS ESTADSTICO

Contraste de inters: H
0

1
= =
I
= 0

CM T r

F

=
CM R
F
(I 1),(I 1)(J 1)


Rechazar H
0
a nivel si F
(exp)
> F
;I 1,(I 1)(J 1)

Tambin es interesante contrastar: H
0

1
= =
J
= 0

F

=
CM R
F
(J 1),(I 1)(J 1)

Vous aimerez peut-être aussi