Vous êtes sur la page 1sur 80

ESTADSTICA

FACULTAT D INFORMTICA



APUNTS DE CLASSE PROF. LDIA MONTERO:
TEMA 7: ANLISI DE LA VARIANA I COVARIANA


AUTORA:
Ldia Montero Mercad
Departament d Estadstica i Investigaci Operativa
Versi 1.0
Setembre del 2.004







FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-2
TABLA DE CONTENIDOS

INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-3

INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-4

INTRODUCCIN

El Modelo Lineal General es el tratamiento de los modelos ANOVA y ANCOVA por tcnicas de
regresin lineal.

Formulacin, estimacin y contrastes de significacin habituales: modelos ANOVA con uno y dos
factores por regresin

Formulacin, estimacin de los modelos ANCOVA por regresin lineal a partir de un caso de
estudio

Desarrollo de 6 Casos de Estudio e interpretacin de los resultados del paquete MINITAB para
Windows; paquete estadstico de soporte de la docencia en el Departamento.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-5

INTRODUCCIN (CONT.)

El Tema 6 de Regresin Normal Clsica ha presentado:

El modelo de regresin permite medir el efecto relativo de cada variable explicativa sobre la
respuesta y hacer predicciones sobre la respuesta conocido el valor de las variables explicativas

Estimacin por mnimos cuadrados (justificado en clase): se presentan como aquellos que
satisfacen las ecuaciones normales. Aspectos geomtricos y estadsticos.

Se conoce el principio de la varianza incremental para contrastacin, la interpretacin de la
tabla ANOVA y la diagnosis y validacin del modelo va el anlisis de los residuos.


La notacin a emplear y un breve resumen de lo expuesto durante el Tema 2 es...

Sea Y la variable de respuesta representada por un vector de n observaciones
n
y y K
1
.

Se va a suponer la existencia de un trmino independiente asociado al parmetro
0
.

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-6
INTRODUCCIN (CONT.)
La notacin empleada y un breve resumen de lo expuesto...
Sean
p
X X K
1
las variables explicativas o regresores, vectores de observaciones de dimensin n>p.
El modelo de regresin mltiple presentado es el siguiente:
i pi p i i
x x y + + + + = L
1 1 0
para n i , , 1 K = o + = X Y
|
|
|
.
|

\
|
=
n
y
y
M
1
Y ,
|
|
|
|
|
.
|

\
|
=
pn n
p
p
x x
x x
x x
L
M M M M
L
L
1
2 12
1 11
1
1
1
X
,
|
|
|
.
|

\
|
=
p

M
0
y
|
|
|
.
|

\
|
=
n

M
1
.
Las hiptesis clsicas ligadas al trmino de error :
Errores mutuamente independientes con | | | | n i
i i
K 1 V , 0 E
2
= = = .
Errores distribuidos normalmente, sto es, ( ) I 0 N
2
,
n
.

La estimacin se resume en b solucin de las ecuaciones normales: Y X Xb X
T T
=
( ) ( ) ( )Y H I e X X X X H Y X X X b
T
1
T T
1
T
= = = =

, ,
)
y
1
2

=
p n
s
e e
T
.

La distribucin de los estimadores responde a ( )
1 T
X) (X N

+

2
1
,


p
y
1
2
2

p n

e e
T
.

El test de regresin mediante el estadstico de Fisher es
1
2

p n p
F
s p
SCM
,
, ( )

=
= =
n
i
i
T
y y y n Y Y SCM
1
2 2




FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-7
INTRODUCCIN (CONT.)

La extensin de los modelos de regresin lineal para el tratamiento del anlisis de la varianza
y de la covarianza se denomina Modelo Lineal General.

El anlisis de la varianza es un mtodo para el anlisis de datos procedentes del diseo
experimental frecuentemente empleado ...

Resulta desconocido por muchos ingenieros e investigadores que los modelos de anlisis de
varianza pueden tratarse a travs de los procedimientos generales de regresin lineal (mltiple)
tomando determinadas precauciones: ya que los modelos ANOVA resultan sobreparametrizados

El tratamiento del anlisis de la varianza mediante regresin lineal enfatiza la existencia de un
modelo subyacente: el modelo de anlisis de la varianza

La diagnosis y validacin de los modelos ANOVA (y ANCOVA) puede remitirse a los
procedimientos generales de anlisis de los residuos empleados en regresin mltiple, con la
ventaja de ser procedimientos grficos y que entran por los ojos

Adems, la formulacin por regresin hace ms llevadero el trabajo con experimentos con un
nmero de rplicas distintas (diseos no balanceados, o balanceados inicialmente, pero con
problemas posteriores) o diseos complejos
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-8
INTRODUCCIN (CONT.)

Sin embargo, no hay que confundir el diseo de experimentos y la regresin...

La clave en el diseo de experimentos radica en cmo disear X (la decisin de cmo recoger la
informacin); por el contrario, en regresin, la matriz X viene dada

El tratamiento por regresin de los problemas ANOVA involucra la definicin de un conjunto de
variables mudas (dummies), pero hay muchas maneras de efectuar la definicin, algunas ms
convenientes que otras, en la prctica, para la extensin a modelos complejos.

La exposicin trata modelos de regresin lineal de la forma,

+ = X Y
con
( ) I 0 N
2
,
n

,

donde la matriz de diseo X puede contener variables mudas para el anlisis de la varianza
(ANOVA) o variables mudas ms variables continuas (covariantes) para el anlisis de la
covarianza (ANCOVA). Modelos de efectos fijos.

La presentacin formal del modelo lineal general se puede consultar en Fox (1.997).
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-9
INTRODUCCIN: ESQUEMA DE LA PRESENTACIN
Caso de Estudio 1 : Anlisis de la Varianza de un factor (One-Way ANOVA)

Se presenta la tabla ANOVA y el proceder del contraste de homogeneidad de medias.
... para posteriormente formular, interpretar y discutir diversos modelos de regresin lineal
equivalentes
... y mostrar preferencia por la propuesta de suma cero.
Diagnosis del Modelo: anlisis de los residuos.

Caso de Estudio 3: Anlisis de la Varianza con dos factores (Two-Way ANOVA)

Se presentan los modelos aditivos e interactivos y los contrastes habituales (Tema 4)
... para posteriormente formular, a partir de variables dummies, los modelos de regresin lineal
equivalentes y detallar el procedimiento de los contrastes de significacin habituales .
Caso de estudio con factores anidados donde se ilustra la potencia de la metodologa de anlisis
expuesta: Caso de Estudio 5.

Caso de Estudio 6: Introduccin al Anlisis de la Covarianza (ANCOVA)

Tratamiento y formulacin por regresin lineal
... se detallan algunas pautas de anlisis de modelos ANCOVA.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-10

INTRODUCCIN

EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-11
CASO DE ESTUDIO 1: EL MODELO ANOVA DE UN FACTOR (1)



1.1.1 Caso de Estudio 1 (Ejemplo de MINITAB v1.1)

Una consultora de Ingeniera e Informtica quiere evaluar la reduccin de horas-hombre que
supone la introduccin de una nueva herramienta de clculo, un programa nuevo con mayores
requerimientos de hardware, pero con unas prestaciones superiores segn los artculos aparecidos
en revistas especializadas de software. La empresa dispone de 6 ingenieros
senior y se disea un experimento aleatorizado que asigna a cada
ingeniero 4 problemas, de dos tipos (Factor B), 2 de sistemas lineales y
2 de modelizacin estadstica, a resolver aleatoriamente, uno de
cada, con la nueva herramienta y con la habitual (Factor A). Se contabiliza
el tiempo de resolucin en minutos y se introducen los datos en el programa
estadstico MINITAB.





FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-12
Adams
Dixon
Erickson
Jones
Maynes
Williams
2
3
4
5
6
7
8
FACTOR A
T
I
E
M
P
O
NEW
OLD
INGENIERO
CASO DE ESTUDIO 1: EL MODELO ANOVA DE UN FACTOR (2)
Datos y Resultados MINITAB ...

Worksheet size: 100000 cells
MTB > Retrieve "G:\LIDIA\CURRI\TU\MEMO2\DOCSWORD\Cas1.mtw".
Retrieving worksheet from file: G:\LIDIA\CURRI\TU\MEMO2\DOCSWORD\Cas1.mtw


Current worksheet: Cas1.mtw
MTB > Plot 'TIEMPO'*'FACTOR A';
SUBC> Symbol 'INGENIERO';
SUBC> ScFrame;
SUBC> ScAnnotation.



MTB > Oneway 'TIEMPO' 'FACTOR A'.

One-way Analysis of Variance

Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,11 72,11 70,78 0,000
Error 22 22,41 1,02
Total 23 94,52
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev -----+---------+---------+---------+-
New 12 2,925 0,538 (----*---)
Old 12 6,392 1,322 (---*---)
-----+---------+---------+---------+-
Pooled StDev = 1,009 3,0 4,5 6,0 7,5

MTB > PRINT C1-C7

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-13
2,5 1,5 0,5
95% Confidence Intervals for Sigmas
OLD
NEW
8 7 6 5 4 3 2
TIEMPO
P-Value : 0,000
Test Statistic: 32,248
t Levene's Test
P-Value : 0,006
Test Statistic: 6,042
F-Test
Factor Levels
1
0
Homogeneity of Variance Test for TIEMPO
Data Display
Row TIEMPO INGENIERO FACTOR B FACTOR A D1B D1A D2A
1 3,1 Jones Stat New 1 1 0
2 7,5 Jones Stat Old 1 0 1
3 2,5 Jones Eng New 0 1 0
...
24 4,8 Maynes Eng Old 0 0 1
MTB>%Vartest 'TIEMPO''FACTOR A'
SUBC> Confidence 95,0.

Homogeneity of Variance

Response TIEMPO
Factors FACTOR A
ConfLvl 95,0000

F-Test (normal distribution)
Test Statistic: 6,042
P-Value : 0,006

Levene's Test (any continuous distribution)
Test Statistic: 32,248
P-Value : 0,000




MTB > TwoT 95,0 'TIEMPO' 'FACTOR A';
SUBC> Alternative 0.

Two Sample T-Test and Confidence Interval

Two sample T for TIEMPO

FACTOR A N Mean StDev SE Mean
New 12 2,925 0,538 0,16
Old 12 6,39 1,32 0,38

95% CI for mu (New) - mu (Old): ( -4,35; -2,58)
T-Test mu (New) = mu (Old) (vs not =): T = -8,41 P = 0,0000 DF = 14
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-14
MTB > TwoT 95,0 'TIEMPO' 'FACTOR A';
SUBC> Alternative -1.
Two Sample T-Test and Confidence Interval
Two sample T for TIEMPO
FACTOR A N Mean StDev
New 12 2,925 0,538
Old 12 6,39 1,32

95% CI for mu (New) - mu (Old):
( -4,35; -2,58)
T-Test mu (New) = mu (Old) (vs <):
T = -8,41 P = 0,0000 DF = 14

MTB > TwoT 95,0 'TIEMPO' 'FACTOR A';
SUBC> Alternative 0;
SUBC> Pooled.

Two Sample T-Test and Confidence Interval
Two sample T for TIEMPO
FACTOR A N Mean StDev
New 12 2,925 0,538
Old 12 6,39 1,32

95% CI for mu (New) - mu (Old):
( -4,32; -2,61)
T-Test mu (New) = mu (Old) (vs not =):
T = -8,41 P = 0,0000 DF = 22
Both use Pooled StDev = 1,01

MTB > ANOVA 'TIEMPO' = 'FACTOR A'.
Analysis of Variance (Balanced Designs)
Factor Type Levels Values
FACTOR A fixed 2 New Old

Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 70,78 0,000
Error 22 22,412 1,019
Total 23 94,518
2 1 0 -1 -2
2
1
0
-1
-2
N
o
r
m
a
l

S
c
o
r
e
Residual
Normal Probability Plot of the Residuals
(response is TIEMPO)
1 0 1 1 0 0
: : = H H
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-15
CASO DE ESTUDIO 1: EL MODELO ANOVA DE UN FACTOR (5)
Comentarios ...
El diagrama bivariante, tiempo de resolucin (Y) frente al Factor A sugiere que el nuevo
programa reduce el tiempo de resolucin.

ONEWAY, la tabla ANOVA muestra un valor del estadstico F de 70,78 que contrastado con un
nivel de confianza del 95% facilita el nivel de significacin de la hiptesis nula
1 0
: =
0
H ,
frente a la hiptesis alternativa
1 0 1
: H
p=0 ( 05 . 0 = y F
1, 22
) .
BasicStatistics 2-Sample t... de MINITAB, t=8,41 con 14 grados de libertad, pero son
22: la opcin Assume equal variances y contraste bilateral de 2-Sample t de MINITAB facilita
el mismo contraste que ONEWAY.
La hiptesis de homogeinidad de la varianzas no se satisface:
2
1
2
0 0
: = H
, frente a la hiptesis
alternativa
2
1
2
0 1
: H
muestra un nivel de significacin inferior al 1% a un nivel
05 . 0 =

(ANOVA Homogeniety of Variance).

En general, los diseos experimentales suelen contar con ms de un factor y se abordan con los
procedimientos MINITAB: ANOVA (Balanced Designs), Two-Way ANOVA y GLM.

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-16
CASO DE ESTUDIO 1: EL MODELO ANOVA DE UN FACTOR (6)

Analysis of Variance (Balanced Designs)

Factor Type Levels Values
FACTOR A fixed 2 New Old
Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 70,78 0,000
Error 22 22,412 1,019
Total 23 94,518

Means
FACTOR 1 N TIEMPO
New 12 2,9250
Old 12 6,3917


La tabla ANOVA es idntica a la obtenida con el
procedimiento ONEWAY: existen diferencias significativas entre el tiempo empleado con el
programa nuevo y el habitual a un nivel
05 . 0 =
. Sin embargo, no se sabe si es apropiado el
modelo ANOVA: falta su diagnosis y validacin.

El anlisis de los residuos para la diagnosis y validacin del modelo puede efectuarse
almacenando los residuos y procediendo como se conoce del anlisis de los residuos en regresin
mltiple (normal P-P plot, diagramas bivariantes de los residuos, etc.)
Adams
Dixon
Erickson
Jones
Maynes
Williams
-2
-1
0
1
2
FACTOR A
T
R
E
S
1
NEW
OLD
INGENIERO
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-17
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (1)

El modelo ANOVA de un factor (genricamente con I niveles). Se fijan las ideas en el Caso de
Estudio 2: formulacin y construccin de los modelos de regresin, interpretacin de sus
parmetros y discusin de su empleo en inferencia.

Grupo 1
1
1 12 11
, , ,
n
y y y L
Media
1
y
Grupo 2
2
2 22 21
, , ,
n
y y y L
Media
2
y
... ... ...
Grupo I
I
In I I
y y y , , ,
2 1
L
Media
I
y

(1)
ij i ij
Y + =
, I parmetros y ( ) I 0 N
2
,
n
.
(2)
ij i ij
Y + + =
, es la esperanza del efecto para todos los niveles, I+1
parmetros.

La hiptesis nula habitual es que no hay diferencias entre las medias de los grupos:

(1)
= = =
I
L
1
:
0
H
frente
:
1
H
Alguna
i

distinta.
(2)
0 :
1
= = =
I
L
0
H
frente
0 :
i

1
H
.

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-18
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (2)

(R 1) Sea
ij i ij
Y + = , la formulacin por regresin resultante es,

|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J
y
y
y
y
I
M
M
M
M
1
1
11
_
1
Y
,
} } }
{
{
|
|
|
|
|
|
.
|

\
|
=
1 0 0 0
0
0 1 0
0 0 1
X
I 2 1
O M M
L
L
,
|
|
|
.
|

\
|
=
I

M
1

,
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J

M
M
M
1
1
11
_



de manera que el estimador de los parmetros tiene es la media de los grupos, suponiendo el
nmero de rplicas por clase idntico e igual a J (
I i J n
i
, , 1 K = =
).

La desventaja de esta formulacin es que no puede extenderse a ms de un factor y por tanto,
la generalizacin de la formulacin ANOVA a partir de (2).

( )
|
|
|
.
|

\
|
=
|
|
|
|
.
|

\
|
|
|
|
.
|

\
|
= =

=
=

I
J
j
Ij
J
j
j
y
y
y
y
J
J
M M O
1
1
1
1
1
0
0
Y X X X b
T
1
T
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-19
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (3)
(R 2)
ij i ij
Y + + =
El modelo de regresin correspondiente tiene I+1 parmetros y X X
T
es
singular,
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J
y
y
y
y
I
M
M
M
M
1
1
11
_
1
Y
,
} } } } }
|
|
|
|
|
|
|
.
|

\
|
=
= = =
1 0 0 1
0 1
0 0 1
0 1 0 1
0 0 0 1 1
X
I i 2 i 1 i 1
L
M L M
M M
M
L
,
|
|
|
|
.
|

\
|
=
I

M
1

,
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J

M
M
M
1
1
11
_

,
|
|
|
|
|
.
|

\
|
=
J J
J J
J J n
0 0
0 0
0
O M
L
X X
T

No existe una solucin nica a las ecuaciones normales, sin infinitas y todas ellas facilitan una
suma de cuadrados de los residuos de igual valor.

Tcnicamente, existen infinitas posibilidades de formular un modelo de regresin equivalente,
pero con solucin nica, basta aadir cualquier restriccin del tipo
0
1
0
= +

=
I
i
i i

.

Se van a ver dos posibilidades ...

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-20
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (4)

(R 3) ij i ij
Y + + =
ms la restriccin
0 =
I

. Si el nmero de rplicas por clase es


idntico e igual a J el modelo de regresin equivalente es,

|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J
y
y
y
y
I
M
M
M
M
1
1
11
_
1
Y
,
I n
|
|
|
|
|
.
|

\
|
=
0 0 1
1
1 0 1
0 0 1 1
X
R
L
O M M
M
,
|
|
|
|
.
|

\
|
=
1
1
R
I

,

I parmetros.
El efecto del nivel I viene expresado por

y el efecto aditivo debido al nivel i por


i

.
Sin embargo, la formulacin ms habitual contempla

como la media global y


i

como el efecto
diferencial (positivo o negativo) debido al nivel i-simo sobre la media global.

( )
|
|
|
|
.
|

\
|

= =

I I
I
I
y y
y y
y
1
1
M
Y X X X b
T
R
1
R
T
R
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J

M
M
M
1
1
11
_

FACULTAT D INFORMTICA ESTADSTICA


Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-21
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (5)
(R 4) ij i ij
Y + + =
ms la restriccin
0
1
=

=
I
i
i

(o

=
=
1
1
I
i
i I

): el efecto medio viene
expresado por

y el efecto aditivo debido al nivel i por


i

,

|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J
y
y
y
y
I
M
M
M
M
1
1
11
_
1
Y
,
I nx
|
|
|
|
|
.
|

\
|

=
1 1 1
1
1 0 1
0 0 1 1
X
R
L
O M M
M
,
|
|
|
|
.
|

\
|
=
1
1
R
I

,
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

=
IJ
I
J

M
M
M
1
1
11
_


( )
|
|
|
|
.
|

\
|

= = =

y y
y y
y
I
R R R
1
1
R
M
Y X X X b
T
1
T

El nmero de parmetros es I . La matriz
R R
X X
T
es no singular de dimensiones IxI . Las
columnas de la matriz de diseo o variables mudas (dummies) se notan como
1 1
, ,
I
D D L
.

La ltima de la propuesta produce una estimacin de los parmetros tales que,
I
I
i
i
=
=
1

,
=
i i
y

=
=
1
1
I
i
i I

de donde i i ij
y y y = + =
.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-22
FORMULACIN DEL MODELO ANOVA DE UN FACTOR POR REGRESIN (6)

La contrastacin de la hiptesis nula
0 :
1
= = =
I
L
0
H
frente a la hiptesis alternativa
0 :
i

1
H
en (R 4)
ij i ij
Y + + =
ms la restriccin de suma cero es,


Si H
1
es correcta la suma de cuadrados de los residuos correspondiente al modelo completo SCR
1
,
satisface
2
2
1
I n
SCR

.

Si adems
0 :
1
= = =
I
L
0
H
es correcta entonces
( )

= =
2
y y SCT SCR
ij o
,
2
1
2
0

n
SCR

y
de ah,
2
1
2
1 0

I
SCR SCR

y

I n I
I n
SCR
I
SCR SCR
f

=
, 1
1 1 0
1
F



FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-23
CONTINUACIN DEL CASO DE ESTUDIO 1 (1)

Se definen las variables mudas de las propuestas (R1) a (R4) y se comparan los resultados del
procedimiento Stat Regression Regression de MINITAB. Cdigos: I=2 i=1 Old e i=2 New .

D
1A
1 si Old y 0 de otro modo (New). D
2A
0 si Old y 1 si New.

Regression Analysis

The regression equation is
TIEMPO = 6,39 D1A + 2,93 D2A

Predictor Coef StDev T P
Noconstant
D1A 6,3917 0,2914 21,94 0,000
D2A 2,9250 0,2914 10,04 0,000

S = 1,009

Analysis of Variance
Source DF SS MS F P
Regression 2 592,91 296,45 291,01 0,000
Residual Error 22 22,41 1,02
Total 24 615,32

Source DF Seq SS
D1A 1 490,24
D2A 1 102,67

(R 1)
93 , 2

39 , 6

2 2 2
1 1 1
= = =
= = =

y y
y y
j
j
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-24
CONTINUACIN DEL CASO DE ESTUDIO 1 (2)
Definicin del modelo de regresin estndar (R2), sin considerar la dependencia lineal de las
columnas de la matriz de diseo: MINITAB detecta la singularidad y toma la decisin de
eliminar una de las columnas, la del nivel 2, lo que facilita el modelo de regresin restringido
(R3). Cdigos: I=2 i=1 Old e i=2 New .

D
1A
1 si Old y 0 de otro modo (New). D
2A
0 si Old y 1 si New.

Regression Analysis

* D2A is highly correlated with other X variables
* D2A has been removed from the equation

The regression equation is
TIEMPO = 2,93 + 3,47 D1A

Predictor Coef StDev T P
Constant 2,9250 0,2914 10,04 0,000
D1A 3,4667 0,4121 8,41 0,000

S = 1,009 R-Sq = 76,3% R-Sq(adj) = 75,2%

Analysis of Variance
Source DF SS MS F P
Regression 1 72,107 72,107 70,78 0,000
Residual Error 22 22,412 1,019
Total 23 94,518


(R 3)
93 , 2
39 , 6
2 2
1 2 1 1 1
= = =
= + = + = =


y y
y y y
j
j
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-25
CONTINUACIN DEL CASO DE ESTUDIO 1 (3)
Modelo de regresin restringido (R4): D
1A
1 si Old y 1 de otro modo (New).

El trmino independiente estimado proporciona el valor medio del efecto que debe
incrementarse en 1,73 minutos para estimar la media del programa habitual y decrementarse en
la misma cantidad para reflejar la media estimada para el programa nuevo.

La varianza estimada del modelo coincide con el valor facilitado por los procedimientos
ONEWAY y Balanced ANOVA y el coeficiente de determinacin del modelo es del 76,3%.

MTB > LET D1A= D1A D2A
MTB > REGRESS TIEMPO 1 D1A;
SUBC > Constant.
MTB >
Regression Analysis

The regression equation is
TIEMPO = 4,66 + 1,73 D1A

Predictor Coef StDev T P
Constant 4,6583 0,2060 22,61 0,000
D1A 1,7333 0,2060 8,41 0,000

S = 1,009 R-Sq = 76,3% R-Sq(adj) = 75,2%

Analysis of Variance
Source DF SS MS F P
Regression 1 72,107 72,107 70,78 0,000
Residual Error 22 22,412 1,019
Total 23 94,518
(R 4)
93 , 2
39 , 6 73 , 1 66 , 4
1 2 2 2
1 1 1
= = + = =
= + = + = =


y y
y y
j
j
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-26
CASO DE ESTUDIO 2 (DRAPER Y SMITH, 81)
Modelo ANOVA con un factor de 3 niveles que va a tratarse por regresin.

En la misma empresa, se desea evaluar el efecto del consumo de caf, 0, 1 y 2
tazas, en el nmero de pulsaciones por minuto de las 30 personas de personal de
soporte que tiene en plantilla. Inicialmente se quiere dar respuesta a la cuestin
de si el consumo de caf tiene algn efecto significativo sobre el nmero de
pulsaciones (y de ah, la actividad del personal de soporte).


Datos y Resultados MINITAB

MTB > PRINT C1-C2

Data Di spl ay

Row PULSACS FACTOR1
1 242 0
2 245 0
3 244 0
4 248 0
...
30 250 2




2 1 0
252
247
242
FACTOR A
P
U
L
S
A
C
S
MTB > ANOVA 'PULSACS' = 'FACTOR A'.

Analysis of Variance (Balanced Designs)

Factor Type Levels Values
FACTOR A fixed 3 0 1 2

Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 2 61,400 30,700 6,18 0,006
Error 27 134,100 4,967
Total 29 195,500

MTB > Oneway ' PULSACS' 'FACTOR A';
SUBC> Tukey 5;
SUBC> GNormalplot;
SUBC> GFits.


One-way Analysis of Variance

Analysis of Variance for PULSACS
Source DF SS MS F P
FACTOR A 2 61,40 30,70 6,18 0,006
Error 27 134,10 4,97
Total 29 195,50
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---+---------+---------+---------
+--
0 10 244,80 2,39 (------*------)
1 10 246,40 2,07 (------*------)
2 10 248,30 2,21 (-------*------)
----+---------+---------+---------
Pooled StDev =2,23 244,0 246,0 248,0 250,0



MTB > Code (0) 1 (1) 0 (2) 0 'FACTOR A' D01A
MTB > Code (0) 0 (1) 1 (2) 0 'FACTOR A' D02A
MTB > Code (0) 0 (1) 0 (2) 1 'FACTOR A' D03A
MTB > Regress ' PULSACS' 3 'D01A' 'D02A' 'D03A';
SUBC> Constant.

Regression Analysis
* D03A is highly correlated with other X variables
* D03A has been removed from the equation

The regression equation is
PULSACS = 248 - 3,50 D01A - 1,90 D02A

Predictor Coef StDev T P
Constant 248,300 0,705 352,33 0,000
D01A -3,5000 0,9967 -3,51 0,002
D02A -1,9000 0,9967 -1,91 0,067

S = 2,229 R-Sq = 31,4% R-Sq(adj) = 26,3%

Analysis of Variance
Source DF SS MS F P
Regression 2 61,400 30,700 6,18 0,006
Residual Error 27 134,100 4,967
Total 29 195,500


(R 3)
3 , 248
4 , 246 9 , 1 3 , 248
8 , 244 5 , 3 3 , 248
3 3
2 3 2 2
1 3 1 1
= = =
= = + = =
= = + = =

y y
y y y
y y y
j
j
j
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-28
2 1 0
2
1
0
-1
-2
FACTOR A
T
R
E
S
3
MTB > LET D1A = D01A-D03A
MTB > LET D1B = D02A-D03A
MTB > Name c8 = 'TRES3'
MTB > Regress ' PULSACS' 2 'D1A' 'D2A';
SUBC> Tresiduals 'TRES3';
SUBC> Constant.

Regression Analysis

The regression equation is
PULSACS = 247 - 1,70 D1A - 0,100 D2A

Predictor Coef StDev T
P
Constant 246,500 0,407 605,82
0,000
D1A -1,7000 0,5754 -2,95
0,006
D2A -0,1000 0,5754 -0,17
0,863

S = 2,229 R-Sq = 31,4% R-Sq(adj) = 26,3%

Analysis of Variance
Source DF SS MS F P
Regression 2 61,400 30,700 6,18 0,006
Residual Error 27 134,100 4,967
Total 29 195,500

Source DF Seq SS
D1A 1 61,250
D2A 1 0,150


MTB > Plot 'TRES3'*'FACTOR A'; 3 , 248
4 , 246 1 , 0 5 , 246
8 , 244 7 , 1 5 , 246
2 1 3 3 3
2 2 2
1 1 1
= = + = =
= = + = =
= = + = =



y y
y y
y y
j
j
j
(R 4)
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-29

INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-30
CASO DE ESTUDIO 3: EL MODELO ANOVA DE DOS FACTORES

1.1.2 Caso de Estudio 1 (Ejemplo de MINITAB v1.1)

Una consultora de Ingeniera e Informtica quiere evaluar la reduccin de horas-hombre que
supone la introduccin de una nueva herramienta de clculo, un programa nuevo con mayores
requerimientos de hardware, pero con unas prestaciones superiores segn los artculos aparecidos
en revistas especializadas de software. La empresa dispone de 6 ingenieros
senior y se disea un experimento aleatorizado que asigna a cada
ingeniero 4 problemas, de dos tipos (Factor B), 2 de sistemas lineales y
2 de modelizacin estadstica, a resolver aleatoriamente, uno de
cada, con la nueva herramienta y con la habitual (Factor A). Se contabiliza
el tiempo de resolucin en minutos y se introducen los datos en el programa
estadstico MINITAB.






FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-31
EL MODELO ANOVA CON 2 FACTORES: CASO DE ESTUDIO 3

Se considera la existencia de 2 tipos de problemas (Factor B) en el Caso de Estudio 1

Worksheet size: 100000 cells
MTB > Retrieve "G:\LIDIA\CURRI\TU\MEMO2\DOCSWORD\Cas3.mtw".
Retrieving worksheet from file: G:\LIDIA\CURRI\TU\MEMO2\DOCSWORD\Cas3.mtw
Worksheet was saved on 09/03/98 18:08:46
Current worksheet: Cas3.mtw
MTB > ANOVA 'TIEMPO' = 'FACTOR A' 'FACTOR B';
SUBC> Residuals 'RESI2'.

Analysis of Variance (Balanced Designs)
Factor Type Levels Values
FACTOR A fixed 2 New Old
FACTOR B fixed 2 Eng Stat

Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 263,58 0,000
FACTOR B 1 16,667 16,667 60,92 0,000
Error 21 5,745 0,274
Total 23 94,518

Two-way Analysis of Variance

Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 698,93 0,000
FACTOR B 1 16,667 16,667 161,55 0,000
Interaction 1 3,682 3,682 35,69 0,000
Error 20 2,063 0,103
Total 23 94,518

No trata interacciones
Ni diseos no balanceados
Si trata interacciones
No diseos no balanceados
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-32

Individual 95% CI
FACTOR A Mean ---+---------+---------+---------+--------
New 2,925 (-*-)
Old 6,392 (-*-)
---+---------+---------+---------+--------
3,000 4,000 5,000 6,000
Individual 95% CI
FACTOR B Mean --------+---------+---------+---------+---
Eng 3,825 (---*--)
Stat 5,492 (---*---)
--------+---------+---------+---------+---
4,000 4,500 5,000 5,500
MTB > Code ( "Stat" ) -1 ( "Eng" ) 1 'FACTOR B' 'D1B'
MTB > Code ( "New" ) -1 ( "Old" ) 1 'FACTOR A' 'D1A'
MTB > Plot 'TIEMPOMED'*'D1B'...

-1 NEW
1 OLD
ENG
1
0
STAT
-1
7
6
5
4
3
2
D1B
T
I
E
M
P
O
M
E
D
D1A
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-33
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (1)

El anlisis de la varianza de 2 factores examina la relacin entre una variable de respuesta
cuantitativa y dos variables explicativas cualitativas.
La inclusin del segundo factor permite la modelizacin y contraste de relaciones de
dependencia parciales e introducir interacciones.
Al suponer en Two-way ANOVA que se dispone de las medias poblacionales de cada celda de las
combinaciones de los niveles de los factores:
J j I i
ij
, , 1 , , 1 , K K = =
, se pueden establecer
patrones de relacin habituales claramente.

1 .. . . J
1
11
.. . .
J 1

1

M M M M M
I
1 I
.. . .
IJ

I


1
.. . .
J


Si A y B no interaccionan, entonces la relacin parcial entre cada factor y la variable de
respuesta no depende del nivel del otro factor, es decir, la diferencia entre niveles es
constante. Se supone I = 4 y J = 2 en los diagramas bivariantes siguientes.
A
B
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-34
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (2)
1
2
5 4 3 2 1 0
8
7
6
5
4
3
FACTOR A
m
u
_
i
j
FACTOR B









Factores A y B
son
significativos.

No hay efectos
interactivos
entre A y B.
Factor A es
significativo.

Factor B no es
significativo.

No hay efectos
interactivos
entre A y B.
1
2
0 1 2 3 4 5
3
4
5
6
7
8
m
u
_
i
j
FACTOR A
FACTOR B
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-35
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (3)














Factor A no es
significativo.

Factor B es significativo.

No hay efectos
interactivos entre A y B.
1
2
1 2 3 4
2
3
4
5
6
m
u
_
i
j
FACTOR A
FACTOR B
1
2
5 4 3 2 1 0
8
7
6
5
4
3
m
u
_
i
j
FACTOR A
FACTOR B
Factor A es significativo.

Factor B es significativo.

Hay efectos interactivos
entre A y B.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-36

DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (4)
Los posibles modelos ANOVA de 2 factores son, en funcin de la existencia de efectos principales
de alguno de los factores, o de ambos, y de interacciones adicionales:

(M 0) El modelo bsico de ausencia de efectos:
ijk ijk
Y + =

(M 1) El modelo ANOVA completo:
ijk ij j i ijk
Y + + + + =

(M 2) El modelo ANOVA aditivo es:
ijk j i ijk
Y + + + =

(M 3) El modelo ANOVA del factor A: ijk i ijk
Y + + =

(M 4) El modelo ANOVA del factor B:
ijk j ijk
Y + + =


Las hiptesis que suelen contrastarse ms habitualmente son:

H
1
: No existen efectos interactivos o equivalentemente, los efectos de los factores A y B son
aditivos.
H
2
: No existen diferencias en la variable de respuesta asociadas a los distintos niveles del
factor A.
H
3
: No existen diferencias en la variable de respuesta asociadas a los distintos niveles del
factor B.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-37
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (5)
La hiptesis anteriores se contrastan a partir la suma de cuadrados residual y el test de
Fisher:

H
1
: Se compara el modelo completo con el modelo aditivo.
H
2
: Se compara el modelo completo (aditivo, a veces) con el modelo ANOVA de B.
H
3
: Se compara el modelo completo (aditivo, a veces) con el modelo ANOVA de A.

Pero para disponer de las sumas de cuadrados residuales de los modelos implicados (M0) a (M3),
es necesario hacer la estimacin de los parmetros del modelo: ( ) y X b y y
T T T
= =

=
n
1 l
2

l l
y y SCR .

MODELO # Parm. ( ) S.C.Residual Hiptesis Estad. Fisher
(M1) ijk ij j i ijk
Y + + + + =

IJ n-IJ SCR
1

(M2)
ijk j i ijk
Y + + + =

I+J-1 n-I-J+1 SCR
2
H
1

(M2) (M1)
1
1
1 2
21

SCR SCR


(M3)
ijk i ijk
Y + + =

I n-I SCR
3
H
2
(M3) (M2)
1
1
2 3
32

SCR SCR


(M4)
ijk j ijk
Y + + =

J n-J SCR
4
H
3
(M4) (M2)
1
1
2 4
42

SCR SCR


(M0)
ijk ijk
Y + =

1 n-1 SCR
0

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-38
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (6)
Caso de Estudio 3: Mecnica de la inferencia en ANOVA 2 factores

MODELO #
Parm.
( ) S.C.Residual Hiptesis Estad.
Fisher
(M1)
ijk ij j i ijk
Y + + + + =

IJ=4 n-IJ=20 2,063

(M2)
ijk j i ijk
Y + + + =

I+J-1=3 n-I-
J+1=21
?
(5,745)
H
1

(M2) (M1)
20
063 , 2
1
683 , 3

(M3)
ijk i ijk
Y + + =

I=2 n-I=22 ?
(22,412)
H
2
(M3) (M2)
20
063 , 2
1
667 , 16

(M4)
ijk j ijk
Y + + =

J=2 n-J=22 ?
(77,852)
H
3
(M4) (M2)
20
063 , 2
1
107 , 72

(M0)
ijk ijk
Y + =

1 n-1=23 94,518


La ortogonalidad de las distintas componentes permite una inferencia sencilla:

( ) ( ) ( )
1
SCR SCM SCM SCM SCT + + + = ( ) ( ) ( )
1
1 1
2
1
2
1
2
SCR y y y y K y y KI y y KJ
I
i
J
j
j i ij
J
j
j
I
i
i
+ + + + =

= = = =

y
( ) ( ) ( )
3 2 1
SCM SCM SCM = =
, as como
( ) ( ) ( )
3 2 1
SCM SCM SCM = =
.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-39
DESCRIPCIN DEL MODELO ANOVA CON 2 FACTORES (7)
Caso de Estudio 3: Mecnica de la inferencia en ANOVA 2 factores (Cont.)

MTB > Twoway 'TIEMPO' 'FACTOR A' 'FACTOR B';
Two-way Analysis of Variance
Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 698,93 0,000
FACTOR B 1 16,667 16,667 161,55 0,000
Interaction 1 3,682 3,682 35,69 0,000
Error 20 2,063 0,103
Total 23 94,518
MTB > Twoway 'TIEMPO' 'FACTOR A' 'FACTOR B'.
SUBC> Additive.
Two-way Analysis of Variance
Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,107 72,107 263,58 0,000
FACTOR B 1 16,667 16,667 60,92 0,000
Error 21 5,745 0,274
Total 23 94,518
MTB > Oneway 'TIEMPO' 'FACTOR A'.
One-way Analysis of Variance
Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR A 1 72,11 72,11 70,78 0,000
Error 22 22,41 1,02
Total 23 94,52
MTB > Oneway 'TIEMPO' 'FACTOR B'.
One-way Analysis of Variance
Analysis of Variance for TIEMPO
Source DF SS MS F P
FACTOR B 1 16,67 16,67 4,71 0,041
Error 22 77,85 3,54
Total 23 94,52
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-40
TRATAMIENTO POR REGRESIN DEL MODELO ANOVA DE 2 FACTORES (1)

El modelo aditivo
ijk j i ijk
Y + + + =
del factor A
y del factor B tiene un total de
parmetros de 1 + I + J

matriz de diseo con columnas


linealmente dependientes.

Las dos restricciones de suma cero a
aadir son
0
1
=

=
I
i
i

y
0
1
=

=
J
j
j

matriz de diseo restringida con


un nmero de columnas independientes
1 + (I-1) + (J-1) = I+J-1.

Se pueden dar reglas mecnicas
fciles para la construccin del
modelo
+ =
R R
X Y
.


}
}

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

+
|
|
|
|
|
|
|
|
.
|

\
|
+
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|


)
`






)
`

=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|

IJK
IJ
K I
I
JK
J
K
J
I
IJK
IJ
K I
I
JK
J
K
J I n
y
y
y
y
y
y
y
y
IJ
I
J

M
M
M
M
M
M
M
M
M
L L
M M M M M
L L
M M M M M
L L
M M M M M
L L
M M M M M M M
L L
M M M M
L L
M M
L L
M M M M
L L
M
M
M
M
M
M
M
M
M
M
M
1
1
11
1
1 1
11
111
R
1
1
1
1
1
1
11
1
1 1
11
111
) 1 ( x
1 1 1 1 1
1 1 1 1 1
1
0
0
0 1 1 1 1
0 1 1 1 1
_ _ _ _ _ _ _
1 1 0 0 1
1 1 0 0 1
1
0
0
0 1 0 1 1
0 1 0 1 1
_
1
1
11
R
X
0 0
Y
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-41
TRATAMIENTO POR REGRESIN DEL MODELO ANOVA DE 2 FACTORES (2)

Se pueden dar reglas mecnicas fciles para la construccin del modelo
+ =
R R
X Y
. Ms
sintticamente, respetando la ordenacin de los datos ilustrada anteriormente para I=J=3


1 1
1 1

1 1 1 1
1 -1 -1
1 1
X= 1 1 1 X
R
= 1 1 1
1 -1 -1
1 1
1 1 1 1 -1 -1 1
1 -1 -1

1
I


1

J


1
1 I


1
1 J




0
0
1
1
= + +
= + +
J
I


K
K
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-42
TRATAMIENTO POR REGRESIN DEL MODELO ANOVA DE 2 FACTORES (3)

El modelo de regresin ANOVA interactivo
ijk ij j i ijk
Y + + + + =
.
Total de parmetros del modelo completo es 1 + I + J + IJ = (I+1)(J+1).
El nmero de parmetros independientes es: 1 + (I-1) + (J-1) + (I-1)(J-1) = IJ.
Restricciones de suma-cero
0
1
=

=
I
i
i

y
0
1
=

=
J
j
j

(las anteriores) ms,


I i J j
J
j
ij
I
i
ij
L K 1 0 , 1 0
1 1
= = = =

= =

, que son I+J restricciones, pero una es redundante, y
sin prdida de generalidad se elimina la suma de la ltima columna de los parmetros
0
1
=

=
I
i
iJ

11

...
1 , 1 J

J 1

0
1
1
=

=
J
j
j

21

...
1 , 2 J

J 2

0
1
2
=

=
J
j
j

... ... ... ... ...

11

...
1 , J I

IJ

0
1
=

=
J
j
Ij


0
1
1
=

=
I
i
i


...
0
1
1 ,
=

=

I
i
J i



0
1
=

=
I
i
iJ



FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-43
TRATAMIENTO POR REGRESIN DEL MODELO ANOVA DE 2 FACTORES (4)
El modelo de regresin ANOVA con interacciones
ijk ij j i ijk
Y + + + + =
resulta de lgica de
construccin muy automatizable.

Se pueden dar reglas mecnicas fciles para la construccin del modelo
+ =
R R
X Y
.
Sintticamente, respetando la ordenacin de los datos ilustrada anteriormente para I=J=3


1 1
1 1 1 1
-1 -1 -1 -1
1 1
X
R
= 1 1 1 1
-1 -1 -1 -1
1 -1 -1
1 -1 -1 1 -1 -1
-1 -1 1 1 1 1

1
1 I


1
1 J


11
1 1 J ,


1 1, I


1 1 J I ,



FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-44
CASO DE ESTUDIO 4: TWO-WAY ANOVA (1)

Construccin del modelo de regresin para la estimacin de un modelo ANOVA de 2 factores, a
partir de datos ficticios correspondientes a un Factor A con I=3 niveles, un Factor B con J=2
niveles y un nmero de rplicas constante K=2, en total n=12 .Se detalla la construccin del modelo
ANOVA completo por regresin, para a continuacin estimar el modelo con el procedimiento
Regression de MINITAB .


Niveles Factor B
Niveles
Factor A
B
1
B
2
Total
A
1
6,8 6,6 5,3 6,1 24,8
A
2
7,5 7,4 7,2 6,5 28,6
A
3
7,8 9,1 8,8 9,1 34,8
Total 45,2 43,0 88,2

El modelo ANOVA completo ijk ij j i ijk
Y + + + + =
tiene 12
(=1+3+2+6) parmetros lo que da un modelo inicial al que deben
aadirse los constricciones...
0
0
0
0
0
0
31 21 11
32 31
22 21
12 11
2 1
3 2 1
= + +
= +
= +
= +
= +
= + +






FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-45
CASO DE ESTUDIO 4: TWO-WAY ANOVA (2)
La formulacin por regresin del modelo con 1+2+1+2x1=6 variables mudas resultante de la
reparametrizacin con las constricciones de suma cero da una matriz de diseo restringida,

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
+
|
|
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|








=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
322
321
311
311
222
221
212
211
122
121
112
111
R
21
11
1
2
1
12x6
1 1 1 1 1 1
1 1 1 1 1 1
1 1 1 1 1 1
1 1 1 1 1 1
1 0 1 1 0 1
1 0 1 1 0 1
1 0 1 1 0 1
1 0 1 1 0 1
0 1 1 0 1 1
0 1 1 0 1 1
0 1 1 0 1 1
0 1 1 0 1 1
1 , 9
8 , 8
1 , 9
8 , 7
5 , 6
2 , 7
4 , 7
5 , 7
1 , 6
3 , 5
6 , 6
8 , 6
2

R
X Y
322
321
312
311
222
221
21
211
122
121
112
111


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-46
CASO DE ESTUDIO 4: TWO-WAY ANOVA (3)
( )
|
|
|
|
|
|
|
|
.
|

\
|

=
|
|
|
|
.
|

\
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|
= = =

117 , 0
317 , 0
183 , 0
2 , 0
15 , 1
35 , 7
2 , 2
3
2 , 2
2 , 6
10
2 , 88
6
1
0 0 0 0
6
1
0 0 0 0
0 0 0 0 0
0 0 0
6
1
0
0 0 0
6
1
0
0 0 0 0 0
2 , 2
3
2 , 2
2 , 6
10
2 , 88
1
8 4 0 0 0 0
4 8 0 0 0 0
0 0 12 0 0 0
0 0 0 8 4 0
0 0 0 4 8 0
0 0 0 0 0 12
12
1
12
1
12
1
12
1
12
1
12
1
Y X X X b Y X b X X
T
R
1
R
T
R R
T
R R R
T
R


La suma de cuadrados explicada por
el modelo vale 14,35 y los
estimadores de los parmetros del
modelo ANOVA completo ...

La suma de cuadrados explicada por
el modelo se descompone en la suma
de cuadrados explicada por cada uno
de los trminos...



183 , 0

183 , 0

35 , 1 2 , 0 15 , 1
35 , 7
1 2 4 1
2 1 3 3 2 2 1
1
= = = =
= = = = = =
= =

b
b b
b
434 , 0 0
434 , 0 117 , 0 317 , 0 0
117 , 0 0 117 , 0
317 , 0 0 317 , 0
31 32 32 31
21 11 31 31 21 11
21 22 22 21 6 21
11 12 12 11 5 11
= = = +
= = = = + +
= = = + = =
= = = + = =




b
b
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-47

CASO DE ESTUDIO 4: TWO-WAY ANOVA (4)
( ) = = = =

= =
2 2
1
2
1
2
n y n y y y SCM
n
i
i
n
i
i R R
T
R
T
R
b X X b

( )
( ) ( ) 35 , 14 2067 , 1 4033 , 0 74 , 12 12

8 4
4 8

12

8 4
4 8
12
12
2
21
11
21 11
2
1
2
1
2 1
2
2
8 4 0 0 0 0
4 8 0 0 0 0
0 0 12 0 0 0
0 0 0 8 4 0
0 0 0 4 8 0
0 0 0 0 0 12
21

11

1

21
11
1
2
1
= + + =
|
|
.
|

\
|
|
|
.
|

\
|
+ +
|
|
.
|

\
|
|
|
.
|

\
|
+ =
=
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
.
|

\
|




Puede notarse que las predicciones en el modelo reducido son coherentes con el modelo inicial
completo, por ejemplo:

32 2 3 21 11 1 2 1 32
22 2 2 21 1 2 22
12 2 1 11 1 1 12
31 1 3 21 11 1 2 1 31






+ + + = + + =
+ + + = + =
+ + + = + =
+ + + = + =
y
y
y
y

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-48
CASO DE ESTUDIO 4: TWO-WAY ANOVA (5)
El modelo ANOVA aditivo
ijk j i ijk
Y + + + =
tiene 6 (=1+3+2) parmetros lo que da un modelo
inicial reparametrizable con las constricciones de suma cero en un modelo de regresin con
1+2+1=4 variables mudas independientes,




Los estimadores de los parmetros se
calculan resolviendo las ecuaciones
normales.

La suma de cuadrados explicada por el
modelo es 13,14. Los estimadores de los
parmetros del modelo ANOVA aditivo
son:

0
0
2 1
3 2 1
= +
= + +

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
+
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|




=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
322
321
311
311
222
221
212
211
122
121
112
111
1
2
1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 0 1
1 1 0 1
1 1 0 1
1 1 0 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 , 9
8 , 8
1 , 9
8 , 7
5 , 6
2 , 7
4 , 7
5 , 7
1 , 6
3 , 5
6 , 6
8 , 6
2

R
R
X Y
322
321
312
311
222
221
21
211
122
121
112
111
183 , 0

183 , 0

35 , 1 2 , 0 15 , 1
35 , 7
1 2 4 1
2 1 3 3 2 2 1
1
= = = =
= = = = = =
= =

b
b b
b
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-49
CASO DE ESTUDIO 4: TWO-WAY ANOVA (6)
Resultados del anlisis GLM del MINITAB y tratamiento por regresin.
Data Display
Row Y FACTOR A FACTOR B D1A D2A D1B D1A*D1B D2A*D1B
1 6,8 1 1 1 0 1 1 0
2 6,6 1 1 1 0 1 1 0
3 5,3 1 2 1 0 -1 -1 0
4 6,1 1 2 1 0 -1 -1 0
5 7,5 2 1 0 1 1 0 1
6 7,4 2 1 0 1 1 0 1
7 7,2 2 2 0 1 -1 0 -1
8 6,5 2 2 0 1 -1 0 -1
9 7,8 3 1 -1 -1 1 -1 -1
10 9,1 3 1 -1 -1 1 -1 -1
11 8,8 3 2 -1 -1 -1 1 1
12 9,1 3 2 -1 -1 -1 1 1

MTB > GLM 'Y' = 'FACTOR A' 'FACTOR B'
'FACTOR A'* 'FACTOR B'
General Linear Model
Factor Type Levels Values
FACTOR A fixed 3 1 2 3
FACTOR B fixed 2 1 2

Analysis of Variance for Y, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
FACTOR A 2 12,7400 12,7400 6,3700 25,82 0,001
FACTOR B 1 0,4033 0,4033 0,4033 1,64 0,248
FACTOR A*FACTOR B 2 1,2067 1,2067 0,6033 2,45 0,167
Error 6 1,4800 1,4800 0,2467
Total 11 15,8300
MTB > Regress 'Y' 5 'D1A' 'D2A' 'D1B' 'D1A*D1B' 'D2A*D1B';
SUBC> Constant.
Regression Analysis
The regression equation is
Y = 7,35 - 1,15 D1A - 0,200 D2A + 0,183 D1B + 0,317 D1A*D1B + 0,117 D2A*D1B

Predictor Coef StDev T P
1
2
3 2 1
9
8
7
6
FACTOR A
Y

M
E
D
I
A
FACTOR B
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-50
1
2
3
1 2
6
7
8
9
FACTOR B
Y

M
E
D
I
A
FACTOR A
Constant 7,3500 0,1434 51,27 0,000
D1A -1,1500 0,2028 -5,67 0,001
D2A -0,2000 0,2028 -0,99 0,362
D1B 0,1833 0,1434 1,28 0,248
D1A*D1B 0,3167 0,2028 1,56 0,169
D2A*D1B 0,1167 0,2028 0,58 0,586

S = 0,4967 R-Sq = 90,7% R-Sq(adj) = 82,9%
Analysis of Variance
Source DF SS MS F P
Regression 5 14,3500 2,8700 11,64 0,005
Residual Error 6 1,4800 0,2467
Total 11 15,8300

Source DF Seq SS
D1A 1 12,5000

MTB > Regress 'Y' 3 'D1A' 'D2A' 'D1B' ;
SUBC> Constant.
Regression Analysis
The regression equation is
Y = 7,35 - 1,15 D1A - 0,200 D2A + 0,183 D1B

Predictor Coef StDev T P
Constant 7,3500 0,1673 43,94 0,000
D1A -1,1500 0,2366 -4,86 0,001
D2A -0,2000 0,2366 -0,85 0,422
D1B 0,1833 0,1673 1,10 0,305
S = 0,5795 R-Sq = 83,0% R-Sq(adj) = 76,7%

Analysis of Variance
Source DF SS MS F P
Regression 3 13,1433 4,3811 13,05 0,002
Residual Error 8 2,6867 0,3358
Total 11 15,8300
Source DF Seq SS
D1A 1 12,5000

MTB > Regress 'Y' 2 'D1A' 'D2A' ...
Regression Analysis
The regression equation is
Y = 7,35 - 1,15 D1A - 0,200 D2A
95 , 8 434 , 0 183 , 0 35 , 1 35 , 7


45 , 8 434 , 0 183 , 0 35 , 1 35 , 7


85 , 6 117 , 0 183 , 0 2 , 0 35 , 7


45 , 7 117 , 0 183 , 0 2 , 0 35 , 7


7 , 5 317 , 0 183 , 0 15 , 1 35 , 7


7 , 6 317 , 0 183 , 0 15 , 1 35 , 7


32 2 3 32
31 1 3 31
22 2 2 22
21 1 2 21
12 2 2 12
11 1 1 11
= + + = + + + =
= + + = + + + =
= = + + + =
= + + = + + + =
= = + + + =
= + + = + + + =






y
y
y
y
y
y
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-51
1 1
1 2
2 1
2 2
3 1
3 2
6 7 8 9
-0,5
0,0
0,5
FITS1
R
E
S
I
1
FACTORES (A,B)
Predictor Coef StDev T P
Constant 7,3500 0,1691 43,45 0,000
D1A -1,1500 0,2392 -4,81 0,001
D2A -0,2000 0,2392 -0,84 0,425
S = 0,5859 R-Sq = 80,5% R-Sq(adj) = 76,1%

Analysis of Variance
Source DF SS MS F P
Regression 2 12,7400 6,3700 18,55 0,001
Residual Error 9 3,0900 0,3433
Total 11 15,8300

MTB > Regress 'Y' 1 'D1B' ...
Regression Analysis
The regression equation is
Y = 7,35 + 0,183 D1B
Predictor Coef StDev T P
Constant 7,3500 0,3585 20,50 0,000
D1B 0,1833 0,3585 0,51 0,620

S = 1,242 R-Sq = 2,5% R-Sq(adj) = 0,0%
Analysis of Variance
Source DF SS MS F P
Regression 1 0,403 0,403 0,26 0,620
Residual Error 10 15,427 1,543
Total 11 15,830
MTB > Plot 'RESI1'*'FITS1'...
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-52
CASO DE ESTUDIO 5: FACTORES CRUZADOS VERSUS ANIDADOS (1)
Construccin del modelo de regresin para la estimacin de un modelo ANOVA de 2 factores
anidado que representa un experimento para comparar 2 drogas, A
1
y A
2
(Factor A), una de las
cuales se ha empleado en K pacientes de 3 hospitales (B
1
a B
3
) y la otra en K pacientes de 2
hospitales distintos (B
4
y B
5
); los hospitales constituyen el Factor B.

Los factores no estn cruzados: en este diseo anidado tiene sentido comparar los efectos de
las 2 drogas (Factor A) y las posibles diferencias en la respuesta entre los hospitales que hayan
empleado la misma droga (Factor B).
Se detalla la construccin del modelo ANOVA completo por regresin, para a continuacin
estimar el modelo con el procedimiento Regression de MINITAB.

Factor A
Respuesta A
1
A
2

K=1 6,8 6,6 5,3 6,8 6,1
K=2 7,5 7,4 7,2 7,5 6,5
K=3 7,8 9,1 8,8 7,8 9,1
Factor B B
1
B
2
B
3
B
4
B
5

El modelo completo es
| |
25 24 13 12 11 2 1
+ + + + + + + = Y E
tiene 8 (=1+2+5)
parmetros que se reparametriza con las constricciones de suma cero ...
0
0
0
25 24
13 12 11
2 1
= +
= + +
= +



FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-53

+
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|







=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
R
24
12
11
1
1 0 0 1 1
1 0 0 1 1
1 0 0 1 1
1 0 0 1 1
1 0 0 1 1
1 0 0 1 1
0 1 1 1 1
0 1 1 1 1
0 1 1 1 1
0 1 0 1 1
0 1 0 1 1
0 1 0 1 1
0 0 1 1 1
0 0 1 1 1
0 0 1 1 1
1 , 9
5 , 6
1 , 6
8 , 7
5 , 7
8 , 6
8 , 8
2 , 7
3 , 5
1 , 9
4 , 7
6 , 6
8 , 7
5 , 7
8 , 6

R
X Y
253
252
251
243
242
241
133
132
131
123
122
121
113
112
111
CASO DE ESTUDIO 5: FACTORES CRUZADOS VERSUS ANIDADOS (2)

Los estimadores de los 5 (1+1+3) parmetros
se calculan resolviendo las ecuaciones
normales:

( )
|
|
|
|
|
|
.
|

\
|

=
|
|
|
.
|

\
|
|
|
|
.
|

\
|
= = =

500 , 1
311 , 0
022 , 0
361 , 0
028 , 7
9
8 , 1
8 , 0
5 , 26
5 , 106
1
6 0 0 0 0
0 6 3 0 0
0 3 6 0 0
0 0 0 15 3
0 0 0 3 15
Y X X X b Y X b X X
T
R
1
R
T
R R
T
R R R
T
R

Los estimadores de los parmetros del
modelo ANOVA anidado completo son:






5 , 1 0 5 , 1
289 , 0 0 311 , 0 022 , 0
361 , 0 361 , 0
028 , 7
24 25 25 24 5 24
12 11 13 13 12 11 4 12 3 11
1 2 2 1
1
= = = + = =
= = = + + = = = =
= = = =
= =


b
b b
b
b
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-54
CASO DE ESTUDIO 5: FACTORES CRUZADOS VERSUS ANIDADOS (3)

El modelo ANOVA anidado para contrastar la hiptesis nula No hay diferencias entre las
drogas, pero s entre los hospitales, H
0
:
0
2 1
= =
, sera
ijk j ijk
Y + + =
tiene 4 (=1+2+1) parmetros independientes,
que al aadirse las constricciones de suma cero ...

Resultados de General Linear Model primero y despus con Regression de MINITAB. Se
ilustra la definicin de variables mudas.

La contrastacin de la hiptesis nula mediante el estadstico de Fisher a partir de los
resultados de la regresin muestra que no hay evidencia para rechazar la hiptesis nula:


96 , 4 6302 , 1
10
520 , 11
1
520 , 11 398 , 13
5 15 1
05 , 0
10 , 1
1 1 0
= =

= < F
SCR SCR SCR
f





0

0

5 4
3 2 1
= +
= + +


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-55

MTB > PRINT C1-C10
Data Display
Row Y FACTOR A FACTOR B D1A D1A*D1B D1A*D2B D1A*D4B D1B D2B D4B
1 6,8 1 1 1 1 0 0 1 0 0
2 7,5 1 1 1 1 0 0 1 0 0
3 7,8 1 1 1 1 0 0 1 0 0
4 6,6 1 2 1 0 1 0 0 1 0
5 7,4 1 2 1 0 1 0 0 1 0
6 9,1 1 2 1 0 1 0 0 1 0
7 5,3 1 3 1 -1 -1 0 -1 -1 0
8 7,2 1 3 1 -1 -1 0 -1 -1 0
9 8,8 1 3 1 -1 -1 0 -1 -1 0
10 8,8 2 4 -1 0 0 -1 0 0 1
11 7,9 2 4 -1 0 0 -1 0 0 1
12 7,8 2 4 -1 0 0 -1 0 0 1
13 5,9 2 5 -1 0 0 1 0 0 -1
14 4,5 2 5 -1 0 0 1 0 0 -1
15 5,1 2 5 -1 0 0 1 0 0 -1
MTB > GLM 'Y' = 'FACTOR A' 'FACTOR B'( 'FACTOR A')...
General Linear Model
Factor Type Levels Values
FACTOR A fixed 2 1 2
FACTOR B(FACTOR A) fixed 5 1 2 3 4 5

Analysis of Variance for Y, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
FACTOR A 1 1,878 1,878 1,878 1,63 0,231
FACTOR B(FACTOR A) 3 14,042 14,042 4,681 4,06 0,040
Error 10 11,520 11,520 1,152
Total 14 27,440
MTB > Regress 'Y' 4 'D1A'-'D1A*D4B'..

Regression Analysis
The regression equation is
Y = 7,03 + 0,361 D1A - 0,022 D1A*D1B + 0,311 D1A*D2B - 1,50 D1A*D4B

Predictor Coef StDev T P
Constant 7,0278 0,2828 24,85 0,000
D1A 0,3611 0,2828 1,28 0,231
D1A*D1B -0,0222 0,5060 -0,04 0,966
D1A*D2B 0,3111 0,5060 0,61 0,552
D1A*D4B -1,5000 0,4382 -3,42 0,007

S = 1,073 R-Sq = 58,0% R-Sq(adj) = 41,2%
42 , 71 5 , 1 361 , 0 28 , 70
42 , 68 5 , 1 361 , 0 28 , 70
36 , 70 281 , 0 361 , 0 28 , 70
95 , 70 311 , 0 361 , 0 28 , 70
62 , 70 022 , 0 361 , 0 28 , 70
25 2 25
24 2 24
13 1 13
12 1 12
11 1 11
= + = + + =
= = + + =
= + = + + =
= + + = + + =
= + = + + =





y
y
y
y
y
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-56
Analysis of Variance

Source DF SS MS F P
Regression 4 15,920 3,980 3,45 0,051
Residual Error 10 11,520 1,152
Total 14 27,440

Source DF Seq SS
D1A 1 1,878
D1A*D1B 1 0,107
D1A*D2B 1 0,436
D1A*D4B 1 13,500

MTB > Regress 'Y' 3 'D1B'-'D4B'.

Regression Analysis

The regression equation is
Y = 7,10 - 0,022 D1B + 0,311 D2B + 1,50 D4B

Predictor Coef StDev T P
Constant 7,1000 0,2850 24,92 0,000
D1B -0,0222 0,5203 -0,04 0,967
D2B 0,3111 0,5203 0,60 0,562
D4B 1,5000 0,4506 3,33 0,007

S = 1,104 R-Sq = 51,2% R-Sq(adj) = 37,9%

Analysis of Variance
Source DF SS MS F P
Regression 3 14,042 4,681 3,84 0,042
Residual Error 11 13,398 1,218
Total 14 27,440

Source DF Seq SS
D1B 1 0,107
D2B 1 0,436
D4B 1 13,500

MTB >
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-57

INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA






FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-58

MODELOS ANOVA MS COMPLEJOS

La extensin de la formulacin por regresin a modelos ANOVA ms complejos, por ejemplo al
aumentar el nmero de factores en los diseos experimentales o contrastar hiptesis ms
complicadas.

En los diseos de experimentos reales los factores pueden estar cruzados o anidados o una
mezcla de ambos: todos ellos pueden tratarse con el procedimiento General Linear Model de
MINITAB o formularse mediante variable mudas por modelos de regresin.

Al aumentar el nmero de factores (A, B, C, ...) tambin deben formularse modelos que incluyan
trminos de interaccin de orden superior (AB, BC, AC, ABC,...), no supone diferencias
esenciales en el proceder, aunque sin lugar a dudas se complica grandemente la interpretacin
de los resultados.

Las interacciones de orden elevado pueden conducir a prdida de robustez por la presencia de
valores aberrantes y a contrastes en cadena escabrosos, AB significativo, BC no significativo,
ABC significativo, etc.

Las hiptesis a contrastar surgen del conocimiento externo del problema.

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-59


INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-60
EL MODELO ANCOVA

Los modelos ANCOVA o modelos de anlisis de la covarianza son modelos mixtos en los que
aparecen tanto variables mudas que representan niveles de factores o interacciones como
variables continuas o covariantes.

Se pretende analizar las medias definidas por los niveles de los factores (y sus interacciones),
despus de incluir el efecto de las covariantes en la variable de respuesta.

Se presenta un Caso de Estudio con una nica covariante, pero el mtodo de anlisis propuesto
se puede extender directamente a situaciones ms generales.








FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-61
CASO DE ESTUDIO 6: LOS VELOCISTAS

Los datos muestran las prestaciones obtenidas por unos velocistas segn los tres niveles de un
factor que representan tres mtodos de entrenamiento distintos, y una variable explicativa,
covariante, que representa las prestaciones obtenidas antes de iniciar el entrenamiento. Se desea
comparar los mtodos de entrenamiento teniendo en cuenta las diferencias en las aptitudes
iniciales en las tres clases de sujetos de estudio (Dobson, 1990).
Factor A
Rplica A
1
A
2
A
3

k=1 6 3 8 4 6 3
k=2 4 1 9 5 7 2
k=3 5 3 7 5 7 2
k=4 3 1 9 4 7 3
k=5 4 2 8 3 8 4
k=6 3 1 5 1 5 1
k=7 6 4 7 2 7 4
(y, x) y x y x y x

El grfico indica que las prestaciones finales se
incrementan linealmente con las aptitudes
iniciales y que las prestaciones finales son
generalmente superiores para los mtodos de entrenamiento 2 y 3 que para el 1.
1
2
3
5 4 3 2 1
9
8
7
6
5
4
3
X
Y
FACTOR A
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-62
FORMULACIN DEL MODELO ANCOVA (1)
Ejemplo sin datos, de carcter sociolgico y muy intuitivo, inspirado en la propuesta de Fox
(84): relacin entre los ingresos (Y) y el nivel de educacin (X) entre la poblacin blanca,
oriental y negra de los EEUU (Factor A, I=3 ).






Modelo (M1)
Interaccin
factor
covariante: sin
correlacin entre
1
2
3
1 2 3 4 5 6 7 8
1
2
3
4
5
6
7
8
9
X
Y
Bl
Bl
Bl
Bl
Or
Or
Or
Or
Ne
Ne
Ne
Ne
FACTOR A
1
2
3
0 1 2 3 4 5 6 7 8 9
0
1
2
3
4
5
6
7
8
9
X
Y
Bl
Bl
Bl
Bl
Or
Or
Or
Or
Ne
Ne
Ne
Ne
FACTOR A
Modelo (M1)
Interaccin factor
covariante: con
correlacin entre
raza y educacin
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-63
FORMULACIN DEL MODELO ANCOVA (2)







Modelo (M2):
Sin interaccin factor
covariante, sin
correlacin entre raza
y educacin
Modelo (M2):
Sin Interaccin factor
covariante, con
correlacin entre raza y
educacin
1
2
3
9 8 7 6 5 4 3 2 1 0
9
8
7
6
5
4
3
2
1
0
X
Y
Ne
Ne
Ne
Ne
Or
Or
Or
Or
Bl
Bl
Bl
Bl
FACTOR A
1
2
3
8 7 6 5 4 3 2 1
7
6
5
4
3
2
X
Y
Ne
Ne
Ne
Ne
Or
Or
Or
Or
Bl
Bl
Bl
Bl
FACTOR A
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-64
FORMULACIN DEL MODELO ANCOVA (3)
Modelo (M3) sin
efecto aditivo
de raza

Modelo (M4)
ingresos y
educacin sin
efecto de raza




Modelo (M5) sin relacin
con educacin o raza




1
2
3
3 4 5 6
3
4
5
6
X
Y
Bl
Bl
Bl
Bl
Or Or Or Or
Ne
Ne
Ne
Ne
FACTOR A
1
2
3
3 4 5 6
3
4
5
6
X
Y
Bl
Bl
Bl
Bl
Or
Or
Or
Or
Ne
Ne
Ne
Ne
FACTOR A
1
2
3
3 4 5 6
3
4
5
6
X
Y
Bl
Bl
Bl
Bl Or
Or
Or
Or
Ne
Ne
Ne
Ne
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-65
FORMULACIN DEL MODELO ANCOVA (4)

(M 1) El modelo ANCOVA completo se formula ik ik i i ik
x Y + + + + = ) (
tiene 8 (=1+3+4)
parmetros al reparametrizarse con las constricciones de suma cero, se configura una matriz
de diseo restringida con 6 (=1+2+1+2) columnas independientes:


1 1

x
1
x
1
1 1

x
1
x
1



X= 1 1 x
2
x
2
X
R
= 1 1 x
2
x
2



1 1 x
3
x
3
1 -1 -1 x
3
-x
3
-x
3



1
2



1

2

3


1

2

1

2




0
0
3 2 1
3 2 1
= + +
= + +


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-66
FORMULACIN DEL MODELO ANCOVA (5)
El modelo ANCOVA de pendientes paralelas se formula ik ik i ik
x Y + + + =
, tiene
5 (=1+3+1) parmetros que al aadirse la constriccin
0
3 2 1
= + +
da un
modelo de regresin equivalente con 1+2+1=4 variables independientes.



1 1

x
1
1 1

x
1



X= 1 1 x
2
X
R
= 1 1 x
2



1 1 x
3
1 -1 -1 x
3



1
2



1

2



1 x
1



X= X
R
= 1 x
2



1 x
3



El modelo de regresin simple
ik ik ik
x Y + + =
tiene 2 (=1+1) parmetros
independientes.
(M 2)
(M 4)
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-67

FORMULACIN DEL MODELO ANCOVA (6)
El modelo ANCOVA de centro de gravedad comn se formula
( )
ik ik i ik
x Y + + + =

tiene 5 (=1+1+1) parmetros y la constriccin
0
3 2 1
= + +
configura un modelo
de regresin equivalente con 1+1+2=4 variables independientes.


1 x
1
x
1
1 x
1
x
1



X= 1 x
2
x
2
X
R
= 1 x
2
x
2



1 x
3
x
3
1 x
3
-x
3
-x
3



1

2

3


1

2


1


X
R
= 1


1



Un caso extremo es el modelo
ik ik
Y + = de perturbacin aleaotoria que tiene 1
parmetro.

(M 3)
(M 5)
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-68
FORMULACIN DEL MODELO ANCOVA (7)

Continuacin del Caso de Estudio 6 ...

Se detalla el proceso de estimacin de los modelos (M1) y (M2) por regresin, as como el
contraste de significacin de la interaccin factor-covariante.

Los resultados calculados a mano se comparan con los resultados de los procedimientos GLM y
Regression de MINITAB.

El proceso de definicin de variables mudas y adicin de constricciones al modelo de regresin
inicial puede generalizarse al caso de ms de un regresor y ms de un factor con facilidad.
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-69
CASO DE ESTUDIO 6: Los Velocistas (CONT.)
La formulacin del modelo ANCOVA completo
por regresin tiene 8 (=1+3+4) parmetros
ik ik i i ik
x Y + + + + = ) (
al que deben
aadirse las constricciones de suma cero:





La suma de cuadrados explicada por el modelo
es 54,175 y los estimadores de los parmetros
del modelo ANCOVA completo son:



0
0
3 2 1
3 2 1
= + +
= + +

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
+
|
|
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|







37
36
35
34
33
32
31
27
26
25
24
23
22
21
17
16
15
14
13
12
11
R
2
1
2
1
4 4 4 1 1 1
1 1 1 1 1 1
4 4 4 1 1 1
3 3 3 1 1 1
2 2 2 1 1 1
2 2 2 1 1 1
3 3 3 1 1 1
2 0 2 1 0 1
1 0 1 1 0 1
3 0 3 1 0 1
4 0 4 1 0 1
5 0 5 1 0 1
5 0 5 1 0 1
4 0 4 1 0 1
0 4 4 0 1 1
0 1 1 0 1 1
0 2 2 0 1 1
0 1 1 0 1 1
0 2 3 0 1 1
0 1 1 0 1 1
0 3 3 0 1 1
7
5
8
7
7
7
6
7
5
8
9
7
9
8
6
3
4
3
5
4
6

R
X Y
37
36
35
34
33
32
31
27
26
25
24
23
22
21
17
16
15
14
13
12
11
747 , 0
863 , 0 016 , 1 879 , 1
234 , 4
4 1
2 1 3 3 2 2 1
1
= =
= = = = = =
= =
b
b b
b

151 , 0

0

070 , 0

221 , 0

2 1 3 3 2 1
6 2 5 1
= = = + +
= = = =

b b
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-70

CASO DE ESTUDIO 6: Los Velocistas (3)
En la formulacin del modelo ANCOVA completo los estimadores de los parmetros se calculan
resolviendo las ecuaciones normales:

( )
|
|
|
|
|
|
|
|
.
|

\
|

=
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|
=
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|
= =

070 , 0
221 , 0
747 , 0
016 , 1
879 , 1
234 , 4
59
57
398
6
16
131
0599 , 0 0263 , 0 0113 . 0 1786 , 0 0687 , 0 0119 , 0
0263 , 0 0732 , 0 0020 , 0 0687 , 0 1759 , 0 0146 , 0
0113 , 0 0020 , 0 0356 , 0 0119 , 0 0146 , 0 0953 , 0
1785 , 0 0587 , 0 0119 , 0 6440 , 0 2431 , 0 0227 , 0
0687 , 0 1759 , 0 0146 , 0 2431 , 0 5311 , 0 0902 , 0
0119 , 0 0146 , 0 0953 , 0 0227 , 0 0902 , 0 3106 , 0
59
57
398
6
16
131
1
155 59 37 43 19 5
59 100 18 19 34 4
37 18 196 5 4 58
43 19 5 14 7 0
19 34 4 7 14 0
5 4 58 0 0 21
Y X X X b
T
R
1
R
T
R R


El modelo ANCOVA sin interacciones (rectas paralelas)
ik ik i ik
x Y + + + =
tiene 5 (=1+3+1)
parmetros al que debe aadirse la constriccin
0
3 2 1
= + +
para formular por regresin
el modelo con 1+2+1=4 variables independientes ...

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-71
CASO DE ESTUDIO 6: Los Velocistas (4)
El modelo ANCOVA sin interacciones (rectas paralelas)
ik ik i ik
x Y + + + =


La suma de cuadrados explicada por el modelo tiene el
valor 53,507. Los estimadores de los parmetros del
modelo ANCOVA sin interacciones factor-covariante se
calculan resolviendo las ecuaciones normales:






+
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.
|

\
|







R
R
X Y

2
1
4 1 1 1
1 1 1 1
4 1 1 1
3 1 1 1
2 1 1 1
2 1 1 1
3 1 1 1
2 1 0 1
1 1 0 1
3 1 0 1
4 1 0 1
5 1 0 1
5 1 0 1
4 1 0 1
4 0 1 1
1 0 1 1
2 0 1 1
1 0 1 1
3 0 1 1
1 0 1 1
3 0 1 1
7
5
8
7
7
7
6
7
5
8
9
7
9
8
6
3
4
3
5
4
6
37
36
35
34
33
32
31
27
26
25
24
23
22
21
17
16
15
14
13
12
11
( )
|
|
|
|
|
.
|

\
|

=
|
|
|
.
|

\
|
|
|
|
.
|

\
|
= = =

743 , 0
838 , 0
35 , 1
196 , 4
398
6
16
131
1
196 5 4 58
5 14 7 0
4 7 14 0
58 0 0 21
Y X X X b Y X b X X
T
R
1
R
T
R R
T
R R R
T
R
743 , 0
512 , 0 838 , 0 35 , 1
19 , 4
4
2 1 3 3 2 2 1
1
= =
= = = = = =
= =
b
b b
b

FACULTAT D INFORMTICA ESTADSTICA


Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-72
CASO DE ESTUDIO 6: Los Velocistas (5)

Los resultados MINITAB de General
Linear Model y Regression con la
codificacin de variables mudas
efectuada (suma cero) se indica a
continuacin.

En este punto una consideracin final:
los modelos deben validarse y para ello
se debe proceder a un anlisis de los
residuos.

La contrastacin de la hiptesis nula
No hay interaccin entre los niveles
del factor y la covariante, (M2) versus
(M1), mediante el estadstico de
Fisher a partir de los resultados de la regresin muestra que no hay evidencia para rechazar la
hiptesis nula:

68 , 3 5192 , 0
15
635 , 9
2
635 , 9 302 , 10
6 21 2
05 , 0
15 , 2
1 1 2
= =

= < F
SCR SCR SCR
f

1
2
3
1 2 3 4 5
-2
-1
0
1
X
R
E
S
I
1
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-73

RESULTADOS MINITAB
Worksheet size: 100000 cells
MTB > Indicator 'FACTOR A' C4 C5 C8.
MTB > LET C4=C4-C8
MTB > LET C5=C5-C8
MTB > LET C6=C4*C3
MTB > LET C7=C5*C3
MTB > print c1-c7
Data Display
Row Y FACTOR A X D1A D2A X1A X1B
1 6 1 3 1 0 3 0
2 4 1 1 1 0 1 0
3 5 1 3 1 0 3 0
4 3 1 1 1 0 1 0
5 4 1 2 1 0 2 0
6 3 1 1 1 0 1 0
7 6 1 4 1 0 4 0
8 8 2 4 0 1 0 4
9 9 2 5 0 1 0 5
10 7 2 5 0 1 0 5
11 9 2 4 0 1 0 4
12 8 2 3 0 1 0 3
13 5 2 1 0 1 0 1
14 7 2 2 0 1 0 2
15 6 3 3 -1 -1 -3 -3
16 7 3 2 -1 -1 -2 -2
17 7 3 2 -1 -1 -2 -2
18 7 3 3 -1 -1 -3 -3
19 8 3 4 -1 -1 -4 -4
20 5 3 1 -1 -1 -1 -1
21 7 3 4 -1 -1 -4 -4
MTB >
MTB > GLM 'Y' = 'FACTOR A' 'FACTOR A'* X;
SUBC> covariates 'X'.

FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-74
General Linear Model
Factor Type Levels Values
FACTOR A fixed 3 1 2 3
Analysis of Variance for Y, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
X 1 36,575 15,672 15,672 24,40 0,000
FACTOR A 2 16,932 6,693 3,346 5,21 0,019
FACTOR A*X 2 0,667 0,667 0,334 0,52 0,605
Error 15 9,635 9,635 0,642
Total 20 63,810
Term Coef StDev T P
Constant 4,2337 0,4467 9,48 0,000
X 0,7470 0,1512 4,94 0,000
X*FACTOR A
1 0,2207 0,2169 1,02 0,325
2 -0,0699 0,1962 -0,36 0,727
MTB >
MTB > Regress 'Y' 5 'D1A' 'D2A' 'X' 'X1A' 'X1B';
SUBC> Constant.
Regression Analysis

The regression equation is
Y = 4,23 - 1,88 D1A + 1,02 D2A + 0,747 X + 0,221 X1A - 0,070 X1B

Predictor Coef StDev T P
Constant 4,2337 0,4467 9,48 0,000
D1A -1,8788 0,5841 -3,22 0,006
D2A 1,0163 0,6432 1,58 0,135
X 0,7470 0,1512 4,94 0,000
X1A 0,2207 0,2169 1,02 0,325
X1B -0,0699 0,1962 -0,36 0,727

S = 0,8015 R-Sq = 84,9% R-Sq(adj) = 79,9%
Analysis of Variance
Source DF SS MS F P
Regression 5 54,175 10,835 16,87 0,000
Residual Error 15 9,635 0,642
Total 20 63,810

MTB > Regress 'Y' 3 'D1A' 'D2A' 'X' ;
SUBC> Constant.

Regression Analysis
( ) ( )
( ) ( )
( ) ( ) x x x y
x x x y
x x x y
6 , 0 09 , 5 151 , 0 747 , 0 86 , 0 23 , 4


817 , 0 25 , 5 07 , 0 747 , 0 02 , 1 23 , 4


968 , 0 35 , 2 221 , 0 747 , 0 88 , 1 23 , 4


3 3 . 3
2 2 . 2
1 1 . 1
+ = + + = + + + =
+ = + + = + + + =
+ = + + = + + + =



FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-75

The regression equation is
Y = 4,19 - 1,35 D1A + 0,838 D2A + 0,743 X
Predictor Coef StDev T P
Constant 4,1864 0,4277 9,79 0,000
D1A -1,3497 0,2558 -5,28 0,000
D2A 0,8381 0,2582 3,25 0,005
X 0,7429 0,1421 5,23 0,000

S = 0,7785 R-Sq = 83,9% R-Sq(adj) = 81,0%
Analysis of Variance
Source DF SS MS F P
Regression 3 53,507 17,836 29,43 0,000
Residual Error 17 10,302 0,606
Total 20 63,810
MTB > Regress 'Y' 3 'X' 'X1A' 'X1B';
SUBC> Constant.

Regression Analysis

The regression equation is
Y = 3,92 + 0,793 X - 0,398 X1A + 0,216 X1B

Predictor Coef StDev T P
Constant 3,9199 0,5320 7,37 0,000
X 0,7932 0,1822 4,35 0,000
X1A -0,3981 0,1189 -3,35 0,004
X1B 0,21637 0,09984 2,17 0,045

S = 0,9800 R-Sq = 74,4% R-Sq(adj) = 69,9%
Analysis of Variance
Source DF SS MS F P
Regression 3 47,482 15,827 16,48 0,000
Residual Error 17 16,327 0,960
Total 20 63,810

MTB > Regress 'Y' 1 'X' ;
SUBC> Constant.

Regression Analysis

The regression equation is
Y = 3,45 + 1,01 X

Predictor Coef StDev T P
Constant 3,4468 0,6112 5,64 0,000
X 1,0106 0,2001 5,05 0,000

S = 1,197 R-Sq = 57,3% R-Sq(adj) = 55,1%
Analysis of Variance
Source DF SS MS F P
Regression 1 36,575 36,575 25,52 0,000
Residual Error 19 27,234 1,433
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-76
Total 20 63,810
MTB > Plot 'Y'*'X'...
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-77


INTRODUCCIN
EL MODELO ANOVA DE UN FACTOR
CASO DE ESTUDIO 1
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 2

EL MODELO ANOVA DE DOS FACTORES
CASO DE ESTUDIO 3
FORMULACIN DEL MODELO POR REGRESIN
CASO DE ESTUDIO 4
CASO DE ESTUDIO 5

MODELOS ANOVA MS COMPLEJOS
EL MODELO ANCOVA
CASO DE ESTUDIO 6
FORMULACIN DEL MODELO ANCOVA POR REGRESIN

CONCLUSIONES
BIBLIOGRAFA
FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-78
CONCLUSIONES (1)

En la exposicin del tema se ha ilustrado como modelos especficos de anlisis de la varianza y
anlisis de la covarianza se podan estimar por tcnicas estndar de regresin mltiple, as
como el proceder en la contrastacin de hiptesis habituales que aparecen en tales anlisis.

La seleccin cuidadosa de las variables mudas es el punto crucial. A pesar de que muchas
reparametrizaciones pueden resultar vlidas en modelos simples, algunas son mejores que
otras, principalmente cuando se estudian interacciones entre los niveles de factores.

En diseos de experimentos complejos no estndares y no balanceados es donde se aprecia la
potencia del enfoque descrito. Si el diseo de experimentos es estndar y balanceado es ms
interpretable el tratamiento del modelo por los procedimientos Balanced ANOVA o Two-Way
ANOVA de MINITAB.

Ante diseos no balanceados o muy complejos y por falta de ortogonalidad en las componentes,
resulta ms seguro y exacto recalcular los sucesivos modelos por regresin y realizar los
contrastes de significacin manualmente a partir de las sumas de cuadrados residuales de los
modelos representativos (varianza incremental) y el estadstico de Fisher.


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-79
CONCLUSIONES (2)

La formulacin por regresin pone de manifiesto la existencia de un modelo en el anlisis de la
varianza y la covarianza.

La formulacin por regresin pone de manifiesto que el anlisis de los residuos en los modelos
de anlisis de la varianza y de la covarianza juega el mismo papel que en los modelos de
regresin normal clsica.

Los modelos lineales generales ofrecen una visin unificada de la regresin, el anlisis de la
varianza y el anlisis de la covarianza, son elegantes y potentes, y mirando ms all, el
siguiente paso consiste en permitir distribuciones de los errores no normales y relaciones
entre regresores y respuesta no lineales que nos ocupa el resto del temario.


FACULTAT D INFORMTICA ESTADSTICA
Dept. Estad sti ca e Investi gaci n Operati va - UPC
Setembre del 2. 004 Dra. L di a Montero pgi na 7-80

BIBLIOGRAFA

A. Dobson (1.990). An Introduction to Generalized Linear Models. Chapman and Hall.
N.R. Draper y H. Smith (1.981). Applied Regression Analysis. John Wiley.
J. Fox (1.997). Applied Regression Analysis, Models and Related Methods. Sage Publications.
L. Lebart, A. Morineau y J.P. Fnelon (1.985). Traitement des donnes statistiques: Mthodes
et programmes. Ed. Bordas (Paris).
J.K. Lindsey (1.997). Applying Generalized Linear Models. Springer-Verlag.
P. McCullagh y J.A. Nelder (1.989). Generalized Linear Models. Chapman and Hall.
MINITAB Reference Manual, Release 1.1 for Windows. State College, PA: MINITAB Inc.
(1.996).
D. Pea Snchez de la Rivera (1.994). Estadstica Modelos y Mtodos (2): Modelos lineales y
series temporales. Alianza Universidad Textos.

Vous aimerez peut-être aussi