Académique Documents
Professionnel Documents
Culture Documents
Ancova GLM
Ancova GLM
Rgressions
Analyse de Covariance
Modles Linaires Gnraliss
Pour un nombre de comparaisons k , si H0 est vraie, la probabilit de laccepter pour tous les k
est (1 - ")k
ex: pour 4 moyennes, (1 - ")k =(0.95)6 = .735; alors, " (pour toutes les comparaisons) = 0.265
En comparant les moyennes des 4 chantillons provenant de la mme population on sattend
dtecter des diffrences significatives pour une paire dans 27% des cas
0.20
0.16
Taux de croissance 8
(cm/jour)
0.12
0.08
0.04
0.00
16
20
24
Temprature (C)
28
240
Poids (kg)
200
160
120
Site 1
Site 2
Site 3
Pour le Type I, les facteurs peuvent tre manipuls par lexprimentateur, pas
dans le Type II
Les calculs pour les deux types sont identiques mais seulement pour lANOVA un
critre de classification !
Procdure
Variable
dpendante
Variable(s) indpendante(s)
ANOVA 1 facteur
1 continue
1 discontinue*
Attention : lANOVA est plus fiable et plus robuste que les comparaisons
multiples. Une CM ne doit pas tre faite si H0 (1 phase ANOVA) est accepte !
Elle pourrait ventuellement voir des diffrences l o il ny en a pas !!
En plus, une ANOVA plusieurs facteurs permet de tester les interactions entre
facteurs.
x
x
Facteur Y
Y1
x
Y2
Facteur X
X: pas deffet; Y:
faible effet (ou rien
si mme ligne); pas
dinteraction
X: effet important;
Y: faible effet; pas
dinteraction
X: pas deffet; Y:
effet important;
pas dinteraction
X: effet important;
Y: effet important;
pas dinteraction
X: effet important;
Y: pas deffet;
lgre interaction
X: effet modr; Y:
effet important;
interaction importante
Manipulation par
lexprimentateur?
Estimation de leffet des
traitements?
Prdiction?
Calcul de lANOVA un critre
de classification
Calcul de lANOVA plusieurs
critres de classification
Facteur fixe
Facteur
alatoire
Oui
Non
Oui
Non
Oui
Non
Identique
Diffrent (trs !)
Procdure
Variable
dpendante
Variable(s) indpendante(s)
ANOVA 1 facteur
1 continue
1 discontinue*
2 ou plus discontinues *
Rgression simple
prdit
observ
Rgression simple :
coefficients de corrlation et de rgression
Le coefficient de corrlation r:
r=
b=
( X i X )(Yi Y )
i =1
X Y
( X i X )2
i =1
Cov ( X , Y )
Cov ( X , Y )
X
2
Alors
X
r=b
Y
Procdure
Variable
dpendante
Variable(s) indpendante(s)
ANOVA 1 facteur
1 continue
1 discontinue*
2 ou plus discontinues *
Rgression simple
1 continue
1 continue
2 ou plus continues
Rgression et ANOVA
Comparaison Taille-Poids chez diffrents
groupes de Vertbrs
Pour une taille donne, il est normal (on
sattend ) que le poids dun mammifre
soit plus important que celui dun oiseau.
Masse
Taille
Rgression et ANOVA
Comparaison du Poids dun animal en fonction de diffrents rgime
alimentaire
Si le rgime alimentaire est riche, il est normal (on sattend ) que le poids
de lanimal soit plus lev.
Si plus de 2 rgimes alimentaires sont compars, une ANOVA 1 facteur (le
rgime) simpose.
Mais quelle est la condition respecter ?
Le poids dpend de la taille; il faut donc quau dbut de lexprience, avant
lapplication du rgime alimentaire test, le poids, donc la taille, de dpart soit
identique. Si cette condition nest pas respecte, lexprience est biaise.
Si cette condition nest pas ralise, il est possible dintroduire dans le modle
la variabilit que lon connat dj : leffet de la taille.
Cest donc une ANOVA (1 facteur) avec une co-variable (taille). On parle
dANCOVA
Rgression et ANOVA
Gain en Poids
Rgime 2
Rgime 1
Lintroduction de la
taille en co-variable ne
mettra plus en vidence
de diffrence significative entre les rgimes
alimentaires !
Contrle
Variable Dpendante : continue
Facteur (=var. indp.) : discret (discontinu)
Co-variable : continue
Taille
Utilisation de lANCOVA
Y
Modles
qualitativement
similaires
Y
Modles
qualitativement
diffrents
X1
Variable
dpendante
Variable(s) indpendante(s)
ANOVA 1 facteur
1 continue
1 discontinue*
2 ou plus discontinues *
Rgression simple
1 continue
1 continue
2 ou plus continues
ANCOVA
1 continue
Le modle de la rgression:
Yi
ei
Yi = a + bX i + ei
a
(ordonne
lorigine)
Xi
Observes
Prdites
a & b diffrents
X1
Y
a diffrents
mme b
X1
Mmes a,
diffrents b
X1
Y
Mmes a,
mmes b
X1
Groupe 1
Groupe 2
Groupe 1
Groupe 2
Groupe 1
Groupe 2
X
Y
Groupe 1
Groupe 2
1.8
Femelles
Mles
1.8
LFKL
LFKL
1.7
1.7
1.6
1.6
1.5
1.0
1.1
1.2
1.6
1.7
1.5
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
LAGE
1.8
Analyse
Mles
Log(forklength)(LFKL) est la
variable dpendante, log(age)
(LAGE) est la variable indpendante
continue, et sex (SEX$) est la
variable discontinue (2 niveaux)
1.6
1.5
1.0
1.1
1.5 1.6
1.7
1.9
1.8
LFKL
LFKL
1.7
Femelles
1.7
1.6
1.5
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
LAGE
Analysis of Variance
Source
Sum-of-Squares df Mean-Square
LAGE
SEX$
SEX$*LAGE
0.143
0.000
0.000
1
1
1
0.143
0.000
0.000
Error
0.071
88
0.001
F-ratio
176.650
0.504
0.337
P
0.000
0.479
0.563
Conclusion 1 : la pente est la mme pour les deux sexes - p(SEX$*LAGE) > .05
Q2 : lordonne lorigine est-elle la mme?
Analysis of Variance
Source
Sum-of-Squares df Mean-Square
SEX$
LAGE
0.001
0.143
1
1
0.001
0.143
Error
0.072
89
0.001
F-ratio
1.851
178.163
P
0.177
0.000
Conclusion 2 : Ordonne lorigine est la mme pour les deux sexes - p(SEX$ > .05)
Le meilleur modle est donc la rgression commune.
Coefficient
1.211
0.336
Std Error
0.031
0.024
.
1.000
P(2 Tail)
39.191
14.144
0.000
0.000
ANOVA 1 facteur
ANCOVA 1 facteur