Vous êtes sur la page 1sur 4

M2 Pro Ingnierie Mathmatique

Universit d'Angers, Universit de Nantes

Anne 2011-2012

TD Analyse de variance 1 facteur

Exercice 1 : Rappels de cours

On considre le modle d'analyse de variance suivant :

yij = + i + ij , i = 1 . . . p, j = 1 . . . ni .
1. Ecrire le modle sous la forme matricielle d'une rgression multiple Y = X + . Peut-on
utiliser la mthode des moindres carrs ordinaire pour estimer les paramtres , et =
(1 , . . . , p ) ?
2. Ecrire pour chaque contrainte
(a) = 0
(b) P
1 = 0
p
(c) Pi=1 ni i = 0
p
(d)
i=1 i = 0
le modle rgulier Y = X + , en prcisant X et en fonction de X et .
3. Quel est l'EMC pour chacune des contraintes ? Quel est son esprance ?
4. Retrouver pour chacune des contraintes la valeur de Y et construire le tableau d'analyse de
variance l'aide des quantits kY Y k2 et kY Y k2 .

Exercice 2 : Analyse de variance 1 facteur

On veut tudier l'impact d'une ancienne mine d'arsenic sur les composantes hydrochimiques et
hydrobiologiques d'un rseau hydrographique de Corse. Les mesures ont t faites sur 4 stations :
B2, B3 (sur la Bravona) et P2 (sur un auent la Presa) o est situe la mine d'arsenic. Les tableaux
1. et 2. page 3 rsument la bioaccumulation de l'arsenic (en g/g ) sur les branchies des truites
captures pour chaque station.
Station
P2
B2
B3

eectif
22
21
24

somme
106.19
13.84
5.83

moyenne
4.83
0.66
0.24

variance
1.58
0.07
0.02

TAB.1 : Bioaccumulation de l'arsenic (Donnes brutes)

Station
P2
B2
B3

eectif
22
21
24

somme
47.95
16.75
11.47

moyenne
2.18
0.8
0.48

variance
0.08
0.02
0.01

TAB.2 : Bioaccumulation de l'arsenic (Donnes transformes)

1. Ecrire le modle d'analyse de variance. Les conditions d'une analyse de variance sont-elles
vries ?

2. On propose dans le Tableau 2. de transformer les donnes l'aide de la fonction x 7 x. A


l'aide du test de Bartlett, vrier l'galit des variances dans ce cas.
3. Si les conditions sont vries, raliser le tableau d'analyse de variance et proposer un test
pour vrier que la station est un facteur signicatif pour la bioaccumulation d'arsenic. Sinon,
comment conclure ?

Exercice 3 : Varits de pommes de terre

Pour comparer 4 varits de pommes de terre dans une rgion, on choisit 36 parcelles de 250
m2 cultives dans des conditions comparables. les 4 varits V1 , V2 , V3 , et V4 sont rparties de
faon alatoire sur respectivement 9, 11, 9 et 7 parcelles. Le Tableau 3. contient les mesures du
rendement en tonnes l'hectare.

V1
V2
V3
V4

14.5
12.5
13.2

13.7
13.2
9.5
12.7

15.8
14.7
12.3
11.6

17.2
11.8
10.7
10.3

12.5
12.7
9.8
14.0

13.9
18.2
13.1
11.8

14.8
14.2
10.7
10.1

18.5
13.3
12.2

12.9
11.7
13.5

10.2
10.1

9.8

TAB. 3 : Rendement en tonnes par hectare

1. Modliser le problme sous la forme matricielle en imposant la contrainte = 0.


2. Calculer . Interprter. Estimer la variance 2 du modle.
3. Construire le tableau d'analyse de variance et tester l'aide du test de Fisher global l'inuence
de la varit sur le rendement.
4. Comparer deux deux les rendements en utilisant la mthode de Bonferroni, puis tudier le
contraste
= 1 + 2 + 3 34 .
5. Retrouver les rsultats des questions 3. et 4. l'aide des tests d'hypothses linaires vus au
chapitre prcdent.

Exercice 4 : Contrainte

ni i = 0
Le tableau suivant prsente les observations issues d'une classication un facteur avec 4 modalits et 17 observations rparties telles que n1 = 3, n2 = n3 = 4, et n4 = 6 :
1
1.6
2.3
1.2

2
2.5
3
2.8
2.9

3
3.5
4.2
4.3
4.5

4
4.1
3.9
4.6
5.2
5.9
6.0

1. Modliser ce problme d'analyse de variance sous la forme yij = + i + ij . Choisir comme
P4
contrainte i=1 ni i = 0 et calculer la matrice X du plan d'exprience.
2. Vrier que

62.5
1/17
0
0
0

0
1/3
1/17
1/17
; X 0 y = 9.75
(1)
(X 0 X )1 =

0
8.6
1/17 1/4 1/17
1/17
3.3
0
1/17
1/17
1/4 1/17
3. Dterminer
partir de .
4. Construire le tableau d'analyse de variance et raliser le test H0 : 1 = 2 = 3 = 0 au
niveau 5%.

Exercice 5 : Plans d'expriences

Une balance est dite sans biais de prcision 2 si lorsqu'on pse un objet M de masse m, on
quilibre dans l'autre plateau avec un poids alatoire yM = m+, o  N (0, 2 ). On veut estimer
les masses a, b et c de trois objets A, B et C l'aide de trois peses. On va montrer que la meilleure
stratgie n'est pas de peser chaque objet sparment mais de peser, chaque pese, les trois objets.
On peut procder de trois faons direntes :
P1 on pse chaque objet sparment, observant yA , yB et yC .
P2 on pse deux objets la fois, observant yAB , yAC et yBC .
P3 les trois objets interviennent dans chaque pese, deux gauche et un droite, observant
yAB,C , yAC,B et yBC,A .
1. Ecrire les trois modles. Vrier que pour chacun, (X 0 X)1 X 0 = X 1 . Commenter.
2. En dduire les EMC de (a, b, c) et les variances individuelles pour chacune des mthodes.
Conclure.

M2 Pro Ingnierie Mathmatique


Universit d'Angers, Universit de Nantes

Anne 2011-2012

TP d'analyse de variance 1 facteur

Exercice 1 : manipuler les contraintes sous R

On veut tudier l'eet de la direction du vent sur les pics d'ozone. Pour cela, on va considrer le
chier "ozone.txt" et expliquer la variable "maxO3" par la variable qualitative "vent".
1. Importer les donnes et rsumer les variables d'intrts, ici "maxO3" et "vent" :

>ozone<-read.table("ozone.txt",header=T)
>summary(ozone[,c("maxO3","vent)])
2. Reprsenter les donnes l'aide des botes moustaches pour illustrer l'eet du vent sur les
pics d'ozone :

>plot(maxO3~vent,data=ozone,pch=15,cex=.5)
>summary(ozone[,c("maxO3","vent)])
Commenter.
3. Raliser l'analyse de variance pour estimer les paramtres du modle :

>regaov<-lm(maxO3~vent,data=ozone)
>summary(regaov)
Que reprsente la ligne Intercept et la colonne Estimate ? Quelle contrainte a-t'on implicitement imposer sur les paramtres ?
4. Retrouver ces rsultats la main en calculant dans ce cas (X 0 X )1 .
5. Tester prsent la signicativit du modle, l'aide du tableau d'analyse de variance :

>anova(regaov)
Conclure.
6. On veut prsent imposer la contrainte = 0 d'eet moyen nul. Pour cela, il sut de
spcier au logiciel un modle sans constante :

>regaov2<-lm(maxO3~-1+vent,data=ozone)
>summary(regaov2)
Que reprsente dans ce cas la collone Estimate de la matrice Coecient. Retrouver les valeurs
des estimateurs " la main".
7. On veut tester l'inuence du vent sur le pic d'ozone grce un tableau d'analyse de variance.
On propose d'utiliser la commande suivante

>anova(regaov2)
Ce tableau d'analyse de variance est faux. Quand la constante ne fait pas partie du modle,
tester H0 : 1 = . . . = I = 0 n'a pas de sens pour illustrer l'eet du facteur.
8. Pour des raisons particulires, on peut choisir une cellule tmoin spcique (R choisit par
dfaut la premire par ordre alphabtique, ici Est) avec la commande suivante :

>regaov3<-lm(maxO3~C(vent,base=2),data=ozone
Retrouver les rsultats de la premire analyse de variance, seul l'ordre des coecients tant
modi.
Pp
9. On peut aussi choisir la contrainte i=1 i = 0 grce la commande :

>regaov3<-lm(maxO3~C(vent,sum),data=ozone)
Interprter les entres de la matrice Coecients dans ce cas. Comment estimer l'eet du vent
du Sud ?

Exercice 2 : Eet d'un mdicament

Le chier "chemical.dat" est un chier qui contient les observations de concentration chimique
dans le sang (en ng/ml) pour un groupe de 10 patients aprs administration orale de 4 doses
direntes (25,50,100,200mg) d'un mdicament (almitrine bismesylate). On veut tudier l'inuence
du traitement sur les caractristiques chimiques du sang.
1. Rcuprer les donnes l'aide des commandes

>chemical<-data.frame("chemical.dat")
> dose<-c(rep(c("dose25"),10),rep(c("dose50"),10),rep(c("dose100"),10),
rep(c("dose200"),10))
>chemical<-data.frame(dose=dose,concent=c(chemical[,1],chemical[,1],chemical[,2],
chemical[,3]),chemical[,4]))
2. Reprsenter les donnes l'aide des botes moustaches. Commenter. Les hypothses d'une
analyse de variance semble-t'elle vries ?
3. Raliser l'analyse de variance avec la fonction lm en utilisant la contrainte par dfaut de R.
Commenter les rsultats de la fonction summary.
4. Construire le tableau d'analyse de variance avec la fonction
la validit de ces rsultats ?

anova. Que peut-on dire quant

5. On cherche vrier si l'hypothse d'homoscdasticit des modalits a lieu. Pour cela, on


eectue le test de Bartlett H0 : 25 = 50 = 100 = 200 contre l'alternative H1 : i 6= j
avec la commande :

> bartlett.test(concent~dose,data=chemical)
Commenter quant la validit du tableau d'analyse de variance de la question prcdente.
6. Pour viter ce phnomne, on propose de s'intresser une transformation logarithmique
de la variable y . Reprsenter les botes moustaches des donnes transformes. Vrier la
procdure de stabilisation avec le test de Bartlett sur log(concent).
7. Raliser l'analyse de variance (phase d'estimation).
8. Commenter les rsultats et construire le tableau d'analyse de variance. Conclure quant
l'eet du traitement.
9. On veut prsent comparer plus prcisemment les eets de la concentration selon la quantit
de mdicament prescrite. Comparer deux deux les eets selon la dose, l'aide de la mthode
de Bonferroni.
10. Tester avec la mthode de Tukey une dirence signicative entre une dose de 25mg et 50mg .
11. Tester l'aide de la mthode des contrastes l'galit de la dirence des eets entre 25mg et
50mg et entre 50mg et 100mg . Utiliser la fonction linear.hypothesis. Mme question entre
25mg et 50mg et entre 200mg et 100mg .
12. Comparer les rsidus pour les deux analyses de variance proposes l'aide de la comande :

>par(mfrow=c(2,2))
>plot(logaov,which=1:4)
>plot(aov,which=1:4)

Exercice 3 : Matrice CONTRASTE


1. Retrouver les rsultats de l'exercice 4 du TD " la main", en calculant la matrice X , l'EMC
et la somme des carrs.
P
2. On veut retrouver ces rsultats grce la fonction lm. Cependant, la contrainte
ni i = 0
n'est pas prprogramme dans R. Il faut utiliser la matrice CON T RAST E qui servira de
contraste :

>II<-length(levels(data$\$$x))
>nI<-table(data$\$$x)
CONTRASTE<-matrix(rbind(diag(II-1),-nI[-II]/nI[II]),II,II-1)
>aov<lm(y~C(x,CONTRASTE),data=data)