Académique Documents
Professionnel Documents
Culture Documents
Anne 2011-2012
yij = + i + ij , i = 1 . . . p, j = 1 . . . ni .
1. Ecrire le modle sous la forme matricielle d'une rgression multiple Y = X + . Peut-on
utiliser la mthode des moindres carrs ordinaire pour estimer les paramtres , et =
(1 , . . . , p ) ?
2. Ecrire pour chaque contrainte
(a) = 0
(b) P
1 = 0
p
(c) Pi=1 ni i = 0
p
(d)
i=1 i = 0
le modle rgulier Y = X + , en prcisant X et en fonction de X et .
3. Quel est l'EMC pour chacune des contraintes ? Quel est son esprance ?
4. Retrouver pour chacune des contraintes la valeur de Y et construire le tableau d'analyse de
variance l'aide des quantits kY Y k2 et kY Y k2 .
On veut tudier l'impact d'une ancienne mine d'arsenic sur les composantes hydrochimiques et
hydrobiologiques d'un rseau hydrographique de Corse. Les mesures ont t faites sur 4 stations :
B2, B3 (sur la Bravona) et P2 (sur un auent la Presa) o est situe la mine d'arsenic. Les tableaux
1. et 2. page 3 rsument la bioaccumulation de l'arsenic (en g/g ) sur les branchies des truites
captures pour chaque station.
Station
P2
B2
B3
eectif
22
21
24
somme
106.19
13.84
5.83
moyenne
4.83
0.66
0.24
variance
1.58
0.07
0.02
Station
P2
B2
B3
eectif
22
21
24
somme
47.95
16.75
11.47
moyenne
2.18
0.8
0.48
variance
0.08
0.02
0.01
1. Ecrire le modle d'analyse de variance. Les conditions d'une analyse de variance sont-elles
vries ?
Pour comparer 4 varits de pommes de terre dans une rgion, on choisit 36 parcelles de 250
m2 cultives dans des conditions comparables. les 4 varits V1 , V2 , V3 , et V4 sont rparties de
faon alatoire sur respectivement 9, 11, 9 et 7 parcelles. Le Tableau 3. contient les mesures du
rendement en tonnes l'hectare.
V1
V2
V3
V4
14.5
12.5
13.2
13.7
13.2
9.5
12.7
15.8
14.7
12.3
11.6
17.2
11.8
10.7
10.3
12.5
12.7
9.8
14.0
13.9
18.2
13.1
11.8
14.8
14.2
10.7
10.1
18.5
13.3
12.2
12.9
11.7
13.5
10.2
10.1
9.8
Exercice 4 : Contrainte
ni i = 0
Le tableau suivant prsente les observations issues d'une classication un facteur avec 4 modalits et 17 observations rparties telles que n1 = 3, n2 = n3 = 4, et n4 = 6 :
1
1.6
2.3
1.2
2
2.5
3
2.8
2.9
3
3.5
4.2
4.3
4.5
4
4.1
3.9
4.6
5.2
5.9
6.0
1. Modliser ce problme d'analyse de variance sous la forme yij = + i + ij . Choisir comme
P4
contrainte i=1 ni i = 0 et calculer la matrice X du plan d'exprience.
2. Vrier que
62.5
1/17
0
0
0
0
1/3
1/17
1/17
; X 0 y = 9.75
(1)
(X 0 X )1 =
0
8.6
1/17 1/4 1/17
1/17
3.3
0
1/17
1/17
1/4 1/17
3. Dterminer
partir de .
4. Construire le tableau d'analyse de variance et raliser le test H0 : 1 = 2 = 3 = 0 au
niveau 5%.
Une balance est dite sans biais de prcision 2 si lorsqu'on pse un objet M de masse m, on
quilibre dans l'autre plateau avec un poids alatoire yM = m+, o N (0, 2 ). On veut estimer
les masses a, b et c de trois objets A, B et C l'aide de trois peses. On va montrer que la meilleure
stratgie n'est pas de peser chaque objet sparment mais de peser, chaque pese, les trois objets.
On peut procder de trois faons direntes :
P1 on pse chaque objet sparment, observant yA , yB et yC .
P2 on pse deux objets la fois, observant yAB , yAC et yBC .
P3 les trois objets interviennent dans chaque pese, deux gauche et un droite, observant
yAB,C , yAC,B et yBC,A .
1. Ecrire les trois modles. Vrier que pour chacun, (X 0 X)1 X 0 = X 1 . Commenter.
2. En dduire les EMC de (a, b, c) et les variances individuelles pour chacune des mthodes.
Conclure.
Anne 2011-2012
On veut tudier l'eet de la direction du vent sur les pics d'ozone. Pour cela, on va considrer le
chier "ozone.txt" et expliquer la variable "maxO3" par la variable qualitative "vent".
1. Importer les donnes et rsumer les variables d'intrts, ici "maxO3" et "vent" :
>ozone<-read.table("ozone.txt",header=T)
>summary(ozone[,c("maxO3","vent)])
2. Reprsenter les donnes l'aide des botes moustaches pour illustrer l'eet du vent sur les
pics d'ozone :
>plot(maxO3~vent,data=ozone,pch=15,cex=.5)
>summary(ozone[,c("maxO3","vent)])
Commenter.
3. Raliser l'analyse de variance pour estimer les paramtres du modle :
>regaov<-lm(maxO3~vent,data=ozone)
>summary(regaov)
Que reprsente la ligne Intercept et la colonne Estimate ? Quelle contrainte a-t'on implicitement imposer sur les paramtres ?
4. Retrouver ces rsultats la main en calculant dans ce cas (X 0 X )1 .
5. Tester prsent la signicativit du modle, l'aide du tableau d'analyse de variance :
>anova(regaov)
Conclure.
6. On veut prsent imposer la contrainte = 0 d'eet moyen nul. Pour cela, il sut de
spcier au logiciel un modle sans constante :
>regaov2<-lm(maxO3~-1+vent,data=ozone)
>summary(regaov2)
Que reprsente dans ce cas la collone Estimate de la matrice Coecient. Retrouver les valeurs
des estimateurs " la main".
7. On veut tester l'inuence du vent sur le pic d'ozone grce un tableau d'analyse de variance.
On propose d'utiliser la commande suivante
>anova(regaov2)
Ce tableau d'analyse de variance est faux. Quand la constante ne fait pas partie du modle,
tester H0 : 1 = . . . = I = 0 n'a pas de sens pour illustrer l'eet du facteur.
8. Pour des raisons particulires, on peut choisir une cellule tmoin spcique (R choisit par
dfaut la premire par ordre alphabtique, ici Est) avec la commande suivante :
>regaov3<-lm(maxO3~C(vent,base=2),data=ozone
Retrouver les rsultats de la premire analyse de variance, seul l'ordre des coecients tant
modi.
Pp
9. On peut aussi choisir la contrainte i=1 i = 0 grce la commande :
>regaov3<-lm(maxO3~C(vent,sum),data=ozone)
Interprter les entres de la matrice Coecients dans ce cas. Comment estimer l'eet du vent
du Sud ?
Le chier "chemical.dat" est un chier qui contient les observations de concentration chimique
dans le sang (en ng/ml) pour un groupe de 10 patients aprs administration orale de 4 doses
direntes (25,50,100,200mg) d'un mdicament (almitrine bismesylate). On veut tudier l'inuence
du traitement sur les caractristiques chimiques du sang.
1. Rcuprer les donnes l'aide des commandes
>chemical<-data.frame("chemical.dat")
> dose<-c(rep(c("dose25"),10),rep(c("dose50"),10),rep(c("dose100"),10),
rep(c("dose200"),10))
>chemical<-data.frame(dose=dose,concent=c(chemical[,1],chemical[,1],chemical[,2],
chemical[,3]),chemical[,4]))
2. Reprsenter les donnes l'aide des botes moustaches. Commenter. Les hypothses d'une
analyse de variance semble-t'elle vries ?
3. Raliser l'analyse de variance avec la fonction lm en utilisant la contrainte par dfaut de R.
Commenter les rsultats de la fonction summary.
4. Construire le tableau d'analyse de variance avec la fonction
la validit de ces rsultats ?
> bartlett.test(concent~dose,data=chemical)
Commenter quant la validit du tableau d'analyse de variance de la question prcdente.
6. Pour viter ce phnomne, on propose de s'intresser une transformation logarithmique
de la variable y . Reprsenter les botes moustaches des donnes transformes. Vrier la
procdure de stabilisation avec le test de Bartlett sur log(concent).
7. Raliser l'analyse de variance (phase d'estimation).
8. Commenter les rsultats et construire le tableau d'analyse de variance. Conclure quant
l'eet du traitement.
9. On veut prsent comparer plus prcisemment les eets de la concentration selon la quantit
de mdicament prescrite. Comparer deux deux les eets selon la dose, l'aide de la mthode
de Bonferroni.
10. Tester avec la mthode de Tukey une dirence signicative entre une dose de 25mg et 50mg .
11. Tester l'aide de la mthode des contrastes l'galit de la dirence des eets entre 25mg et
50mg et entre 50mg et 100mg . Utiliser la fonction linear.hypothesis. Mme question entre
25mg et 50mg et entre 200mg et 100mg .
12. Comparer les rsidus pour les deux analyses de variance proposes l'aide de la comande :
>par(mfrow=c(2,2))
>plot(logaov,which=1:4)
>plot(aov,which=1:4)
>II<-length(levels(data$\$$x))
>nI<-table(data$\$$x)
CONTRASTE<-matrix(rbind(diag(II-1),-nI[-II]/nI[II]),II,II-1)
>aov<lm(y~C(x,CONTRASTE),data=data)