Vous êtes sur la page 1sur 4

M2 Pro Ingnierie Mathmatique

Universit d'Angers, Universit de Nantes

Anne 2011-2012

TD d'analyse de variance 2 facteurs et Analyse de la covariance

Exercice 1

On tudie la consommation de carburant de vhicules en fonction de la marque(A,B,C,D et E)


et du type de conduite (a,b, et c). On dipose de trois rptitions pour chaque modalit, prcises
dans le tableau ci-dessous :
marque/conduite
A
B
C
D
E

20.3
19.5
22.1
17.6
23.6

a
19.8
18.6
23.0
18.3
24.5

21.4
18.9
22.4
18.2
25.1

21.6
20.1
20.1
19.5
17.6

b
22.4
19.9
21.0
19.2
18.3

21.3
20.5
19.8
20.3
18.1

19.8
19.6
22.3
19.4
22.1

c
18.6
18.3
22.0
18.5
24.3

21.0
19.8
21.6
19.1
23.8

1. Ecrire le modle complet deux facteurs et estimer les paramtres du modle en imposant
une contrainte.
2. Tester l'additivit des deux facteurs.

Exercice 2

Une entreprise cherche tester 4 modles de machines crire. Pour cela, elle demande 5
secrtaires de taper un texte pendant 15 minutes. A la n du test, on compte le nombre moyen de
mots taps en 1 minute. On rpte l'exprience le lendemain. Les rsultats sont prsents dans le
tableau ci-dessous :
Machine crire
Secrtaire
Rsultats
Machine crire
Secrtaire
Rsultats

1
1
33 ;36
3
3
34 ;37

2
1
32 ;35
4
3
33 ;34

3
1
37 ;39
1
4
34 ;33

4
1
29 ;31
2
4
33 ;36

1
2
31 ;31
3
4
31 ;35

2
2
37 ;35
4
4
31 ;27

3
2
35 ;35
1
5
31 ;31

4
2
31 ;33
2
5
35 ;36

1
3
34 ;36
3
5
37 ;40

1. Ecrire le modle non-rgulier.


2. Ecrire le modle sous la forme y = X +  en tenant compte des contraintes habituelles pour
rendre le modle rgulier.
3. tester les hypothses suivantes :
 H0 : "Pas d'eet du type de machine crire"
 H0 : "Pas d'eet de la secrtaire"
 H0 : "Pas d'interaction entre le type de machine et la secrtaire".

2
3
40 ;36
4
5
33 ;33

Exercice 3

Une compagnie fabriquant des grands ventilateurs usage industriel souhaite amliorer ses
produits. Elle contacte des statisticiens (vous) an de raliser une tude prcise.
Le choix se porte sur trois facteurs suivants : le type de trou la base des pales (hexagonal
ou rond), le type de support sur lequel le ventilateur est x ( pointes ou lisse), et la faon dont
l'assemblage est fait (enfonc ou viss). Les dtails techniques se trouvent dans la Figure 1.
La mesure de qualit d'un ventilateur est base sur le couple, mesure en Pieds.Livres, correspondant la casse du ventilateur en se sparant du support.
L'tude a port, au dpart, sur N = 8 ventilateurs, puis sur N = 64 ventilateurs.
1. Dnir le modle d'analyse de variance complet.
2. Donner les contraintes de manire rendre le modle orthogonal. Donner ses contraintes
pour tous les eets, et donner les estimateurs correspondants.
3. Interprter le tableau d'analyse de variance du modle (Table 1). Proposer une explication
de la colonne "Puissance observe" (calcul avec = 5%), et une manire de la calculer.
4. Dans le cas N = 8, interprter les rsultats. Que remarquez-vous sur l'eet crois A*B*C ?
5. Faire une tude complte du cas N = 64. Comparer avec les rsultats de Table 1. Expliquer
les dirences de puissances observes.
6. Conclure sur l'inuence des dirents facteurs ? Etudier les rglages optimaux conseills dans
les dirents cas (Table 1 et Table 4). Quel est l'inuence prcise sur la qualit du ventilateur ?
7. Que pensez du Tableau 5 ?

M2 Pro Ingnierie Mathmatique


Universit d'Angers, Universit de Nantes

Anne 2011-2012

TP d'analyse de variance 2 facteurs et Analyse de la covariance

Exercice prliminaire

Vrier les hypothses du modle d'analyse de variance des exercices (TD et TP) relatifs aux
chapitres 4 et 5. Quand ces hypothses ne sont pas vries, et que le nombre d'observations est
faible, on pourra utiliser l'quivalent non-paramtrique de Kruskal et Wallis, pour tudier l'eet
des facteurs.

Exercice 1 : Anova deux facteurs

On veut tudier l'volution du poids des rats selon 4 rgimes dirents : combinaison de deux
types de protines direntes (Boeuf et Crales) et deux quantits direntes (leve ou basse).
Chaque traitement possde 10 rptitions et on suppose notre chantillon constitu de 40 rats pris
au hasard auxquels on donne un traitement au hasard.
1. Importer les donnes et rsumer les variables d'intrts :

2.

3.

4.
5.

6.

>rat<-read.table("weight-R.dat",header=T)
>summary(rat)
Reprsenter les donnes l'aide d'une bote moustache par traitement (croisement des deux
facteurs) :
>boxplot(Gain~Protein*Amount,data=rat)
On peut aussi analyser l'eet des deux facteurs grce aux graphes suivants :
> par(mfrow=c(1,2))
> with(rat,interaction.plot(Protein,Amount,Gain))
> with(rat,interaction.plot(Amount,Protein,Gain
Quel est le plus explicite ? Commenter.
Raliser l'analyse de variance du modle complet et tester l'interaction des deux facteurs :
>mod.complet<-lm(Gain~Protein*Amount,data=rat)
>anova(modcomplet)
Conclure quant l'hypothse d'additivit des deux facteurs.
On considre le modle sans interaction. Raliser la phase d'estimation du modle :
>mod.add<-lm(Gain~Protein+Amount,data=rat)
>summary(mod.add)
Interprter les rsultats de la matrice
. Conclure sur l'eet de chacun des facteurs. Ces rsultats dpendent des contraintes utilises. Par dfaut, R utilise les contraintes
1 = 0 et 1 = 0.
P
Retrouver les rsultats de la question prcdente en imposant les contraintes
i = 0 et
P
j = 0, ce qui donne :
{
>mod.add2<-lm(Gain~C(Protein,sum)+C(Amount,sum),data=rat)
>summary(mod.add2)
On peut prfrer xer la contrainte pour raliser les direntes analyses de variance. Pour
cela, on peut utiliser les commandes suivantes :
>options(contrasts=c("contr.sum","contr.sum"))
>mod.complet<-lm(Gain~Protein+Amount+Protein:Amount,data=rat)
>mod.add<-lm(Gain~Protein+Amount,data=rat)

Coecients

7.

8.

Exercice 2 : Analyse de variance 3 facteurs

Une tude marketing tudie l'impact de 4 campagnes publicitaires (diuses sur des chanes
locales) sur les ventes de lait. Un chantillon de familles a t constitu en tenant compte du lieu
d'habitation ainsi que de la constitution de la famille. Les donnes (chier "milk.dat") contiennent
les consommations en lait (en dollars) aprs deux mois de campagne dans 4 villes (une par campagne publicitaire), dans 5 rgions direntes, pour 6 tailles de familles direntes.
Aprs avoir lu et rorganis les donnes, tudier les direntes hypothses concernant les interactions et l'eet de chaque facteur.

Exercice 3 : Ancova

Le chier "jellysh.dat" contient la taille, le poids en millimtres de 46 mduses d'Australie


provenant de deux sites (Dangar Island et Salamander Bay). Raliser une rgression de la taille
en fonction du poids en utilisant le site comme covariable. Considrer le modle complet, puis le
modle avec une seule pente, puis une seule ordonne l'origine. Choisissez le meilleur modle.

Exercice 4 : Ancova deux variables qualitatives

On considre nouveau le chier "milk.dat", mais cette fois-ci on considre la variable taille
comme une variable quantitative. Cela permet d'conomiser notablement des degrs de libert car
moins de paramtres sont estims.
Reprsenter les nuages de points de la consommation en fonction de la taille, en associant une
couleur chaque campagne publicitaire, et un symbole chaque rgion. Estimer le modle complet
contenant toutes les interactions et commenter. Estimer les droites de rgression pour chaque
croisement rgionpub. Dterminer la campagne la mieux adapte chaque rgion.