Académique Documents
Professionnel Documents
Culture Documents
Mahdi Louati
Plan
Notations
On note I le nombre de modalités prises par le facteur d’intérêt. On note
ni le nombre d’individus sur lesquels on a observé la modalité i . Au total,
on a
n = n1 + n2 + . . . + nI
observations. On note y la variable à expliquer. yij est l’observation pour
le j ème individu du niveau i du facteur.
Modèle régulier
On suppose que yij est la réalisation de la variable aléatoire Yij suivant le
modèle suivant
Modèle régulier
Alors, on a l’écriture matricielle suivante
µ1
Y = X r ... + ε, où ε ∼ Nn (0, σ 2 In ).
µI
Modèle régulier
Alors, on a l’écriture matricielle suivante
µ1
Y = X r ... + ε, où ε ∼ Nn (0, σ 2 In ).
µI
Modèle singulier
Même si facile d’un point de vie mathématique, en pratique il n’est pas
utilisé dans cette forme. Il sera en général écrit par les utilisateurs
(biologistes, etc...) de la façon suivante
1 1 0 ... ... 0
1 ... 0
... ... 0
1 1 0 ... ... 0
1 1 0 ... ... 0
1 0 1 0 ... 0
X = 1 ... ... .
0 ... 0
1 ... 1
0 ... 0
.
1 .. . . .
... 0 1
.. .. ..
. . ... ... 0 .
1 0 ... ... 0 1
1 1 0 ... ... 0
1 ... 0
... ... 0
1 1 0 ... ... 0
1 1 0 ... ... 0
1 0 1 0 ... 0
X = 1 ... ... .
0 ... 0
1 ... 1
0 ... 0
.
1 .. . . .
... 0 1
.. .. ..
. . ... ... 0 .
1 0 ... ... 0 1
Validation
Test du modèle
Test du modèle
H0 : α2 = α3 = . . . = αI = 0 versus H1 : ∃ (i = 2, 3, . . . , I ), αi 6= 0.
Test du modèle
H0 : α2 = α3 = . . . = αI = 0 versus H1 : ∃ (i = 2, 3, . . . , I ), αi 6= 0.
D’autre part on a
ni
I X
X
SCR = kY − Yb k2 = kY − X r βk
b 2 = kY − P[X r ] Y k2 = (yij − y i )2
i=1 j=1
D’autre part on a
ni
I X
X
SCR = kY − Yb k2 = kY − X r βk
b 2 = kY − P[X r ] Y k2 = (yij − y i )2
i=1 j=1
ni
I X
X
SCR0 = kY − P[X 0 ] Y k2 = (yij − y .. )2 = SCT
i=1 j=1
D’autre part on a
ni
I X
X
SCR = kY − Yb k2 = kY − X r βk
b 2 = kY − P[X r ] Y k2 = (yij − y i )2
i=1 j=1
ni
I X
X
SCR0 = kY − P[X 0 ] Y k2 = (yij − y .. )2 = SCT
i=1 j=1
1
..
.
1
I X ni ni
1
1 X 1 X
r
..
y .. = yij , y i. = yij et X = ∈ M(n, I , R).
n ni .
i=1 j=1 j=1 1
1
..
.
1
Mahdi LOUATI Analyse de la variance Université Paris-Dauphine | Tunis 13 / 41
Analyse de la variance à un facteur Validation du modèle et test du modèle
(SCR0 − SCR)/(rg (X r ) − rg (X 0 ))
F =
SCR/(n − rg (X r ))
(SCR0 − SCR)/(rg (X r ) − rg (X 0 ))
F =
SCR/(n − rg (X r ))
(SCT − SCR)/(I − 1)
=
SCR/(n − I )
(SCR0 − SCR)/(rg (X r ) − rg (X 0 ))
F =
SCR/(n − rg (X r ))
(SCT − SCR)/(I − 1)
=
SCR/(n − I )
(kY − P[X 0 ] Y k2 − kY − P[X r ] Y k2 )/(I − 1)
=
kY − P[X r ] Y k2 /(n − I )
∼ FI −1,n−I .
X ni
I X ni
I X
X
2
SCT = (yij − y .. ) = (yij − y i. + y i. − y .. )2
i=1 j=1 i=1 j=1
X ni
I X ni
I X
X
2
= (yij − y i. ) + (y i. − y .. )2
i=1 j=1 i=1 j=1
ni
I X
X
+2 (yij − y i. )(y i. − y .. )
i=1 j=1
| {z }
=0
X ni
I X ni
I X
X
2
= (yij − y i. ) + (y i. − y .. )2 ,
i=1 j=1 i=1 j=1
ni
I X
X
(yij − y i. )(y i. − y .. ) = 0?
i=1 j=1
En effet
ni
I X
X
(yij − y i. )(y i. − y .. )
i=1 j=1
X X X X
= yij y i. − y .. yij − (y i. )2 + (y .. ) y i.
ij ij ij ij
X X X X
2
= ni y i. y i. − y .. ni y i. − ni (y i. ) + (y .. ) ni y i.
i i i i
X X
= ni y i. y i. − ni (y i. )2 = 0.
i i
Remarque
On peut ainsi réinterpréter le test de la façon suivante:
Remarque
On peut ainsi réinterpréter le test de la façon suivante:
Le facteur a une influence d’autant plus forte que la variabilité entre les
niveaux des facteurs est grande par rapport à la variabilité interne à
chaque niveau du facteur.
Résultats de l’analyse
summary(arbres.lm)
H0 : µi = µi 0 versus H1 : µi 6= µi 0 .
Qµ
∼ Tn−r .
b
T =p
σb Q((X ) (X r ))−1 Q t
2 r t
Ici
n1
Qµ
b=µ bi 0 et (X r )t (X r ) =
bi − µ
.. .
.
nI
Mahdi LOUATI Analyse de la variance Université Paris-Dauphine | Tunis 19 / 41
Analyse de la variance à un facteur Comparaison de traitements
I (I −1)
X
δ ≤ 2 δ.
j,j 0 , j<j 0
Remarques
Ainsi, si I = 7 et δ = 5%, on borne la probabilité de se tromper au
moins une fois par 1. Donc on n’a aucun contrôle.
Pour palier à cela, il existe plusieurs méthodes. Une méthode
classique est la méthode de Bonferroni qui consiste à recorriger le
niveau de chaque test.
2δ
Chaque test sera fait avec un niveau I (I −1) , atteignant ainsi au final
un niveau global δ.
Remarques
Ainsi, si I = 7 et δ = 5%, on borne la probabilité de se tromper au
moins une fois par 1. Donc on n’a aucun contrôle.
Pour palier à cela, il existe plusieurs méthodes. Une méthode
classique est la méthode de Bonferroni qui consiste à recorriger le
niveau de chaque test.
2δ
Chaque test sera fait avec un niveau I (I −1) , atteignant ainsi au final
un niveau global δ.
Attention, de cette façon, il devient plus dur de rejeter les hypothèses
nulles.
Modèle Régulier
H0 : µ1 = µ2 = . . . = µI versus H1 : NonH0 .
Interprétations
Ce qui est important dans la sortie, ce sont les F et p-valeurs. Notons
que F (2, 101) = 1.156. De plus p = 0.319 > 0.05 ceci signifie que
dans ce cas l’ANOVA n’est significative.
Interprétations
Ce qui est important dans la sortie, ce sont les F et p-valeurs. Notons
que F (2, 101) = 1.156. De plus p = 0.319 > 0.05 ceci signifie que
dans ce cas l’ANOVA n’est significative.
Cependant, si la Statut était significative dans le test des 2 degrés de
liberté (p < 0.05 et F plus grande que la valeur critique 2.37 pour
α = 0.05), alors nous devons savoir quelles paires de niveaux Statut
sont significativement différentes les unes des autres. Cela nécessitera
trois tests (dominé vs dominant, dominé vs codominant, dominant vs
codominant), nous souhaitons donc ajuster ce que nous considérons
comme statistiquement significatif pour tenir compte de cette
multiplicité de tests.
Interprétations
Ce qui est important dans la sortie, ce sont les F et p-valeurs. Notons
que F (2, 101) = 1.156. De plus p = 0.319 > 0.05 ceci signifie que
dans ce cas l’ANOVA n’est significative.
Cependant, si la Statut était significative dans le test des 2 degrés de
liberté (p < 0.05 et F plus grande que la valeur critique 2.37 pour
α = 0.05), alors nous devons savoir quelles paires de niveaux Statut
sont significativement différentes les unes des autres. Cela nécessitera
trois tests (dominé vs dominant, dominé vs codominant, dominant vs
codominant), nous souhaitons donc ajuster ce que nous considérons
comme statistiquement significatif pour tenir compte de cette
multiplicité de tests.
Pour une ANOVA unidirectionnelle (ANOVA avec un facteur) nous
pouvons d’abord voir les p-valeurs non ajustées en utilisant la
commande pairwise.t.test et en n’indiquant aucun ajustement des
p-valeurs
Remarque
Avec cette même commande, nous pouvons ajuster les p-valeurs selon une
variété de méthodes. Ci-dessous, nous étudions les ajustements de
Bonferroni et Holm des p-valeurs.
Mahdi LOUATI Analyse de la variance Université Paris-Dauphine | Tunis 27 / 41
Analyse de la variance à un facteur Comparaison de traitements
Interprétation
Nous pouvons voir que les ajustements conduisent tous à une
augmentation des p-valeurs, mais malheureusement aucune paire ne
semble être significative à α = 0, 05.
Mahdi LOUATI Analyse de la variance Université Paris-Dauphine | Tunis 28 / 41
Analyse de la variance à un facteur Comparaison de traitements
Remarque
Il existe d’autres méthodes pour faire des tests multiples (méthode de
Tukey ou de Scheffé par exemple). Elles ne seront pas vues dans ce cours.
Plan
Remarque
Pour estimer le modèle singulier, nous sommes revenus au modèle régulier.
Remarque
Pour estimer le modèle singulier, nous sommes revenus au modèle régulier.
Il est en fait possible de traiter le modèle singulier directement, en utilisant
les contraintes.
On considère le modèle
Y = X β + ε,
où β ∈ Rp et X est une matrice à n lignes et p colonnes de rang r < p.
On considère le modèle
Y = X β + ε,
où β ∈ Rp et X est une matrice à n lignes et p colonnes de rang r < p.
Soit βb l’estimateur des moindres carrés de β est tel que X βb est le projeté
orthogonal de Y sur [X ] (i.e., X βb = P[X ] Y ).
On considère le modèle
Y = X β + ε,
où β ∈ Rp et X est une matrice à n lignes et p colonnes de rang r < p.
Soit βb l’estimateur des moindres carrés de β est tel que X βb est le projeté
orthogonal de Y sur [X ] (i.e., X βb = P[X ] Y ).
Alors βb vérifie les équations suivantes (dites normales)
X t Y = X t X β.
b
On considère le modèle
Y = X β + ε,
où β ∈ Rp et X est une matrice à n lignes et p colonnes de rang r < p.
Soit βb l’estimateur des moindres carrés de β est tel que X βb est le projeté
orthogonal de Y sur [X ] (i.e., X βb = P[X ] Y ).
Alors βb vérifie les équations suivantes (dites normales)
X t Y = X t X β.
b
Remarque
Dans le Chapitre 1, nous avions poursuivi la démonstration en utilisant
l’inversibilité de X t X puisque X est de rang plein.
On considère le modèle
Y = X β + ε,
où β ∈ Rp et X est une matrice à n lignes et p colonnes de rang r < p.
Soit βb l’estimateur des moindres carrés de β est tel que X βb est le projeté
orthogonal de Y sur [X ] (i.e., X βb = P[X ] Y ).
Alors βb vérifie les équations suivantes (dites normales)
X t Y = X t X β.
b
Remarque
Dans le Chapitre 1, nous avions poursuivi la démonstration en utilisant
l’inversibilité de X t X puisque X est de rang plein.
Cependant, la situation est différente dans le cas du modèle singulier. La
matrice X t X n’est pas inversible et par conséquent, les équations normales
ont une infinité de solutions.
Remarque
Intuitivement, une façon de trouver une expression pour βb est d’imposer
des contraintes.
Remarque
Intuitivement, une façon de trouver une expression pour βb est d’imposer
des contraintes.
Remarque
Intuitivement, une façon de trouver une expression pour βb est d’imposer
des contraintes.
X t Y = X t X βb et H βb = 0p−r .
X
Notons G = ∈ Mn+p−r ,p . Alors on a
H
Remarque
Intuitivement, une façon de trouver une expression pour βb est d’imposer
des contraintes.
X t Y = X t X βb et H βb = 0p−r .
X
Notons G = ∈ Mn+p−r ,p . Alors on a
H
X
G G βb = (X t , H t )
t
βb = X t X βb + H t H βb = X t X βb = X t Y .
H
Définition
La contrainte H est dite contrainte admissible si et seulement si
ker G = ker H ∩ ker X = {0p }.
Définition
La contrainte H est dite contrainte admissible si et seulement si
ker G = ker H ∩ ker X = {0p }.
Proposition
Si H est admissible, alors
βb = (G t G )−1 X t Y .
Définition
La contrainte H est dite contrainte admissible si et seulement si
ker G = ker H ∩ ker X = {0p }.
Proposition
Si H est admissible, alors
βb = (G t G )−1 X t Y .
Démonstartion
Si H est admissible, alors G est de rang p donc de rang plein, d’où G t G
est inversible. Ainsi on obtient
βb = (G t G )−1 X t Y ,
Définition
La contrainte H est dite contrainte admissible si et seulement si
ker G = ker H ∩ ker X = {0p }.
Proposition
Si H est admissible, alors
βb = (G t G )−1 X t Y .
Démonstartion
Si H est admissible, alors G est de rang p donc de rang plein, d’où G t G
est inversible. Ainsi on obtient
βb = (G t G )−1 X t Y ,
Remarques
On définit Yb comme étant le projeté orthogonal de Y sur [X ].
Remarques
On définit Yb comme étant le projeté orthogonal de Y sur [X ].
D’après le Chapitre 1, on a
Yb = P[X ] Y = X β,
b
Remarques
On définit Yb comme étant le projeté orthogonal de Y sur [X ].
D’après le Chapitre 1, on a
Yb = P[X ] Y = X β,
b
P[X ] Y = X βb = X (G t G )−1 X t Y .
Remarques
On définit Yb comme étant le projeté orthogonal de Y sur [X ].
D’après le Chapitre 1, on a
Yb = P[X ] Y = X β,
b
P[X ] Y = X βb = X (G t G )−1 X t Y .
Conséquences
βb = (G t G )−1 X t Y dépend des contraintes dans G .
Conséquences
βb = (G t G )−1 X t Y dépend des contraintes dans G .
Si βb et β vérifient la contrainte définie par H, alors βb est un
estimateur sans biais de β.
Conséquences
βb = (G t G )−1 X t Y dépend des contraintes dans G .
Si βb et β vérifient la contrainte définie par H, alors βb est un
estimateur sans biais de β.
Démonstartion
En effet, on a
b = E (G t G )−1 X t Y = (G t G )−1 X t E(Y )
E(β)
= (G t G )−1 X t X β car E(Y ) = E(ε) = β
= (G t G )−1 (X t X + H t H)β car Hβ = 0p−r .
Ainsi
b = (G t G )−1 (G t G )β = β.
E(β)
Conséquences
b = σ 2 (G t G )−1 X t X (G t G )−1 .
V(β)
Conséquences
b = σ 2 (G t G )−1 X t X (G t G )−1 .
V(β)
Sous l’hypothèse de résidus Gaussiens,
βb ∼ N β, σ 2 (G t G )−1 X t X (G t G )−1 .
Conséquences
b = σ 2 (G t G )−1 X t X (G t G )−1 .
V(β)
Sous l’hypothèse de résidus Gaussiens,
βb ∼ N β, σ 2 (G t G )−1 X t X (G t G )−1 .
Démonstartion
En effet, on a
b = V (G t G )−1 X t Y = (G t G )−1 X t V(Y )X (G t G )−1 t
V(β)
= (G t G )−1 X t σ 2 Ir X (G t G )−1 car V(Y ) = V(ε) = σ 2 Ir .
= σ 2 (G t G )−1 X t X (G t G )−1 .
Concernant σ 2
kY − Yb k2 kY − P[X ] Y k2
b2 =
σ = .
n − rg (X ) n − rg (X )
Or rg (X ) = I , dans le cas de l’anova à un facteur. Donc
kY − P[X ] Y k2
b2 =
σ
n−I
Remarque
D’autres tests sont automatiquement proposés dans R. Par exemple, le
summary donne directement la p-value des tests
α
bi
∼ Tn−I ,
b αi )
V(b
b2 (G t G )−1 X t X (G t G )−1
où V(b
b αi ) = σ
i+1,i+1
.
α
bi
∼ Tn−I ,
b αi )
V(b
b2 (G t G )−1 X t X (G t G )−1
où V(b
b αi ) = σ
i+1,i+1
.
En revenant à la définition des paramètres αi , tester si αi = 0 revient à se
demander si le groupe i est significativement différent du groupe de
référence (par défaut le groupe 1 sous R).
α
bi
∼ Tn−I ,
b αi )
V(b
b2 (G t G )−1 X t X (G t G )−1
où V(b
b αi ) = σ
i+1,i+1
.
En revenant à la définition des paramètres αi , tester si αi = 0 revient à se
demander si le groupe i est significativement différent du groupe de
référence (par défaut le groupe 1 sous R).
Puisque ce test dépend de la contrainte choisie, ce test est peu
satisfaisant. On préfèrera tester des paramètres qui ne dépendent pas de la
contrainte choisie pour estimer.
Définition
On dit que φ est estimable si et seulement si il existe u tel que C t = u t X .
Définition
On dit que φ est estimable si et seulement si il existe u tel que C t = u t X .
De cette façon, on a
φb = C t βb = u t X (G t G )−1 X t Y .
Définition
On dit que φ est estimable si et seulement si il existe u tel que C t = u t X .
De cette façon, on a
φb = C t βb = u t X (G t G )−1 X t Y .