Académique Documents
Professionnel Documents
Culture Documents
12 Juin 2015
Plan
Introduction
Conclusion
Plan
Introduction
Conclusion
Introduction
Plan
Introduction
Conclusion
académie...)
I patients dans un hôpital
I habitants d'un quartier
unités)
Problématiques
Types de questions auxquelles on peut souhaiter répondre :
données individuelles
I interprétation : en 1930 la population noire était concentrée
dans les Etats du Sud les plus pauvres (et donc dans
l'ensemble les moins éduqués)
● ●●
●
●
● ●
● ● ●●
●
●●● ●
●
●
●
●● ● ●●
●●
y=β0+β1x
●●
●
●
●●
●
40
●
y
●●● ●
● ● ●
●
●
●
●
●● ●
● I alors qu'au sein de chaque
30
●● ●
●
● ● ●●
●● ●● ●
●
● groupe, la corrélation entre x
20
●●
●●●●● ●
●
●
●
●
et y est négative
10
●● ●
●
●● ●
●
0 20 40 60 80 100
Plan
Introduction
Conclusion
yij = β0 + αj + ij
I où :
1. αj correspond à un terme groupe (commun à tous les individus
du groupe)
2. ij représente un écart strictement individuel à la moyenne
●
●
●
●
● I β0 est la moyenne de y sur
●
●
l'ensemble de la population.
●
●
●
●
●
3.0
●
●
●
●
●
●
●
α10
●
I αj
la moyenne du groupe j
●
●
● ●
α8 ●
●
α9
● ●
●●
●
α7●
● ● ●
● ●
moyenne totale β0 .
α●4 β0=y
y
●
● ●
● ● α5
α2
●
● ●
● α●3 ●
● ●
●
● α6●
2.0
● ● ●
● ● ● ●
● ●
I ij
● ●
●●
yi
● ● ●
●
●
●
εi
●
β0 + α1=y1
observée pour i par rapport à
●
●
●
la moyenne de son groupe
1.0
la moyenne :
d'intérêt
eet entreprise ?
I Quelles caractéristiques observables du quartier sont corrélées
2
yij = β0 + αj + εij αj ∼ N(0, σα )
εij ∼ N(0, σε2 )
Le retard scolaire
I Étude du retard scolaire à l'entrée en 6e, spécicité : variable
binaire.
I Prise en compte de l'eet quartier d'habitation de l'élève.
I Le modèle logit à eets aléatoires
pij
log = β0 + αj pij = probabilité d'être en retard
1 − pij
I Résultats :
σα2 = 0, 436 et σε2 = π 2 /3 = 3, 28 (xé dans un modèle logit
pour rendre le modèle identiable)
→ ρ = 11, 7%.
Pauline Givord et Marine Guillerm Séminaire de Méthodologie Statistique
Introduction
Des modèles multiniveaux pour quoi faire ? Modèles à eets xes
Des modèles multiniveaux comment ? Modèles à eets aléatoires
Conclusion
I Le modèle
La forme du modèle
● ● ●●●
●
●
●
α9
●
●
●
●
●
●
α● 10
●
● ●
●● ● ● ●
autre. → Modèle à
●
α6
●● ●
α8
constante aléatoire. ● ●●
●● ●
●
● ●●
→
● ●●
Chaque groupe a sa
●
α3
●
● ● ● ●
●
●
α4
● ● ●
● ●
● ●
y
●
α2
●●
●
●
●
● α5 ●
●
●
●
●●
●
● ●
●
relation générale. β 1x
0+
y=β
●
●
●
contrôlé de x. ●
●
●●
●●
→ L'eet de la variable x ● ●
Estimer les αj
I Pour certaines problématiques, les eets groupes αj peuvent
avoir un intérêt.
Par exemple : estimer les eets école ou faire des
prédictions.
I Calcul des eets groupe :
σ̂ 2
α̂j = cj × (ȳj − β̂0 − x̄j β̂1 ) avec cj = 2 α 2
σ̂α + σ̂ε /nj
0≤ cj ≤ 1 : facteur de contraction.
→ La contraction rapproche la droite du groupe j de la droite
générale.
I La contraction est d'autant plus importante que le groupe est
de petite taille.
→ Quand les eectifs sont faibles, les estimations risquent
quand même de ne pas être très ables.
Les hypothèses
I Enjeu : Avoir une interprétation causale des paramètres estimés.
I H1 : Exogénéité des covariables cov (εij , x k ) = 0 k = 1, . . . , p
ij
→ Les caractéristiques individuelles non observées ayant un
eet sur la variable d'intérêt ne sont pas corrélées aux
covariables.
I H2 : Hypothèse sur les eets aléatoires
cov (αj , xijk ) = 0 k = 1, . . . , p .
→ Les caractéristiques inobservées du groupe ayant un eet sur
la variable d'intérêt ne sont pas corrélées aux variables incluses
dans le modèle.
I H2 est spécique à la modélisation à eets aléatoires. Dans le
modèle à eets xes, pas d'hypothèse sur les eets groupe...
I Mais H1 doit être vériée qu'on soit dans le cadre eets
aléatoires ou eets xes.
Les hypothèses
les classes les plus petites sont formées pour les élèves les plus
en dicultés scolaires.
I Inclure le niveau scolaire des élèves en début d'année permet
Le test d'Hausman
I On distingue les variables qui caractérisent l'individu, notées
xij ; de celles qui caractérisent son groupe, notées xj
l'hypothèse H2.
Le modèle de Mundlak
Plan
Introduction
Conclusion
Conclusion