Académique Documents
Professionnel Documents
Culture Documents
• Régression logistique
• Les données
On cherche à expliquer une variable Y binaire par p variables explicatives
X1,…,Xp.
On dispose de n observations (x1,y1),…, (xn,yn)
• Odds ratios
Régression logistique– odd ratio
OR
Régression logistique – odd ratio
• Test de Wald
Régression logistique – Tests d’hypothèses
Proportion théorique
Régression logistique – Test
(résidus plus facile à analyser ,leur distribution étant “presque” centrée réduite).
Résidu de déviance
Déviance
Régression logistique
Exemple – chd
Régression logistique – fonction glm( )
> chd.glm <- glm(CHD ~ AGE, family=binomial(link=logit))
Régression logistique sur R
Estimations
Note:
Odd ratio
> exp(chd.glm$coef[2])
AGE
1.117307
Régression logistique – Exemple
Prévision
Régression logistique – Exemple
Régression logistique sur R
Exemple – logistic 2
On envisage le cas d’une régression logistique pour une variable réponse
Y binaire ( présence ou absence ) en fonction d’une variable explicative
X de type dichotomique ou binaire (X=0, X=1).
Régression logistique sur R
Régression logistique sur R
• Odds ratios
-> Interprétation identique (Régression logistique simple)
->
• Notion d’interaction
Lorsque l’examen des tableaux de contingence entre Y et X1 , X2 révèle
l’existence possible d’une interaction , on peut tester cette interaction.
• Sélection de variables
Méthodes permettant de sélectionner un meilleur modèle
Méthode ascendante
- on choisit un modèle de départ (par exemple le modèle constant);
- la procédure ajoute à chaque étape le terme le plus significatif;
- le critère de choix est le critère d’Akaiké.
Méthode descendante
- la procédure part du modèle initial (modèle complet) et élimine
à chaque étape le terme du modèle le moins significatif.