Vous êtes sur la page 1sur 15

La rgression logistique

Rgression logistique

Mesure de la relation entre une variable dpendante


(dichotomique) et une ou plusieurs variables indpendantes

Utile dans la prdiction de la prsence ou absence dun


comportement (ex. succs ou chec, amlioration ou non)
Rgression logistique

Exemple: Le nombre dheures de travail par semaine par rapport


lobtention dune promotion.
Rgression logistique

Une fonction linaire ne permettra pas dajuster de faon optimale


les donnes. Puisque la variable dpendante est dichotomique, une
rgression nonlinaire (logistique) est la meilleure option.

u b0 b1 x1 b2 x2 L bp x p

1
y
1 eu
Rgression logistique
Rgression logistique

Cependant, la mthode des moindres carrs nest pas optimale


pour trouver la solution des coefficients de rgression. Il faut donc
utiliser la mthode du maximum du log de la vraisemblance. Le
but est de trouver les b qui maximisent L(b).
b (b0 , b1 , b2 ,L , b p )

n
L(b) yi ln yi (1 yi ) ln(1 yi ) log-likelihood=LL(b)
i 1
Rgression logistique

Exemple

L(b) 55.6765 b0 5.30945


b1 0.110921
Rgression logistique

Test dhypothse: Fonction de ressemblance


Lide est de comparer le rapport entre un modle avec peu de
coefficients par rapport un modle avec plus de coefficients. Par
exemple, un modle avec les prdicteurs et un modle sans les
prdicteurs.
vraisemblance de la constante
G 2 = -2 ln
vraisemblance de la constante plus les coefficients

G 2 = 2 LL(b) LL(0)
Rgression logistique

Test dhypothse
Exemple
LL(0) -68.3315
LL(b) -53.6765

G 2 = 2 -53.6765 -68.3315 29.3099

Dans des chantillons levs, G2 se distribue selon un 2. Les


degrs de libert correspondent au nombre de prdicteurs dans le
modle ayant le plus de prdicteurs moins celui qui en a le moins.
dl 1 0 1
Rgression logistique

Test dhypothse
Exemple
G 2 = 29.3099

dl 1

2 (1, 0.95) = 3.84

Comme le G2>2, alors nous concluons que le prdicteur x1 ne doit


pas tre enlev de lquation. Autrement dit, le nombre dheure de
travail est significatif par rapport lobtention dune promotion.
Rgression logistique

Test dhypothse: Test de Wald


Permet didentifier les prdicteurs qui sont significatif.
Le test se distribue selon un Z.

bi
W Z
SEbi

Note: SPSS rapporte un W=Z2


Rgression logistique

Rapport de cote
Permet de mesurer laugmentation (diminution) de la cote dtre
dans une catgorie lorsque la valeur dune unit est augment de 1.

RCi ebi

Exemple: Pour chaque augmentation dune


heure de travail, les chances de
RC1 eb1 e0.110921 1.11731 promotion augmente de 12%
Rgression logistique

Tableau de classification
Permet de voir le taux de bonnes et mauvaises classification

Si le prdicteur est aussi dichotomique, alors il galement possible de calculer le


rapport de cote
Rgression logistique
Force dassociation ~ R2
Permet de mesurer le pourcentage de variance explique.
McFadden Exemple
LL(b)
2 1 2 0.214468
LL(0)

Cox & Snell


2
LL ( b ) LL (0) 2
RCS 0.254052
R 2
CS 1 e n

Nagerlkerke
2
RCS 2
R 2 ,
2
N R 2
1 e n
LL (0)
RN2 0.340993
RMAX MAX
Fin!

Vous aimerez peut-être aussi