Vous êtes sur la page 1sur 2

Regression logistique

Les modèles dichotomiques (choix binaires) sont


utilisés dans des secteurs très divers.
Exemple : L’âge et la présence (1) ou l’absence (0)
d’une maladie cardiovasculaire chez 100 individus
ont été enregistrées.
plot(CHD~Age, main=" Représentation de CHD en
fonction de l’âge",col="red")

plot(piobs~Agec,main=" Courbe de fréquence de


CHD y par classe d’âge ",type= "l")

Une méthode permettant de réduire cette


variabilité consiste à regrouper les patients par
classe d’âge et calculer la proportion de malades
observée selon les classes d’âge.

Dans un modèle de choix binaire, on souhaite


expliquer une variable Y (Y=0 (échec) ou Y=1
(succès)) , par une variable ou plusieurs variables
explicatives X1,X2, . . . ,Xk.
Pour ceci, on cherche à modéliser la loi de Y |X = x
(ou Xk=xk)
On modélise logit(π(x)) avec π(x) = P(Y = 1|X = x)
Représentation graphique des proportions
observées de malades selon la classe d'âge : Logit(π(x))=a+bx (en cas de régression simple)

piobs=c(0.1,0.133,0.250,0.333,0.461,0.625,0.764,0 Logit(π(x))=a0+a1x1+…+akxk (en cas de régression


.800) Agec=c(24,31.5,36.5,41.5,46.5,51.5,56.5,64) multiple)

plot(piobs~Agec,main="Prop. de malades selon la Et donc la probabilité estimée est :


classe d'âge") a+bx
e
π ( x) = a +bx
1+ e
Courbe de la fonction logit :
p=seq(0.01,0.99,by=0.01)
logit=log(p/(1-p))
plot(logit~p,main="Courbe de la fonction L=glm(REU~GEN+NEC+NEN+NMI,data=data,family
logit",ylab="logit (p) ",,type= "l",col= "red" ) =binomial(logit))
Estimation d’un modèle avec logit : summary(L)
Mod=glm(y~x,data=data,family=binomial(logit)) si on veut effacer la constante on met :
summary(Mod) L=glm(REU~0+GEN+NEC+NEN+NMI,data=data,fam
ily=binomial(logit))
tester le modéle:
Pour calculer χ 23 ( 0.05) :
pour tester l’hypothèse : H0 : a1 = a2 = . . . = ak = 0,
nous utilisons le ratio du Log vraisemblance LR qchisq(0.95,3)
LR = −2ln(LR/ LU) =−2(ln(LR) − ln(LU ))
LR est la valeur de la fonction du Logvraisemblance Estimation par un modèle probit :
contrainte sous H0
FitProbit =
LU = valeur de la fonction du Logvraisemblance non glm(CHD~Age,family=binomial(link="probit"))
contrainte
summary(FitProbit)
On trouve dans les résultats d’estimation null
evidance qui représente -2ln(LR)
Et Residual evidance qui égale -2ln(LU)
On doit calculer null evidance – residual evidance

Si LR > χ 2k ( α ) ou χ 21 ( α ) en cas de regression simple


le modèle est significatif.
2
χ 1 (0.05)=3.81

Odds Ratios :
π (x )
¿=
1−π (x)

Si OR=3 => la réponse Y = 1 a trois fois plus de


chances de se réaliser que Y=0.
L’odds ratio (rapport des chances) entre deux
individus x et x’
π ( x)
1−π (x )
¿=
π (x ' )
1−π (x ' )

OR(x, x’) >1 => π(x) > π(x’)


OR(x, x’) =1 => π(x) = π(x’)
OR(x, x’) <1 => π(x) < π(x’)

Estimation d’un modéle logit multiple :

Vous aimerez peut-être aussi