utilisés dans des secteurs très divers. Exemple : L’âge et la présence (1) ou l’absence (0) d’une maladie cardiovasculaire chez 100 individus ont été enregistrées. plot(CHD~Age, main=" Représentation de CHD en fonction de l’âge",col="red")
plot(piobs~Agec,main=" Courbe de fréquence de
CHD y par classe d’âge ",type= "l")
Une méthode permettant de réduire cette
variabilité consiste à regrouper les patients par classe d’âge et calculer la proportion de malades observée selon les classes d’âge.
Dans un modèle de choix binaire, on souhaite
expliquer une variable Y (Y=0 (échec) ou Y=1 (succès)) , par une variable ou plusieurs variables explicatives X1,X2, . . . ,Xk. Pour ceci, on cherche à modéliser la loi de Y |X = x (ou Xk=xk) On modélise logit(π(x)) avec π(x) = P(Y = 1|X = x) Représentation graphique des proportions observées de malades selon la classe d'âge : Logit(π(x))=a+bx (en cas de régression simple)
piobs=c(0.1,0.133,0.250,0.333,0.461,0.625,0.764,0 Logit(π(x))=a0+a1x1+…+akxk (en cas de régression
plot(piobs~Agec,main="Prop. de malades selon la Et donc la probabilité estimée est :
classe d'âge") a+bx e π ( x) = a +bx 1+ e Courbe de la fonction logit : p=seq(0.01,0.99,by=0.01) logit=log(p/(1-p)) plot(logit~p,main="Courbe de la fonction L=glm(REU~GEN+NEC+NEN+NMI,data=data,family logit",ylab="logit (p) ",,type= "l",col= "red" ) =binomial(logit)) Estimation d’un modèle avec logit : summary(L) Mod=glm(y~x,data=data,family=binomial(logit)) si on veut effacer la constante on met : summary(Mod) L=glm(REU~0+GEN+NEC+NEN+NMI,data=data,fam ily=binomial(logit)) tester le modéle: Pour calculer χ 23 ( 0.05) : pour tester l’hypothèse : H0 : a1 = a2 = . . . = ak = 0, nous utilisons le ratio du Log vraisemblance LR qchisq(0.95,3) LR = −2ln(LR/ LU) =−2(ln(LR) − ln(LU )) LR est la valeur de la fonction du Logvraisemblance Estimation par un modèle probit : contrainte sous H0 FitProbit = LU = valeur de la fonction du Logvraisemblance non glm(CHD~Age,family=binomial(link="probit")) contrainte summary(FitProbit) On trouve dans les résultats d’estimation null evidance qui représente -2ln(LR) Et Residual evidance qui égale -2ln(LU) On doit calculer null evidance – residual evidance
Si LR > χ 2k ( α ) ou χ 21 ( α ) en cas de regression simple
le modèle est significatif. 2 χ 1 (0.05)=3.81
Odds Ratios : π (x ) ¿= 1−π (x)
Si OR=3 => la réponse Y = 1 a trois fois plus de
chances de se réaliser que Y=0. L’odds ratio (rapport des chances) entre deux individus x et x’ π ( x) 1−π (x ) ¿= π (x ' ) 1−π (x ' )