Vous êtes sur la page 1sur 1

Modèles linéaires généralisés - Régression logistique

M2 STD – Laurent Léger

E1 – Beetle
Les données sont issues d’une expérimentation sur l’efficacité d’un traitement anti parasite
sur n=481 cafards. Les données individuelles reportent la variable explicative est la dose
de poison administrée logdose10 exprimée sur échelle logaritmique, la variable réponse est
binaire avec valeur 0 si l’individu a survécu et valeur 1 pour le cas de mort. ).

L’objectif est d’analyser la liaison dose poison - mortalité en utilisant un modèle de


régression logistique.

1. Représenter graphiquement les variables mort10 en fonction de logdose10 ; commenter.

2. On remarque que les valeurs de la variable explicative ( doses de poison administrée ) sont
en nombre réduit; il est donc possible de regrouper les individus (données agrégées) ayant
reçu la même dose et de reporter les proportions pour chaque dose administrée des individus
morts ou ayant survécu. Construire le tableau de données agrégées en utilisant le code suivant :

log.dose <- unique(log.dose10)

N <- numeric(length(log.dose))
mort <- numeric(length(log.dose))
for (i in 1:length(log.dose)){
N[i] <- sum(log.dose10 == log.dose[i])
mort[i] <- sum(log.dose10 == log.dose[i] & mort10 == 1)
}
data.aggr <- data.frame(log.dose, mort, N)
data.aggr

Représenter graphiquement les proportions et commenter.

3. Utiliser la transformation logit en faire une représentation graphique et commenter.


(Note : correction pour valeur logit infinie - à voir)

4. Exécuter une régression logistique avec la fonction glm( ) de R.

Le modèle régression logistique peut prendre trois formes qui conduisent aux mêmes
résultats.

Modèle 1 -> modèle sur données agrégées


- Yi ~ cbind(mort, N-mort) , matrice avec colonnes morts et survivants

Modèle 2 -> modèle sur les proportions


- Yi = Zi/Ni ~ Binomiale dite des fréquences

Modèle 3 -> modèle sur données individuelles


- Yi= Ti ~ Bernoulli

Afficher les résultats de la modélisation coefficients estimés, valeurs des critères de


vraisemblance
et AIC avec l’instruction summary:
Expliciter le test sur coefficient de la variable explicative.
Déterminer l’odds ratio correspondant.

5. Déterminer les vraisemblances des différents modèles – modèle saturé , modèle nul ou
constant
et modèle avec variable explicative ; expliciter le test de déviance.

6. Déterminer les valeurs estimées par le modèle et représenter graphiquement l’ajustement.

Vous aimerez peut-être aussi