Vous êtes sur la page 1sur 2

UNIVERSITE D’ABOMEY-CALAVI

CHAIRE INTERNATIONALE EN PHYSIQUE MATHEMATIQUE ET APPLICATIONS


(CIPMA Chaire UNESCO)

MODELES PARAMETRIQUES
DE REGRESSION
Niveau: Master (STATISTIQUE APPLIQUEE AU VIVANT)
Année académique: 2019-2020
Durée: 3h
Tout document est interdit. Calculatrice autorisée.
Il sera tenu compte de la qualité de la rédaction.
NB: Le corrigé-type sera disponible après la composition à l’adresse:
sites.google.com/view/nicodemeatchade/
Enseignant: Dr ATCHADE Nicodème

Bonne chance !
1 Questions de compréhension du cours.
1. On considère la loi dite logistique, admettant pour densité la fonction:
e−x
f : x 7→ c ,
(1 + e−x )2
définie sur R, où c est une constante.

1.1. Déterminer c. On remplacera désormais c par la valeur trouvée.


1.2. Soit n ∈ N∗ et X1 ; ...; Xn une famille de variables aléatoires indépendantes distribuées
selon une loi logistique.
Quelle est la loi de Mn = max(X1; ...; Xn) ? On donnera sa fonction de répartition et
sa densité.

2. Après avoir rappelé la différence entre la transformation de Box-Cox et celle de Yeo Johnson,
donner l’expression de cette dernière pour λ = 2 et Y < 0.

3. Après avoir donné la fonction de vraisemblance du modèle de régression de Poisson, montrer


que l’estimation du modèle est donnée par:
n  
X 1
s(α, β) = (yi − λi ) .
i=1
x i

4. Soit le modèle de régression:


yi = γ0 + γ1 xi + εi .
On définit l’estimateur γb1 comme le coefficient de régression de y en x , γb0 celui de la con-
stante du modèle et var(εi ) = σ 2 .

1
4.1. Donner les estimateurs du maximum de vraisemblance de γ1 , γ0 et σ 2 .
4.2. On considère le modèle linéaire suivant sous sa forme matricielle

Y = β0 1n + Xβ + ε.

Montrer que l’estimateur Ridge du modèle est donné par:

βb0 (λ) = Ȳ ; β(λ)


b = (X t X + λIp )−1 X t Y.

2 Exercice. Et si on réfléchissait encore ?


Un chercheur s’intéresse au nombre d’infections de l’oreille de jeunes nageurs. Pour 187 nageurs,
il dispose de :
X1 - un indicateur d’assiduité à la nage (Freq; Occas).
X2 - un indicateur sur le lieu habituel de nage (Beach; NonBeach).
X3 - un indicateur sur la tranche d’âge ([15; 19]; [20; 24]; [25; 29]).
X4 - un indicateur sur le sexe (Female; Male).
Y - le nombre (entier naturel) d’infections de l’oreille.
Il souhaite expliquer Y à partir de X1 , X2 , X3 et X4 .

1. La décision d’une modélisation par la régression de Poisson est-elle fondée ? Justifier.

2. Pouvait-il inclure dans le modèle les interactions ? Justifier.

3. Les syntaxes de R ci-dessous indiquées pour la modélisation sont-elles bien spécifiées ? Sinon,
rectifier.
> library(stats)
> reg = glm(Y ∼ X1 * X2 * X3 * X4 )
> summary(reg)

4. Interpréter le(s) coefficient(s) significatifs du modèle en se basant sur les résultats présentés
ci-après. Indication: ”*” pour un seuil de 1% et ”.” pour un seuil de 5%.

Tableau. Résultats de la modélisation

Fin

Vous aimerez peut-être aussi