Académique Documents
Professionnel Documents
Culture Documents
ENSAI
TP 1. Chaînes de Markov.
Exercice 1
Soit (Xt )t∈N
une chaîne deMarkov à deux états 0 ou 1. On suppose que sa matrice de transition est
1−p p
donnée par P = avec 0 ≤ p, q ≤ 1.
q 1−q
1. Donner l'estimateur du maximum de vraisemblance (p̂, q̂) de (p, q) obtenu à partir d'un échantillon
X1 , . . . , Xn .
√
2. Dénir une statistique σ̂ telle que Sn := n (p̂ − p) /σ̂ converge en loi vers une loi N (0, 1).
3. On suppose n = 100, p = 0.7 et q = 0.5. Simuler N = 500 réalisations de Sn et vérier l'ajustement
à la loi gaussienne à l'aide d'un graphe quantile/quantile.
4. A partir d'une nouvelle réalisation d'une trajectoire de longueur n = 100, donner un intervalle de
conance de niveau asymptotique 95% pour le paramètre p.
Exercice 2
On modélise la dynamique d'une épidémie à l'aide d'une chaîne de Markov. On suppose que la taille de
la population est N = 9 et on note Xt le nombre de personnes infectées au temps t. On pose X0 = 5. La
matrice de transition P de la chaîne est dénie par P (i, i + 1) = p = 1 − P (i, i − 1) lorsque 1 ≤ i ≤ 8,
P (0, 0) = 1 et P (9, 8) = 1.
1. Donner une interprétation de la dynamique de la chaîne pour la propagation de l'épidémie.
2. Rappeler un résultat du cours qui permet de calculer la temps moyen T (p) à attendre avant extinction
de l'épidémie.
3. Pour p = 0.4 + j/100, j = 1, . . . , 20, représenter la courbe qui à p associe T (p). Commenter.
Exercice 3
Sous R, la librairie SMPPracticals contient le jeu de données intron qui est une séquence de 1572 nucléo-
tides d'un gène humain appelé préproglucagon.
1. Ajuster une chaîne de Markov et donner une estimation de la matrice de transition et de la probabilité
invariante.
2. On veut maintenant tester l'hypothèse nulle d'indépendance entre les coordonnées. Sous H0 , les lignes
de la matrice P sont identiques et une estimation de P (x, y) est donnée par
n−1
1 X
P̂n,0 (x, y) = 1Xi+1 =y .
n − 1 i=1
P̂n (x, y)
(a) Montrer que la statistique Wn = 2 est celle d'un test de rapport de
X
Nn (x, y) log
(x,y)∈E 2
P̂n,0 (x, y)
vraisemblance.
(b) On admettra que la loi asymptotique de Wn est la loi de χ2 (|E| − 1)2 . Implémenter le test et
donner la p−value. La fonction rchisq peut être utilisée pour générer des échantillons de loi du
χ2 .
3. On veut maintenant ajuster une chaîne de Markov d'ordre 2. Une chaîne de Markov à l'ordre m ≥ 1
est simplement une suite de variables aléatoires (Xt )t∈N telle que
P (Xt = xt |Xt−1 = xt−1 , . . . , X0 = x0 )
= P (Xt = xt |Xt−1 = xt−1 , . . . , Xt−m = xt−m ) for t ≥ m.
1
Il est facile de vérier que le processus augmenté (Yt )t≥m−1 déni par Yt = (Xt , Xt−1 , . . . , Xt−m+1 )
est une chaîne de Markov à l'ordre 1 qui sera irréductible si par exemple toutes les probabilités
conditionnelles ci-dessus sont positives. Dans le cas homogène, la dynamique est déterminée par une
mesure de probabilité initiale sur E m et un opérateur de transition P : E m × E → [0, 1] déni par
P (x0 , . . . , xm−1 ; xm ) = P (Xt = xm |Xt−1 = xm−1 , . . . , Xt−m = x0 ) .
où Nn (x1 , . . . , xm ; y) compte le nombre d'indices t pour lesquels (Xt , . . . , Xt+m−1 , Xt+m ) prend la
valeur (x1 , . . . , xm , y) et Nn(+) (x1 , . . . , xm ) = y∈E Nn (x1 , . . . , xm ; y).
P