Vous êtes sur la page 1sur 2

3A, 2023 Statistique des processus. TP 1.

ENSAI

TP 1. Chaînes de Markov.

Exercice 1
Soit (Xt )t∈N 
une chaîne deMarkov à deux états 0 ou 1. On suppose que sa matrice de transition est
1−p p
donnée par P = avec 0 ≤ p, q ≤ 1.
q 1−q
1. Donner l'estimateur du maximum de vraisemblance (p̂, q̂) de (p, q) obtenu à partir d'un échantillon
X1 , . . . , Xn .

2. Dénir une statistique σ̂ telle que Sn := n (p̂ − p) /σ̂ converge en loi vers une loi N (0, 1).
3. On suppose n = 100, p = 0.7 et q = 0.5. Simuler N = 500 réalisations de Sn et vérier l'ajustement
à la loi gaussienne à l'aide d'un graphe quantile/quantile.
4. A partir d'une nouvelle réalisation d'une trajectoire de longueur n = 100, donner un intervalle de
conance de niveau asymptotique 95% pour le paramètre p.
Exercice 2
On modélise la dynamique d'une épidémie à l'aide d'une chaîne de Markov. On suppose que la taille de
la population est N = 9 et on note Xt le nombre de personnes infectées au temps t. On pose X0 = 5. La
matrice de transition P de la chaîne est dénie par P (i, i + 1) = p = 1 − P (i, i − 1) lorsque 1 ≤ i ≤ 8,
P (0, 0) = 1 et P (9, 8) = 1.
1. Donner une interprétation de la dynamique de la chaîne pour la propagation de l'épidémie.
2. Rappeler un résultat du cours qui permet de calculer la temps moyen T (p) à attendre avant extinction
de l'épidémie.
3. Pour p = 0.4 + j/100, j = 1, . . . , 20, représenter la courbe qui à p associe T (p). Commenter.
Exercice 3
Sous R, la librairie SMPPracticals contient le jeu de données intron qui est une séquence de 1572 nucléo-
tides d'un gène humain appelé préproglucagon.
1. Ajuster une chaîne de Markov et donner une estimation de la matrice de transition et de la probabilité
invariante.
2. On veut maintenant tester l'hypothèse nulle d'indépendance entre les coordonnées. Sous H0 , les lignes
de la matrice P sont identiques et une estimation de P (x, y) est donnée par
n−1
1 X
P̂n,0 (x, y) = 1Xi+1 =y .
n − 1 i=1

P̂n (x, y)
(a) Montrer que la statistique Wn = 2 est celle d'un test de rapport de
X
Nn (x, y) log
(x,y)∈E 2
P̂n,0 (x, y)
vraisemblance.  
(b) On admettra que la loi asymptotique de Wn est la loi de χ2 (|E| − 1)2 . Implémenter le test et
donner la p−value. La fonction rchisq peut être utilisée pour générer des échantillons de loi du
χ2 .
3. On veut maintenant ajuster une chaîne de Markov d'ordre 2. Une chaîne de Markov à l'ordre m ≥ 1
est simplement une suite de variables aléatoires (Xt )t∈N telle que
P (Xt = xt |Xt−1 = xt−1 , . . . , X0 = x0 )
= P (Xt = xt |Xt−1 = xt−1 , . . . , Xt−m = xt−m ) for t ≥ m.

1
Il est facile de vérier que le processus augmenté (Yt )t≥m−1 déni par Yt = (Xt , Xt−1 , . . . , Xt−m+1 )
est une chaîne de Markov à l'ordre 1 qui sera irréductible si par exemple toutes les probabilités
conditionnelles ci-dessus sont positives. Dans le cas homogène, la dynamique est déterminée par une
mesure de probabilité initiale sur E m et un opérateur de transition P : E m × E → [0, 1] déni par
P (x0 , . . . , xm−1 ; xm ) = P (Xt = xm |Xt−1 = xm−1 , . . . , Xt−m = x0 ) .

On peut alors montrer que l'EMV est donné par


P̂n(m) (x1 , · · · , xm ; y) = Nn (x1 , . . . , xm ; y) /Nn+ (x1 , . . . , xm ) ,

où Nn (x1 , . . . , xm ; y) compte le nombre d'indices t pour lesquels (Xt , . . . , Xt+m−1 , Xt+m ) prend la
valeur (x1 , . . . , xm , y) et Nn(+) (x1 , . . . , xm ) = y∈E Nn (x1 , . . . , xm ; y).
P

(a) Ajuster une chaîne de Markov à l'ordre 2 sur la séquence intron.


(b) On veut sélectionner un ordre pour la chaîne de Markov (ici on veut choisir entre m = 1 et m = 2).
Si L̂m,n est la vraisemblance maximisée pour le modèle d'ordre m, on dénit
|E|m (|E| − 1)
BIC(m) = − log L̂m,n + log(n).
2
Des résultats théoriques garantissent que m̂ = arg minm≥0 BIC(m) est bien un estimateur consis-
tant de l'ordre de la chaîne. Que peut-on dire pour jeu de données intron ?

Vous aimerez peut-être aussi