Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Leonardo Brenner
Leonardo.Brenner@univ-amu.fr
www.lsis.org/brennerl
1 Chaînes de Markov
Définition formelle
Idée générale
Discrete Time Markov Chains
Continuous Time Markov Chains
Propriétés
Analyse de Performance
1 Chaînes de Markov
Définition formelle
Idée générale
Discrete Time Markov Chains
Continuous Time Markov Chains
Propriétés
Analyse de Performance
Chaînes de Markov
Définition formelle
Un processus stochastique {X (t), t ≥ 0} forme une chaîne de Markov à
temps continu si pour tous les entiers n, et pour n’importe quelle séquence
t0 , t1 , ..., tn , tn+1 telle que t0 < t1 < ... < tn < tn+1 , on a
Probabilités de transition
À partir du processus stochastique Prob{X (tn+1 = xn+1 |X (tn ) = xn } on peut
écrire les probabilités de transition d’une chaîne de Markov à temps continu et
non-homogène par :
Chaînes de Markov
Chaînes de Markov
Définition
Une chaîne de Markov est une suite de variables aléatoires (Xn , n ∈ ) qui N
permet de modéliser l’évolution discrète et dynamique d’un système
aléatoire : Xn représente l’état du système à l’instant n.
Propriété de Markov
La propriété fondamentale des chaînes de Markov, dite propriété de Markov,
est que son évolution future ne dépende du passé que au travers de sa valeur
actuelle.
Chaînes de Markov
Représentation graphique
a
R S
b
c
d
E
Présentation
Dans une chaîne de Markov à temps discret, on observe l’état du système
dans un ensemble discret du temps. Autrement dit, l’intervalle de temps entre
chaque observation est constant.
Intervalle d’observation
Un important paramètre dans le DTMC est le choix de l’intervalle de temps
entre les observations :
Un intervalle trop petit ne permet pas d’observer des changements d’état.
Un intervalle trop grand permet de multiples changements d’état entre
chaque observation.
Étudiant endormi
0.5
R S
0.3
0.6
0.9
E
Matrice de transition
P =???
Présentation
Dans une chaîne de Markov à temps continu, le changement d’état peut se
produire dans n’importe quel point dans le temps.
Ces points sont aléatoires et pas nécessairement entiers.
Intervalle de temps
L’intervalle de temps entre chaque changement d’état suit une variable
exponentielle dont le taux dépend uniquement de l’état courant du système.
Propriétés
loi sans mémoire
1
Espérance (valeur moyenne) = λ
Leonardo Brenner (LSIS) Modèles à Événements Discrets 12 / 36
Chaînes de Markov Continuous Time Markov Chains
Étudiant endormi
3
R S
2
4
6
E
Matrice de transition
Q =???
Propriétés
Irreductibilité
état accessible : Un état j est dit accessible à partir d’un état i (i → j) si à
partir de l’état i on peut arriver à l’état j avec une probabilité non-nulle.
état communicant : Un état i est dit communicant avec l’état j (i ↔ j) si
i → j et j → i. Un ensemble d’états C est une classe communicante si
tous les états dans C communique avec tous les autres et aucun état
dans C communique avec un état en dehors de C.
Propriétés
Periodicité
état périodique : Un état i a une période k si tout retour à l’état i doit avoir
lieu dans un nombre de pas multiple de k (k > 1).
état apériodique : Si k = 1, alors l’état est dit apériodique.
Propriétés
Récurrence
état transitoire : un état i est dit transitoire si, étant donné qu’on
commence par l’état i, il y a une probabilité non-nulle de ne plus jamais
retourner à l’état i.
état récurrent : un état i est récurrent s’il n’est pas un état transitoire.
état absorbant : un état i est dit absorbant s’il est impossible de sortir de
cet état.
Propriétés
Ergodicité
état ergodique : un état i est dit ergodique s’il est apériodique et
récurrent.
Analyse de performance
Type d’analyse
Transitoire : évolution du comportement du système (dépendant du
temps et de l’état initial) ;
Stationnaire : comportement moyen du système (independant du temps
et de l’état initial).
Évolution du système
1 . . .
Régime stationnaire
Probabilité . . . π[x]
de l’état x
0 . . .
0 1 2 3 t ∞
Temps
Leonardo Brenner (LSIS) Modèles à Événements Discrets 18 / 36
Chaînes de Markov Analyse de Performance
π.Q = π
π.Q = 0
Leonardo Brenner (LSIS) Modèles à Événements Discrets 19 / 36
Chaînes de Markov Analyse de Performance
PageRank (simplifié)
PageRank est l’algorithme d’analyse des liens concourant au système de
classement des pages Web utilisé par le moteur de recherche Google. Il
mesure quantitativement la popularité d’une page web.
Fonctionnement
Le principe de base est d’attribuer à chaque page une valeur proportionnelle
au nombre de fois que passerait par cette page un utilisateur parcourant le
graphe du Web en cliquant aléatoirement, sur un des liens apparaissant sur
chaque page.
Chaque lien d’une page vers une autre correspond à une transition. Chaque
page représente un état.
Exercice
Considerez un ensemble de 4 pages web. Chaque page a les liens suivants :
Page 1 : 2 et 3
Page 2 : 3 et 4
Page 3 : 1, 2 et 4
Page 4 : 1 et 2
Donnez la chaîne de Markov, la matrice de transition et le PageRank de
chaque page.
1 Chaînes de Markov
Définition formelle
Idée générale
Discrete Time Markov Chains
Continuous Time Markov Chains
Propriétés
Analyse de Performance
Motivations
Permet de modéliser des tâches avec des temps d’exécution non
determinites
Possibilité de prendre en compte des pannes aléatoires
...
Cas général
Le comportement dynamique d’un réseau de Petri stochastique est décrit au
travers de processus stochastiques :
Définition formelle
Définition
Soit SPN = (P, T , Pre, Post, M0 , Λ) un réseau de Petri stochastique où :
P est un ensemble fini de places ;
T est un ensemble fini de transitions ;
Pre et Post sont, respectivement, les matrices d’incidence avant et
après ;
M0 est le marquage initial ;
Λ = (λ1 , .., λ|T | ) où λi est le taux associé à la transition ti (paramètre de la
loi exponentielle).
Hypothèses necessaires
Hypothèses
Les taux associés aux transitions sont indépendants du marquage ;
RdPS - Exemple
Étudiant endormi
P1
Transition Taux
t4 t1 3
t1 t2 2
t3 4
t2 t4 6
P3 P2
t3
Grafe d’atteignabilité
Propriétés
Le graphe d’atteignabilité d’un SPN est identique à celui du réseau de
Petri non temporisé correspondant.
Un SPN est isomorphe à une chaîne de Markov à temps continu
(CTMC). En particulier, un SPN k-borné est isomorphe à une CTMC finie.
Construction de la CTMC
Le graphe d’atteignabilité, valué par les taux correspondant au franchissement
des transitions, définit le générateur d’un processus markovien homogéne. La
CTMC associée à un RdPS donné est donc obtenue en appliquant les règles
suivantes :
1 l’espace d’états de la CTMC S = {si }correspond à l’ensemble des
marquages atteignables à partir de M0 (i.e. R(M0 )) du réseau de Petri ;
2 Les taux pour passer de l’état si (correspondant à Mi ) à l’état sj (Mj ) est
obtenu en sommant tous les taux de franchissement des transitions qui
permettent de passer de Mi à Mj .
Leonardo Brenner (LSIS) Modèles à Événements Discrets 29 / 36
Réseaux de Petri Stochastiques Graphe d’atteignabilité
Étudiant endormi
t1 3
t3 4
t4 6
0,0,1 0,0,1
2 étudiants
Comment modeliser le comportement de deux étudiants ?
Matrice de transition
Matrice de transition Q
La matrice de transition Q (appelée aussi générateur du processus
markovien) est obtenue ainsi :
(P
k /tk ∈Ej (Mi ) λk si i 6= j
qij =
−qi si i = j
où
P
qi = k /tk ∈E(Mi ) λk
E(Mi ) : ensemble des transitions franchissables à partir du marquage Mi
Ej (Mi ) : ensemble des transitions de E(Mi ) permettant d’obtenir Mj
Indices de performances
Temps de séjour
Le temps de séjour suit une loi exponentielle de taux qi (la somme des taux
de toutes les transitions possibles). On a donc :
λj
La probabilité de franchir en premier tj ∈ E(Mi ) à partir de Mi est égal à qi
1
Le temps de séjour moyen dans la marquage Mi est égal à qi
Indices de performances
Fonction indice
On peut associer à chaque marquage une fonction indice (ou récompense)
r (M). Cette fonction associe le marquage à la probabilité d’état correspondant
au marquage. L’indice moyen est defini par :
X
R= r (Mi )πi
i/Mi ∈R(M0 )
Indices de performances
Nombre moyen de jetons
Pour calculer le nombre moyen de jetons, on définit la fonction indice tel que :
On obtient ainsi :
X
E(M(Pi )) = nP{A(i, n)} où A(i, n) = {Mj ∈ R(M0 )/Mj (Pi ) = n}
n>0
Quelle est la probabilité qu’un seul processeur soit dans l’état d’attente ?
Combien de processeurs peut-on mettre dans cet ordinateur sans perdre de
performances ?
Test de logiciel
Problème
Imaginez un logiciel pour lire et convertir de la musique MP3. L’interface du
logiciel est composée de trois boutons : Ouverture, lecture et conversion.
L’utilisateur ne peut pas commencer la lecture ou la conversion avant d’ouvrir
le fichier. Toutefois, il peut ouvrir un nouveau fichier lorsqu’il est en train de lire
ou de convertir un fichier.
Chaque boutons déclenche une fonction différente du logiciel. Nous voulons
tester exhaustivement chacune des trois fonction du logiciel, mais nous
n’avons que la possibilité d’en tester deux. Quelles sont les fonctions plus
utilisées ?