Vous êtes sur la page 1sur 18

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique


Université des Sciences et de la Technologie Houari Boumediene
 

Faculté de Mathématiques
  Filière : Recherche Opérationnelle

Identification des modèles autorégressif périodique via l’algorithme


génétique

Présenté par :
• AIT AISSI Ouardia Février 2021 Chargé du module :Pr.HAMDI
• HADDALENE Saliha
1
Plan de travail
 Introduction.

 Modèle autorégressif périodique.


 Identification des modèles périodiques .

 L’ALGORITHME GÉNÉTIQUE.
 Les opérateurs évolutionnaires.
 Application de l’algorithme au problème d’identification .

 Simulation.

 Conclusion.
2
Introduction:
 
Le monde tel qu’on le connait est rempli de phénomènes lié aux temps . En
statistique , l’une des méthodes souvent utilisées est celle des séries chronologie .A
l’aide d’un modèle, il est possible de faire des réductions sur les évènements du
futur.

Les modèles autorégressifs périodiques(PAR) étirent les modèles autorégressifs


classiques en variant les paramètres avec les saisons . Le choix des modèles
autorégressifs périodiques(PAR) des séries chronologiques peut être coûteux en
calcul, et les résultats ne sont pas toujours satisfaisants.

Dès lors ,dans l’article Eugene Ursu et Kamil Feridun Turkman ont proposé une
nouvelle procédure automatique au problème de sélection de modèle, basée sur
l’un des nouveaux outils d’optimisation statistique en utilisant l’algorithme
génétique . Le critère d’information bayésien est utilisé comme un outil pour iden-
tifier l’ordre du modèle PAR.
Modèle autorégressif périodique
3

•permettant
Les modèles PAR étend la définition des modèle AR en
  aux paramètres AR de varies avec la saison . Le
processus est un processus PAR

fixé et une valeur s donnée ,la variable aléatoire représente la


réalisation dans la saison , avec } de l’année .
Les modèles périodiques ont une grande souplesse pour décrire
des
des données
données hydrologiques
hydrologiques ouou économiques
économiques ,, même
même après
après l’avoir
l’avoir
désaisonnalisées elles présentent encore des variations
saisonnières. De préférence on commence par un modèle
périodique et ensuite tester pour voir s’il existe une variation des
paramètres d’une saison à l’autre .
Identification des modèles périodiques 4

•l’identification
Divers critères de sélection utilisant BIC peuvent être utilisés pour
  du modèle PAR. Une manière possible consiste à utiliser le
critère de sélection BIC est de séparé pour chacune des composantes
saisonnières . les ordres autorégressifs pour chaque saison sont obtenus en
minimisant un critère de type BIC . En utilisant l’idée de Mcleod (1994), ce
critère peut être factorisé saison par saison :

Le critère BIC pour la saison est donnée par:


5

Remarques

Les modèles autorégressifs périodiques (PAR) étirent les


modèles autorégressifs classiques en variant les paramètres
avec les saisons . Le choix des modèles autorégressifs
périodiques (PAR) des séries chronologiques peut être
coûteux en calcul, et les résultats ne sont pas toujours
satisfaisants . Même en se servant le critère d’information
bayésien est utilisé comme un outil pour identifier l’ordre du
modèle (PAR).
L’ALGORITHME GÉNÉTIQUE. 6

•mécanismes
  L’algorithme génétique (AG) est un algorithme de recherche basé sur les
de la sélection naturelle et de la génétique inspiré de Darwin. Il
combine une stratégie de ”survie des plus forts” avec un échange
d’information aléatoire mais structuré. En outre , on part avec une population
de taille de solutions potentielles (chromosomes) initiales arbitraire ment
choisies .On évalue leur performance (fitness) relative .Codé comme une
chaîne binaire de longueur L

Sur la base de ces performances on crée une nouvelle population de


solutions potentielles en utilisant des opérateurs évolutionnaires simples : la
sélection, le croisement et la mutation. On recommence ce cycle jusqu’à ce
que l’on trouve une solution plus au moins satisfaisante dans l’espoir que la
nouvelle population obtiendra de meilleurs résultats que la précédente.
Les opérateurs évolutionnaires 7

 Codage et initialisation
 Évaluation
 Sélection
 Croisement
 Mutation

Remarque :

On arrêté l’algorithme lorsque le résultat atteint une solution


satisfaisante ou s’il n’y a pas d’amélioration pendant un certain
nombre de générations
8
Application de l’algorithme au problème d’identification

•   de l’utilisation de l’approche GA pour le problème


Lors
d’identification du modèle PAR ,des représentations de chaîne pour
les chromosomes doivent être fournies, l’identification sera faite
pour chacune des périodes , un gène pour chaque intervalle (retard)
, sera réservé, en le remplissant avec 1 si le paramètre est libre, et
avec 0 si le paramètre est contraint à zéro. La chaîne résultante
représente le chromosome . Par exemple, si nous prenons , le
modèle suivant :

000001100000000
9

•chromosomes
L’implémentation de l’AG commence par une population initiale de
  générés au hasard . Nous évaluons chaque chromosome au
moyen d’une fonction à valeur réelle positive appelée fonction de fitness qui
mesure la qualité de la solution. Notre choix est le critère d’information
bayésien ( BIC) donné dans(3).Un problème fréquent avec ce choix est que le
critère proposé doit être minimisé, donc ne peut pas être implémenté
directement en tant que fonction de fitness (qui doit être maximisé). Puisque
le BIC donné(3)peut être négatif, alors on optera pour une simple
transformation linéaire .

M est la valeur maximale du


•Sur la  base de ces valeurs de fitness , une sélection de tournoi des individus est effectuée. 10
Cette sélection de tournois est basée sur l’exécution de plusieurs tournois parmi un groupe

de chromosomes choisis au hasard dans la population actuelle. Le gagnant de chaque

tournoi (celui avec la meilleure condition physique) est sélectionné pour faire partie d’une

nouvelle population, qui remplace la population précédente. Chaque individu peut être

sélectionné plus d’une fois pour appartenir à la nouvelle population . La probabilité de

croisement décrit la fréquence à laquelle les croisements seront effectués , La probabilité

qu’un croisement se produise dans l’intervalle )est généralement élevée , le croisement

uniforme avec =0, 8 s’est avéré adéquat, La probabilité de mutation est généralement

supposée faible, souvent prise dans l’intervalle(0, 001 0, 1). Des valeurs plus élevées

transforment l’AG en une recherche aléatoire. Nous avons choisi Pm=0, 01.Nous arrêtons la

répétition de la procédure après un nombre fixe de générations.


11

Remarque
La stratégie élitiste est appliquée pour éviter que les meilleurs
individus ne soient pas sélectionné alors les meilleurs 5 pour
cent sont directement reproduit à l’identique.
Simulation 12

•On  a ici le résultat de la simulation . Pour illustrer la sélection des


modèles PAR, trois processus de génération de données sont utilisés.

Les modèles et correspondent à un PAR à quatre saisons, tandis que DGP3


représente un PAR à 12 saisons ; Il y a pas d’hypothèses sur les paramètres de
contrainte du modèle DGP1 (tableau 1), mais pour les modèlesDGP2etDGP3, on
suppose que les paramètres évalués dans les tableaux 2 et 3 sont connus ; Il
convient de mentionner que les processus AR sont différentes selon les saisons.
Pour chaque DGP, le processus stochastique est supposé être un bruit blanc
gaussien apériodique, avec une moyenne de 0 et des variances données sur la
dernière .
13

Tableau 1

Tableau 2

Tableau 3
14
Nous examinons l’algorithme de sélection pour différentes longueurs : 200 observations
par saison pour DGP1 et DGP2 et 500 observations par saison pour DGP3 . Pour les trois
modèles, les Nous ordres par saison varient de 0 à 15, conduisant à un chromosome de
longueur L=15. La taille de la population , Np , est choisie dans l’ensemble{20, 40} le nombre
maximum autorisé de générations Ng est égal à 25, 50 ou 100 et le nombre d’individus élites
est de 1. Pour chaque Np et Ng indiqués ci-dessus l’algorithme de sélection est appliqué à
100 indépendantes simulations . Les moyennes empiriques lorsque le vrai modèle est détecté
sont données dans le tableau 4. Trois statistiques sont utilisées pour résumer le résultat:

q1 est la proportion de simulations dans lesquelles le vrai modèle est détecté , q2 est la
proportion de simulations dans lesquelles le chromosome diffère de la vraie chaîne en un
point (cela signifie qu’au plus un décalage inexistant a été inclus ou un décalage existant a été
exclu) et q3 est la proportion des cas restants, à savoir la proportion de simulations dans
lesquelles le chromosome détecté diffère de la vraie chaîne en au moins deux points.

Les performances de l’AG sont assez satisfaisantes, avec un taux élevé d’identification
correcte. Le taux d’identification correcte dépend clairement de Np, et de cette étude de
simulation limitée, on a puis obtenir d’excellents résultats. Le temps de calcul total est
également raisonnable selon la taille de la population Np et le nombre de générations Ng.
15

Tableau 4
16
Conclusion

Dans cet article, ils ont utilisé l’AG comme méthode pour identifier le
sous-ensemble de processus PAR .C’est une nouvelle méthode de sélection
proposée pour la classe des modèles PAR . les expériences de simulation ont
montré la vitesse à laquelle cette méthode automatique identifie correctement
le bon modèle .
Merci POUR votre
attention

Vous aimerez peut-être aussi