Vous êtes sur la page 1sur 8

Les multimodèles

4
4.1 Introduction
L’approche multimodèle est le sujet de diverses recherches qui l’ont considéré comme
une approche permettant de trouver une structure simple à étudier pour la commande et
pour le diagnostic, tout en gardant le vrai comportement non linéaire du système. Cette
approche a montré sa fiabilité et a présenté des intérêts certains depuis la publication
des travaux de Johansen et Foss [6]. L’approche multimodèle consiste à décomposer un
problème complexe en un ensemble de sous-problèmes plus simples à étudier et dont les
solutions conduisent à la résolution du problème original (problème global). Il s’agit d’un
outil permettant de simplifier l’étude des systèmes complexes.
L’intérêt de cette approche est d’éliminer la conception d’un système non linéaire
complexe et qui peut ne pas reproduire le comportement du système étudié.
En 1985, Takagi et Sugeno [10] ont proposé un modèle flou d’un système constitué
d’un ensemble de règles ”si prémisse alors conséquence”, telle que la conséquence d’une
règle est un modèle affine. Le modèle global s’obtient par l’agrégation des modèles locaux.

4.2 Terminologies se rapportant aux multimodèles


L’identification d’une structure multimodèle concerne la recherche d’une structure op-
timale qui permet la reproduction du comportement du système étudié ainsi que l’esti-
mation de touts les paramètres qui constituent ce modèle.
Définition 4.1
Multimodèle : [3, 9] ensemble de sous-modèles agrégés par un mécanisme d’inter-
polation permettant de caractériser le comportement dynamique global d’un système. Un
multimodèle se caractérise par le nombre de ses sous-modèles, par leur structure et par le
choix des fonctions de pondération.
Définition 4.2
Sous modèle : [3, 9] modèle de structure quelconque, généralement simple et linéaire
et/ou affine, représentant le comportement du système dans une zone de fonctionnement
bien spécifique.
Chapitre 4. Les multimodèles

Définition 4.3
Zone de fonctionnement : [3, 9] Domaine Di issu du partitionnement de l’es-
pace de fonctionnement D ⊂ Rn du système tel que D = ∪i Di . Le système possède un
comportement dynamique relativement homogène dans chaque zone de fonctionnement.
Définition 4.4
Variable de décision : [3, 9] ξ ⊂ Rj : variable vectorielle connue caractéristique du
système et accessible par mesure en temps réel. Elle peut être par exemple une variable
d’état mesurable et/ou un signal d’entrée du système.
Définition 4.5
Fonction de pondération (ou d’activation) : [3, 9] µi (ξ(t)) : fonction µi (ξ(t)) :
Rj → R1 associée aux différentes zones de fonctionnement, dépendants des variables
de décision. Elles servent ainsi à quantifier graduellement l’appartenance du point de
fonctionnement courant du système à une zone de fonctionnement.

4.3 Structures multimodèles


Pour décrire le comportement non linéaire d’un système par une représentation mul-
timodèle, deux structures sont les plus adoptées ; les multimodèles de Takagi-Sugeno et
les multimodèles découplés ou à états découplés. D’autres structures sont proposées mais
leur utilisation reste limitée [2, 9].

4.3.1 Structure couplée, modèles flous de Takagi-Sugeno


Ce type de modèles, connu aussi sous le nom de multimodèle de Takagi-Sugeno, a
été initialement proposé dans un cadre de modélisation floue par Takagi et Sugeno en
1985 [10] et dans le cadre des multimodèles par Johansen et Foss [6]. Ce modèle est
largement utilisé pour l’analyse, la modélisation, la commande, l’estimation d’état et le
diagnostic des systèmes non linéaires.
Chaque système dynamique non linéaire peut être simplement décrit par un modèle
flou de Takagi-Sugeno [10]. Un modèle flou de Takagi-Sugéno est la fusion floue de plusieurs
modèles linéaires, chacun d’entre eux représente le comportement local du système autour
d’un point de fonctionnement.
Un modèle de Takagi-Sugeno est décrit par des règles floues de type : IF-THEN,
représentant les relations linéaires locales entre les entrées et les sorties du système non
linéaire. Il a une base de règles constituée de M règles, chaque règle a p antécédents, où
la ième règle est exprimée comme suit :
Ri : SI ξ1 is F1i et ... et ξp est Fpi

ẋ(t) = Ai x(t) + Bi u(t)
ALORS : (4.1)
y = Ci x(t)
i = 1, ..., M, Fji (j = 1, ..., p) sont des termes flous et ξ = [ξ1 , ξ2 , ..., ξp ] est un vecteur
connu des variables permises [7] qui peut dépendre de l’état, de l’entrée ou de la sortie du
système (il peut dépendre des trois en même temps).

ISSAT Kairouan 2 Atef KHEDHER


Chapitre 4. Les multimodèles

Le modèle flou de Takagi-Sugeno s’écrit :


 M
 X
 ẋ(t) = µi (ξ(t))(Ai x(t) + Bi u(t))



i=1
M (4.2)
 X
 y(t) = µi (ξ(t))Ci x(t)



i=1

où x(t) ∈ Rn est le vecteur d’état commun à tous les modèles locaux. y(t) ∈ Rm la sortie
mesurée, u(t) ∈ Rr l’entrée du système, ξ(t) est la variable de décision des fonctions de
pondération µi (.).
La structure couplée peut être représentée par la figure (4.1) [9]

[ (t )

NORMALISATION

u (t ) P1 ([ (t )) P1 ([ (t ))
A1 x  B1u 3 C1 3

P2 ([ (t )) P2 ([ (t ))
x(t  1) q 1 x(t ) y (t )
A2 x  B2 u 3 6 C2 3 6

P3 ([ (t )) P3 ([ (t ))
AM x  BM u CM
3 3

Figure 4.1 – Architecture du multimodèle de Takagi-Sugeno

Les fonctions d’activation µi (ξ(t)) sont non linéaires et dépendent de la variable de


décision ξ(t). Les fonctions d’activation sont des règles normalisées et définies comme suit :
p
Tj=1 ωi (ξ(t))
µi (ξ(t)) = M
(4.3)
X p
Tj=1 ωj (ξ(t))
j=1

où ωi (ξ(t)) est le degré d’appartenance de la variable ξ et T est une t-norme. Les fonctions
de pondération peuvent être triangulaires, gaussiennes, trapézoı̈dales, etc. Dans ce travail
les modèles locaux sont pondérés par des fonctions gaussiennes.
Dans le cas des systèmes mono-variables, ces fonctions sont calculées par l’équation

ISSAT Kairouan 3 Atef KHEDHER


Chapitre 4. Les multimodèles

suivante :

ωi (.) : R → R
(ξ(t) − ci )2
ωi (ξ(t)) = exp(− ) (4.4)
σi2

σi sont les dispersions de la fonction ωi (.).


Les fonctions de pondération doivent satisfaire la propriété de convexité (4.5).
M
X
µi (ξ(t)) = 1 et 0 ≤ µi (ξ(t)) ≤ 1 (4.5a)
i=1

Dans le cas où on a C1 = C2 = ... = Ci = ...CM = C l’équation (4.2) devient :


M
X
ẋ(t) = µi (ξ(t))(Ai x(t) + Bi u(t)) (4.6a)
i=1
y(t) = Cx(t) (4.6b)

4.3.2 Structure découplée


En 1991 Filev [4] a proposé une structure multimodèle à états découplés. Cette struc-
ture peut être représentée par l’expression suivante :

ẋi (t) = Ai x(t) + Bi u(t) (4.7a)


yi (t) = Ci xi (t) (4.7b)
M
X
y(t) = µi (ξ(t))yi (t) (4.7c)
i=1

Les sorties yi (t) n’ont pas un sens physique puisqu’elles sont des sorties artificielles per-
mettant la description du comportement non linéaire du système réel.
Cette structure permet de découpler les parties dynamiques des sous-modèles. Les
sous modèles peuvent alors avoir des structures différentes linéaires ou non linéaires et
comportant des états différents, tout en conservant la compatibilité des dimensions des
vecteurs des sorties.
La structure découplée tolère un ajustement de la complexité des sous modèles rela-
tif à la zone de fonctionnement caractérisée, puisque les états locaux sont parfaitement
indépendants. Cette structure peut être représentée par la figure (4.2) [9].

Remarque 4.1 Cette structure est présentée à titre indicatif. Ce cours s’intéresse essen-
tiellement à la structure couplée de Takagi-Sugeno

ISSAT Kairouan 4 Atef KHEDHER


Chapitre 4. Les multimodèles

[ (t )

NORMALISATION

u (t ) x1 (t  1) x1 (t ) P1 ([ (t ))
A1 x  B1u q 1 C1 3

P 2 ([ (t ))
x2 (t  1) x2 (t ) y (t )
A2 x  B2 u q 1 C2 3 6

x3 (t  1) x3 (t ) P3 ([ (t ))
AM x  BM u q x13 (t ) CM
3

Figure 4.2 – Architecture du multimodèle decouplé

4.4 Obtention d’une structure multimodèle


Les multimodèles sont décrits sous forme d’une interpolation entre des modèles li-
néaires locaux pondérés chacun par une fonction qui revèle le degré de contribution du
modèle local dans le modèle global. Chaque modèle local est un système dynamique LTI
valide autour d’un point de fonctionnement caractérisant le fonctionnement du système
dans la zone de fonctionnement.
Dans le cas où l’on dispose d’un modèle non linéaire explicite que l’on souhaite décrire
par une structure multimodèle on peut faire une linéarisation de ce modèle autour des
différents points de fonctionnement. [6]
Pour expliquer cette approche ; on considère un système non linéaire pour lequel on
veut établir une représentation multimodèle. Les sorties du système sont :

y(t) = F (x(t)) (4.8)

Supposons qu’on dispose d’un ensemble de M modèles locaux fi (x(t)) descriptifs du


comportement du système dans différentes zones de fonctionnement. Ces modèles peuvent
être construits à partir des connaissances physiques sur le fonctionnement du système dans
ces zones. Chaque modèle linéaire local fi est valide dans une zone de fonctionnement. La
validité locale de chaque modèle est indiquée par une fonction ω(x(t)) pour i ∈ {1...M}.
Cette fonction est maximale dans la zone de fonctionnement décrite par le modèle local
correspondant et faible ailleur. Le modèle global s’écrit :
M
X
ym (t) = µi (ξ(t))fi (x(t)) (4.9)
i=1

ISSAT Kairouan 5 Atef KHEDHER


Chapitre 4. Les multimodèles

où :
ωi (ξ(t))
µi (ξ(t)) = M
(4.10)
X
ωj (ξ(t))
j=1

La fonction de pondération µi (x(t)) détermine le degré d’activation du ième modèle


local associé, selon la zone où évolue le système. Cette fonction indique la contribution
du modèle local correspondant dans le modèle global (multimodèle). Elle assure un pas-
sage progressif de ce modèle aux modèles locaux voisins. Ces fonctions sont généralement
de forme triangulaire, sigmoı̈dale ou gaussienne, et doivent satisfaire les propriétés de
convexité (4.5).

4.5 Recherche des modèles locaux par linéarisation


Dans le cas où la forme analytique du modèle non linéaire est disponible, on peut
effectuer une linéarisation de l’équation du modèle autour des différents points de fonc-
tionnement judicieusement choisis [1, 8]. Considérons le système non linéaire suivant :

ẋm (t) = F (x(t), u(t))
(4.11)
y(t) = G(x(t), u(t))
où (F, G) ∈ R2n sont des fonctions non linéaires continues, x(t) ∈ Rn est le vecteur d’état
et u(t) ∈ Rm est le vecteur d’entrée. On peut représenter le système non linéaire étudié
par un multimodèle composé de plusieurs modèles locaux linéaires ou affines. L’obtention
d’un modèle local se fait en effectuant une linéarisation du système étudié autour d’un
point de fonctionnement arbitraire (xi , ui ) ∈ Rn ∗ Rn .
On peut dans ce cas adopter le choix proposé par Johansen et Foss [6], qui consiste à
définir les modèles locaux comme le premier terme du développement en série de Taylor
du système [5].
En supposant que les différents modèles locaux sont issus d’une linéarisation autour
de M points de fonctionnement (xi , ui ), i ∈ {1...M}. La formulation multimodèle est la
suivante :
ẋ(t) = M
 P
i=1 µi (ξ(t))(Ai xm (t) + Bi u(t) + Di ) (4.12)
ym (t) = M
P
i=1 µi (ξ(t))(Ci xm (t) + Ei u(t) + Ni )

avec :

δF (x, u) δF (x, u)
Ai = , Bi = , Di = F (xi , ui ) − Ai xi − Bi ui
δx x=xi,u=ui δu x=xi ,u=ui

δG(x, u) δG(x, u)
Ci = , Ei = , Ni = G(xi , ui ) − Ci xi − Ei ui
δx x=xi ,u=ui δu x=xi ,u=ui
Le nombre de modèles locaux M dépend de la précision de la modélisation souhaitée, de
la complexité du système non linéaire et du choix de la structure des fonctions d’activation,
ces dernières doivent satisfaire les propriétés de convexité (4.5).

ISSAT Kairouan 6 Atef KHEDHER


Chapitre 4. Les multimodèles

4.6 Obtention par transformation polytopique


Notons que la méthode d’obtention de multimodèles la plus utiliseé est celle obtenue
par transformation polytopique des formes non linéaires. La méthode proposée utilise
uniquement la bornitude des termes non linéaires. Cette méthode est basée sur une trans-
formation polytopique convexe de fonctions scalaires à l’origine de la non linéarité. Elle
permet de réduire le nombre de modèles locaux au minimum. En effet pour une fonction
h(x(t)) bornée de [a, b] → R pour tout x ∈ [a, b] avec (a, b) ∈ R2 , il existe deux fonctions.
F i (.) : [a, b] → [0, 1], i ∈ I2
x(t) → F i (x(t))
avec F 1 (x(t)) + F 2 (x(t)) = 1 et deux scalaires a et b tels que :
h(x(t)) = F 1 (x(t))α + F 2 (x(t))β
Une décomposition évidente de h(x(t)) est de considérer sur [a, b]
β ≤ h(x(t)) ≤ α
avec :
β = min (h(x(t)) et α = max (h(x(t))
x∈[a, b] x∈[a, b]

h(x(t)) − β α − h(x(t))
F 1 (x(t)) = et F 2 (x(t)) =
α−β α−β
Cette méthode de décomposition, qui n’est pas unique, sera utilisée par la suite. En effet,
considérons le cas général d’un système non linéaire affine en la commande de la forme :
!  !
ẋ(t) x(t)

A(x(t) B(x(t)
=
y(t) C(x(t) D(x(t) u(t)

avec x(.) ∈ Rn , u(.) ∈ Rm , y(.) ∈ Rl , A(.) ∈ Rn.m , B(.) ∈ Rn.m , C(.) ∈ Rl.n , et D(.) ∈
Rl.m .
On pose :  
A(x(t) B(x(t)
E(x(t) =
C(x(t) D(x(t)
Sous l’hypothèse que E(x(t)) est continue et bornée et en considérant chaque terme non
constant, la matrice E(x(t)) peut être transformée sous la forme suivante :
M
X
E(x(t)) = µi (ξ(t))Ei
i=1
avec :  
Ai Bi
Ei =
C i Di
Le nombre de modèles locaux M issus de la transformation se trouve par conséquent
dépendre du nombre s des non-linéarités contenues dans la matrice E(x). Ce nombre est
égal à M = 2s.

ISSAT Kairouan 7 Atef KHEDHER


Bibliographie

[1] Abonyi J., Babuska R. et Szeifert F., Fuzzy Modeling With Multivariate Membership
Functions : Gray-Box Identification and Control Design, IEEE Trans. On Systems, Man
and Cybernetics, Vol. 31 (5), pp. 755-767, 2001.
[2] Akhenak A., Conception d’observateurs non linéaires par approche multimodèle : ap-
plication au diagnostic, thèse de doctorat, Institut National Polytechnique de Lorraine,
France, 2004.
[3] Chadli M., Stabilité et commande des systèmes décrits par des multimodèles, thèse de
doctorat, Institut National Polytechnique de Lorraine, France, 2002.
[4] Filev D., Fuzzy modeling of complex systems. International Journal of Approximate
Reasoning, 5(3), pp :281-290, 1991.
[5] Gasso K., Identification des systèmes dynamiques non linéaires : approche multimo-
dèle, Doctorat de l’Institut National Polytechnique de Lorraine, Vandoeuvre- les-Nancy,
2000.
[6] Johansen T. A. et Foss A. B., Non linear local model representation for adaptive
systems. IEEE International Conference on Intelligent control and instrumentation,
Vol. 2, pp. 677-682, 1992.
[7] Korbicz J., Koscielny J., Kowalczuk Z., and Cholewa W., Fault diagnosis. Models,
Artificial Intelligence, Applications. Springer-Verlag, Berlin, 2004.
[8] Marcelo V. C., Aguirre L. et Saldanha R., Using Steady-State Prior Knowledge to
Constrain Parameter Estimates in Nonlinear System Identification, IEEE Trans. on
Circuits and Systems-I : Fundamental Theory and Applications, Vol. 49 (9), pp. 1376-
1381, 2002.
[9] Orjuela R., Contribution à l’estimation d’état et au diagnostic des systèmes représentés
par des multimodèles, thèse de doctorat, Institut Nationa Polytechnique de Lorraine,
France, 2008.
[10] Takagi T. et Sugeno M., Fuzzy identification of systems and its applications to model
and control. IEEE Transactions on Systems, Man, and Cybernetics, 15, pp : 116-132,
1985
[11] Tanaka K., Ikeda T. et He Y. Y., Fuzzy regulators and fuzzy observers : relaxed
stability conditions and LMI-based design, IEEE Trans. Fuzzy Systems, Vol. 6 (1), pp.
250-256, 1998.
[12] Tanaka K. et Sugeno M., Stability analysis of fuzzy systems using Lyapunov’s di-
rect method. In International Conference of the North American Fuzzy Information
Processing Society, NAFIPS, pages 133-136, Toronto, Canada, 1990.