Vous êtes sur la page 1sur 25

Commande adaptative des systèmes

par Mohammed M’SAAD


Professeur à l’École nationale supérieure d’ingénieurs de Caen
Laboratoire d’automatique et de procédés, ISMRA, Caen
et Joël CHEBASSIER
Docteur de l’Institut national polytechnique de Grenoble
Laboratoire d’automatique de Grenoble

1. Motivations................................................................................................ S 7 426 – 2
2. Systèmes de commande sous-jacents ............................................... — 3
2.1 Modèles de commande linéaire ................................................................. — 4
2.2 Synthèse du système de commande......................................................... — 5
2.3 Stabilité et performances nominales ......................................................... — 6
2.4 Généralité de la commande prédictive...................................................... — 8
3. Commande prédictive adaptative ....................................................... — 9
3.1 Traitement des données.............................................................................. — 9
3.2 Algorithme d’adaptation paramétrique ..................................................... — 9
3.3 Algorithme de commande .......................................................................... — 11
3.4 Exemple de Rohrs........................................................................................ — 12
4. Applications .............................................................................................. — 16
4.1 Réacteur chimique....................................................................................... — 16
4.2 Système de transmission flexible .............................................................. — 20
5. Conclusion ................................................................................................. — 22
Références bibliographiques ......................................................................... –– 25

et article présente une approche pour la commande adaptative à partir


C d’une lecture critique de la littérature sur ce domaine. Elle consiste à combi-
ner une méthode de commande prédictive avec un algorithme d’adaptation
robuste sous une logique de supervision appropriée. Le choix de la commande
prédictive est motivé par sa généralité et sa simplicité de mise en œuvre. La
robustesse de l’algorithme d’adaptation paramétrique est particulièrement
requise pour préserver les performances du système de commande adaptative
en présence des bruits de mesure, des perturbations de charge et des dynami-
ques négligées et/ou variables dans le temps. La supervision permet d’appliquer
le principe d’équivalence certitude avec la prudence requise pour assurer l’inté-
grité du système de commande adaptative, notamment les performances du
système de commande sous-jacent.
Un ensemble de résultats de simulations est présenté autour d’un exemple
célèbre pour illustrer les problèmes de systèmes de commande adaptative, en
l’occurrence l’adaptation paramétrique. Deux applications sont présentées pour
démontrer l’applicabilité des techniques de commande adaptative pour l’auto-
ajustement et le calibrage des régulateurs. Elles concernent deux procédés
pilotes : un réacteur chimique et un système de transmission flexible.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 1
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

1. Motivations commande adaptative et permettre ainsi une synthèse systéma-


tique d’un algorithme de commande adaptative intrinsèquement
stable [13] [14] [15] [16]. Ces propriétés sont assurées par un traite-
ment adéquat des données et un algorithme d’adaptation paramé-
La synthèse d’un système de commande se fait généralement en trique robuste. Le bloc de supervision permet d’assurer l’intégrité
trois étapes. La première étape consiste à élaborer un modèle de du système de commande conformément aux résultats de stabilité,
commande qui représente au mieux le comportement d’entrée- de convergence et de robustesse disponibles dans la littérature [2].
sortie du procédé par rapport aux performances requises, à partir de
la théorie de l’identification des systèmes [1] [2]. Comme les ■ Commande adaptative directe
méthodes de commande sont essentiellement prédictives, les Les paramètres du régulateur sont directement adaptés avec un
modèles de commande associés sont fondamentalement utilisés algorithme d’adaptation paramétrique approprié (figure 1 b). La
pour la synthèse de bons prédicteurs de la sortie du système et phase de détermination des paramètres du régulateur à partir de
n’ont généralement aucun sens physique particulier. La seconde ceux du modèle de commande est ainsi contournée. Tous les objec-
étape consiste à déterminer les paramètres d’un régulateur en fonc- tifs de commande pour lesquels il est possible de récrire le compor-
tion des performances requises à partir des méthodes de synthèse tement d’entrée-sortie du système à commander sous une forme
offertes par la théorie de la commande [3] [4] [5] [6]. La spécification linéaire par rapport aux paramètres du régulateur peuvent être
des performances constitue la tâche essentielle du concepteur, qui considérés, en l’occurrence la commande à variance minimale [8], la
utiliserait avec plaisir toute bonne conception assistée par ordina- commande avec modèle de référence et la commande avec modèle
teur. La dernière étape consiste à mettre en œuvre l’algorithme de interne [2]. Le traitement des données et la supervision sont utilisés
commande sur un calculateur temps réel, doté d’une bonne librairie pour les mêmes considérations que la commande adaptative indi-
d’analyse numérique et d’une interface, disponible pour ce faire. recte.
Toutes ces étapes peuvent être faites en temps réel comme le
montre la figure 1 qui représente les principaux schémas de L’ultime motivation du concept de commande adaptative a été de
commande adaptative [2] [7] [8] [9] [10] [11]. maintenir les performances requises quand la dynamique du
comportement d’entrée-sortie du système à commander varie dans
■ Commande adaptative indirecte le temps. Les résultats théoriques disponibles sur la convergence, la
Un modèle de comportement d’entrée-sortie du système à stabilité et la robustesse des algorithmes de commande adaptative
commander y est continûment mis à jour et est utilisé pour la ne permettent pas de répondre d’une manière définitive à une telle
synthèse du régulateur comme s’il était le meilleur modèle de motivation [2] [7] [8] [9] [10] [11]. En effet, un système de commande
commande que l’on aurait utilisé (figure 1 a). Les paramètres du adaptative est composé de deux boucles à contre-réaction : le
régulateur sont ainsi adaptés de manière à réaliser les perfor- système de commande sous-jacent, soit la boucle à contre-réaction
mances requises. Toutes les méthodes de commande et d’identifi- ordinaire formée par le système à commander en contre-réaction
cation basées sur un modèle de commande linéaire par rapport aux avec le régulateur, et une boucle d’adaptation des paramètres du
paramètres peuvent être combinées pour la synthèse de systèmes régulateur constituée d’un algorithme d’adaptation paramétrique et
de commande adaptative comme en témoignent les nombreux d’une méthode de synthèse dans le cas d’une commande adapta-
algorithmes de commande linéaire adaptative [2] et ceux de la tive indirecte. Les performances requises sont ainsi réalisées pour le
commande adaptative des robots [12]. L’école française a particuliè- modèle de commande en temps réel engendré par l’algorithme
rement mis en évidence les propriétés requises de l’algorithme d’adaptation paramétrique. Elles ne sont pas nécessairement satis-
d’adaptation paramétrique pour assurer la stabilité d’un système de faites pour le système à commander.

Logique de supervision Logique de supervision

Superviseur Superviseur

Algorithme Algorithme
d'adaptation d'adaptation
Synthèse paramétrique paramétrique
du
régulateur Traitement Traitement
des des
données données

v (t ) v (t )

y*(t ) y*(t ) y (t )
u (t ) y (t ) u (t )
Régulateur Procédé Régulateur Procédé

a indirecte b directe

Figure 1 – Commande adaptative supervisée

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

Néanmoins, une recherche méthodologique a été développée Par ailleurs, on dira qu’une séquence {s (t )} est α asymptotique-
pour tirer le meilleur profit de la culture de la commande adaptative ment petite en moyenne (α – APM) si :
et a été utilisée pour faire l’ajustement automatique des régulateurs,
le calibrage automatique des régulateurs si besoin et la supervision
t = <+ k
des systèmes de commande, comme en témoignent les nombreuses 1
applications industrielles et semi-industrielles réussies [8] [17]. On lim sup lim sup -------
k→∞ <→∞ k ∑ s(t) < α
peut ainsi réduire raisonnablement le temps d’ajustement à la mise t = <+1
en œuvre, affiner les performances pourvu que toutes les conditions
d’une bonne adaptation paramétrique soient réunies et détecter des
anomalies de fonctionnement en vue de prendre les décisions qui
s’imposent [8] [18] [19]. Des régulateurs autoajustables sont d’ores
et déjà sur le marché grâce à la puissance de calcul bon marché 2. Systèmes de commande
offerte par la micro-informatique qui ne cesse d’élargir le champ
d’application des techniques de commande avancée. sous-jacents
Cet article présente les techniques de commande adaptative en se
focalisant sur un algorithme de commande adaptative général à la
lumière des résultats disponibles. La généralité en question sera Les systèmes de commande sous-jacents peuvent être générale-
considérée au sens des propriétés fondamentales suivantes : ment représentés comme l’indique la figure 2 avec :
— P1 : une large applicabilité. Le système à commander peut être — {u (t )} et {y (t )} désignent respectivement l’entrée et la sortie
stable ou instable, inversement stable ou non et peut exhiber un du système à commander, en l’occurrence l’ensemble convertis-
retard relativement important et variable dans le temps ; seur numérique-analogique, actionneur, procédé proprement dit,
— P2 : une insensibilité de la loi de commande par rapport aux capteur, filtre antirecouvrement et convertisseur analogique-numé-
erreurs de modélisation pour assurer une bonne robustesse du sys- rique ;
tème de commande sous-jacent ; — {v (t )} représente l’ensemble des perturbations qui affectent le
— P3 : une compensation des perturbations ; fonctionnement du système à commander, en particulier les pertur-
— P4 : une simplicité de spécification des performances ; bations de charge et les bruits de mesure en entrée et en sortie du
— P5 : la robustesse de l’algorithme d’adaptation paramétrique système à commander ;
par rapport aux perturbations de charges, aux bruits de mesure, aux — {y *(t )} désigne la séquence de référence que l’on peut engen-
erreurs de modélisation et aux variations de paramètres ; drer à partir de la séquence des points de consigne {u*(t )} comme
— P6 : une souplesse de mise en œuvre. suit :

Pour ce faire, on utilisera une approche de commande prédictive


–1 –1
permettant de réaliser les propriétés P1 et P2 avec un algorithme A* ( q ) y *( t + d + 1 ) = B *( q ) u *(t ) (1)
d’adaptation paramétrique robuste au sens de la propriété P5. Le
principe du modèle interne des perturbations est utilisé pour
–1
réaliser la propriété P3. La propriété P4 peut être satisfaite en utili- B *( z )
sant le concept de modèle de référence sur l’état partiel qui permet où la fonction de transfert -------------------
–1
- représente généralement la
A* ( z )
de spécifier d’une manière indépendante les dynamiques de pour-
suite et de régulation. Plusieurs applications ont été réalisées en dynamique de poursuite dominante souhaitée et d désigne le retard
temps réel avec des périodes d’échantillonnage de l’ordre de 50 ms, pur du système à commander en périodes d’échantillonnage ;
vérifiant ainsi la propriété P6. — Wu (z –1) et Wy (z –1) sont des pondérations fréquentielles
généralement utilisées pour des considérations de robustesse. Les
Les systèmes de commande sous-jacents sont présentés d’une variables filtrées correspondantes sont définies comme suit :
manière unifiée dans le deuxième paragraphe, en l’occurrence les
modèles de commande et le concept de prédiction linéaire associé,
–1 –1
un objectif de commande général et la synthèse du système de Wyd ( q ) y f (t ) = W yn ( q ) y (t ) (2)
commande associé (§ 2). Le rôle des fonctions de sensibilité usuelles
et la généralité de la méthode de synthèse adoptée sont particulière-
ment mis en évidence. Le troisième paragraphe est dédié aux algo- –1 –1 –1
Wud ( q ) u f (t ) = D ( q ) W un ( q ) u (t ) (3)
rithmes d’adaptation paramétrique dont les performances et les
problèmes de robustesse sont illustrés à travers un ensemble de
résultats de simulation (§ 3). Deux applications sont présentées au –1 –1
Wyd ( q ) y f*(t ) = W yn ( q ) y *(t ) (4)
quatrième paragraphe pour démontrer les performances de la
méthode de commande adaptative prédictive proposée (§ 4). Quel-
ques remarques sur l’applicabilité des techniques de commande où Wun (q –1), Wud (q –1), Wyn (q –1) et Wyd (q –1) sont des polynô-
adaptative sont données en guise de conclusion (§ 5). mes d’Hurwitz [6]. Le polynôme D (q –1) représente la nature des
Par la suite, nous considérerons plus particulièrement le cas des perturbations de charge qui affectent le fonctionnement du procédé.
systèmes échantillonnés et adopterons une formulation avec Le cas D (q –1) = 1 – q –1 permet d’incorporer une action intégrale
l’opérateur retard q –1 défini par : explicite dans le système de commande indépendamment de la
méthode de synthèse à considérer. On assure ainsi une erreur sta-
q –1 s (t ) = s (t – 1) tique nulle pour les perturbations du type échelon satisfaisant ainsi
la propriété fondamentale d’une quelconque commande PID tout
où t désigne l’instant d’échantillonnage, soit t = kTe où k est un en évitant les limitations de cette dernière [20].
entier naturel et Te est la période d’échantillonnage.
La synthèse du régulateur se fait à partir d’un modèle de
L’anneau des polynômes en q –1 à coefficients réels est alors
commande du système de manière à réaliser un objectif de
utilisé pour représenter les équations aux différences sous une
commande donné. On présente dans ce qui suit la classe des
forme polynomiale :
modèles de commande considérée, un objectif de commande suffi-
samment versatile pour englober tous les objectifs de commande
nx qui ont été utilisés dans la communauté de commande adaptative et
∑ xi s ( t – i )
– nx
X ( q –1) s ( t ) = ( x 0 + x 1 q –1 + … + x nx q )s(t) = une approche de commande prédictive pour la synthèse du système
i=0 de commande sous-jacent.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 3
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

v (t )

y*(t + d + 1) uf (t ) 1 u (t ) Système à y (t )
Wy (z –1) Régulateur
Wu (z –1) commander

Wy (z –1)
yf (t )

u (t ) entrée du système à commander y* (t ) séquence de référence


y (t ) sortie du système à commander Wy (z –1) et Wu (z –1) pondérations fréquentielles
v (t ) ensemble des perturbations
Figure 2 – Système de commande linéaire

2.1 Modèles de commande linéaire avec


A a (q –1) = A (q –1) W yd (q –1) W un (q –1) D (q –1) (12)
Le comportement d’entrée-sortie du système à commander est
généralement approximé par des équations aux différences de la B a (q –1) = B (q –1) W yn (q –1 ) W ud (q –1) (13)
forme :
–1 –1 C a (q –1) = C (q –1) W yn (q –1 ) W un (q – 1) (14)
A ( q ) y (t ) = B ( q ) u ( t – d – 1 ) + v (t ) + w (t ) (5)
Un tel modèle est utilisé pour déterminer un prédicteur à j pas de
–1 –1
D ( q ) v (t ) = C ( q ) ω (t ) (6) la sortie filtrée à partir des informations disponibles à l’instant t avec
une dynamique caractérisée par un polynôme donné Pp (q –1). Ce
avec prédicteur peut être déterminé à partir de la reparamétrisation
suivante du modèle de commande (11) (14) :
A ( q –1 ) = 1 + a 1 q –1 + … + a naq –na (7) –1 –1 –1
Pp ( q ) yf ( t + j ) = Pp ( q ) Gj – d ( q ) uf ( t + j – d – 1 )
–1 –1 –1 –1
B( q ) = b0 + b1 q + … + b nbq –nb (8) + Hj – d ( q ) uf ( t – 1 ) + Fj ( q ) yf ( t ) (15)
–1 –1
+ Ej ( q ) Ca ( q ) ω ( t + j )
C ( q –1 ) = 1 + c 1 q –1 + … + c ncq –nc (9)
où (Ej (q –1),
F j (q –1))
et (Gj – d (q –1), Hj – d (q –1)) représentent
–1 –1 respectivement les solutions uniques d’ordre minimal des divisions
D( q ) = 1 + d1 q + … + d ndq –nd (10) euclidiennes :
où d + 1 est le retard pur du modèle en périodes d’échantillonnage, P p (q –1 ) = A a (q –1 ) E j (q –1 ) + q –jF j ( q –1 ) (16)
{v (t )} et {w (t )} représentent respectivement les perturbations qui
affectent le fonctionnement du système à commander et les erreurs –1 –1 –1 –1 –j + d –1
Ej ( q ) Ba ( q ) = Pp ( q ) Gj – d ( q )+q Hj – d ( q ) (17)
de modélisation inéluctables, {ω (t )} est une séquence d’impulsions
dont les amplitudes et les instants d’occurrence sont inconnus Le meilleur prédicteur est obtenu à partir du concept de prédiction
(contexte déterministe) ou une séquence de variables aléatoires de optimale [20], en l’occurrence :
moyenne nulle et de variances finies (contexte stochastique). –1
ŷ f ( t + j ⁄ t ) = G j – d ( q ) u f ( t + j – d – 1 ) + ŷ f0 ( t + j ⁄ t ) (18)
Le modèle de commande (5) (6) peut être caractérisé par les fonc-
tions de transfert : –1 –1 –1
P p ( q ) ŷ f0 ( t + j ⁄ t ) = H j – d ( q ) uf ( t – 1 ) + Fj ( q ) yf ( t ) (19)
–d–1 –1 –1
–1 z B(z ) –1 C(z ) Les remarques suivantes sont relativement importantes pour des
3 n ( z ) = --------------------------------
–1
- et * n ( z ) = -----------------
–1
A(z ) D(z ) considérations de synthèse des lois de commande prédictive.
■ La détermination des solutions (Ej (q –1), Fj (q –1)) et (Gj – d (q –1),
qui représentent respectivement la dynamique dominante du Hj – d (q –1)) pour j ∈ [ hi , hp ] des divisions euclidiennes (16) et (17)
système à commander et le modèle des perturbations externes à la peut se faire d’une manière récursive [20]. Par ailleurs, ces deux
lumière du principe du modèle interne. Le problème de commande divisions euclidiennes permettent de récrire le modèle de synthèse
est bien posé si le modèle de commande est admissible vis-à-vis de sous la forme :
l’objectif de commande, en l’occurrence la synthèse du système de
commande est faisable et ses performances sont robustes par B a ( z –1 ) –1 – j + d H j – d (z )
–1
–j B a ( z
–1
) F j (z –1 )
rapport aux erreurs de modélisation. - = Gj – d ( z ) + z
--------------------- --------------------------- + z -----------------------------------------
–1
-
A a ( z –1 ) Pp (z –1) A a ( z –1 ) P p ( z )
La synthèse du système de commande est faite à partir d’un
modèle qui relie l’entrée filtrée à la sortie filtrée et que l’on peut qui montre que les j – d coefficients du polynôme Gj – d (z –1), soit g0,
obtenir relativement facilement après de simples manipulations g1,…g j –d – 1, ne sont autres que les premiers éléments non nuls de
algébriques effectuées sur le modèle de commande (5) (6) en la réponse du système à une entrée dont la transformée en z est
supposant que les erreurs de modélisation sont identiquement donnée par :
nulles, soit :
W y ( z –1 )
U ( z –1 ) = -------------------------
A a (q –1) y f (t ) = B a (q –1) u f ( t – d – 1 ) + C a (q –1) ω (t ) (11) W u ( z –1 )

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 4 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

■ L’erreur de prédiction est donnée par l’équation : en supposant que :

Pp ( q –1
) ( y f (t + j ) – ŷ f ( t + j ⁄ t ) ) = E j ( q –1 –1
) C a ( q ) ω (t + j ) (20) u f (t + i ) = 0 pour i ∈ [ hc, hp – d – 1 ] (24)

qui fait apparaître clairement que le prédicteur est optimal, au sens avec hi entier fini tel que hi > d + 1 ,
de la minimisation de la variance de l’erreur de prédiction, si les pon- hp et hc entiers finis ou infinis,
dérations fréquentielles Wu (z –1) et Wy (z –1) sont choisies telles que : λ scalaire positif qui permet de pondérer l’effet de la séquence
d’entrée filtrée {uf (t )}.
C a ( q –1) ω ( t ) = P p (q –1 ) γ (t )
La réalisation de l’objectif de commande optimale à horizon
où {γ (t )} est une séquence de variables aléatoires indépendantes de fuyant (23) (24) peut être faite en adoptant une approche de
moyenne nulle et de variances finies σ 2. En effet, l’équation de commande prédictive généralisée lorsque les horizons de prédic-
l’erreur de prédiction associée est donnée par l’équation aux tion et de commande sont finis [20] ou une approche de commande
différences : linéaire quadratique gaussienne lorsque ces horizons sont infinis
[14]. La synthèse ci-après est faite à partir d’une approche de
commande prédictive, elle est basée sur le principe d’équivalence
y f (t + j ) – ŷ f ( t + j ⁄ t ) = E j (q –1 ) γ (t + j )
certitude qui stipule que la minimisation du critère (23) est équiva-
= γ ( t + j ) + e1 γ ( t + j – 1 ) + … + ej – 1 γ ( t + 1 ) lente à la minimisation du critère quadratique :

et sa variance est bien minimale, soit : hp


J ( U f ( t + hc – 1 ) ) = ∑ ( ŷ f ( t + j ⁄ t ) – y*f ( t + j ) ) + λ ( u f ( t + j – hi ) ) (25)
2 2

 2  2 2
j–1 j = hi
ε  ( y f (t + j ) – ŷ f ( t + j ⁄ t ) )  =  1 + ∑ e i  σ
   i=1  où ŷ ( t + j ⁄ t ) est le prédicteur optimal à j pas de la sortie du système
à l’instant t + j à partir des informations disponibles à l’instant t.
■ Les prédicateurs à j pas sur un horizon de prédiction hp peuvent En utilisant les équations du prédicteur (18) (19), on peut récrire le
se mettre sous la forme vectorielle : critère quadratique (25) sous la contrainte (24) sous la forme vecto-
rielle suivante :
Yˆ f ( t + hp ⁄ t ) = GU f ( t + hp – d – 1 ) + Yˆ f0 ( t + hp ⁄ t ) (21)
2
avec Jˆ ( U f ( t + hc – 1 ) ) = GU f ( t + hc – 1 ) + Yˆ f 0 ( t + hp ⁄ t ) – Y *f ( t + hp )
T
Yˆ f ( t + hp ⁄ t ) = [ ŷ f ( t + d + 1 ⁄ t )… ŷ f ( t + hp ⁄ t ) ] + λ U f ( t + hc – 1 )
2
(26)
T
Yˆ f 0 ( t + hp ⁄ t ) = [ ŷ f0 ( t + d + 1 ⁄ t )… ŷ f0 ( t + hp ⁄ t ) ] avec
Uf ( t + hp – d – 1 ) = [ u f ( t )… u f ( t + hp – d – 1 ) ]T * T
Y f ( t + hp ) = [ y *f ( t + hi )… y *f ( t + hp ) ]
g0 0 … … 0 (22) T
Yˆ f 0 ( t + hp ⁄ t ) = [ ŷ f0 ( t + hi ⁄ t )… ŷ f0 ( t + hp ⁄ t ) ]
g1 g0 … … 0
Uf ( t + hc – 1 ) = [ u f (t )… u f ( t + hc – 1 ) ]T
G = : … … :
:

g hp – d – 2 … … g0 0 g hi – d – 1 … g 0 0 … 0 (27)
g hp – d – 1 … … … g 0 g hi – d … g1 g0 … 0
Le prédicteur ŷ f ( t + j ⁄ t ) est complètement disponible à l’instant t G = … … … … … …
pour j < d + 1. Pour j > d + 1 , il dépend de la séquence de g hc – 1 … … … … g0
commandes { u f (t + i ) } i ∈ [ t, t + j – d – 1 ] que l’on peut déterminer à … … … … … …
partir d’un objectif de commande donné. g hp – d – 1 … … … … g hp – d – hc

Notons que la dimension de la matrice G est (hp – hi + 1) × hc ;


elle a été réduite par rapport à celle de la matrice G qui apparaît
2.2 Synthèse du système de commande dans les expressions (21) (22) des prédicteurs optimaux, soit
( hp – d ) × ( hp – d ) . Les premières hi – d – 1 lignes ont été suppri-
mées car on utilise un horizon d’initialisation hi > d + 1 , alors que
Les objectifs de commande qui ont été utilisés par la commu- les dernières colonnes ont été supprimées parce qu’on utilise un
nauté de commande adaptative sont principalement ceux de la horizon de commande hc ∈ [ 1, hp – d – 1 ] .
commande linéaire, en l’occurrence le placement des pôles et éven-
tuellement des zéros ou la minimisation d’un critère quadratique. Le vecteur de commande U *f ( t + hc – 1 ) qui minimise le critère
Tous ces objectifs de commande peuvent être obtenus à partir de la (26) (27), soit :
minimisation au sens d’un horizon fuyant, par rapport au vecteur de
commande : ∂ Jˆ ( U f ( t + hc – 1 ) )
---------------------------------------------------- = 0
∂ U f ( t + hc – 1 )
Uf ( t + hc – 1 ) = [ u f (t )… u f ( t + hc – 1 ) ]T , du critère suivant :
est obtenu à partir de l’équation :

J ( U f ( t + hc – 1 ) ) (23) [ G TG + λ Ihc ] U f* ( t + hc – 1 ) = – G T [ Yˆ f 0 ( t + hp ⁄ t ) – Y *( t + hp ) ]


hp
2 Le calcul de la séquence de commande optimale U *f ( t + hc – 1 )
= ε  ∑ [ y f ( t + j ) – y*f ( t + j ) ] + λ [ u f ( t + j – hi ) ] 
2
consiste à résoudre un système d’équations linéaires de dimension
 j = hi  hc. On utilisera pour ce faire l’une des méthodes numériques dispo-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 5
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

nibles dans toutes les librairies scientifiques dans la mesure ou l’on 2.3 Stabilité et performances nominales
peut obtenir une bonne robustesse numérique en spécifiant conve-
nablement la pondération λ ; c’est-à-dire qu’il suffit de prendre λ
légèrement supérieur au zéro de la machine utilisée. En tenant compte des définitions des variables filtrées (2) (3) (4),
Le concept d’horizon fuyant consiste à ne prendre en considéra- la loi de commande (29) (30) (31) (32) peut se récrire sous la forme
tion que la première composante du vecteur de commande optimal désormais usuelle :
U f ( t + hc – 1 ) , soit uf (t ), et à recommencer le processus d’optimi-
*

sation à chaque période d’échantillonnage pour maintenir le S ( q –1 ) D ( q –1 ) u (t ) + R ( q –1 ) y ( t ) = T ( q –1 ) y * ( t + hp ) (33)


système de commande en boucle fermée aux instants d’échantillon-
nage. La loi de commande à horizon fuyant qui en résulte est alors avec
donnée par :
S ( q –1 ) = S a ( q –1 ) W yd ( q –1 ) W un ( q –1 ) (34)
hp
u f (t ) = – ∑ γ j ( ŷ f0 (t + j ⁄ t ) – y*f (t + j ) ) (28) R ( q –1 ) = R a ( q –1 ) W yn ( q –1 ) W ud ( q –1 ) (35)
j = hi
T ( q –1 ) = T a ( q –1 ) W yn ( q –1 ) W ud ( q –1 ) (36)
où les coefficients γj pour j ∈ [ hi, hp ] ne sont autres que les compo-
–1 T
La figure 3 montre le système de commande nominale associé où
santes de la première ligne de la matrice G TG + Ihc G . En tenant ({vu (t )} et {νu (t )}) et ({vy (t )} et {νy (t )}) représentent respective-
ment les perturbations de charge et les bruits de mesure à l’entrée
compte de l’expression (19) du prédicteur à j pas, on peut récrire et à la sortie du système à commander dont la dynamique est
cette loi de commande comme suit : supposée être parfaitement décrite par la fonction de transfert
z – d – 1B ( z –1)
h hp 3 n ( z –1) = --------------------------------- . Le comportement entrée-sortie d’un tel
∑ ∑
–1 –1
Pp ( q –1 ) u
f (t ) = – γ j Hj – d ( q ) u f (t – 1 ) – γ j Fj ( q ) y f (t ) A ( z –1)
j = hi j = hi système de commande est obtenu en éliminant successivement
hp l’entrée {u (t )} et la sortie {y (t )} entre les équations du système à
+ ∑ γ j P p ( q –1 ) y *f (t + j ) commander d’une part et de la loi de commande (33) (34) (35) (36)
j = hi d’autre part, soit :
ou d’une manière équivalente sous la forme :
P c ( q –1 ) y ( t ) = B ( q – 1 ) T ( q – 1 ) y *( t + hp – d – 1 ) (37)
–d–1
Sa ( q –1 ) u
(t ) + R a ( q
–1
) yf ( t ) = Ta ( q
–1
) y *f ( t + hp ) (29) + A ( q – 1 ) S ( q – 1 ) D ( q – 1 ) v y (t ) – q B ( q –1 ) R ( q –1 ) ν y ( t )
f
–d–1 –1 –1
+q B(q ) S ( q –1 ) D ( q ) [ vu ( t ) + νu ( t ) ]
avec
P c ( q –1 ) u ( t ) = A ( q –1 ) T ( q –1 ) y * ( t + hp ) (38)
hp –1 –d–1
+ A ( q –1 ) S ( q –1 ) D ( q ) vu ( t ) – q B ( q –1 ) R ( q –1 ) ν u ( t )
S a ( q –1 ) = Pf ( q –1 ) + ∑ γ j q –1 Hj – d ( q –1 ) (30)
– A ( q – 1 ) R ( q – 1 ) [ v y (t ) + ν y (t ) ]
j = hi

avec
hp


–d–1 –1
R a ( q –1 ) = γ j F j ( q –1 ) (31) P c ( q –1 ) = A ( q –1 ) D ( q –1 ) S ( q –1 ) + q B(q ) R ( q –1 )
j = hi
Les remarques suivantes permettent de mieux appréhender les
propriétés du système de commande et d’introduire le concept de
hp modèle de référence sur l’état partiel pour pouvoir spécifier d’une
T a ( q –1 ) = P p ( q –1 ) ∑ γ j q –hp + j (32) manière indépendante les dynamiques de poursuite et de régula-
j = hi tion.

vu (t ) u(t ) vy (t )

y*(t + d + 1) u (t ) y (t )
1
T (z –1) + + + 3n (z –1) +
S (z –1) D (z –1)

– R (z –1) +
y (t )

u (t ) entrée νu (t ) perturbations de charge à la sortie


y (t ) sortie vy (t ) bruit de mesure à l'entrée
vu (t ) perturbations de charge à l'entrée νy (t ) bruit de mesure à la sortie
Figure 3 – Système de commande nominal
standard

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 6 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

■ Le système de commande nominale est asymptotiquement sta- indépendamment du modèle de commande. Le système à comman-
ble si et seulement si Pc (q –1) est un polynôme d’Hurwitz, soit : der doit être alors inversement stable, soit :
–1
Pc ( z ) = 0 ⇒ z < 1 B (z –1) = 0 ⇒ z < 1

Cette condition nécessite que le plus grand diviseur commun Une telle condition est plutôt une exception qu’une règle dans la
(pgcd) des polynômes A (q –1) D (q –1) et B (q –1) soit un polynôme pratique de la commande des systèmes échantillonnées [3].
d’Hurwitz, soit :
■ Si le polynôme T (q –1) est choisi comme suit :
pgcd ( A ( z –1
) D ( z –1), B(z )) = 0 ⇒ z < 1
–1
1
T (q –1) = βP c ( q –1) avec β = ------------
B(1)
On retrouve ainsi les conditions usuelles de stabilisabilité ou de
détectabilité des modèles de commande [3]. alors la dynamique de poursuite peut être spécifiée indépendam-
Par ailleurs, en tenant compte des expressions (30) et (31) des ment des dynamiques de régulation à travers la dynamique du
polynômes Sa (q –1) et Ra (q –1) d’une part, et d’autre part des divi- générateur de la séquence de référence. En effet, la dynamique de
sions euclidiennes (16) et (17), on peut récrire le polynôme caracté- poursuite qui en résulte est donnée par :
ristique sous la forme :
–d–1 * –1
z B (z )
βB ( z –1) ou βB ( z –1) --------------------------------------
P c ( q –1 ) = A a ( q –1 ) S a ( q –1 ) + q
–d–1
B a ( q –1 ) R a ( q –1 ) = A a ( q
–1
) P p ( q –1 ) A* ( z –1)
On notera que le scalaire β a été introduit pour avoir un gain
hp
statique unitaire. C’est le cas d’une commande avec modèle de réfé-

j–d–1 –1 –j+d –1 –j
+ γj q [ Aa ( q )q Hj – d ( q –1 ) + Ba ( q ) q Fj ( q –1 ) ]
rence sur l’état partiel qui est motivée par des considérations de
j = hi simplicité de spécification des performances [22].
hp
 
= P p ( q –1 )  A a ( q ) + ∑ γ j q j – d – 1 [ B a ( q ) – A a ( q ) G j – d ( q –1 ) ]
–1 –1 –1
■ Les performances nominales du système de commande sont
 j = hi  complètement caractérisées par six fonctions de transfert, comme
le montre la figure 4, en l’occurrence les dynamiques de poursuite
qui est conforme au théorème de séparation d’une quelconque d’entrée-sortie données respectivement par les fonctions de
commande avec retour d’état estimé, soit : transfert :

P c ( q –1 ) = P f ( q –1 ) P p ( q –1 ) A (z –1) T ( z )
–1 –1
B *( z ) A ( z ) T ( z )
–1 –1

–1
- ou ------------------------------------------------------
--------------------------------- –1
-
où Pc ( z ) A* ( z –1) P c ( z )
hp
et

–1 –1 –1 –1
Pf ( q ) = Aa ( q )+ γ j q j – d – 1[ B a ( q ) – Aa ( q ) G j – d ( q –1 ) ]
–1 –d–1 * –1 –1 –1
j = hi
B ( z –1) T ( z ) z B (z )B(z )T(z )
- ou ----------------------------------------------------------------------
--------------------------------- -
Comme le polynôme Pp (q –1) représente la dynamique du prédic- Pc ( z )
–1
A* (z –1) P c (z )
–1
teur qui est naturellement asymptotiquement stable, la condition de
stabilité nominale du système de commande est assurée si et seule-
et les diverses dynamiques de régulation vis-à-vis de l’ensemble
ment si Pf (q –1) est un polynôme d’Hurwitz. Les propriétés
des perturbations qui affectent le fonctionnement du système à
suivantes donnent les polynômes Pf (q –1) pour un ensemble de
commander ; ce sont les fonctions de sensibilité usuelles du sys-
spécifications des paramètres de synthèse hp, hc, hi et λ [20] [21] :
tème de commande définies par les fonctions de transfert :
— P1 : si hi = d +1, hc < hp = hi + hc –1 et λ = 0, alors Pf (q–1)
= β0Ba (q–1) –1 –1
6 ( z –1), 7 ( z ), 3 n ( z )6 ( z –1) et 5 ( z –1)6 ( z –1)
— P2 : si hp = hi = d +1, hc = 1 et λ ≠ 0, alors Pf (q –1) = α0 Aa (q –1)
+ γ0 Ba (q –1) –1
avec 6 ( z –1) et 7 ( z ) respectivement les fonctions de sensibilité et
— P3 : si hi = nb + d + 1, hc = na + nd, hp > na + nd + nb + d et de sensibilité complémentaire du système de commande nominale,
λ = 0, alors Pf (q –1) = 1 soit :
— P4 : si hi = d + 1, hc = 1, hp → ∞ , λ = 0 et D (q –1) = 1 – q –1,
alors Pf (q –1) = A (q –1)Wyd (q –1) Wun (q –1) A ( z –1) D ( z – 1) S ( z ) –1
–1 z
–d–1
B ( z –1) R ( z )
–1
6 ( z –1) = ----------------------------------------------------- et 7 ( z ) = ---------------------------------------------------
où α0, β0 et γ0 sont des scalaires dépendant du coefficient ba0 du –1
Pc ( z ) P c ( z – 1)
polynôme Ba (q –1) et de la pondération de la commande λ comme
suit : –1 –1
alors que 5 ( z ) et 3 n ( z ) ne sont autres que les fonctions de
λ 1 b a0 transfert du régulateur et du modèle de commande, soit :
α 0 = --------------------
2
-, β 0 = -----------
2
et γ 0 = --------------------
2
-
λ + b a0 b a0 λ + b a0 –d–1
–1 R (z – 1) –1 z B (z –1)
5 ( z ) = ----------------------------------- et 3 n ( z ) = ---------------------------------
Ces propriétés permettent entre autres de préciser le placement S ( z –1) D ( z – 1) A (z – 1)
des pôles effectué par la commande prédictive pour les spécifi-
cations considérés. Des gabarits fréquentiels typiques des dynamiques de régulation
Nota : une étude plus poussée de la stabilité nominale de la commande prédictive à du système de commande doivent être obtenus pour réaliser un
l’horizon étendu a été faite à partir de la stabilité de la commande linéaire quadratique à bon compromis performances-robustesse et assurer ainsi la moti-
horizon fuyant dans [5]. Elle est basée sur le concept de pseudo-équations algébriques de
Riccati qui consiste à récrire l’équation aux différences de Riccati sous la forme d’une équa-
vation ultime d’un problème d’automatique, en l’occurrence main-
tion algébrique de Riccati et à utiliser tous les résultats qui lui sont associés. tenir la séquence de sortie du système à commander au voisinage
de la séquence de référence indépendamment des perturbations qui
■ La poursuite parfaite est obtenue par une loi de commande affectent le fonctionnement du système. Il suffit de tenir compte du
(R (q –1), S (q –1), T (q –1)) satisfaisant : fait que les perturbations de charge sont dominantes en basses
–d–1
fréquences, alors que les bruits de mesures dominent en hautes
A (q – 1) D (q – 1) S (q – 1) + q B (q –1) R (q –1) = B (q –1)T ( q –1) fréquences.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 7
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

y*(t + hp) A (z –1) T (z –1) y*(t + hp) z –d –1 B(z –1)T (z –1)


Pc (z –1) Pc (z –1)

vu (t ) 6 (z –1) vu (t ) 3n (z –1) 6 (z –1)

u(t ) – 7 (z –1) + u (t ) u(t ) 3n (z –1) 6(z –1) + y (t )

vy (t ) – 5 (z –1)6(z –1) vy (t ) 6(z –1)

y (t ) – 5 (z –1)6(z –1) y (t ) – 7(z –1)

a en entrée b en sortie

+ somme
A (z –1) T (z –1) et B (z –1) T (z –1) fonctions de transfert
Pc (z –1) Pc (z –1)
6(z –1) fonction de sensibilité
7(z –1) fonction de sensibilité complémentaire
5 (z –1) fonction de transfert du régulateur
3n (z –1) fonction de transfert du modèle de commande
Figure 4 – Performances nominales

2.4 Généralité de la commande prédictive lence a été mise en évidence dans [23]. Notons toutefois que le
modèle de commande doit être inversement stable : une condition
qui est restrictive dans la pratique de la commande numérique où
La commande prédictive a reçu une attention particulière tout au un échantillonnage relativement raisonnable conduit généralement
long de cette dernière décennie aussi bien dans le monde universi- à des zéros à l’extérieur du cercle unité [3].
taire que dans le monde industriel. La plupart des méthodes de ■ Commande à variance minimale généralisée
synthèse disponibles dans la littérature sur la commande peuvent
être obtenues en choisissant convenablement les paramètres de Elle est obtenue en choisissant hp = hi = d + 1 et λ > 0, et consiste
synthèse à partir des propriétés P1 à P4 définies au paragraphe 2.3. donc à minimiser, par rapport à uf (t ), le critère quadratique :

■ Commande à variance minimale  2 2


J ( t + d + 1 ) = ε  ( y f ( t + d + 1 ⁄ t ) – yf*( t + d + 1 ) ) + λ ( u f (t ) ) 
Elle a été utilisée dans les premiers développements de  
commande adaptative et est obtenue en choisissant hp = hi = d + 1
et λ = 0. Le critère quadratique à minimiser est alors : ou d’une manière équivalente :
2 2
 2
Jˆ ( t + d + 1 ⁄ t ) = ( yˆf ( t + d + 1 ⁄ t ) – yf*( t + d + 1 ) ) + λ ( u f (t ) )
J ( t + d + 1 ) = ε  ( y f ( t + d + 1 ) – yf*( t + d + 1 ) ) 
  Elle a été principalement introduite pour relâcher la condition de
stabilité asymptotique des systèmes de commande à variance mini-
ou d’une manière équivalente : male [24]. En effet, le système de commande correspondant est
asymptomatiquement stable si et seulement si le modèle de
2
Jˆ ( t + d + 1 ⁄ t ) = ( yˆf ( t + d + 1 ⁄ t ) – yf*( t + d + 1 ) ) commande et les pondérations considérées vérifient la condition :

La dynamique de poursuite est alors celle du modèle de référence Wu ( 0 )


- λA (z –1) W y (z –1 ) + B (z –1 ) W u (z –1 ) est inversement stable.
-----------------------------
Wy ( 0 ) B ( 0 )
B (q )
* –1
--------------------- alors que la dynamique de régulation est caractérisée par
A* ( q –1) La plupart des premières applications de commande autoajus-
celle du prédicteur. Par ailleurs, le modèle de commande peut être table ont été faites avec la commande à variance minimale généra-
récrit sous une forme linéaire en les paramètres du régulateur lisée que l’on peut aisément interpréter comme une commande
permettant ainsi une adaptation paramétrique directe au bénéfice prédictive de Smith relativement bien élaborée dans la mesure où la
de la phase de détermination des paramètres du régulateur à partir dynamique du prédicteur peut être spécifiée par le concepteur et
de ceux du modèle estimé. Ces propriétés de simplicité de spécifi- non prise par défaut égale à celle du modèle de commande [20]. On
cation des performances et de la mise en œuvre représentent notera que l’adaptation paramétrique peut être effectuée directe-
l’ultime motivation de la commande adaptative à variance minimale ment pour avoir la prédiction requise sans altérer les performances
[3] [8] ou la commande avec modèle de référence [2] dont l’équiva- du système de commande sous-jacent.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 8 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

■ Commande avec placement des pôles rithme d’adaptation paramétrique à recouvrir les performances du
Elle est obtenue en choisissant hi = nba + d +1, hc = naa, système de commande sous-jacent indépendamment des perturba-
hp > na a + nb a + d et λ = 0. Plus précisément, les pôles du système tions d’état, des bruits de mesure, des éventuelles variations de
de commande seront ceux du prédicteur plus 2 max (naa, nba paramètres et des dynamiques négligées. En effet, il a été montré
+ d + 1) – nca pôles en zéro [20]. D’un point de vue robustesse du que les systèmes de commande adaptative sont susceptibles de
système de commande, il est plus sage d’éviter d’assigner des pôles perdre la robustesse du fait même de l’adaptation paramétrique
en zéro. La synthèse d’un système de commande avec placement effectuée. Un exemple académique (§ 3.4) illustre ces aspects fonda-
arbitraire des pôles est possible si le modèle de commande utilisé mentaux de la commande adaptative.
pour ce faire est complètement commandable et observable, soit L’adaptation paramétrique a reçu une attention particulière dans
Aa (q –1) et Ba (q –1) sont premiers entre eux. Une telle condition n’est la communauté de commande adaptative. Des résultats théoriques
pas aussi restrictive que celle de la commande avec modèle de réfé- et méthodologiques fort intéressants sont disponibles sur la robus-
rence ou à variance minimale qui nécessite que les zéros du système tesse, et donc la crédibilité, des algorithmes de commande adapta-
à commander soient à l’intérieur du domaine de stabilité. La plupart tive. Cette robustesse est généralement obtenue avec un traitement
des résultats théoriques disponibles sur la stabilité, la convergence et approprié des signaux d’entrée-sortie et un algorithme d’adaptation
la robustesse des algorithmes de commande adaptative indirects ont paramétrique robuste.
été obtenus avec une commande avec placement des pôles [16]. On
notera toutefois que la condition de stabilité critique est la comman-
dabilité et l’observabilité uniformes du modèle estimé. Une telle
propriété n’est généralement pas satisfaite si les signaux d’entrée- 3.1 Traitement des données
sortie ne vérifient pas la condition d’excitation persistante ou si la
structure du modèle estimé n’est pas relativement appropriée.
Le traitement des données est effectué par un filtrage adéquat et
■ Commande avec modèle interne éventuellement une normalisation des signaux d’entrée-sortie pour
Elle peut être obtenue avec un prédicteur dont la dynamique est se ramener à un problème d’adaptation paramétrique indépendant
caractérisée par Pp (q –1) = A (q –1)Fd (q –1) et dont le modèle interne de la bornitude des données d’entrée-sortie et donc bien posé [29].
des perturbations est donné par D (q –1) = 1 – q –1 en choisissant Le modèle d’adaptation paramétrique est alors donné par :
hp = temps d’établissement en périodes d’échantillonnage, hc = 1,
T
hi = d + 1 et λ = 0. Ce choix est fait à partir d’une analyse des perfor- y fn (t ) = θ φ fn ( t – 1 ) + e fn (t ) (39)
mances de la commande avec modèle interne dont le polynôme
Fd (q –1) représente les pôles du filtre de robustification [20]. Notons avec
que l’on peut récrire le modèle de commande sous une forme
e (t ) = v (t ) + w (t ) (40)
linéaire en les paramètres du régulateur que l’on peut adapter direc-
tement si besoin est. T
θ ( t ) = a 1 … a na b 0 … b nb (41)
■ Commande linéaire quadratique gaussienne
Elle peut être obtenue en faisant tendre les horizons de prédiction T
et de commande vers l’infini [4]. Le critère quadratique à minimiser φ f ( t ) = – y f (t ) … – y f (t – n a + 1 ) u f (t – d ) … u f ( t – d – n b ) (42)
est alors donnée par :
où l’indice fn dénote la fonction de filtrage et de normalisation des
T signaux d’entrée-sortie.
1 2 2
J ( u ( t ) ) = lim ε  ----- ∑ ( y f ( t + j ) – yf*( t + j ) ) + λ ( u f (t + j – 1 ) )  Le filtrage est généralement effectué par un filtre passe-bande de
T → ∞ T 
j=1 –1 –1
D(z )G(z )
La commande linéaire quadratique gaussienne adaptative a été fonction de transfert ----------------------------------- . Notons que le choix :
–1
F(z )
particulièrement motivée par des considérations de robustesse du
système de commande sous-jacent et de simplicité de mise en F (q –1) = C (q –1) et G (q –1) = 1
œuvre. La commande optimale est en effet relativement insensible
aux erreurs de modélisation [4] et on peut toujours utiliser l’équation conduit à une séquence {vf (t )} identiquement égale à la séquence
aux différences de Riccati pour la synthèse de la loi de commande {ω (t )}. Cela représente le cas idéal pour l’identification des
adaptative correspondante [14]. La condition de stabilité critique systèmes si {wf (t )} est identiquement nulle et {vf (t )} est une
consiste en la stabilisabilité uniforme du modèle estimé qui est séquence de variables aléatoires indépendantes, de moyenne nulle
détectable par construction. Une telle propriété peut être satisfaite et de variances finies. Le choix du filtre peut être fait conformément
relativement facilement par rapport à la condition de commandabi- aux récents résultats sur l’interaction entre l’identification et la
lité uniforme, requise pour la commande avec placement des pôles, commande [30] [31].
qui n’est généralement pas satisfaite si la structure du modèle d’esti- La normalisation des données est effectuée comme suit :
mation est surparamétrisée, même si les signaux d’entrée-sortie x(t)
vérifient la condition d’excitation persistante. x n (t ) = --------------- (43)
η(t)
T
avec η ( t ) = µ n η ( t – 1 ) + ( 1 – µ n )max ( φ f ( t ) φ f ( t ), η min )
3. Commande prédictive où 0 < µn < 1 et ηmin > 0.
adaptative
3.2 Algorithme d’adaptation
La théorie de la commande adaptative a été largement étudiée paramétrique
tout au long des trois dernières décennies. Des résultats théoriques
relativement importants sont disponibles dans la littérature [2] [7]
[9] [10] [11]. Des applications industrielles réussies ont montré son L’adaptation paramétrique doit être faite de manière à assurer la
applicabilité au point où des régulateurs autoajustables sont d’ores stabilité du système de commande adaptative et éventuellement les
et déjà sur le marché [8] [17] [25] [26] [27] [28]. L’applicabilité de la performances requises. Toutes les méthodes de commande et
commande adaptative est étroitement liée à la capacité de l’algo- d’identification basées sur un modèle de commande linéaire par

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 9
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

rapport aux paramètres peuvent être combinées pour la synthèse porer ainsi une certaine capacité de poursuite des paramètres varia-
de systèmes de commande adaptative comme en témoignent le bles dans le temps, soit :
nombre des algorithmes de commande linéaire adaptative (voir par 0 < f min < F ( t ) < f max < ∞
exemple [2]) et ceux de la commande de robots rigides [12]. L’école
française a mis en évidence les propriétés requises de l’algorithme {s (t )} permet de geler l’adaptation des paramètres si besoin est,
d’adaptation paramétrique pour assurer la stabilité d’un système de notamment quand {φfn (t )T F (t ) φfn (t )} est relativement petite en
commande adaptative [2] [13] [14] [32] [33] : moyenne comme le suggère l’expression (46).
— P1 : les paramètres estimés sont bornés, soit : L’erreur paramétrique associée est donnée par l’équation aux
+ différences :
∃R θ ∈ 5 ⁄ θ̂ ( t ) < R θ
T
— P2 : le modèle estimé reproduit le comportement d’entrée-sor-  F ( t – 1 ) φ fn ( t – 1 ) φ fn ( t – 1 )  –1
 I np + s ( t ) ------------------------------------------------------------------------------------------------------------------- – I np q θ̃ ( t )
tie du procédé en moyenne, soit :  ν ( t ) + ( 1 – s ( t ) ) φ fn ( t – 1 ) F ( t – 1 ) φ fn ( t – 1 )
T

∃ γ θ ∈ 5 ⁄ { y fn ( t ) – θ̂ ( t ) φ fn ( t – 1 ) } est γ θ -APM
+ T
F ( t – 1 ) φ fn ( t – 1 )
— P3 : les variations des paramètres estimés sont petites en = s ( t ) ------------------------------------------------------------------------------------------------------------------- e fn ( t ) (47)
ν ( t ) + ( 1 – s ( t ) ) φ fn ( t – 1 )T F ( t – 1 ) φ fn ( t – 1 )
moyenne, soit :

∃ µ θ ∈ 5 ⁄ { θ̂ (t ) – θ̂ ( t – 1 ) } est µθ -APM qui permet de mieux appréhender la nécessité du traitement des


+
données et du gel de l’adaptation paramétrique.
— P4 : le modèle estimé est admissible en moyenne, il existe une En effet, dans le cas d’une adaptation paramétrique, c’est-à-dire
sous-séquence croissante { t k } k ∈ 1 , telle que { t k – t k – 1 } k ∈ 1 est s (t) = 1, cette équation devient :
bornée et le système de commande correspondant au modèle
obtenu à partir de { θ̂ (t k ) } est asymptotiquement stable.  I + --------- - F ( t – 1 ) φ fn ( t – 1 ) φ fn ( t – 1 )  – I np q
1 T –1
 np ν ( t ) 
θ̃ ( t )
Il apparaît clairement que les propriétés de stabilité ne concernent
que l’algorithme d’adaptation paramétrique et que la convergence 1
= ---------- F ( t – 1 ) φ fn ( t – 1 ) e fn ( t )
des paramètres du modèle estimé vers leurs vraies valeurs n’est pas ν(t)
nécessaire pour la stabilité du système de commande. Les trois
Il apparaît clairement que la normalisation assure une entrée
premières propriétés sont satisfaites par les algorithmes d’adapta-
bornée au système dynamique sous-jacent dans la mesure où la
tion paramétrique disponibles dans la littérature pourvu que les
erreurs de modélisation soient petites en moyenne, soit :  1 
séquence d’entrée - F ( t – 1 ) φ fn ( t – 1 ) e fn ( t ) 
 --------- est bornée.
+  ν (t ) 
∃ γ * ∈ 5 ⁄ { w fn (t ) } est γ *-APM Quant au filtrage des données, il est généralement réalisé de
manière à annuler en moyenne une telle entrée. Par ailleurs, le
La propriété P4 est généralement vérifiée dans la pratique dans la
système dynamique associé est asymptomatiquement stable si
mesure où l’adaptation paramétrique n’est effectuée que lorsque la
étant donné un entier naturel k, pour tout entier naturel j il existe un
condition d’excitation persistante est satisfaite. On peut toutefois
nombre réel positif fnmin tel que :
modifier l’algorithme d’adaptation paramétrique ou la loi de com-
mande adaptative pour assurer l’admissibilité du modèle estimé, j+k

∑ φfn (t ) φfn (t )
T
mais ces modifications ne peuvent être utilisées dans la pratique > f n min > 0
[16] [32]. Par ailleurs, la pratique de la commande adaptative a parti- t=j
culièrement mis en évidence que les performances du système de
commande adaptative sont celles du système de commande sous- Une telle propriété est appelée condition d’excitation persistante
jacent si la réponse fréquentielle du modèle admissible est dans un du vecteur d’observation {φfn (t )}. Cette condition assure la conver-
voisinage du modèle de synthèse du système de commande sous- gence des paramètres estimés dans un voisinage de leurs vraies
jacent. Cet aspect sera illustré au paragraphe 3.4. valeurs si l’opération de filtrage est réalisée d’une manière
Un algorithme d’adaptation paramétrique relativement général  1 
adéquate, soit  ---------- F ( t – 1 ) φ fn ( t – 1 ) e fn ( t )  est nulle en moyenne.
 ν(t)
pour englober tous les algorithmes d’adaptation paramétrique qui
sont communément utilisés dans la pratique de la commande adap- 
tative est donné ici : On peut ainsi réaliser les performances du système de commande
[33]. Comme la condition d’excitation persistante n’est pas toujours
θˆ (t ) = θ̂ ( t – 1 ) vérifiée et plus particulièrement dans un contexte de régulation,
l’erreur paramétrique associée est donnée par l’équation aux
F ( t – 1 ) φ fn ( t – 1 ) T (44) différences :
+ s ( t ) ------------------------------------------------------------------------------------------ ( y fn ( t ) – φ fn (t – 1) θ̂ ( t – 1 ) )
ν ( t ) + φ fn ( t – 1 )T F ( t – 1 ) φ fn ( t – 1 )
–1 1
[ 1 – q ] θ̃ ( t ) = ---------- F ( t – 1 ) φ fn ( t – 1 ) e fn ( t )
ν(t)
 T 
1  F ( t – 1 ) φ fn ( t – 1 ) φ fn ( t – 1 ) F ( t – 1 )  qui montre clairement la possibilité d’une dérive des paramètres
F (t ) = ----------  F ( t – 1 ) + s (t ) -
--------------------------------------------------------------------------------------------
λ (t )  λ (t ) estimés, c’est-à-dire θˆ ( t ) → ∞ lorsque t → ∞ , qui peut conduire à
---------- + φ fn ( t – 1 )T F ( t – 1 ) φ fn ( t – 1 ) 
 µ (t )  l’instabilité du système de commande adaptative [16]. C’est pour-
+ s (t ) R (t ) (45) quoi l’adaptation paramétrique est gelée quand les signaux
d’entrée-sortie ne sont pas suffisamment excitants pour améliorer
le processus d’estimation paramétrique, soit s (t ) = 0. L’équation
 T
 1 si { φ fn ( t ) F ( t ) φ fn ( t ) } est suffisamment petite (47) devient alors :
s(t) =  sur un certain horizon (46)
–1
 0 autrement ( 1 – q ) θ˜ ( t ) = 0

où {θˆ (t )} et {F (t )} sont respectivement les paramètres estimés et la λ (t )
Lorsque {R (t )} est identiquement nulle et ν ( t ) = ---------- , l’algo-
matrice du gain d’adaptation que l’on peut régulariser en utilisant µ (t )
judicieusement les séquences {λ (t )}, {µ (t )}, {ν (t )} et {R (t )} et incor- rithme d’adaptation paramétrique sans gel d’adaptation (44) (45)

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 10 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

peut être obtenu directement à partir de la minimisation d’un critère En effet, on peut assurer une borne inférieure non nulle de la
du type moindres carrés pondérés, soit : matrice de gain d’adaptation F (t ) en régularisant la matrice diago-
t t
nale comme suit :
  2
∑  ∏ si di < d0 alors di (t ) = di (t – 1) sinon d0 fini
T
J ( θˆ ( t ) ) = λ ( j ) µ ( i ) ( y fn ( i ) – θˆ ( t ) φ fn ( i – 1 ) ) + J ( θˆ (t 0 ) )

i = t0 j = i+1 où d0 est un seuil spécifié par l’utilisateur. Il s’agit d’une procédure
avec particulière de réinitialisation de la matrice de gain d’adaptation
F (t ). Quant à la borne supérieure, on peut l’assurer par un algo-
T –1
J ( θˆ (t 0 ) ) = [ θˆ (t 0 ) – θ ] [ F ( t 0 ) ] [ θˆ (t 0 ) – θ ] rithme du type trace constante.
Lorsque {R (t )} n’est pas nulle et λ (t ) = µ (t ) = 1, l’adaptation des
On distingue plusieurs cas. paramètres du modèle de commande peut être interprété comme
■ l (t ) = m (t ) = 1 : ce cas correspond à la méthode des moindres un problème d’observation associé à la représentation d’état :
carrés où toutes les données d’entrée-sortie sont prises en considé-
ration de la même façon dans le critère. Le gain d’adaptation peut  θ ( t ) = θ ( t – 1 ) + w (t )
devenir asymptotiquement nul et ne présente donc aucune robus- 6  T (48)
 yf (t ) = θ ( t ) φ f ( t – 1 ) + v f (t )
tesse vis-à-vis des variations éventuelles des paramètres.
■ l (t ) = l et m (t ) = 1 avec 0 < l < 1 : ce cas correspond à la où la séquence {w (t )} représente les variations éventuelles des
méthode des moindres carrés avec facteur d’oubli fixe où les don- paramètres et la séquence {vf (t )} représente les perturbations qui
nées les plus récentes ont beaucoup plus d’importance que les affectent le fonctionnement du système à commander.
anciennes données dans le processus d’estimation, ce qui justifie Un observateur d’état approprié pour le système (48) peut être
l’appellation de la méthode. Cet algorithme peut conduire cepen- obtenu à partir du filtre de Kalman associé, en l’occurrence l’algo-
dant à une séquence {F (t )} de matrices de gain d’adaptation expo- rithme d’adaptation paramétrique (44) à (46) où {η (t )} et {R (t )}
nentiellement croissante dans le cas d’une dégénérescence de représenteraient respectivement les covariances des bruits de
l’information contenue dans les données d’entrée-sortie, c’est-à- mesure et des variations paramétriques, soit les séquences {vf (t )}
dire {φfn (t ) φfn (t )T} est nulle en moyenne. et {w (t )}. L’estimateur de l’état θˆ ( t ) est consistant si et seulement
■ l (t ) = ll (t – 1) + (1 – l) et m (t ) = 1 avec 0,95 < l (0) et l < 0,98 : si le système (48) est uniformément observable : étant donné un
ce cas correspond à la méthode des moindres carrés avec facteur de entier k, pour tout entier naturel j, il existe deux nombres réels φmin
l’oubli variable. Notons que le facteur d’oubli λ (t ) converge expo- et φmax tels que :
nentiellement vers 1, ce qui conduit à un algorithme des moindres j+k
∑ φf ( t ) φf ( t )
T
carrés simples. Ce type de facteur d’oubli permet toutefois de remé- 0 < φ min < < φ max < ∞
dier au problème des mauvaises conditions initiales. t=j
■ Algorithme des moindres carrés avec trace constante : ce cas est
obtenu en choisissant λ (t ) = µ (t ) tel que trace (F (t )) = trace (F (t – 1)),
soit : 3.3 Algorithme de commande
T
φf ( t – 1 ) F ( t – 1 ) F ( t – 1 ) φf ( t – 1 )
λ (t ) = 1 – -------------------------------------------------------------------------------------------------------------------------------
T
------- La commande prédictive peut être combinée avec un algorithme
( η (t ) + φ f ( t – 1 ) F ( t – 1 ) φ f ( t – 1 ) ) trace ( F ( t – 1 ) ) d’adaptation paramétrique robuste pour obtenir un système de
Ce type d’algorithme permet d’assurer que la matrice de gain commande adaptative, comme l’indique la figure 1 a. On peut ainsi
d’adaptation est bornée supérieurement indépendamment de la faire de l’autoajustement de régulateurs ou de la commande adap-
nature des informations traitées. En effet, le facteur d’oubli λ (t ) tative prudente sous une certaine logique de supervision qui permet
devient identiquement égal à 1 dans le cas d’un manque d’informa- d’assurer l’intégrité du système de commande. Comme il a été déjà
tion ou une dégénérescence du gain d’adaptation. mentionné, l’algorithme de commande adaptative est obtenu sous
la bénédiction du principe d’équivalence certitude qui consiste à
■ Algorithme du gradient normalisé : ce cas est obtenu en choisis- remplacer le modèle de commande par son estimé à chaque
sant λ (t ) = 1, ν (t ) = 1 et µ (t ) = 0. Cette méthode minimise, par rap- période d’échantillonnage. On réalise pour ce faire les étapes
port à θˆ ( t ) , le critère quadratique suivant : suivantes :
T 2 1. attendre le top d’horloge pour acquérir la sortie du procédé ;
J ( θˆ (t ) ) = ( y fn ( t ) – θˆ (t ) φ fn ( t – 1 ) )
T –1 2. mettre à jour les paramètres du modèle de commande du
+ [ θˆ (t ) – θˆ (t – 1 ) ] [ F ( t 0 ) ] [ θˆ (t ) – θˆ (t – 1 ) ] procédé en utilisant l’algorithme d’adaptation paramétrique
Elle a été plus particulièrement utilisée par la communauté de (44) à (46) à partir du modèle d’adaptation paramétrique (39) à
traitement du signal. La convergence d’un tel algorithme est relati- (43) ;
vement lente et nécessite donc une bonne initialisation. 3. construire un modèle de commande admissible à partir du
Notons que la séquence de matrices de gain d’adaptation {F (t )} modèle estimé comme suit :
des algorithmes d’adaptation paramétrique du type moindres  θˆ ( t ) si θˆ ( t ) est admissible
carrés peut avoir une borne inférieure nulle si la condition d’excita- θa ( t ) = 
tion persistante n’est pas vérifiée. Il est donc nécessaire d’utiliser  θ a ( t – 1 ) autrement
{R (t )} pour éviter un tel problème. Une procédure relativement
simple peut être obtenue à partir des propriétés suivantes : 4. évaluer la loi de commande à partir du modèle de commande
admissible θa (t ) ;
min { λ i ( t ) } < F ( t ) < max { λ i ( t ) } < trace ( F ( t ) ) pour i ∈ [ 1, np ]
5. appliquer le signal de commande et aller à l’étape 1.
et Notons que les résultats théoriques obtenus pour la commande
np np
adaptative sont relativement prometteurs pour l’applicabilité des
techniques de commande avancée des procédés et plus particuliè-
∏ λi ( t ) = det ( F ( t ) ) = det ( D ( t ) ) = ∏ di ( t ) pour i ∈ [ 1, np ] rement l’autoajustement des systèmes de commande prédictive et
i=1 i=1
leur calibrage en temps réel si besoin est. De nombreuses appli-
où λi (t ) est la ième valeur propre de F (t ) et di (t ) est le ième cations semi-industrielles et industrielles réussies permettent
élément de la matrice diagonale D (t ). d’expliquer cet enthousiasme.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 11
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

3.4 Exemple de Rohrs


système modèle estimé
0,2
L’exemple de Rohrs a été utilisé pour mettre en évidence que la
robustesse d’un algorithme de commande adaptative peut être 0
perdue du fait même de l’adaptation paramétrique en présence de
perturbations ou d’erreurs de modélisation [34]. Il s’agit d’un – 0,2
exemple académique où le système à commander est parfaitement – 0,4
décrit par la fonction de transfert : Partie imaginaire
– 0,6
1
3 ( p ) = -----------------------------------------------------
(p + 1)(p2 + 2p + 1) – 0,8

et la synthèse du système de commande est faite à partir d’un –1


modèle de premier ordre, soit :
– 1,2
1 – 0,5 0 0,5 1 1,5 2
} ( p ) = ------------------
(p + 1) Partie réelle
La figure 5 montre les lieux de Nyquist du système à commander Figure 5 – Lieux de Nyquist des modèles de synthèse
et du modèle de commande qui permettent de mieux appréhender
les erreurs de modélisation considérées.
Dans ce qui suit, on montre un ensemble de résultats de simula- résultats suffisamment avancés pour être utilisés dans la pratique.
tion dont la motivation est d’illustrer le problème de robustesse des La démarche utilisée est compréhensive, elle consiste à procéder de
algorithmes d’adaptation paramétrique à partir de ce célèbre la manière progressive décrite ici.
exemple de Rohrs. L’initialisation du système de commande adapta-
tive est faite à partir d’une identification en boucle ouverte utilisant s
1 Montrer que la synthèse du système de commande sous-jacent

une séquence binaire pseudo-aléatoire comme entrée ou en boucle est faisable aussi bien dans le cas idéal où le modèle de synthèse
fermée avec un relais dont l’amplitude et l’hystérésis sont spécifiées représente parfaitement le système à commander que dans un cas
de manière à satisfaire la condition d’excitation persistante requise non idéal à partir d’un modèle linéaire de premier ordre, soit :
pour une bonne estimation des paramètres [35]. Cette initialisation 1 1
permet de pallier le problème du comportement transitoire de la } ( p ) = 3 ( p ) = ----------------------------------------------------- ou } ( p ) = ------------------
boucle d’adaptation paramétrique sur lequel on ne dispose pas de (p + 1)(p2 + 2p + 1) (p + 1)

10 20

0 0
Amplitude (dB)

Amplitude (dB)
– 10 – 20

– 20 – 40

– 30 – 60
0 5 10 0 5 10
Pulsation (rad/s) Pulsation (rad/s)
a sensibilité b sensibilité complémentaire

10 0

5
Amplitude (dB)

Amplitude (dB)

– 20

– 40
–5

– 10 – 60
0 5 10 0 5 10
Pulsation (rad/s) Pulsation (rad/s)
c sensibilité x régulateur d sensibilité x procédé

cas idéal
nominales
réalisées
Figure 6 – Fonctions de sensibilité usuelles

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 12 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

1,5 1,5
1 1
0,5 0,5
Amplitude 0 Amplitude 0 Référence et sortie
– 0,5 – 0,5 du procédé
–1 –1
– 1,5 – 1,5
0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80 100 120 140 160 180 200
t (s) t (s)

2 2
0 0
Amplitude –2 Amplitude –2
–4 –4
–6 –6 Commande
–8 –8
0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80 100 120 140 160 180 200
t (s) t (s)
a cas idéal b modèle d'ordre réduit

Figure 7 – Commande prédictive

La synthèse du système de commande sous-jacent a été faite avec


une méthode de commande prédictive généralisée dont les paramè- 2
tres de synthèse ont été choisis de manière à réaliser un modelage
1
approprié des fonctions de sensibilité usuelles comme l’indique la
Amplitude 0
figure 6 qui montre les gains des fonctions de sensibilité usuelles
réalisées dans le cas idéal, soit 3 ( p ) = } ( p ) , et les gains de fonc- –1
tions de sensibilité usuelles réalisées et nominales dans le cas non –2
idéal. Le comportement d’entrée-sortie des systèmes de commande 0 20 40 60 80 100 120 140 160 180 200
correspondants est tout à fait satisfaisant, en poursuite comme en t (s)
régulation, comme le montre la figure 7. On notera plus particulière- a référence et sortie du procédé
ment que la dégradation des performances en poursuite n’est pas
très importante. 4
2
s
2 Confirmer tous les résultats de commande adaptative obtenus
Amplitude
dans le cas idéal, en l’occurrence la réalisation asymptotique de 0
l’objectif de commande et la convergence des paramètres. Les –2
figures 8 a et b montrent le comportement d’entrée-sortie du –4
système de commande adaptative lorsque la structure du système à 0 20 40 60 80 100 120 140 160 180 200
commander est connue, soit na = 3, nb = 1 et d = 0, et en l’absence t (s)
b commande
des perturbations d’état et des bruits de mesure. La convergence
des paramètres est illustrée par la figure 8 c.
2
s
3 Illustrer le problème de dérive des paramètres estimés en
1
Paramètres a1, a2 et a3
présence des bruits de mesure, des perturbations d’état et des
erreurs de modélisation. La figure 9 montre le comportement 0
d’entrée-sortie du système de commande adaptative, l’évolution –1
des paramètres estimés et les lieux de Nyquist du système à –2
commander et du modèle estimé final en présence d’un bruit de 0 20 40 60 80 100 120 140 160 180 200
mesure relativement raisonnable, soit un bruit blanc de moyenne t (s)
nulle et de variance 0,01. La figure 10 montre le comportement 0,03
d’entrée-sortie du système de commande adaptative, l’évolution Paramètres b0, b1 et b2
des paramètres estimés et les lieux de Nyquist du système à 0,02
commander et du modèle estimé final en présence d’une perturba- 0,01
tion en échelon d’amplitude 0,25 qui apparaît à l’instant t = 125 s.
Les figures 11 a, b et c montrent respectivement le comportement 0
d’entrée-sortie du système de commande adaptative et l’évolution 0 20 40 60 80 100 120 140 160 180 200
t (s)
des paramètres estimés lorsqu’on utilise un modèle d’estimation de
c évolution des paramètres estimés
premier ordre, soit la structure na = 1, nb = 0 et d = 0, en l’absence de
bruits de mesure et de perturbations. La dérive des paramètres
estimés est tout à fait remarquable au point où les réponses Figure 8 – Commande prédictive adaptative. Cas idéal
fréquentielles du système à commander et du modèle estimé final
sont suffisamment différentes pour ne pas recouvrir les perfor- présence d’un bruit de mesure lorsque les signaux d’entrée-sortie
mances du système de commande sous-jacent, comme le montre la sont préalablement filtrés. La figure 13 montre le comportement
figure 11 d des lieux de Nyquist correspondants. d’entrée-sortie du système de commande adaptative et les lieux de
s4 Montrer que le filtrage des signaux d’entrée-sortie permet de Nyquist du système à commander et du modèle estimé final en
recouvrir les performances du système de commande sous-jacent présence d’une perturbation d’état du type échelon lorsque les
en présence des bruits de mesure et des perturbations d’état dont le signaux d’entrée-sortie sont préalablement filtrés. Le traitement de
modèle interne est connu. La figure 12 montre le comportement données associé a été réalisé par un filtre passe-bande dont les
d’entrée sortie du système de commande adaptative et les lieux de fréquences de coupure ont été spécifiées en fonction des dynami-
Nyquist du système à commander et du modèle estimé final en ques requises du système de commande.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 13
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

2
2
1
Amplitude 0 1
–1 Amplitude 0
–2
0 20 40 60 80 100 120 140 160 180 200
t (s) –1
a référence et sortie du procédé –2
0 20 40 60 80 100 120 140 160 180 200
2
t (s)
1 a référence et sortie du procédé
Amplitude 0
–1
–2 2
0 20 40 60 80 100 120 140 160 180 200
t (s) 1
b commande 0
Amplitude
–1
2
Paramètres a1, a2 et a3 –2
1
0 –3
0 20 40 60 80 100 120 140 160 180 200
–1
t (s)
–2
0 20 40 60 80 100 120 140 160 180 200 b commande
t (s)
0,1
Paramètres b0, b1 et b2 2
0,05 Paramètres a1, a2 et a3
1
0
0
– 0,05
0 20 40 60 80 100 120 140 160 180 200 –1
t (s)
c évolution des paramètres estimés –2
0 20 40 60 80 100 120 140 160 180 200
système modèle estimé t (s)
0,2

0 0,025 Paramètres b0, b1 et b2


0,02
– 0,2
0,015
– 0,4 0,01
Partie
imaginaire 0,005
– 0,6
0 20 40 60 80
100 120 140 160 180 200
– 0,8
t (s)
–1 c évolution des paramètres estimés

– 1,2
– 0,5 0 0,5 1 1,5 2 système modèle estimé
Partie réelle 0,2
d lieux de Nyquist 0

Figure 9 – Commande prédictive adaptative en présence d’un bruit – 0,2


de mesure
Partie – 0,4
imaginaire
– 0,6
Le filtrage des signaux d’entrée-sortie est une opération néces-
saire dans une quelconque synthèse de commande adaptative, il – 0,8
permet essentiellement de recouvrir la réponse fréquentielle du
système à commander si la structure du modèle d’estimation est –1
convenablement choisie pour cette fin. Notons que le filtrage ne
– 1,2
permet pas de pallier le problème de dérive des paramètres estimés – 0,5 0 0,5 1 1,5 2
en présence de dynamiques négligées comme le montre la figure Partie réelle
14 obtenue avec un modèle d’estimation de premier ordre et un d lieux de Nyquist
filtrage passe-bande des signaux d’entrée-sortie.
s5 Mettre en évidence qu’une adaptation paramétrique en Figure 10 – Commande prédictive adaptative en présence
présence des perturbations et de dynamiques négligées conduit de perturbations de charge

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 14 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

2 2

1 1
Amplitude 0 Amplitude 0

–1 –1

–2 –2
0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80
100 120 140 160 180 200
t (s) t (s)
a référence et sortie du procédé a référence et sortie du procédé

4 2

2 1
Amplitude 0 Amplitude 0

–2 –1
–4 –2
0 20 40 60 80 100 120 140 160 180 200 0 20 40 60 80 100 120 140 160 180 200
t (s) t (s)
b commande b commande

système modèle estimé


– 0,92 Paramètre a1 0,2
– 0,94
– 0,96 0
– 0,98
–1 – 0,2
– 1,02
– 0,4
– 1,04 Partie
20 40 60 80 100 120 140 160 180 200 imaginaire – 0,6
t (s)
– 0,8
Paramètre b0 –1
0,07

0,06 – 1,2
– 0,5 0 0,5 1 1,5 2
0,05 Partie réelle
c lieux de Nyquist
0,04
20 40 60 80
100 120 140 160 180 200 Figure 12 – Commande prédictive adaptative avec filtrage
t (s) des données en présence d’un bruit de mesure
c évolution des paramètres estimés

système modèle estimé


0,2 avec un modèle estimé de premier ordre. La figure 15 d montre les
lieux de Nyquist du système à commander et du modèle estimé
0 final. Le problème de perte de stabilité peut être résolu par un gel
systématique de l’adaptation paramétrique dès que l’information
– 0,2
courante n’est pas suffisamment riche pour affiner le processus
– 0,4 d’estimation des paramètres. La figure 16 montre le comportement
Partie d’entrée-sortie du système de commande adaptative robuste et
imaginaire – 0,6 l’évolution des paramètres estimés en présence des perturbations
de charge avec un modèle estimé de premier ordre. Notons que
– 0,8 l’adaptation paramétrique a été automatiquement gelée pendant
–1 toute la période de régulation afin de recouvrir les performances du
système de commande sous-jacent.
– 1,2
– 0,5 0 0,5 1 1,5 2 s
6 Illustrer une conjecture, largement vérifiée par notre expérience,

Partie réelle
qui peut être faite : la structure du modèle d’adaptation paramétrique
doit être suffisamment flexible pour pouvoir recouvrir la réponse
d lieux de Nyquist
fréquentielle du système à commander. C’est cette propriété qui doit
guider la spécification de la structure d’un modèle de commande. Les
Figure 11 – Commande prédictive adaptative avec réduction d’ordre figures 17 et 18 montrent le comportement d’entrée-sortie du
système de commande adaptative robuste avec des modèles d’esti-
mation de second ordre correspondant respectivement aux structures
généralement à une perte de la stabilité du système de commande na = 2, nb = 1 et d = 0 et na = 1, nb = 1 et d = 0. Les bonnes perfor-
adaptative associée. La figure 15 montre le comportement mances obtenues sont justifiées par la vraisemblance des lieux de
d’entrée-sortie du système de commande adaptative et l’évolution Nyquist du système à commander, du modèle initial et du modèle
des paramètres estimés en présence des perturbations de charge estimé final, comme le montrent les figures 17 c et 18 c.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 15
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

2 – 0,95

1
Paramètre a1
Amplitude 0 –1

–1

–2 – 1,05
0 20 40 60 80
100 120 140 160 180 200 20 40 60 80 100 120 140 160 180 200
t (s) t (s)
a référence et sortie du procédé

2 0,075
Paramètre b0
1
0,07
Amplitude 0

–1 0,065
20 40 60 80 100 120 140 160 180 200
–2
0 20 40 60 80 100 120 140 160 180 200 t (s)
t (s) a évolution des paramètres
b commande

système modèle estimé système modèle estimé


0,2 0,2

0 0

– 0,2 – 0,2

– 0,4 – 0,4
Partie Partie
imaginaire – 0,6 imaginaire – 0,6

– 0,8 – 0,8

–1 –1

– 1,2 – 1,2
– 0,5 0 0,5 1 1,5 2 – 0,5 0 0,5 1 1,5 2
Partie réelle Partie réelle
c lieux de Nyquist b lieux de Nyquist

Figure 13 – Commande prédictive adaptative avec filtrage Figure 14 – Commande prédictive adaptative avec filtrage
des données en présence de perturbations de charge des données et un modèle d’estimation du premier ordre

4. Applications Dans ce qui suit, on présente les résultats obtenus dans les cas du
réacteur chimique et du système de transmission flexible. Ces
procédés pilotes ont été respectivement conçus au Laboratoire des
Plusieurs applications ont été effectuées avec la méthodologie sciences du génie chimique de Nancy et au Laboratoire d’automa-
proposée à partir de SIMART : un progiciel pour la commande tique de Grenoble pour étudier l’applicabilité des techniques de
avancée de procédés [36]. Ce dernier a été conçu aussi bien comme commande avancée.
une station de travail pour la résolution des problèmes de commande
de procédés, que comme une base d’apprentissage de l’automatique.
À ce titre, il permet de réaliser toutes les étapes de synthèse d’un
système de commande, à savoir la spécification des performances 4.1 Réacteur chimique
requises à partir d’un cahier des charges, l’identifi-cation d’un modèle
de commande compatible avec les performances requises, la
synthèse d’un régulateur, l’analyse des performances du système de Les réacteurs chimiques opérant en modes batch et semi-batch sont
commande et la mise en œuvre du système de commande. Les de plus en plus utilisés dans la fabrication des produits à haute valeur
étapes d’identification et de commande peuvent être faites en temps ajoutée, en l’occurrence la chimie fine et la pharmacie, pour des consi-
réel, en l’occurrence le calibrage automatique de régulateurs PID dérations de flexibilité et de polyvalence de fonctionnement. La motiva-
(proportionnel, intégral, différentiel), l’autoajustement de régulateurs tion ultime est de répondre à une demande de plus en plus croissante
et de la commande adaptative supervisée. SIMART a déjà été utilisé de produits de grande qualité. Dans le cas d’une réaction exothermique
avec succès pour résoudre des problèmes de commande types, irréversible du type « réactif A + réactif B → produit s C », le mode
proposés par la communauté internationale d’automatique, pour la opératoire consiste à :
commande robuste et adaptative de procédés pilotes, notamment un — préchauffer le solvant et éventuellement une partie des réactifs
bras souple [25], un système de transmission flexible [26], un chariot jusqu’à la température de la réaction à l’aide du fluide caloporteur ;
roulant sur poutre [37], un aérotherme [38], un réacteur chimique qui — maintenir la température du milieu réactionnel constante pen-
peut opérer en modes batch et semi-batch [39], et pour une étude de dant et après l’introduction des réactifs ;
la conduite automatique des véhicules [40]. — refroidir le mélange réactionnel à l’aide du fluide caloporteur.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 16 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

3 2
2 1
1
Amplitude Amplitude 0
0
–1 –1

–2 –2
0 50 100 150 0 50 100 150
t (s) t (s)
a référence et sortie du procédé a référence et sortie du procédé

2 2
0 0
–2 –2
Amplitude Amplitude
–4 –4
–6 –6
–8 –8
0 50 100 150 0 50 100 150
t (s) t (s)
b commande b commande

– 0,8 Paramètre a1 Paramètre a1


– 0,9
– 0,9
–1 –1
– 1,1
– 1,1
– 1,2
– 1,3 – 1,2
20 40 60 80 100 120 140 20 40 60 80 100 120 140
t (s) t (s)
0,1 0,08
Paramètre b0 Paramètre b0
0,08
0,06
0,06
0,04
0,04
0,02 0,02

0 0
0 50 100 150 0 50 100 150
t (s) t (s)
c évolution des paramètres estimés c évolution des paramètres estimés

système modèle estimé


0,2 Figure 16 – Commande prédictive adaptative robuste
avec modèle du premier ordre
0
bonne poursuite du profil de température de réaction. Ce dernier est
– 0,2
préalablement obtenu à partir d’une optimisation appropriée.
– 0,4 Le réacteur considéré est constitué d’un vase cylindrique en verre
Partie
entouré d’une double enveloppe dans laquelle circule un fluide calo-
imaginaire – 0,6 porteur à débit constant. Ce dernier permet de faire varier la tempéra-
– 0,8 ture de la masse réactionnelle en passant par deux échangeurs de
chaleur respectivement alimentés par une source froide et une source
–1 chaude à travers une vanne de répartition à trois voies et d’une pompe
de circulation. Le fluide réfrigérant utilisé est l’eau de ville. Le réacteur
– 1,2 est surmonté d’un condensateur, d’un agitateur à vitesse variable qui
–1 – 0,5 0 0,5 1 1,5 2
permet d’homogénéiser le contenu du réacteur, d’un dispositif d’ajout
Partie réelle
de réactifs et d’une sonde pour la mesure de la température du milieu
d lieux de Nyquist réactionnel. L’ensemble est relié à un micro-ordinateur IBM-PC à
travers une carte d’entrée-sortie, comme le montre la figure 19. Le
Figure 15 – Commande prédictive adaptative en présence réacteur peut fonctionner en mode batch ou en mode semi-batch.
de perturbations de charge, de dynamiques négligées, ■ Fonctionnement en mode batch : le réacteur est tout simplement
avec un modèle d’estimation du premier ordre rempli avec 1,5 L d’eau de ville que l’on préchauffe jusqu’à atteindre
une température donnée, puis on introduit 25 g de pastilles
Le changement de la dynamique du procédé est relativement d’hydroxyde de sodium NaOH (soude) pour changer la température
important pour justifier l’utilisation des techniques de commande du réacteur. La chaleur de dissolution de ce produit est approxima-
avancée pour assurer les performances requises, notamment une tivement – 11,9 kcal/mol.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 17
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

2 2

1
1
Amplitude Amplitude 0
0
–1

–1 –2
0 50 100 150 0 50 100 150
t (s) t (s)
a référence et sortie du procédé a référence et sortie du procédé

2 2
0 0
–2 –2
Amplitude Amplitude
–4 –4
–6 –6
–8 –8
0 50 100 150 0 50 100 150
t (s) t (s)
b commande b commande

système modèle estimé système modèle estimé


0,2 0,2

0 0

– 0,2 – 0,2

– 0,4 – 0,4
Partie Partie
imaginaire – 0,6 imaginaire – 0,6

– 0,8 – 0,8

–1 –1

– 1,2 – 1,2
– 0,5 0 0,5 1 1,5 2 – 0,5 0 0,5 1 1,5 2
Partie réelle Partie réelle
c lieux de Nyquist c lieux de Nyquist

Figure 17 – Commande prédictive adaptative robuste avec modèle Figure 18 – Commande prédictive adaptative robuste avec modèle
du second ordre, de structure na = 2, nb = 1 et d = 0 du second ordre, de structure na = 1, nb = 1 et d = 0

■ Fonctionnement en mode semi-batch : le réacteur est rempli avec


1,5 L d’eau de ville contenant 2,7 mol d’hydroxyde de potassium KOH
(potasse) que l’on préchauffe jusqu’à atteindre une température dési-
rée, puis l’on introduit 100 mL, d’acide sulfurique pendant 10 min en
maintenant la température du milieu réactionnel aussi constante que
possible. Il s’agit d’une réaction fortement exothermique entre la
potasse et l’acide sulfurique, soit 2 KOH + H2SO4 → K2SO4 + 2 H2O.
L’enthalpie d’une telle réaction est d’environ – 13,7 kcal/mol.
L’entrée et la sortie du système à commander sont respective-
ment l’ouverture de la vanne du fluide caloporteur et la température
du réacteur. La chaleur de la réaction est considérée comme une
perturbation d’état. Les expériences d’étalonnage requises de la
vanne ont montré qu’elle exhibe une caractéristique statique forte-
ment non linéaire avec une hystérésis relativement faible. Une
approximation de l’inverse de la non-linéarité a été utilisée pour
linéariser au mieux le comportement de la vanne dans la mesure où
cette dernière n’est pas asservie en débit. Le problème de
commande considéré est ainsi bien posé.
La démarche qui a été adoptée pour la résolution du problème de
commande considérée est relativement progressive. Elle consiste à
réaliser les étapes suivantes.
s1 Synthèse d’un système de commande PID à partir d’une
méthode basée sur le principe d’optimum symétrique [41]. Le choix
de cette méthode est particulièrement motivé par des considéra-
tions de simplicité d’autocalibrage dans la mesure où son modèle Figure 19 – Réacteur chimique

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 18 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

de synthèse est réduit au point de la réponse fréquentielle dont le


déphasage est de – 135°. En effet, ce dernier est obtenu par une
0 0
expérience appropriée de relais qui permet d’identifier les points de

Amplitude (dB)

Amplitude (dB)
la réponse fréquentielle qui se trouvent dans le troisième quadrant
– 20
du plan complexe [42]. La figure 20 montre le comportement – 10
entrée-sortie du réacteur en contre-réaction avec le relais dont – 40
l’amplitude et l’hystérésis sont automatiquement ajustées de – 20
manière à identifier le point de la réponse fréquentielle dont le – 60
déphasage est de – 135°. Une telle procédure a été proposée dans – 30
[35] pour l’autocalibrage des asservissements de position dans les 0 0,05 0,1 0,15 0 0,05 0,1 0,15
systèmes de manutention. Pulsation (rad/s) Pulsation (rad/s)
a sensibilité b sensibilité complémentaire

0
20

Amplitude (dB)

Amplitude (dB)
38,5 – 20
15
38 10
– 40
37,5 5
Amplitude
37 0 – 60
(°C)
36,5 –5
0 0,05 0,1 0,15 0 0,05 0,1 0,15
36 Pulsation (rad/s) Pulsation (rad/s)
0 2000 4000 6000 8000 10000
t (s) c sensibilité x régulateur d sensibilité x procédé
a température du réacteur

0,8 commande prédictive


commande PID
0,6
Figure 22 – Fonctions de sensibilité usuelles
Amplitude 0,4

0,2
s
2 Identification d’un modèle de commande du système compa-

0 tible avec les performances requises et sa validation aussi bien dans


le domaine temporel que dans le domaine fréquentiel. La figure 21
0 2000 4000 6000 8000 10000 montre les données d’entrée-sortie qui ont été utilisées pour l’iden-
t (s) tification du modèle de commande. Cette dernière a été effectuée
Amplitude = 0 : vanne complètement fermée avec une méthode des moindres carrés relativement élaborée pour
Amplitude = 1 : vanne complètement ouverte réaliser une bonne identification de la dynamique du réacteur dans
b ouverture de la vanne
la bande passante requise pour le système de commande, en
l’occurrence les données sont préalablement filtrées en fonction des
performances requises et normalisées pour des considérations de
Figure 20 – Expérience du relais robustesse numérique de l’algorithme d’identification.
s3 Synthèse d’un système de commande prédictive réalisant un
bon compromis performances-robustesse à partir d’un modelage
approprié des fonctions de sensibilité usuelles (figure 22).
s4 Commande autoajustable du réacteur : l’adaptation paramé-
50 trique est gelée avant la réaction. La spécification de paramètres de
synthèse est faite à partir de celle faite pour l’identification et la
45 synthèse du régulateur robuste. Ce dernier est particulièrement
utilisé comme un régulateur de repli pour la supervision.
Température
(°C) 40

Tableau 1 – Marges de robustesse et bandes d’atténuation


35
0 2000 4000 6000 8000 10000 12000 14000 16000
Méthodes de commande PID CP
t (s)
Marge de gain 10,68 10,32
0,8
Marge de phase 74,01 42,42
Ouverture 0,6 Marge de retard 175 141
de la vanne Marge de module 3,16 2,45
0,4
Bande d’atténuation 0,015 0,005
0,2 PID : proportionnel, intégral, différentiel
0 2000 4000 6000 8000 10000 12000 14000 16000 CP : commande prédictive
t (s)
La figure 23 montre les comportements d’entrée-sortie d’un
Figure 21 – Données d’entrée-sortie pour l’identification système de commande PID pour les fonctionnements en mode
du modèle de commande batch et semi-batch. Les performances semblent être relativement

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 19
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

Température (°C)

Température (°C)
50 50

45 45

40 40

35 35
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
t (s) t (s)
référence température réelle

1 1

Ouverture de

Ouverture de
0,8 0,8

la vanne

la vanne
0,6 0,6
0,4 0,4
0,2 0,2
0 0
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
t (s) t (s)

a mode batch b mode semi-batch

Figure 23 – Comportement d’entrée-sortie du réacteur. Commande avec PID

PID CP
4.2 Système de transmission flexible
0,5
Le système de transmission flexible est composé de trois poulies
0 reliées par deux courroies métalliques comportant chacune deux
ressorts (figure 27). Le mouvement de la première poulie est généré
– 0,5 par un moteur à courant continu qui est localement asservi en posi-
tion et en vitesse par un régulateur PD analogique. Ce dernier est
Partie –1 conçu de manière à ce que la bande passante du système de
imaginaire
commande correspondant soit relativement large pour qu’il puisse
– 1,5
être considéré comme un simple gain statique par rapport au
–2 système de transmission flexible. L’inertie de la troisième poulie
peut être modifiée en y ajoutant des masses. Les positions des
– 2,5 poulies sont mesurées par de simples potentiomètres. Le problème
de commande considéré est celui de l’asservissement en position
–3 de la troisième poulie à partir de la position de la première poulie
– 1,5 –1 – 0,5 0 0,5 indépendamment de la flexibilité du système de transmission et des
Partie réelle variations d’inertie de la troisième poulie. L’entrée et la sortie du
système à commander sont donc respectivement la séquence de
Figure 24 – Gains en boucle ouverte des systèmes de commande référence du système de commande du moteur à courant continu et
la position de la troisième poulie.
bonnes pour justifier largement l’utilisation d’un système de Deux approches ont été utilisées pour traiter le problème de
commande PID pour la réalisation des profils de température requis commande considéré :
lorsque les bruits de mesures de la température de réaction sont — utilisation d’un régulateur robuste vis-à-vis des variations
suffisamment faibles. En effet, la commande PID est intrinsèquement d’inertie de la troisième poulie ;
sensible aux bruits de mesures : la figure 22 montre clairement que — utilisation d’une adaptation paramétrique appropriée pour
le gain de la fonction usuelle sensibilité régulateur est relativement préserver les performances du système de commande vis-à-vis des
important en haute fréquence, malgré les bonnes marges de robus- variations d’inertie.
tesse du système de commande PID (tableau 1, figure 24). Pour mettre en évidence les performances des solutions propo-
sées, trois configurations ont été considérées en fonction de
Les figures 25 et 26 montrent le comportement d’entrée-sortie du
l’inertie de la troisième poulie :
système de commande prédictive et sa version autoajustable en
— aucune modification de l’inertie de la troisième poulie ;
modes batch et semi-batch. La fonction d’autoajustement a été faite
— ajout d’une masse de 1 800 g sur la troisième poulie ;
à partir d’une identification préalable en boucle ouverte utilisant une
— ajout d’une masse de 3 600 g sur la troisième poulie.
séquence binaire pseudo-aléatoire suivie d’une adaptation des
paramètres en boucle fermée qui a été automatiquement gelée juste La figure 28 montre les réponses fréquentielles correspondant
avant la réaction. La faisabilité de la commande prédictive des réac- aux trois configurations considérées. La flexibilité du système de
teurs exothermiques parfaitement agités opérant en mode batch et transmission et l’influence des variations d’inertie sur sa dynamique
semi-batch a été ainsi démontrée. sont clairement mises en évidence. Ces réponses fréquentielles ont
été obtenues par des expériences d’identification en boucle ouverte
réalisées à partir d’une approche expérimentale pour l’identification
On retiendra qu’un système de commande PID est très sensi- des systèmes développée sous SIMART. La séquence binaire
ble aux bruits de mesure, aussi bonnes ses marges de robus- pseudo-aléatoire est judicieusement choisie pour permettre au
tesse soient-elles. système d’exhiber ses modes d’oscillation.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 20 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES
Température (°C)

Température (°C)
50 50

45 45

40 40

35 35
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
t (s) t (s)
référence température réelle

1 1
Ouverture de

Ouverture de
0,8 0,8
la vanne

la vanne
0,6 0,6
0,4 0,4
0,2 0,2
0 0
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
t (s) t (s)

a mode batch b mode semi-batch

Figure 25 – Commande prédictive


Température (°C)

Température (°C)

50 50

45 45

40 40

35 35
0 2000 4000 6000 8000 10000 12000 0 2000 4000 6000 8000 10000 12000
t (s) t (s)
référence température réelle

1 1
Ouverture de

Ouverture de

0,8 0,8
la vanne

la vanne

0,6 0,6
0,4 0,4
0,2 0,2

0 2000 4000 6000 8000 10000 12000 0 2000 4000 6000 8000 10000 12000
t (s) t (s)

a mode batch b mode semi-batch

Figure 26 – Commande prédictive autoajustable

Les deux approches de commande ont été élaborées à partir de la


commande linéaire quadratique gaussienne et sa version adapta-
tive. L’adaptation paramétrique a été faite avec un algorithme de
moindres carrés incorporant toutes les mesures requises par la
robustesse des algorithmes de commande adaptative, en l’occur-
rence le filtrage des données d’entrée-sortie, la régularisation du
gain d’adaptation et le gel de l’adaptation paramétrique quand la
condition d’excitation persistante des signaux d’entrée-sortie n’est
plus satisfaite. Les performances des systèmes de commande asso-
ciés ont été spécifiées à partir du comportement d’entrée-sortie, de
contraintes sur les marges de module et du retard et sur la bande
d’atténuation, et des formes des fonctions de sensibilité usuelles.
Ces dernières permettent de mettre en évidence les performances
Figure 27 – Système de transmission flexible du système de commande en présence de perturbations d’états, de
bruit de mesure et de dynamiques négligées.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 21
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

40
3

Amplitude (dB)
20 Référence et sortie du procédé

Amplitude (V)
2
0
1
– 20
0
– 40
–1
– 60
0 5 10 15 20 25 30 35 40 45 –2
Pulsation (rad/s) 0 5 10 15 20 25 30 35
t (s)
0 2
Commande

Amplitude (V)
– 200
1

Phase (°)
– 400 0
– 600 –1
– 800 –2
0 5 10 15 20 25 30 35 40 45 0 5 10 15 20 25 30 35
Pulsation (rad/s) t (s)
aucune masse ajoutée a aucune modification sur la troisième poulie
ajout d'une masse de 1 800 g
ajout d'une masse de 3 600 g
3
Référence et sortie du procédé

Amplitude (V)
Figure 28 – Réponses fréquentielles 2
1
0

La figure 29 montre le comportement entrée-sortie d’une –1


commande robuste avec modèle de référence sur l’état partiel pour –2
les trois configurations. La synthèse du système de commande a été 0 5 10 15 20 25 30 35
faite avec le modèle identifié pour la seconde configuration, ce qui t (s)
explique les bonnes performances obtenues pour celle-ci. La figure 2
30 montre les différentes fonctions de sensibilité des systèmes de Commande

Amplitude (V)
commande correspondant aux trois configurations considérées. La 1
capacité de poursuite des systèmes de commande robuste est illus-
0
trée par la figure 31 ; les courbes ont été obtenues à partir d’expé-
riences en temps réel avec une séquence de référence hétéroclite. –1
La figure 32 montre les performances d’une commande autoajus-
table avec modèle de référence sur l’état partiel pour les trois confi- –2
0 5 10 15 20 25 30 35
gurations. Les performances sont relativement meilleures par t (s)
rapport à celles obtenues avec la commande robuste. Les figures 33
b 1 800 g sur la troisième poulie
et 34 montrent les performances d’une commande adaptative, en
l’occurrence le comportement d’entrée-sortie et l’évolution de
quatre paramètres estimés. On passe de la deuxième à la première 3
configuration autour de l’instant t = 37,5 s. Le choix d’une séquence Référence et sortie du procédé

Amplitude (V)
de référence sinusoïdale est motivé par le souci de mettre en 2
évidence la capacité d’adaptation du système de commande dans 1
un contexte qui n’est pas relativement favorable à une bonne esti-
0
mation de paramètres.
–1
–2
0 5 10 15 20 25 30 35
t (s)
5. Conclusion 2
Commande

Amplitude (V)
1
L’objectif de cet article était de faire un tour d’horizon sur la 0
commande adaptative à partir d’une lecture d’ingénieur de la litté-
rature sur le domaine. Une structure générale du système de –1
commande sous-jacent a été utilisée pour ce faire. Les méthodes
de synthèse communément utilisées ont été présentées d’une –2
0 5 10 15 20 25 30 35
manière unifiée à partir d’un objectif de commande optimale à
t (s)
l’horizon fuyant. Le concept de modèle de référence sur l’état
partiel a été utilisé pour pouvoir spécifier les dynamiques de pour- c 3 600 g sur la troisième poulie
suite et de régulation d’une manière indépendante. Des quantifi-
cateurs de performances nominales et de stabilité robuste ont été
définis à partir des fonctions de sensibilité usuelles des systèmes Figure 29 – Commande robuste

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 22 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

1,5
10 20 Référence et sortie du procédé

Amplitude (V)
1
0
Amplitude (dB)

Amplitude (dB)
0 0,5
– 20 0
– 10
– 40 – 0,5
– 20 – 60 –1
0 5 10 15 20 25 30 35 40
– 30 – 80 t (s)
0 10 20 30 40 0 10 20 30 40
Pulsation (rad/s) Pulsation (rad/s) 1,5
Commande

Amplitude (V)
1
a sensibilité b sensibilité complémentaire
0,5
0

10 20 – 0,5

0 –1
Amplitude (dB)

Amplitude (dB)

0 0 5 10 15 20 25 30 35 40
– 10 t (s)
– 20 a aucune modification sur la troisième poulie
– 20
– 30 – 40
1,5
– 40 – 60 Amplitude (V) Référence et sortie du procédé
0 10 20 30 40 0 10 20 30 40 1
Pulsation (rad/s) Pulsation (rad/s) 0,5
0
c sensibilité x régulateur d sensibilité x procédé
– 0,5
–1
aucune masse ajoutée 0 5 10 15 20 25 30 35 40
ajout d'une masse de 1 800 g t (s)
ajout d'une masse de 3 600 g 1,5
Commande
Amplitude (V)

1
0,5
Figure 30 – Fonctions de sensibilité usuelles
0
– 0,5

de commande linéaire. Un algorithme d’adaptation paramétrique –1


0 5 10 15 20 25 30 35 40
approprié pour obtenir un système de commande adaptative
t (s)
prudente a été présenté. On peut ainsi faire de l’autoajustement de
régulateurs ou du calibrage automatique des régulateurs si besoin b 1 800 g sur la troisième poulie
est sous une certaine logique de supervision conçue pour assurer
l’intégrité du système de commande. 1,5
Référence et sortie du procédé
Un ensemble de résultats de simulation a été présenté pour 1
Amplitude (V)

mieux appréhender le comportement des algorithmes d’adaptation 0,5


paramétrique en présence de bruits de mesure, de perturbations
d’état et de dynamiques négligées. Ces résultats ont été obtenus 0
avec des algorithmes de commande prédictive adaptative à partir – 0,5
d’un exemple académique relativement populaire dans la commu-
nauté de la commande adaptative. Ce dernier a été utilisé par des –1
0 5 10 15 20 25 30 35 40
chercheurs du MIT pour illustrer le fait que les systèmes de
t (s)
commande adaptative peuvent perdre la robustesse du fait même
1,5
de l’adaptation paramétrique effectuée. Les aspects fondamentaux
Commande
d’une synthèse d’un système de commande adaptative qui se 1
Amplitude (V)

respecte ont été particulièrement mis en évidence, notamment un


0,5
filtrage préalable des signaux d’entrée-sortie, une bonne initialisa-
tion des algorithmes d’adaptation paramétrique et le gel de l’adap- 0
tation paramétrique quand l’information courante n’est pas suffi- – 0,5
samment riche pour affiner la précision du modèle estimé.
–1
Deux applications ont été présentées pour démontrer l’applicabi- 0 5 10 15 20 25 30 35 40
lité des techniques de commande adaptative à un réacteur chimique t (s)
et à un système de transmission flexible. Les performances ont été c 3 600 g sur la troisième poulie
données aussi bien dans le domaine temporel à partir du comporte-
ment d’entrée-sortie du système de commande, que dans le
domaine fréquentiel en termes des fonctions de sensibilité usuelles. Figure 31 – Capacité de poursuite

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 23
COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

3 2
Référence et sortie du procédé

Amplitude (V)
Amplitude (V)
2 1
1
0
0
–1
–1
–2 –2
0 10 20 30 40 50 60 0 10 20 30 40 50 60
t (s) t (s) 37,5 s
2 a référence et sortie du procédé
Commande

Amplitude (V)
1 1

Amplitude (V)
0 0,5

–1 0

–2 – 0,5
0 10 20 30 40 50 60
t (s) –1
0 10 20 30 40 50 60
a aucune modification sur la troisième poulie
t (s) 37,5 s
b commande
3
Référence et sortie du procédé

Amplitude (V)
2
Figure 33 – Capacité d’adaptation
1
0
–1 4
–2
0 10 20 30 40 50 60 3
t (s)
2 2
Commande
Amplitude (V)

1
1
0
0
–1

–2 –1
0 10 20 30 40 50 60
t (s) –2
b 1 800 g sur la troisième poulie
–3
0 10 20 30 40 50 60
3
Référence et sortie du procédé t (s) 37,5 s
Amplitude (V)

2
Figure 34 – Variation des paramètres estimés A1, A2, B1 et B2
1
0
–1
–2
0 10 20 30 40 50 60
t (s)
2
Commande
Amplitude (V)

–1

–2
0 10 20 30 40 50 60
t (s)
c 3 600 g sur la troisième poulie

Figure 32 – Commande adaptative

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 24 © Techniques de l’Ingénieur, traité Informatique industrielle
_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

Références bibliographiques

[1] LJUNG (L.). – System Identification, Theory tems. chap. « Techniques in discrete-time cation and control » p. 111-151, 1993
for the User. 1987, Prentice-Hall, London. robust adaptive control », 1993 Academic Birkhauser, Boston.
[2] LANDAU (I.-D.), LOZANO (R.) et M’SAAD Press. [31] VAN DEN HOF (P.M.J.) et SCHRAMA (R.J.P.). –
(M.). – Adaptive Control. 1997 Communi- [17] CLARKE (D.-W.). – Advances in Model-Based Identification and control-closed-loop issues.
cations and Control Engineering Series, Predictive Control. chap. « Advances in Automatica 31 (12), 1995, p. 1751-1770.
Springer. model-based predictive control » p. 3-21. [32] DE LARMINAT (P.). – Commande adaptive :
[3] ASTRÖM (K.-J.) et WITTENMARK (B.). – 1994 Oxford University Press. Aspects Pratiques et Théoriques. chap.
Computed Controlled Systems : Theory and [18] BENDOTTI (P.). – Commande adaptive avec « Une solution robuste au problème de la
Design. 1997 Prentice Hall Englewood Cliffs, prise en compte des connaissances a priori. stabilité dans la commande adaptative indi-
New Jersey. 1992 Phd thesis Institut national polytechni- recte passive » 1986 Masson, Paris.
[4] ANDERSON (B.D.O.) et MOORE (J.). – Opti- que de Grenoble. [33] GIRI (F.), M’SAAD (M.), DION (J.-M.) et
mal control : Linear Quadratic Methods. [19] FERRERES (G.). – De l’utilisation des outils de DUGARD (L.). – On the robustness of discrete
1990, Prentice-Hall Englewood Cliffs, New robustesse pour la commande adaptative. time indirect adaptive (linear) controllers)
Jersey. 1995 Phd thesis Institut national polytechni- Automatica 27, 1, 1991, p. 153-160.
[5] BITMEAD (R.-R.), GEVERS (M.) et WERTZ (V.). que de Grenoble.
[34] ROHRS (C.), VALAVANI (L.), ATHANS (M.) et
– Adaptive Optimal Control : The Thinking [20] M’SAAD (M.) et CHEBASSIER (J.). – Com- STEIN (G.). – Robustness of adaptive control
Man’s Generalized Predictive Control. 1990 mande optimale. chap. « Commande prédic- algorithms in the presence of unmodelled
Prentice-Hall International Englewood Cliffs, tive des systèmes » p. 2-67, Coordinateurs dynamics. IEEE Trans. Auto. Control AC-30,
New Jersey. DION (J.-M.) et POPESCU (V.) 1996 Diderot 1985, p. 881-889.
[6] GREEN (M.) et LIMEBEER (D.J.N.). – Robust Editeur, Arts et Sciences.
[35] SCHMIDT (L.) et M’SAAD (M.). – On the auto-
Linear Control. 1995 Prentice-Hall, Englewood [21] CLARKE (D.-W.) et MOTHADI (C.). – Proper- tuning of position control in handling sys-
Cliffs, New Jersey. ties of the generalized predictive control. tems. Proceedings of the 4th IFAC
[7] GOODWIN (G.-C.) et SIN (K.-S.). – Adaptive Automatica 25, 6, 1989, p. 859-875. Symposium on Adaptive Systems in Control
Filtering Prediction and Control. 1984 Pren- [22] M’SAAD (M.) et SANCHEZ (G.). – Partial state and Signal Processing 1992 Grenoble.
tice-Hall, Englewood Cliffs, New Jersey. reference model adaptive control of multiva- [36] M’SAAD (M.) et CHEBASSIER (J.). – Simart :
[8] ASTRÖM (K.-J.) et WITTENMARK (B.). – riable systems. Automatica 28, 1992, p. 1189- un progiciel pour l’automatique et ses appli-
Adaptive Control. 1995 Addison-Wesley New 1192. cations. Proceedings des journées d’études
York. [23] EGARDT (B.). – Stability of Adaptive Control- sur les logiciels 1997 Nancy.
[9] SASTRY (S.-S.) et BODSON (M.). – Adaptive lers. 1979, Springer Verlag, Berlin. [37] M’SAAD (M.) et CHEBASSIER (J.). – Partial
Control : Stability, Convergence and Robus- [24] CLARKE (D.-W.) et GAWTHROP (P.-J.). – Self- state reference model predictive control : ite-
tness. 1989 Prentice-Hall, Englewood Cliffs, tuning control. Proceedings of IEE, Pt. D 126, rative performance enhancement and an
New Jersey. 1979, p. 633-640. experimental evaluation. Proceedings of the
[10] NARENDRA (K.-S.) et ANNASWAMY (A.-M.). [25] M’SAAD (M.), HAMMAD (S.) et DUGARD (L.). 9th Conference of Yale, New Haven,
– Stable Adaptive Systems. 1989 Prentice- – A suitable generalized predictive adaptive Connecticut.
Hall, Englewood Cliffs, New Jersey. controller-case study : control of flexible [38] CHEBASSIER (J.), M’SAAD (M.) et ZANOLO
[11] IOANNOU (P.A.) et SUN (J.). – Stable and arm. Automatica 29, 3, 1993, p. 589-608. (E.). – Advanced control using a programma-
Robust Adaptive Control. 1996 Prentice-Hall, [26] M’SAAD (M.) et HEJDA (I.). – On adaptive ble logical controller. Proceedings of the
Englewood Cliffs, New Jersey. control of flexible transmission system. IFAC-SICICA 1997 Annecy.
[12] ORTEGA (R.) et SPONG (M.). – Adaptive Control Engineering Practice 2, 4, 1994, [39] M’SAAD (M.), MIKLOVICOVA (E.), HEJDA (I.)
motion control-a tutorial. Automatica 25 6, p. 629-639. et LATIFI (M.). – Partial state reference model
1989, p. 877-898. [27] M’SAAD (M.) et HEJDA (I.). – Partial state control of a chemical reactors. Proceedings
[13] FUCHS (J.-J.). – Indirect stochastic adaptive reference model (adaptive) control of a ben- of the 35th IEEE Conference on Decision and
control : the general delay-colored noise chmark example. Automatica 30, 1994, Control 1996 Kobe, Japan.
case. IEEE Trans. Auto. Control AC-27, 1982, p. 605-614. [40] M’SAAD (M.), MUELLER (N.) et RAMIREZ-
p. 470-472. [28] NAJIM (K.), NAJIM (M.) et YOULAL (H.). – MENDOZA (R.-A.). – Robust predictive
[14] SAMSON (C.). – Stability analysis of adapti- Self tuning control of an industrial phos- control design for automatic steering. Pro-
vely controlled systems subject to bounded phate dry process. Optimal Control Appli- ceedings of the European Control Confer-
disturbances. Automatica 19, 1983, p. 81-86. cations and Methods 3, 1982, p. 435-442. ence 1997 Bruxelles.
[15] GIRI (F.), M’SAAD (M.), DION (J.-M.) et [29] PRALY (L.). – Almost exact modelling [41] VODA (A.) et LANDAU (I.-D.). – A method for
DUGARD (L.). – A general lemma for the sta- assumption in adaptive control. Int. J. of the auto-calibration of pid controllers. Auto-
bility analysis of discrete-time adaptive Control 51, 3, 1990, p. 643-668. matica 31, 1, 1996, p. 41-54.
control. Int. J. Control 51, 2, 1990, p. 283-288. [30] GEVERS (M.). – Essays on Control : Perspec- [42] ASTRÖM (K.-J.) et HÄGGLUND (T.). – PID
[16] M’SAAD (M.), GIRI (F.), DION (J.-M.) et tives in the Theory and its Applications. Controllers : Theory, Design and Tunning.
DUGARD (L.). – Control and Dynamical Sys- chap. « Towards a joint design of identifi- 1995 Instrument Society of America.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 25

Vous aimerez peut-être aussi