Vous êtes sur la page 1sur 123

AU TO M AT I Q U E - R O B OT I Q U E

Ti660 - Automatique et ingénierie système

Régulation et commande
des systèmes asservis

Réf. Internet : 42394

Actualisation permanente sur


www.techniques-ingenieur.fr
Tec h n ique s de l ’I n gé ni eur
La plus impor tante ressource documentaire scientifique
et technique en français

Une information fiable, claire et actualisée


Validés par un comité scientifique et mis à jour en permanence sur Internet,
les articles Techniques de l’Ingénieur s’adressent à tous les ingénieurs et
scientifiques, en poste ou en formation.
Outil d’accompagnement de la formation et de la carrière des ingénieurs,
les ressources documentaires Techniques de l’Ingénieur constituent le socle
commun de connaissances des acteurs de la recherche et de l’industrie.

Les meilleurs experts techniques et scientifiques


Plus de 200 conseillers scientifiques et 3 500 auteurs, industriels, chercheurs,
professeurs collaborent pour faire de Techniques de l’Ingénieur l’éditeur
scientifique et technique de référence.
Les meilleurs spécialistes sont réunis pour constituer une base de
connaissances inégalée, vous former et vous accompagner dans vos projets.

Une collection 100 % en ligne


• Accessibles sur www.techniques-ingenieur.fr, les dernières nouveautés et
actualisations de votre ressource documentaire
• Les articles téléchargeables en version PDF

Des services associés


Rendez-vous sur votre espace « Mon compte » en ligne pour retrouver la liste
des services associés à vos droits d’accès et les utiliser.

 Des services associés


Pour toute information, le service clientèle reste à votre disposition :
Tél : 01 53 35 20 20 l Fax : 01 53 26 79 18 l Mail : infos.clients@teching.com

III
Cet ouvrage fait par tie de
Automatique et ingénierie système
(Réf. Internet ti660)
composé de  :

Modélisation et analyse de systèmes asservis Réf. Internet : 42391

Régulation et commande des systèmes asservis Réf. Internet : 42394

Automatique avancée Réf. Internet : 42393

Automatique séquentielle Réf. Internet : 42395

Supervision des systèmes industriels Réf. Internet : 42396

Systèmes d'information et de communication Réf. Internet : 42397

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires

IV
Cet ouvrage fait par tie de
Automatique et ingénierie système
(Réf. Internet ti660)

dont les exper ts scientifiques sont  :

Pierre VIDAL
Professeur honoraire des universités

Chékib GHARBI
Directeur du Centre d'Innovation des Technologies sans Contact (CITC
EuraRFID), Lille

Christian TAHON
Professeur à l'Université de Valenciennes et du Hainaut Cambrésis (UVHC)

Étienne DOMBRE
Directeur de Recherche Émérite du CNRS au LIRMM, UMR 5506 Université
Montpellier-CNRS

Éric BONJOUR
Professeur à l'université de Lorraine / ENSGSI, Vice-président Enseignement
-Recherche de l'AFIS

Dominique LUZEAUX
Ingénieur général de l'armement, HDR

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires

V
Les auteurs ayant contribué à cet ouvrage sont :

Gérard ALENGRIN Yassine HADDAB Nathalie PERROT


Pour l’article : R7420 Pour l’article : S7460 Pour l’article : S7437

Alina BESANÇON-VODA Daniel HISSEL Isabelle QUEINNEC


Pour l’article : R7416 Pour les articles : S7440 – S7441 Pour l’article : S7436

Jean-Marc BIANNIC Joseph HOSSENLOPP Jacques RICHALET


Pour les articles : R7433 – S7435 Pour l’article : S7437 Pour les articles : S7424 – S7425

Pierre BORNE Dominique JACOB Frédéric ROTELLA


Pour les articles : R7427 – S7462 Pour les articles : S7418 – Pour les articles : R7427 – S7450
S7419 – S7421
François CARRÈRE Pierre ROUCHON
Pour l’article : R7432 Bernard LANG Pour l’article : S7430
Pour l’article : S7460
Mohammed CHADLI Michel ROUX
Pour l’article : S7462 Guillaume LAURENT Pour l’article : S8095
Pour l’article : S7460
Joël CHEBASSIER Sophie TARBOURIECH
Pour l’article : S7426 Guy LAVIELLE Pour l’article : S7436
Pour les articles : S7424 – S7425
Corinne CURT Michel THOLOMIER
Pour l’article : S7437 Jean LÉVINE Pour les articles : S7440 – S7441
Pour l’article : S7430
Gilles DUC André TITLI
Pour l’article : R7432 Mohammed M'SAAD Pour les articles : S7440 – S7441
Pour l’article : S7426
Stéphane FONT Gilles TRYSTRAM
Pour l’article : R7432 Joëlle MALLET Pour l’article : S7437
Pour les articles : S7424 – S7425
André FOSSARD Irène ZAMBETTAKIS
Pour l’article : S7435 Pascal MAUSSION Pour l’article : S7450
Pour les articles : S7440 – S7441
Sylviane GENTIL Jean-Camille de BARROS
Pour l’article : R7416 Marcel NOUGARET Pour les articles : S7440 – S7441
Pour les articles : R7405 – R7410

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires

VI
Régulation et commande des systèmes asservis
(Réf. Internet 42394)

SOMMAIRE

1– Régulation Réf. Internet page

Principes généraux de correction R7405 11

Correction fréquentielle analogique R7410 15

Régulateurs PID analogiques et numériques R7416 19

Applications de la commande PID. Asservissement température et position S7418 25

Applications de la commande PID. Asservissement température et position S7419 31

Modèles simpliiés des systèmes apériodiques pour leur commande PID. Réglage à S7421 33
partir d'un essai indiciel
Méthodes de synthèse de correcteurs numériques R7420 39

2– Commande Réf. Internet page

La commande prédictive : modélisation S7424 45

Commande prédictive S7425 51

Commande adaptative des systèmes S7426 61

Commande optimale R7427 67

Systèmes dynamiques et commande S7430 71

Commande fréquentielle robuste. Application aux paliers magnétiques R7432 75

Commande modale. Application au pilotage d'un avion R7433 77

Commande en régime glissant S7435 85

Tour d'horizon sur les techniques anti-windup pour les systèmes saturés. Commande S7436 91
anti-windup
Aide au pilotage  : application agroalimentaire S7437 95

Systèmes et régulateurs lous. Déinition et cognition S7440 99

Systèmes et régulateurs lous. Applications S7441 103

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires

VII
Commande des systèmes par platitude S7450 107

Matlab/Simulink pour l'analyse et la commande de systèmes S7460 111

Multimodèles : analyse et synthèse. Commande et observation des modèles Takagi- S7462 115
Sugeno
Cahier des charges des automatismes. Analyse fonctionnelle S8095 119

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires
Régulation et commande des systèmes asservis
(Réf. Internet 42394)


1– Régulation Réf. Internet page

Principes généraux de correction R7405 11

Correction fréquentielle analogique R7410 15

Régulateurs PID analogiques et numériques R7416 19

Applications de la commande PID. Asservissement température et position S7418 25

Applications de la commande PID. Asservissement température et position S7419 31

Modèles simpliiés des systèmes apériodiques pour leur commande PID. Réglage à S7421 33
partir d'un essai indiciel
Méthodes de synthèse de correcteurs numériques R7420 39

2– Commande

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires


QP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTPU

Principes généraux de correction

par Marcel NOUGARET



Professeur à l’Université de Grenoble, Laboratoire d’Automatique

1. Définition.................................................................................................... R 7 405 - 2
1.1 Le correcteur ................................................................................................ — 2
1.2 But de la correction ..................................................................................... — 2
2. Spécifications ........................................................................................... — 2
2.1 Spécifications temporelles.......................................................................... — 2
2.2 Spécifications fréquentielles....................................................................... — 2
2.3 Équivalence des spécifications temporelles ou fréquentielles ................ — 2
2.4 Précision ....................................................................................................... — 3
3. Structure des correcteurs ..................................................................... — 4
3.1 Fonctions de transfert des correcteurs ...................................................... — 4
3.2 Structure de commande ............................................................................. — 4
3.3 Terminologie usuelle ................................................................................... — 4
4. Correction des procédés à dominante du premier ordre ............. — 4
4.1 Limitations pratiques du réglage par un gain ........................................... — 5
4.1.1 Calculs théoriques .............................................................................. — 5
4.1.2 Conséquence de l’existence d’une petite constante de temps,
négligée précédemment .................................................................... — 6
4.2 Correcteur passe-bas................................................................................... — 6
4.3 Correcteur proportionnel et intégral (PI) ................................................... — 7
5. Correction des procédés à dominante du deuxième ordre.......... — 7
5.1 Correcteur PI pour un deuxième ordre ...................................................... — 8
5.2 Correcteur PID pour un deuxième ordre ................................................... — 9
5.2.1 Diverses formes .................................................................................. — 9
5.2.2 Réglages d’un PID pour un deuxième ordre .................................... — 9
5.2.3 Remarque : réglages pour un troisième ordre................................. — 9
6. Amortissement par retour dérivé........................................................ — 10
6.1 Modification d’un premier ordre par retour dérivé .................................. — 10
6.2 Retour dérivé sur procédé du deuxième ordre ......................................... — 10
7. Correction par placement des pôles .................................................. — 11
7.1 Procédé du deuxième ordre ....................................................................... — 11
7.2 Exemple........................................................................................................ — 11
Références bibliographiques ......................................................................... — 12

a sortie du procédé que l’on commande doit évoluer pour suivre la consigne
L demandée. Il faut donc à tout instant (ou périodiquement en régulation
numérique) appliquer, à l’entrée puissance du procédé, la commande appropriée.
Cette commande est calculée par un ensemble de traitements d’informations,
le correcteur, qui utilise des opérateurs (sommateurs, gains, intégrateurs,
dérivateurs) élaborant la commande à partir du signal d’erreur et des mesures
auxiliaires disponibles.
p。イオエゥッョ@Z@。カイゥャ@QYXT

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 405 − 1

QQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTPU

PRINCIPES GÉNÉRAUX DE CORRECTION ____________________________________________________________________________________________________

Notations et Symboles 2. Spécifications


Symbole Définition
Les spécifications sont formulées dans le domaine temporel ou
dans le domaine fréquentiel, avec des règles simples d’équivalence
F (p) fonction de transfert entre ces deux domaines.
g gain statique de l’ensemble : actionneur, Elles concernent trois aspects :


procédé, capteur
K gain statique du correcteur — la précision en régime établi (erreurs de position, de vitesse) ;
— la rapidité (temps de réponse, bande passante) ;
p variable de Laplace
— l’allure de la réponse (régime transitoire peu oscillant, courbe
Q facteur de résonance en boucle fermée de réponse en fréquence plate).
R (p) référence ou consigne
S (p) signal de sortie du capteur
Ti constante de temps de l’intégrateur
Td constante de temps du dérivateur
2.1 Spécifications temporelles
tr temps de réponse à 5 %
Tout système linéaire donne une réponse qui est la somme de
u (p) commande réponses élémentaires du premier ou du deuxième ordre. Les modes
z amortissement d’un système rapides disparaissant les premiers, l’essentiel de la réponse dépend
du deuxième ordre en général du mode le plus lent, qui peut être soit un premier ordre,
α coefficient du correcteur passe-bas soit un deuxième ordre. Il en résulte que les systèmes physiques,
ε0 erreur statique sur l’échelon même compliqués, ont très souvent une allure de réponse à domi-
∆τ petite constante de temps nante du premier ordre ou à dominante du deuxième ordre. On
τ constante de temps s’efforce donc usuellement d’obtenir d’un système asservi, quelle
τa constante de temps apparente que soit sa complexité, qu’il puisse ressembler soit à un premier
ωc pulsation de cassure ordre, soit à un deuxième ordre ; d’où les deux types fondamentaux
ωn pulsation naturelle d’un système de réponse suivants (tableau 1).
du deuxième ordre ■ Premier ordre : l’erreur s’atténue exponentiellement. Si τ est la
ωr pulsation de résonance constante de temps, le temps de réponse à 5 % est :
tr = 3τ
Nota : le temps de réponse à 5 % est défini comme le temps à partir duquel le signal

1. Définition pénètre et demeure à l’intérieur d’une bande de ± 5 % de la valeur asymptotique finale,


bande centrée sur cette valeur.

■ Deuxième ordre (amortissement z ; pulsation naturelle ω n ) :


1.1 Le correcteur l’allure de la réponse varie avec l’amortissement. On a coutume de
prendre z = 0,43 ; trois raisons à ce choix :
Sans mettre en jeu d’énergie appréciable, le correcteur constitue — tout d’abord, une formule simple donne le temps de réponse
la partie « intelligente » de l’asservissement et sa détermination à5%:
judicieuse confère à l’asservissement ses qualités. Aisé à modifier, tr = 2π/0,9ωn
le correcteur peut être muni d’une variation automatique de ses para-
mètres suivant la plage de fonctionnement du procédé, dans le cas — d’autre part, les erreurs de traînage sont plus faibles que pour
où celle-ci évolue lentement. z = 0,7 (qui donnerait le temps de réponse théorique minimal) ;
— enfin le temps de réponse pratique est voisin de celui que l’on
obtiendrait pour z = 0,7.

1.2 But de la correction


Le concepteur de l’asservissement rencontre deux types de
2.2 Spécifications fréquentielles
situations, auxquelles il doit faire face :
Elles peuvent être données directement :
— assurer une réponse acceptable pour des signaux de consigne
définis en fonction du temps (par exemple : cycle de température — bande passante à – 3 dB ou – 6 dB pour l’asservissement ;
pour un traitement thermique) ; — coefficient de surtension Q dB (aussi appelé facteur de
— fournir des caractéristiques fréquentielles (gain, déphasage) résonance) ;
demandées dans une bande de fréquences (par exemple : asservis- — pulsation ou fréquence de résonance.
sement du mouvement d’un haut-parleur dans un système haute Elles peuvent également être indiquées en référence à des filtres
fidélité). standards (ou réponses standards) du premier ou du deuxième ordre
On impose les qualités de l’asservissement en termes de spéci- (§ 2.3).
fications temporelles dans le premier cas, en spécifications fréquen-
tielles dans le second cas.
Le but de la correction est de doter l’asservissement des qualités 2.3 Équivalence des spécifications
attendues, par le calcul et l’implantation du correcteur nécessaire. temporelles ou fréquentielles
Les opérateurs essentiels du correcteur sont réalisables à partir
d’amplificateurs à courant continu et d’éléments résistances/capa- Le double aspect, fréquentiel ou temporel, est sous-jacent dans
cités. La réalisation numérique peut se transposer aisément à partir l’étude d’un asservissement et il est important de pouvoir aller alter-
d’un schéma analogique, en conservant la même organisation fonc- nativement de l’un à l’autre.
tionnelle et en associant un intégrateur numérique à chaque
intégrateur électronique. (0)

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 405 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

QR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTPU

___________________________________________________________________________________________________ PRINCIPES GÉNÉRAUX DE CORRECTION

Tableau 1 – Équivalence temps-fréquence


Systèmes du premier ordre
1
Fonction de transfert F ( p ) = ------------------
1 + τp
Temps Fréquence

réponse indicielle 3 π réponse en fréquence (plan de Bode)


tr temps de réponse à 5 % tr ≈ 3τ ≈ -------
ω
- ≈ --------
ω ωc pulsation de cassure : ωc = 1/ τ
s (t ) sortie c c

Systèmes du deuxième ordre


1
Fonction de transfert F ( p ) = ---------------------------------------
p p2
1 + 2z ------- + -------2-
ωn ω n

Temps Fréquence

réponse en fréquence (plan de Bode)


réponse indicielle (z = 0,43) pour z = 0,43, Q = 2,3 dB
ω p = ω n 1 – z 2 pulsation propre t r ≈ 2π/ω r Q coefficient de surtension
ωn pulsation naturelle ωr pulsation de résonance : ω r = ω n 1 – 2z 2

Les systèmes du premier et du deuxième ordre servent encore Le tableau 1 résume ces relations de passage, qui au sens strict
de guide et l’on admet que leurs propriétés s’étendent aux ne sont vraies que pour les systèmes du premier et du deuxième
systèmes réguliers (ainsi appelés car leur comportement rappelle ordre, mais que l’on utilisera néanmoins pour des systèmes
celui d’un deuxième ordre). quelconques (mais réguliers).
Ainsi, pour obtenir une réponse temporelle du type premier ordre,
on admet que la réponse en fréquence en boucle fermée doit rester
plate jusqu’à la pulsation de cassure ωc = 1/τ, puis chuter au-delà
avec une pente d’environ – 6 dB/octave (sur une étendue d’environ
2.4 Précision
une décade à partir de ωc ).
De même, une réponse temporelle du type deuxième ordre, de La précision s’intéresse à l’état final, après disparition des régimes
pulsation naturelle ωn et d’amortissement z = 0,43, se traduira par transitoires. Un raisonnement simple permet de comprendre la situa-
une réponse en fréquence d’abord plate puis présentant une tion et d’expliquer le rôle d’un intégrateur, si l’on note que
surtension Q = 2,3 dB (c’est celle que l’on obtiendrait pour un l’intégrateur est capable de fournir une sortie non nulle en présence
système du deuxième ordre strict dont l’amortissement serait d’une entrée nulle (article Performances d’un système asservi
z = 0,43). Cette surtension ayant lieu pour la pulsation de réso- [R 7 200], dans la présente rubrique Automatique).
nance ωr pour laquelle on admet que les relations du deuxième Rappelons que l’erreur sur l’échelon unitaire est :
ordre restent vérifiées, soit :
1
ωr = ωn 1 – 2z 2 = 0,8 ω n si z = 0,43 ε 0 = -----------------
1+K
au-delà, la courbe de gain chutera de – 12 dB/octave sur une étendue où K est le gain statique, produit de tous les gains statiques ren-
d’environ une décade. contrés le long de la boucle.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 405 − 3

QS

QT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQP

Correction fréquentielle analogique

par Marcel NOUGARET



Professeur à l’Université de Grenoble, laboratoire d’Automatique

1. Intérêt et méthode................................................................................... R 7 410 - 2


1.1 Intérêt des méthodes fréquentielles .......................................................... — 2
1.2 Méthode exposée ........................................................................................ — 2
2. Correction proportionnelle ................................................................... — 4
2.1 Gain limite .................................................................................................... — 4
2.2 Marge de gain .............................................................................................. — 4
2.3 Réglage du facteur de résonance............................................................... — 4
2.4 Exemple........................................................................................................ — 4
3. Amélioration de la précision ................................................................ — 5
3.1 Correcteur passe-bas................................................................................... — 5
3.1.1 Idée directrice...................................................................................... — 5
3.1.2 Fonction de transfert .......................................................................... — 6
3.1.3 Procédure de détermination .............................................................. — 6
3.2 Version proportionnelle et intégrale (PI).................................................... — 6
3.3 Exemple........................................................................................................ — 7
3.3.1 Correcteur passe-bas.......................................................................... — 7
3.3.2 Correcteur PI ....................................................................................... — 7
4. Amélioration de la rapidité ................................................................... — 8
4.1 Idée directrice : avance de phase idéale .................................................... — 8
4.2 Correcteur à avance de phase .................................................................... — 9
4.2.1 Fonction de transfert .......................................................................... — 9
4.2.2 Procédure de détermination .............................................................. — 9
4.3 Version proportionnelle et dérivée (PD) .................................................... — 10
4.4 Exemple........................................................................................................ — 10
5. Correction mixte ...................................................................................... — 11
5.1 Fonction de transfert ................................................................................... — 11
5.2 Détermination .............................................................................................. — 11
6. Réglages empiriques de PID ................................................................. — 12
6.1 Contexte industriel ...................................................................................... — 12
6.2 Essais successifs.......................................................................................... — 12
6.2.1 Réglage d’un régulateur PI ................................................................ — 12
6.2.2 Réglage d’un régulateur PID.............................................................. — 12
6.3 Pompage limite............................................................................................ — 12
7. Évolution .................................................................................................... — 12
Pour en savoir plus........................................................................................... Doc. R 7 410

et article présente les idées directrices permettant de comprendre les prin-


C cipes de la correction fréquentielle analogique.
Le calcul d’un asservissement dans le domaine fréquentiel consiste à travailler
à partir des courbes de gain et de phase de la fonction de transfert en boucle
ouverte (ensemble : actionneur – procédé – capteur) et à s’efforcer d’obtenir une
allure satisfaisante pour la réponse en fréquence en boucle fermée.
p。イオエゥッョ@Z@ッ」エッ「イ・@QYXT

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 410 − 1

QU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQP

CORRECTION FRÉQUENTIELLE ANALOGIQUE _________________________________________________________________________________________________

En se guidant sur la réponse fréquentielle d’un asservissement du deuxième


ordre bien réglé (amortissement z = 0,43 auquel correspond un facteur de réso-
nance Q = 2,3 dB), on vise à réaliser un correcteur qui donnera, pour la boucle
fermée, une caractéristique fréquentielle plate depuis les basses fré-
quences et présentant un facteur de résonance d’environ 2,3 dB avant de
chuter vers les fréquences élevées.
En utilisant les équivalences approximatives entre les propriétés temporelles
Q et fréquentielles d’un asservissement (article Principes généraux de correction
[R 7 405], dans la présente rubrique Automatique), on traduira, s’il y a lieu, les
spécifications fréquentielles en termes temporels et vice versa.
Le passage de la réponse en fréquence en boucle ouverte, T ( jω ) , à la réponse
en fréquence en boucle fermée, F ( jω ) , utilise l’abaque de Black (article Étude
fréquentielle des systèmes continus [R 7 170], dans la présente rubrique
Automatique).

Notations et Symboles 1. Intérêt et méthode


Symbole Définition 1.1 Intérêt des méthodes fréquentielles
Ac gain du correcteur L’intérêt fondamental est que le calcul d’un correcteur peut être
A0 gain d’oscillation mené à partir de l’analyse harmonique en boucle ouverte, expéri-
mentale, de la totalité de la chaîne ou des composants individuels
C(p) fonction de transfert du correcteur
de celle-ci.
F (jω) réponse en fréquence en boucle fermée
La réalité physique est ainsi prise en compte dans sa complexité
GBO gain en boucle ouverte (en décibels) (retards, frottements, hystérésis, etc.).
GBF gain en boucle fermée (en décibels)
Pour les parties déjà modélisées par une fonction de transfert,
K gain statique de l’ensemble actionneur rappelons qu’on obtient le gain complexe en posant p = j .
– procédé – capteur
Notons également que la connaissance des courbes de Bode en
p variable de Laplace
boucle ouverte permet de se fixer des spécifications réalistes pour
Q facteur de résonance (ou coefficient de ce qui concerne la rapidité attendue de l’asservissement. En par-
surtension) en boucle fermée (en décibels) ticulier, les points de cassure asymptotique de la courbe de gain
T (jω) réponse en fréquence en boucle ouverte situent les principales constantes de temps du procédé. Il sera
tr temps de réponse toujours prudent de demander à l’asservissement un temps de
ε0 erreur statique sur l’échelon de consigne réponse compatible avec celui du procédé en boucle ouverte.
ϕBO phase en boucle ouverte
ϕBF phase en boucle fermée
ϕm déphasage maximal
1.2 Méthode exposée
ω pulsation (radians/seconde)
Nous avons choisi de travailler dans le plan de Black ; de
ω0 pulsation d’oscillation en boucle fermée nombreuses méthodes existent, nous préférons n’en citer qu’une,
ωr pulsation de résonance en boucle fermée ayant eu l’occasion de la pratiquer sur un grand nombre de cas.
ωrd pulsation de résonance désirée Nota : pour la méthode du lieu de Bode, le lecteur pourra se reporter aux références [1]
[9] [11].
L’asservissement est représenté figure 1. Le correcteur est placé
en série ; la sortie est prise égale au signal du capteur, ce qui cor-
respond au schéma usuel à retour unitaire.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 410 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

QV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQP

________________________________________________________________________________________________ CORRECTION FRÉQUENTIELLE ANALOGIQUE

Figure 1 – Correcteur série

■ Modification des lieux


Le gain et la phase de la boucle ouverte T (jω) s’obtiennent par
addition (dans les plans de Bode et de Black) des gains et des phases
du correcteur et du système pour chaque pulsation ω :
|T (jω)|dB = |C (jω)|dB + |KG (jω)|dB (en décibels)
et arg T (jω) = arg C (jω) + arg KG (jω)
Il en résulte, dans le plan de Black, la modification du lieu mon-
trée figure 2.
Nota : le lecteur se reportera à l’article Systèmes et signaux déterministes.
Transformées et abaques [R 7 010] dans la présente rubrique Automatique.
La présentation de la méthode s’appuiera sur un exemple (§ 2.4)
dont les courbes de Bode sont données figure 3. Notons que le gain
statique K est de 20 dB et que ces courbes doivent être relatives à
l’ensemble actionneur – procédé – capteur.
Nous envisagerons successivement des correcteurs permettant
d’améliorer la précision (§ 3), puis la rapidité (§ 4), enfin les deux
à la fois (§ 5).
Nous donnerons pour terminer (§ 6) quelques règles simples,
empiriques, pour les régulateurs industriels.

Figure 2 – Déformation du lieu de Black par l’action du correcteur série

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 410 − 3

QW

QX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQV

Régulateurs PID analogiques


et numériques

par Alina BESANÇON-VODA
Maître de Conférences à l’Institut de sciences et techniques de l’Université Joseph Fourier
de Grenoble
Laboratoire d’automatique de Grenoble
et Sylviane GENTIL
Professeur à l’École nationale d’ingénieurs électriciens de l’Institut national polytechnique
de Grenoble
Laboratoire d’automatique de Grenoble

1. Notations et structure du régulateur PID.......................................... R 7 416 - 2


1.1 Notations et définitions................................................................................ — 2
1.2 Paramètres .................................................................................................... — 3
1.3 Formes des régulateurs PID ........................................................................ — 3
1.4 Diminution des effets des zéros du régulateur PID ................................... — 4
1.5 Marges de robustesse.................................................................................. — 5
2. Identification du procédé ....................................................................... — 7
2.1 Méthodes basées sur la réponse indicielle ................................................ — 7
2.2 Méthodes basées sur la réponse fréquentielle .......................................... — 8
3. Méthodes de synthèse du régulateur PID.......................................... — 11
3.1 Critères typiques de synthèse ..................................................................... — 11
3.2 Méthodes de Ziegler-Nichols et extensions ............................................... — 11
3.3 Méthodes qui simplifient la dynamique du procédé................................. — 13
3.4 Méthodes d’optimisation d’un critère intégral .......................................... — 14
3.5 Placement des pôles .................................................................................... — 14
4. Régulateurs numériques ......................................................................... — 17
4.1 Représentation d’un correcteur continu par un système numérique ...... — 18
4.2 Synthèse directe ........................................................................................... — 20
4.3 Généralisation : différentes structures de PID ........................................... — 24
Références bibliographiques .......................................................................... — 25

L e régulateur standard le plus utilisé dans l’industrie est le régulateur PID


(proportionnel intégral dérivé), car il permet de régler à l’aide de ses trois
paramètres les performances (amortissement, temps de réponse) d’une régula-
tion d’un processus modélisé par un deuxième ordre [R 7 405]. Nombreux sont
les systèmes physiques qui, même en étant complexes, ont un comportement
voisin de celui d’un deuxième ordre, dans une certaine échelle de temps. Par
conséquent, le régulateur PID est bien adapté à la plupart des processus de type
industriel et est relativement robuste par rapport aux variations des paramètres
du procédé, quand on n’est pas trop exigeant pour les performances de la bou-
cle fermée par rapport à celles de la boucle ouverte (par exemple, accélération
très importante de la réponse ou augmentation très importante de l’amortisse-
ment en boucle fermée).
Si la dynamique dominante du système est supérieure à un deuxième ordre,
p。イオエゥッョ@Z@ュ。イウ@QYYY

ou si le système contient un retard important ou plusieurs modes oscillants, le

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 7 416 - 1

QY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQV

RÉGULATEURS PID ANALOGIQUES ET NUMÉRIQUES __________________________________________________________________________________________

régulateur PID n’est plus adéquat et un régulateur plus complexe (avec plus de
paramètres) doit être utilisé, aux dépens de la sensibilité aux variations des para-
mètres du procédé.
La réalisation d’une boucle d’asservissement par PID est un problème très
important, car il influence :
— la qualité de la régulation sur un site industriel ;

Q — le temps de mise en œuvre de la commande ;


et comporte deux aspects essentiels :
— le réglage du régulateur PID, pour lequel la connaissance d’un modèle
dynamique du procédé d’une part et les performances désirées d’autre part
déterminent le choix de la méthode de synthèse ;
— l’implantation du régulateur dans une version analogique ou numérique et
dans une configuration série, parallèle ou mixte.
De plus en plus, les régulateurs PID commercialisés offrent la possibilité
d’autoréglage, qui réalise le calcul automatique des paramètres, à la demande
de l’utilisateur.
Les paragraphes 1, 2 et 3 concernent les régulateurs PID en général et l’identi-
fication de modèles pour le calcul de régulateur tandis que le paragraphe 4
concerne la particularisation à la version numérique.Afin de mieux comprendre les
notions développées dans cet article, le lecteur se reportera dans ce traité aux articles :
— Le calculateur numérique pour la commande des processus [22] ;
— Modélisation et identification des processus [23] ;
— Principes généraux de correction [24] ;
— Correction fréquentielle analogique [25] ;
— Exemple de correction d’un système asservi [26] ;
— Méthodes de synthèse de correcteurs numériques [27].

1. Notations et structure
du régulateur PID p1 (t ) p2 (t )

1.1 Notations et définitions r (t ) e (t )


C (s)
u (t )
G (s)
y (t )
+ + +

La structure du système de commande est décrite par la figure 1 :
la fonction de transfert du régulateur y est notée C (s ) et celle du pro- v (t )
cédé G (s ), où s est la variable de Laplace. La fonction de transfert de
la boucle ouverte compensée sera donc :
avec r (t ) : signal de référence ou consigne
HBO(s ) = C (s ) G (s ) (1) (entré par l’utilisateur ou un autre régulateur),
e (t ) : erreur (entrée du régulateur).
et celle de la boucle fermée : e (t ) = r (t ) – y (t ),
H BO ( s ) u (t ) commande (sortie du régulateur),
H BF ( s ) = ----------------------------
- (2) p1 (t ), p2 (t ) : perturbation à l’entrée et à la sortie du procédé
1 + H BO ( s ) respectivement,
v (t ) : bruit à la sortie du procédé
D’une façon générale, les transformées de Laplace seront notées (par exemple bruit de mesure),
avec des lettres majuscules. On définit ainsi le signal d’erreur par y (t ) : sortie mesurée du procédé
(variable à commander),
E (s ) = R (s ) – Y (s ) où la sortie du procédé est donnée par : C (s) : fonction de transfert du régulateur,
G (s) : fonction de transfert du procédé.
C(s)G(s) G(s)
Y ( s ) = ----------------------------------- R ( s ) + ----------------------------------- P 1 ( s )
1 + C(s)G(s) 1 + C(s)G(s)
1
+ ----------------------------------- (V (s ) + P2(s )) (3)
1 + C(s)G(s) Figure 1 – Configuration du système en boucle fermée

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 416 - 2 © Techniques de l’Ingénieur, traité Mesures et Contrôle

RP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQV

__________________________________________________________________________________________ RÉGULATEURS PID ANALOGIQUES ET NUMÉRIQUES

La fonction de sensibilité de la boucle fermée (sensibilité pertur- 1.3 Formes des régulateurs PID
bation sortie - sortie) est notée :

1
S yv ( s ) = ----------------------------- (4) ■ Forme standard
1 + H BO ( s )
La forme standard de la fonction de transfert du régulateur PID
son maximum étant défini par : est :

S yvmax = max S yv ( jw )
w
(5)
sT i
1 sT d
C ( s ) = K p 1 + ----------- + ----------------------
Td
- (6) Q
avec w pulsation. 1 + s --------
N

On appelle zéros du régulateur les racines du numérateur où par rapport à la forme donnée auparavant, l’action dérivative est
de la fonction de transfert C (s ) de ce régulateur. implémentée avec un filtre du premier ordre, dont la constante de
On parle de pôles du régulateur quand il s’agit des racines temps est N fois plus petite que Td . Ce filtre permet d’atténuer l’effet
du dénominateur de la fonction de transfert. du bruit hautes fréquences dans la commande du PID, le choix typi-
Si ces racines sont réelles, on parle de zéros ou de pôles réels que de N étant compris entre 10 et 20. L’équation (6) représente la
Si les modules de ces racines sont faibles (grandes constantes forme conventionnelle, commercialisée par la plupart des construc-
de temps), on parle de zéros ou de pôles lents (avec une valeur teurs de régulateurs PID.
limite quand la racine est nulle donc pour une constante de
temps infinie). Les deux zéros « lents » introduits par le régulateur peuvent être
complexes, ce qui est utile quand on veut commander des systèmes
avec un mode oscillatoire.

■ Forme parallèle
1.2 Paramètres
La forme « parallèle » de la fonction de transfert du régulateur PID
est :
La commande u (t ) donnée par le régulateur PID, dans sa forme
classique est décrite par : k kd s
C ( s ) = k + -----i + -------------------------------
- (7)
s 1 + (k d ¤ k ) s
1
u ( t ) = K p e ( t ) + -----
Ti
E e t dt
0
t
( )
de ( t )
+ T d --------------
dt avec k, ki et kd constantes.

Elle est la somme de trois termes : Cette forme est équivalente à la forme standard, et la relation
— le terme proportionnel P = Kpe (t ) (proportionnel à l’erreur) ; entre les paramètres de la forme parallèle et la forme standard est
évidente. L’avantage de cette forme vient du fait qu’une action pro-
1 t
E
— le terme intégral I = K p ------- e ( t ) dt (proportionnel à l’inté-
Ti 0
portionnelle, intégrale ou dérivée pure peut être obtenue avec des
paramètres finis du régulateur. Par contre, les paramètres n’ont pas
grale de l’erreur) ; une interprétation physique évidente.
de ( t )
— le terme dérivatif D = K p T d -------------- (proportionnel à la dérivée
de l’erreur). dt ■ Forme série

La forme « série » de la fonction de transfert du régulateur PID


Les paramètres du régulateur PID sont le gain proportionnel est :
Kp , le temps intégral Ti et le temps dérivatif Td , les temps étant ( 1 + t1 s ) ( 1 + t2 s )
exprimés en secondes. C ( s ) = ----------------------------------------------
- (8)
ti s ( 1 + tN s )

Dans les régulateurs PID existants sur le marché, les actions pro- avec t1 , t2 , ti et tN constantes de temps.
portionnelle et intégrale peuvent être exprimées comme suit :
— l’action proportionnelle s’exprime soit par le gain proportion- Cette forme permet de mettre plus facilement en relation les para-
nel Kp , soit par la bande proportionnelle BP. Cette dernière est défi- mètres du régulateur avec les constantes de temps du procédé.
nie comme la variation, en pourcentage, de l’entrée du régulateur e Sous cette forme, le régulateur a deux zéros réels.
nécessaire pour que la sortie u varie de 100 %.
Le régulateur PID sous la forme série (8) peut toujours être repré-
La relation entre le gain Kp et la bande proportionnelle (BP ), expri- senté sous la forme parallèle (6), selon :
mée en % est :
100 ì t1 + t2 Ð tN
BP % = ----------
Kp ï K p = ----------------------------
ti
-
ï
ï T = t +t Ðt
— l’action intégrale s’exprime soit par le temps Ti , qui représente ï i 1 2 N
le temps nécessaire pour que la variation de la sortie (u ) soit égale ï 2
à celle de l’entrée (e ), soit par l’inverse du temps, n, qui exprime le í t1 t2 Ð tN t1 Ð t2 tN + tN (9)
ï T d = -----------------------------------------------------------
t1 + t2 Ð tN
-
nombre de fois que la sortie u répète l’entrée e, dans l’unité de ï
temps (mn, s) : ï 2
ï t1 t2 Ð tN t1 Ð t2 tN + tN
1 ï N = ------------------------------------------------------------
T i = ----- î tN ( t1 + t2 Ð tN )
n

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 7 416 - 3

RQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQV

RÉGULATEURS PID ANALOGIQUES ET NUMÉRIQUES __________________________________________________________________________________________

L’inverse n’est possible que si NT i ÐTd > 2 N T i T d (condition La fonction de transfert en boucle fermée HBF(s ) contient les zéros
introduits par le régulateur, ce qui peut donner parfois des dépasse-
sous laquelle la forme standard donne des zéros réels) : ments importants de la réponse en boucle fermée.

ì ■ Structure 2 : avec l’action « D sur la sortie y », comme sur la


ï T N+1
ï T i + -----d- 4 T i T d æ --------------ö figure 3. La commande U (s ) correspond à :
N è N ø
ït = ------------------ 1 ± 1 Ð -----------------------------------
-
ï 1,2 2 2
æT + T


ï -----d-ö sT d
ï è i Nø 1
(10) U ( s ) = K p E ( s ) + ----------- E ( s ) + ----------------------- ( Ð Y ( s ) ) (11)
í sT i Td
ï Ti 1 + s --------
ï t i = -------- N
ï Kp
ï
ï t = T -----d-
La fonction de transfert en boucle fermée contiendra un zéro de
ï N N moins que la fonction de transfert correspondante à la structure 1,
î donc le dépassement de la réponse indicielle sera diminué. Par con-
tre, le temps de montée en boucle fermée sera plus long.
La forme standard est ainsi plus générale que la forme série. Son
désavantage est le fait qu’une action intégrale ou proportionnelle
pure ne peut pas être obtenue avec des paramètres finis du régula- ■ Structure 3 : avec les actions « P et D sur la sortie y », comme sur
teur. la figure 4. La commande U (s ) correspond à :

1 sT d
1.4 Diminution des effets des zéros U ( s ) = K p Ð Y ( s ) + ----------- E ( s ) + ---------------------- ( Ð Y ( s ) )
sT i Td
(12)
du régulateur PID 1 + s --------
N

1.4.1 Structures mixtes La fonction de transfert en boucle fermée ne contient plus les
deux zéros lents du régulateur, ce qui mène à la diminution du
Les trois structures mixtes de configuration du PID sont des modi- dépassement de la réponse indicielle en boucle fermée, et à un
fications de l’algorithme standard (6) (les autres formes (8) et (7) temps de montée augmenté (par rapport aux structures 1 et 2).
peuvent se ramener à (6)) :
■ La comparaison des réponses des trois structures est illustrée sur
■ Structure 1 : avec les actions « PID sur l’erreur », comme sur la un exemple de régulateur PID calculé selon la méthode de Ziegler-
figure 2 et qui correspond à la commande : Nichols fréquentielle (§ 3.2.2). Sur la figure 5, on montre la réponse
de la sortie y (t ) et de la commande u (t ) à un changement de consi-
sT d gne en échelon et à une perturbation de charge à la sortie (p2 (t )
1 dans la figure 1).
U ( s ) = K p 1 + ---------- + ----------------------
- E(s)
sT i Td
1 + s --------
N

1.4.2 Structure avec consigne pondérée

Une formule générale de la commande U (s ) qui englobe aussi les


trois structures présentées auparavant comme des cas particuliers

1 2
1 Td s et qui offre plus de souplesse est donnée par :
r (t ) e (t ) Kp 1 + + u (t ) y (t )
Ti s T G (s)
+ 1+ d s

N 1
U (s ) = Kp [b1R (s ) – Y (s ) + --------- ( R ( s ) Ð Y ( s ) )
sT i

sT d
+ ----------------------- (b2R (s ) – Y (s ))] (13)
Td
Figure 2 – Structure classique du PID, avec actions P, I et D 1 + s --------
sur l’erreur e N

1 21 2
1 1
r (t ) e (t ) Kp 1 + u (t ) y (t )
Ti s Td G (s)
+ +
– 1+ s –
N

Td s
Kp
T
1+ d s
N

Figure 3 – Structure du PID avec l’action D


sur la sortie y

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 416 - 4 © Techniques de l’Ingénieur, traité Mesures et Contrôle

RR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTQV

__________________________________________________________________________________________ RÉGULATEURS PID ANALOGIQUES ET NUMÉRIQUES

1 21 2
1 1
r (t ) e (t ) Kp u (t ) y (t )
Ti s T G (s)
+ +
– 1+ d s –
N

1 2
Td s


Kp 1 +
T
1+ d s
N

Figure 4 – Structure du PID avec les actions


P et D sur la sortie y

1.4.3 Structure avec filtre sur la consigne


2
y Une autre manière de diminuer ou même d’annuler l’influence
1,5 des zéros introduits par le régulateur est d’utiliser la structure 1 du
3
PID avec « filtre sur la consigne », comme dans la figure 6. La fonc-
1 tion de transfert du filtre HF (s ) peut être :
0,5 1
2 1 — du premier ordre H F ( s ) = ------------------ si on veut diminuer l’effet
0 1 + Ts
0 20 40 60 80 100 120 140 d’un seul zéro du régulateur ; dans le cas où on désire la simplifica-
Temps (s) tion d’un zéro réel de la forme série, on choisit T = t1 ou T = t2 ;
5 1
— du deuxième ordre H F ( s ) = ------------------------------------------------- si on veut dimi-
u 1 ( 1 + T1 s ) ( 1 + T2 s )
2 3 nuer l’effet des deux zéros du régulateur ; dans le cas où on désire la
0 simplification des deux zéros réels de la forme série, on choisit
T1 = t1 et T2 = t2 ;
— une autre dynamique, spécifiée par l’utilisateur.
–5
0 20 40 60 80 100 120 140
Temps (s) 1.5 Marges de robustesse

Figure 5 – Comparaison entre les réponses en boucle fermée Pour l’étude de la robustesse de la boucle fermée obtenue avec un
obtenues avec PID (Ziegler-Nichols fréquentiel) structure 1, 2 et 3 régulateur PID, les marges de robustesse les plus importantes qu’on
va vérifier sont la marge de module et la marge de retard [12] [7].
■ La marge de module :
Ð1
D M = ( S yv max )
r (t ) y * (t ) e (t ) u (t ) y (t )
HF (s) C (s) G (s) est l’inverse de la valeur maximale (en dB ) du module de la fonction
+
– de sensibilité (4) et qui représente, dans le diagramme de Nyquist
du système compensé en boucle ouverte HBO(s ), la plus petite dis-
tance par rapport au point –1 (voir figure 7). Il résulte du théorème
du cercle (Popov-Zames) [16] que la boucle fermée restera stable
pour toute non linéarité (ou variation dans le temps) conique, située
1
Figure 6 – Structure du PID avec filtre sur la consigne à l’intérieur du secteur défini par un gain linéaire minimum --------------------
1 Ð DM
1
et maximum -------------------- .
Les paramètres b1 , b2 sont des facteurs de pondération de la réfé- 1 + DM
rence dans les actions proportionnelle et dérivée, respectivement.
Ils sont utilisés pour atténuer le dépassement de la réponse aux Une valeur typique de cette marge est :
changements de consigne en échelon (0 < b1 < 1), comme indiqué
dans [8]. DM > 0,5 (soit –6dB ) (DMmin = 0,4 (–8dB )) (14)

Pour les structures présentées auparavant, ces facteurs prennent Il est à noter que DM > 0,5 implique une marge de gain DG > 2
les valeurs : (6dB ) et une marge de phase DF > 29o, mais la réciproque n’est pas
vraie.
— b1 = 1, correspondant à la structure « P sur l’erreur » (voir les
figures 2 et 3) ; ■ La marge de retard représente la valeur maximale de la varia-
— b1 = 0, correspondant à la structure « P sur la sortie » (voir la tion ou de l’incertitude sur le retard du système, qu’on peut tolérer
figure 4) ; sur le transfert de la boucle, sans entraîner l’instabilité :
DF
— b2 = 1, correspondant à la structure « D sur l’erreur » (voir la D t = ---------
figure 2) ; w cr
— b2 = 0, correspondant à la structure « D sur la sortie » (voir les où DF est la marge de phase et wcr est la pulsation de croisement
figures 3 et 4). correspondante.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 7 416 - 5

RS

RT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQX

Applications de la commande PID


Asservissement température et position
par Dominique JACOB

Agrégé de Génie-électrique
Ancien élève de l’ENS de Cachan
Maître de conférences à l’IUT de Poitiers

1. Commande PID ......................................................................................... S 7 718 - 2


2. Performances obtenues en boucle fermée ....................................... — 4
3. Principe de la méthode de réglage expérimentale du PID ........... — 5
4. Identification expérimentale en boucle fermée .............................. — 5
5. Principe du calcul d’un correcteur PID ............................................. — 8
6. Commande PID pour un système de classe 0.................................. — 8
7. Calcul d’un correcteur PID pour un système de classe 1 ............ — 15
8. Régulation PID de position d’un moteur Brushless ....................... — 20
9. Remarques sur le calcul numérique de la commande ................... — 23
10. Récapitulatif sur les modèles présentés ........................................... — 24
Annexes ............................................................................................................... Form. S 7 419
Pour en savoir plus ........................................................................................... Doc. S 7 418

a commande PID n’est pas la plus performante des commandes mais c’est
L la plus répandue. Le technicien ou l’ingénieur, confronté en pratique à une
régulation, est bien souvent limité à la mise en œuvre d’un régulateur PID qui
n’offre pas toutes les possibilités de réglage des méthodes modernes. De plus,
il est en général impossible d’effectuer des essais en boucle ouverte pour iden-
tifier le système régulé. On doit alors savoir régler au mieux ce type de régu-
lateur à partir d’essais en boucle fermée uniquement.
On présente ici, en respectant ces contraintes, deux applications concrètes
très fréquentes : une régulation de température et l’asservissement en position
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPT@M@d・イョゥ│イ・@カ。ャゥ、。エゥッョ@Z@ェオゥョ@RPQY

d’un système mécanique motorisé par un moteur Brushless. Le réglage est


effectué par la méthode des moments et la méthode fréquentielle classique.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 418 − 1

RU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQX

APPLICATION S DE LA COM M AN DE PID _____________________________________________________________________________________________________

1. Commande PID Le réglage du PID consiste à déterminer ces quatre paramè-


tres A, ωi , Td , Tƒ pour que les performances du système en
boucle fermée soient les meilleures.
1.1 Position du problème
La fonction de transfert du correcteur peut aussi s’exprimer :
Le système est commandé en boucle fermée [S 7 090] réf. [10]
ω c0 + c1 p + c2 p 2


U (p) Td p
(figure 1). On cherche à déterminer un régulateur PID conduisant à
de bonnes performances de régulation. Le système doit être iden- ε (p) 冢
C ( p ) = ----------------- = A 1 + ------i- + ----------------------
p 1 + Tƒ p
- 冣 = ----------------------------------------------
p (1 + T p) ƒ
-
tifié à partir d’essais en boucle fermée uniquement. On se limite ici
à des systèmes qui sont stabilisables par un correcteur proportion- avec c 0 = A ωi ,
nel. Si le système ne satisfait pas cette contrainte, il nécessite sûre- c 1 = A (1 + Tƒ ωi ),
ment une commande plus complexe que la commande PID et on c 2 = A (Td + Tƒ ).
ne confie pas cette tâche à un technicien.
On obtiendra souvent le PID sous cette forme de fraction ration-
Le correcteur PID élabore la commande u à partir de l’écart,
nelle, mais il faudra le « programmer » avec la première expres-
ε = yd – y entre la mesure y et la valeur désirée (ou consigne) yd en sion pour laquelle les trois effets P, I, D sont bien séparés (ou peut
ajoutant trois effets :
aussi utiliser la décomposition en éléments simples de la fraction
— un effet proportionnel ; plus l’écart est important plus la rationnelle) sinon on obtient des équations aux différences avec
commande doit l’être ; des coefficients de valeurs élevées et proches les unes des autres.
— un effet intégral ; si l’écart est positif, il faut continuer à aug-
On utilise pour cela les relations :
menter la commande pour le réduire ;
— un effet dérivé ; dès que la mesure varie, il faut modifier la A = c 1 – c 0 Tƒ
commande sans attendre qu’un écart important existe.
c0
Soit : ω i = --------
A
u ( t ) = A ε ( t ) + A ωi
t

0
冕 ε ( x ) dx + AT d

---------
dt
c2
T d = -------- – T ƒ
A

U (p) ω
ε (p) 冢
⇔ ----------------- = A 1 + ------i- + T d p
p 冣 1.2 Critère de stabilité pour le réglage
avec p variable de Laplace. du PID
En pratique, l’effet dérivé doit être filtré pour éviter de dégrader
le rapport signal/bruit de la commande [R 7 416] réf. [11]. La performance fondamentale que doit assurer le correcteur est
de rendre le système bouclé (figure 1) suffisamment stable.
On prendra toujours :
En effet, la structure de commande (figure 1) en boucle fermée
conduit « naturellement » à l’instabilité comme le montre le raison-
U (p) ω Td p nement « qualitatif » suivant. Si le signal d’erreur est sinusoïdal,
ε (p) 冢
----------------- = A 1 + ------i- + ----------------------
p 1 + Tƒ p
- 冣 ε (t ) = E M sin ( ω t ), la sortie est aussi sinusoïdale, soit y (t )
= YM sin (ωt + ϕ ) et si on pose T (p ) = C (p ) F (p ), on a :

avec Tƒ constante de temps du filtrage passe-bas appliqué à l’effet YM


T ( j ω ) = ---------
- et ϕ = arg [ T ( j ω ) ]
dérivé. EM
ϕ < 0 car la sortie y est forcément en retard sur l’entrée ε selon le
principe de causalité.
Il existe une pulsation, nommée pulsation critique ωc telle que
Consigne ε Correcteur u Système Mesure arg [T (jωc )] = – π, cette pulsation est caractéristique de T (p ).
yd + C (p ) Commande F (p ) y Supposons que la consigne soit nulle (yd = 0), et que, par exemple

suite à une perturbation qui a agi sur le système, le signal d’erreur
ε (t ) soit sinusoïdal avec cette pulsation précise ωc .
avec Soit ε (t ) = EM sin (ωc t ) d’où y (t ) = |T (jωc )| EM sin (ωc t – arg [T (jωc )])
soit y (t ) = |T (jωc )| EM sin (ωc t + π) = – |T (jωc )| EM sin (ωc t).
u commande du système,
y mesure du signal que l'on souhaite réguler, La sortie y est en opposition de phase avec l’entrée ε. Et comme
ε = yd – y = – y car yd = 0, on obtient ε (t ) = |T (jωc )| EM sin (ωc t )
yd consigne (valeur désirée de y), = EM′ sin (ωc t ).
ε = yd – y signal d'erreur à partir duquel est élaborée la commande, On retrouve la situation initiale de l’étude avec un signal d’erreur
C (p ) = u fonction de transfert du correcteur sinusoïdal d’amplitude E M ′ = |T (jωc )| EM .
ε
y On peut reprendre alors le raisonnement et on voit que l’ampli-
F (p ) = fonction de transfert du système à réguler tude du signal d’erreur est en progression « géométrique » avec la
u
(système en boucle ouverte) raison |T (jωc )|.
C (p ) F (p ) y Si |T (jωc )| > 1, l’amplitude du signal d’erreur va croître indéfi-
On note H (p ) = = la fonction de transfert
1 + C (p ) F (p ) yd niment : le système est dit instable ; si au contraire |T (jωc )| < 1, le
du système bouclé signal d’erreur va s’annuler. Le cas |T (jωc )| = 1 correspond à une
oscillation entretenue à la pulsation ωc (c’est ainsi que l’on réalise
Figure 1 – Structure de commande en boucle fermée les oscillateurs sinusoïdaux).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 418 − 2 © Techniques de l’Ingénieur

RV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQX

____________________________________________________________________________________________________ APPLICATION S DE LA COM M AN DE PID

Pour réaliser une régulation, on souhaite obtenir y = yd , soit


ε = 0 ; il faut donc réaliser |T (jωc )| < 1.
Système en boucle ouverte
Pour stabiliser le système bouclé, il faut satisfaire les deux équa- 20 lg 兩T (jω)兩
tions suivantes : 50

Gain (dB)
arg [T (jωc )] = – π et |T (jωc )| < 1
Naturellement, il faut satisfaire l’inéquation avec une certaine 0
marge et en pratique on fixe 20 lg (|T (jωc )| < – Gm · Gm est nommé
marge de gain et on prend souvent Gm = 10 dB.
De façon duale, on constate que le système bouclé sera stable si
on vérifie les deux équations (notez qu’il s’agit d’une pulsation ωϕ – 100
– 50

10–1 100 101
et non de ωc ) :
ω (rad/s)
|T (jωϕ )| = 1 – π < arg (T (jωϕ ))
Système en boucle fermée Limite supérieure de
On impose en pratique : 20 lg 兩H (jω)兩 la bande passante en
boucle fermée estimée

|T (jωϕ )| = 1 et arg [T (jωϕ )] > – π + ϕm


Figure 2 – Estimation de |H (j␻ )| à partir de |T (j␻ )|

ϕm est nommé marge de phase et en général on prend ϕm = 45o.


Les marges de phase et de gains sont liées au dépassement indi-
ciel du système bouclé : plus les marges sont faibles et plus le
30

20 lg 兩C (jω)兩 (dB)
dépassement indiciel est important.
Ce sont ces relations qui permettent de déterminer un correcteur 20
PID satisfaisant. On constate qu’il faut « augmenter » la phase de
T (jω ) = C (jω ) F (jω ) pour les pulsations ω telles que |T (jω )| ≈ 1. 10
Cela est le principe de « l’avance de phase ».
0
10–1 100 101 102
1.3 Bande passante en boucle fermée ω (rad/s)
obtenue en imposant la marge
Arg [C (jω)] (°)

90
de phase Courbe
asymptotique
La fonction de transfert du système en boucle fermée est 0
Courbe
y T (p)
H ( p ) = -------- = --------------------------. réelle 1
yd 1 + T (p) Tf
– 90
Soit les pulsations ω telles que : 10–1 ωid 101 102
|T (jω )| << 1 (équivalent à 20 lg (|T (jω )| << 0 dB) ω (rad/s)
T (jω)
alors H ( j ω ) = --------------------------- ≈ T (jω) .
1 + T (jω) Figure 3 – Diagramme de Bode du PID
Cette condition est obtenue en haute fréquence car, pour les sys-
tèmes réels, |T (jω )| diminue si la pulsation augmente.
De même si ω est telle que : Pour les pulsations faibles (signaux obtenus en régime permanent
ω Td p ω
|T (jω )| >> 1 (équivalent à 20 lg (|T (jω )| >> 0 dB)
T (jω)

p = jω → 0) ; C ( p ) = A 1 + ------i- + ----------------------
p 1 + Tƒ p p → 0 冣 冢
- → A 1 + ------i- , seuls
p 冣
alors H ( j ω ) = --------------------------- ≈ 1 soit 20 lg (|H (jω )| ≈ 0 dB. les effets P et I interviennent en régime permanent. La phase de C (p )
1 + T (jω)
π
Cette condition est obtenue en basse fréquence car |T (jω )| vaut alors arg [ C ( p ) ] → – -----.
p→0 2
comporte un intégrateur (correcteur PID) ; ainsi le gain augmente si
la pulsation tend vers 0. Pour les pulsations élevées et en négligeant l’influence du filtre
passe-bas, soit Tƒ ≈ 0 (signaux obtenus en régime transitoire,
La « cassure », qui donne une estimation de la bande passante
sur le diagramme de Bode de H (jω ), est donc située à la limite des ω
deux cas |T (jω )| << 1 et |T (jω )| >> 1, la bande passante du système
p = jω → ∞), C ( p ) ≈ A 冢 1 + ------i- + T d p 冣 → A T d p , l’effet D est pré-
p p→0
bouclé peut être estimée (figure 2) par la pulsation ωϕ telle que 1
|T (jωϕ )| = 1 ; c’est justement la pulsation qui permet d’imposer la pondérant en régime transitoire (jusqu’à la pulsation -------- ) et la

marge de phase : pour cette raison, il faut prendre ωϕ le plus grand π
possible. phase de C (p ) vaut alors arg [ C ( p ) ] → + ----- .
p→∞ 2

La limite entre ces deux domaines de fréquences est estimée


par la pulsation ωid telle que :
1.4 Propriétés fréquentielles ωi
du correcteur PID arg [ C ( j ω id ) ] =  arg A 1 + -----------
 j ω id 冤 冢
- + T d j ω id = 0
 冣冥
Le PID permet d’obtenir une avance de phase comme le montre ωi
soit ω id = -------- .
son diagramme de Bode (figure 3). Td

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 418 − 3

RW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQX

APPLICATION S DE LA COM M AN DE PID _____________________________________________________________________________________________________

Le diagramme de Bode donnant la phase réelle et les asymptotes


de C (p ) est conforme à la figure 3.
1

Amplitude
εv
L’avance de phase existe (selon les asymptotes) pour les pulsa- 0,8
1
tions ω id < ω < --------. 0,6
Tƒ Consigne
0,4
ω 1 Mesure
Pour un PID « bien réglé », on aura ω id = -------i- < -------- sinon cela 0,2


Td Tƒ
signifie que l’effet D est inutile car un tel PID n’introduit aucune 0

avance de phase. Le rapport Tƒ ωid entre ces deux pulsations fixe – 0,2
0 1 2 3 4 5 6 7 8 9 10
l’avance de phase maximale du correcteur. Souvent, on impose
Temps (s)
2
T ƒ ωi
α = T ƒ ω id = ---------------- a priori à partir de l’avance de phase
Td Figure 5 – Essai en rampe
souhaitée.

2. Performances obtenues 1

Amplitude
Consigne
0,8
en boucle fermée 0,6
Début ∆t
0,4 de l'essai
Mesure
2.1 Essais expérimentaux 0,2

en régime transitoire 0
t
– 0,2
On évalue les performances en boucle fermée en conduisant des 0 10 20 30 40 50 60 70 80 90 100
essais caractérisant le régime transitoire de la mesure y, quand la Temps (s)
consigne yd varie.
Figure 6 – Essai en accélération
■ L’essai indiciel (ou essai à l’échelon) en boucle fermée (figure 4)
consiste à faire évoluer brutalement la consigne yd (yd est un éche-
lon), à partir d’un régime permanent, et à observer le régime transi-
toire de la mesure y. ■ L’essai à une rampe (figure 5) consiste à faire évoluer la consigne
On caractérise ce régime transitoire (figure 4) par les critères yd , à vitesse v constante (yd = vt ) à partir d’un régime permanent et
suivants : à observer le régime transitoire obtenu. Comme la rampe est l’inté-
— D %, le dépassement indiciel en boucle fermée qui caractérise grale d’un échelon, la réponse à une rampe est l’intégrale de la
( ∆y max – ∆y ) réponse indicielle. Cet essai permet de mesurer l’erreur de poursuite
le degré de stabilité du système, D % = 100 -------------------------------------- ; yd – y
∆y ε v = lim ----------------- qui est un temps qui représente le retard en régime
— trBF , le temps de réponse (à 5 %) en boucle fermée ; t →∞ v
permanent entre la mesure et la consigne. Pour annuler l’erreur de
— εp , l’erreur de position qui est l’écart relatif en régime perma- poursuite, il faut que la fonction de transfert T (p ) = C (p ) F (p ) pos-
∆y d – ∆y sède deux intégrations au moins.
nent entre la consigne et la mesure ε p = ------------------------- (en régime per-
∆y d ■ L’essai en accélération (figure 6) consiste à faire évoluer la
manent). Pour annuler l’erreur de position, il faut que la fonction de
1
transfert T (p ) = C (p ) F (p ) possède une intégration au moins. 冢
consigne yd , à accélération γ constante y d = ----- γ t 2 à partir d’un
2 冣
régime permanent et à observer le régime transitoire obtenu.
Comme le signal d’accélération constante est l’intégral d’un signal à
vitesse constante, la réponse en accélération est l’intégrale de la
réponse à une rampe. Cet essai permet de mesurer l’erreur en accé-
1,2
yd – y
lération ε a = lim ----------------- = t ∆t qui s’exprime en s 2. ∆t représente le
Amplitude

Consigne Mesure t →∞ γ
1
retard temporel, à l’instant t, entre la mesure et la consigne. Pour
0,8 annuler l’erreur en accélération, il faut que la fonction de transfert
0,6 T (p ) = C (p ) F (p ) possède trois intégrations au moins.
∆ymax ∆yd ∆y
0,4
0,2
0 tr 2.2 Précision des systèmes bouclés
– 0,2 en régime permanent
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Temps (s)
La précision d’un système asservi (figure 1) est caractérisée par
l’erreur en régime permanent entre la sortie et la consigne, soit
ε = lim ( y d – y ) .
Figure 4 – Essai indiciel t →∞

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 418 − 4 © Techniques de l’Ingénieur

RX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQX

____________________________________________________________________________________________________ APPLICATION S DE LA COM M AN DE PID

Erreur de position Erreur de poursuite Erreur en accélération


yd = y0 = constante yd = vt yd = 1 γt 2
2

yd – y yd – y yd – y
lim T (p)
p→0
εp = tlim
→⬁ 冢 y0 冣 εv = tlim
→⬁ 冢 v 冣 εa = tlim
→⬁ 冢 γ 冣
Ks
Système de classe 0
1
1 + Ks ⬁ ⬁ Q
Kv 1
p 0 Kv ⬁
Système de classe 1

Ka
1
p2 0 0 Ka
Système de classe 2
Figure 7 – Erreurs en régime permanent
en fonction de la classe du système

Soit T (p ) = C (p ) F (p ), la fonction de transfert du système en 1 : Effectuer un essai indiciel sur le système en boucle fermée
y T (p) commandé avec un correcteur proportionnel pur, C (p ) = A. On
boucle ouverte est H ( p ) = -------- = --------------------------, la fonction de transfert règle la valeur A du correcteur proportionnel pour stabiliser le sys-
yd 1 + T (p)
du système en boucle fermée. tème en boucle fermée mais en cherchant à obtenir une oscillation
amortie sur la réponse indicielle car cela facilite l’identification.
L’erreur dépend du signal de consigne yd .
2 : Identifier un modèle H (p ) de la fonction de transfert du sys-
On définit : tème en boucle fermée à l’aide de cet essai expérimental. On choisit
yd – y un modèle (cf. § 4) présentant le nombre minimal de paramètres.
t →∞

ε p = lim ----------------
yd 冣
- , l’erreur de position si la consigne yd est On détermine les paramètres en ajustant la réponse indicielle du
constante en régime permanent ; modèle à la réponse expérimentale.
yd – y 3 : Déterminer un modèle de la fonction de transfert F (p ) du
t →∞
冢 v 冣
ε v = lim ----------------
- , l’erreur de traînage (ou de poursuite) si, en système en boucle ouverte à partir de H (p ) à partir de la relation
régime permanent, la consigne évolue à la vitesse v, soit yd = vt ; A F (p)
H ( p ) = -------------------------------. On prend pour F (p ) le modèle de comporte-
1 + A F (p )
yd – y
t →∞
冢 γ 冣
ε a = lim ----------------
- , l’erreur en accélération si, en régime perma- ment le plus simple possible conservant les propriétés essentielles
du système (présence d’une intégration, caractère oscillant ou
nent, la consigne évolue avec une accélération constante γ soit apériodique etc.).
1 4 : Calculer (cf. § 6 et § 7) un correcteur PID adapté à F (p )
y d = ----- γ t 2 .
2 limitant le dépassement indiciel toléré et conduisant à un temps de
On a, en appliquant le théorème de la valeur finale : réponse court (par rapport au temps de réponse du système en
1 boucle ouverte).
ε = lim ( y d – y ) = lim p ( 1 – H ( p ) ) y d ( p ) = lim p y d ( p ) --------------------------
t →∞ p →0 p →0 1 + T (p) 5 : Vérifier les performances effectivement obtenues en condui-
sant des essais transitoires (§ 2) et éventuellement modifier les
On constate que la limite lim T ( p ) est prépondérante sur la réglages empiriquement autour du PID ainsi obtenu.
p →0
valeur de l’erreur. L’erreur sera nulle si cette limite est infinie, soit
si T (p ) possède au moins une intégration (p en facteur avec le
dénominateur de T (p )).
4. Identification expérimentale
On définit donc la classe n d’un système comme étant le nombre
d’intégration du système. Par définition, n est la classe de T (p )
en boucle fermée
K
si T (p ) ≈ -------- pour p → 0 avec K constant.
pn 4.1 Modèles de comportement
en boucle fermée
Cela conduit au tableau de la figure 7 suivant, donnant les erreurs
en fonction de la classe du système. Le système en boucle fermée, commandé par un correcteur pro-
portionnel, possède un gain proche de l’unité et en général pré-
sente une réponse indicielle avec des oscillations amorties. Cela
peut être traduit par la fonction de transfert :
3. Principe de la méthode y K ( 1 + τn p )
F 31 ( p ) = ----- = -------------------------------------------------------------------------------
-
de réglage expérimentale u

du PID 冢 2mp
( 1 + τ d p ) 1 + ----------------- + ---------
ω0
p2
ω0
2 冣
avec m coefficient d’amortissement (m < 1),
La méthode, basée sur des essais indiciels, comporte les étapes ω0 pulsation propre ou naturelle,
suivantes. τd , τn constantes de temps.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 418 − 5

RY

SP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTQY

Applications de la commande PID


Asservissement température et position
par Dominique JACOB

Agrégé de Génie-électrique
Ancien élève de l’ENS de Cachan
Maître de conférences à l’IUT de Poitiers

et article contient les annexes de l’article [S 7 418].


C L’annexe 1 permet le calcul des coefficients A, B, C et D de la réponse indi-
cielle du modèle choisi pour les systèmes oscillants.
L’annexe 2 permet le calcul des coefficients A, B, C et D de la réponse indicielle
du modèle choisi pour les systèmes apériodiques.
L’annexe 3 donne le développement limité d’une fraction rationnelle.
L’annexe 4 donne une fonction utilisable avec le logiciel MATLAB permet-
tant d’effectuer l’équivalence des diagrammes de Bode de deux fonctions de
transfert.
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPT@M@d・イョゥ│イ・@カ。ャゥ、。エゥッョ@Z@ェオゥョ@RPQY

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. − © Techniques de l’Ingénieur Form. S 7 419 − 1

SQ

SR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRQ

Modèles simplifiés des systèmes


apériodiques pour leur commande
PID

Réglage à partir d’un essai indiciel
par Dominique JACOB
Professeur agrégé de Génie électrique Ancien élève de l’ENS de Cachan Institut universi-
taire de Technologie POITIERS. Département de Génie électrique

1. Simplification du correcteur PID ........................................................ S 7 421 - 2


2. Modèles de systèmes linéaires en boucle ouverte ........................ — 5
3. Performances obtenues en boucle fermée ...................................... — 8
4. Correcteur à deux intégrations pour un système de classe 0 .... — 10
5. Correcteur PID pour un système apériodique de classe 1 .......... — 14
6. Applications de la méthode ................................................................. — 17
7. Conclusion................................................................................................. — 22
8. Glossaire .................................................................................................... — 23
9. Sigles, notations et symboles.............................................................. — 23
Pour en savoir plus Doc. S 7 421

a commande PID est la plus simple et la plus répandue des commandes en


L boucle fermée. Elle est convenable pour les systèmes apériodiques. Le bon
réglage reste délicat et nécessite de modéliser et d’identifier le système en
boucle ouverte. Pour cela, des modèles simplifiés ont été proposés par
exemple par Broïda ou Strejc qui possèdent peu de paramètres que l’on peut
obtenir à partir de la réponse indicielle.
On présente ici deux autres modèles applicables aux systèmes apériodiques
dont les paramètres sont obtenus à partir d’une réponse indicielle et qui
conduisent rapidement au réglage d’un correcteur PID. Les deux modèles pro-
posés et peuvent représenter

une large gamme de processus. Ils n’ont que trois ou quatre paramètres peu
corrélés. Un essai indiciel en boucle ouverte permet de les estimer simplement
et chaque paramètre ayant un sens physique, il est aisé d’écarter des identifi-
cations aberrantes. De ces paramètres, on déduit le réglage du correcteur PID
adapté au système.

Le correcteur PID est simplifié sous la forme n’ayant que

deux paramètres (A et T car r ≈ 12 varie peu). Le but cherché n’est pas
d’obtenir une commande optimale, mais seulement un réglage rapide et satis-
faisant du correcteur. Le réglage permet d’imposer la stabilité en boucle
p。イオエゥッョ@Z@。カイゥャ@RPRP

Copyright © – Techniques de l’Ingénieur – Tous droits réservés S 7 421 – 1

SS
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRQ

MODÈLES SIMPLIFIÉS DES SYSTÈMES APÉRIODIQUES POUR LEUR COMMANDE PID _____________________________________________________________

fermée avec un dépassement indiciel limité et la bande passante la plus


grande possible.
La méthode s’applique aussi aux systèmes qui possèdent une intégration en
boucle ouverte ou aux réglages d’un correcteur qui possèdent deux intégra-
tions afin d’annuler l’erreur de poursuite.
Dans la suite, pour des signaux évoluant en fonction du temps, l’axe du

Q temps est gradué en secondes.

1. Simplification
Intégrateur
du correcteur PID

Interface IHM

Interface
de sortie
yd ε A.ω i I u Système y
+
– p F(p)

Consigne

Commande
1.1 Position du problème

Mesure
DP
y 1 + Td .p
La structure de commande classique est celle de la figure 1. A.[ ]
1 + Tf .p

de mesure
Le correcteur PID a une fonction de transfert

Interface
Effet P et D
qui comporte quatre para-
Régulateur
mètres :
• le gain A caractérise l’effet proportionnel ;
Figure 2 – Commande avec effets P et D sur la mesure
• le temps Ti caractérise l’effet intégral ; et I sur l’erreur
• le temps Td caractérise l’effet dérivé ;
• la constante de temps Tf permet le filtrage passe bas de la consigne ; cela évite la saturation de la commande lorsque la
l’effet dérivé. consigne varie brutalement, la commande étant plus faible, cela
conduit à un dépassement moindre [1].
Le but du réglage est de déterminer ces quatre paramètres pour
Le réglage des quatre paramètres nécessite l’identification de la
que le système bouclé soit stable, fonction de transfert du système en boucle ouverte F(p). Pour faci-
liter le réglage, on peut limiter le nombre de paramètres du cor-
rapide et précis.
recteur à 2 au lieu de 4 en ayant recours à une modélisation
La stabilité est le critère primordial ; quand elle est obtenue, on simplifiée de F(p) justifiée pour les systèmes apériodiques.
peut la caractériser par le dépassement de la réponse indiciel du
système bouclé H(p).
La rapidité est mesurée par le temps de réponse indiciel ou la 1.2 Expression simplifiée du PID
bande passante de H(p) [S 7 418].
La précision est évaluée par l’erreur de position, l’erreur de trai- Le correcteur PID doit apporter une avance de phase [S 7 418] et
nage et l’erreur en accélération [S 7 418]. ne doit pas posséder de pulsation de résonance ; pour cela, il faut
Avec le même réglage, pour diminuer le dépassement indiciel respecter Ti > Td > Tf alors on peut trouver des valeurs A, Ti, Td, Tf
en acceptant une erreur de trainage plus grande, on peut adopter pour mettre le correcteur sous la forme
la structure de la figure 2 dans laquelle l’effet intégral est appliqué
au signal d’erreur et l’effet dérivé appliqué au signal de mesure et le diagramme de Bode du cor-
uniquement. Ainsi, la commande ne dépend pas de la dérivée de
recteur est de la forme de la figure 3. Il existe une avance de
phase maximale pour une pulsation ωm telle que .
Commande

Le correcteur a pour rôle d’élaborer un signal de commande u(t)


lorsqu’une variation ε(t) survient pour rétablir y = yd soit ε = 0 en
Interface IHM

régime permanent. Si l’erreur ε(t) est un échelon d’amplitude Δε,


Interface Interface
de mesure de sortie

yd ε Correcteur Système y
+
– C(p) u F(p) soit alors le signal de commande est
Mesure
Consigne

Régulateur Soit . Ce signal est


représenté sur la figure 4 où l’on distingue les contributions de
Figure 1 – Structure de commande avec effets P, I, D sur l’erreur l’effet proportionnel (discontinuité initiale A · Δε), de l’effet dérivé

S 7 421 – 2 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

ST
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRQ

_____________________________________________________________ MODÈLES SIMPLIFIÉS DES SYSTÈMES APÉRIODIQUES POUR LEUR COMMANDE PID

Pour que le système bouclé soit le plus rapide possible il faut que :
(discontinuité ), de l’effet intégral (signal évoluant à long • la durée du régime transitoire due au correcteur soit la plus
faible possible, donc que Tf soit le plus petit possible ;
terme à la vitesse ). La durée du régime transitoire est envi-
• la vitesse de variation en régime permanent soit la
ron de 3 · Tf.
plus grande possible, donc Ti le plus petit possible.
Et pour qu’il existe une avance de phase il faut respecter Ti >

20 log(C|F|)
Td >> Tf.
On choisit donc Ti = Td = r · Tf avec r > 1. Q
D’où l’expression simplifiée du correcteur :
25
20 .
dB

15
10 Courbe
exacte Pour obtenir une avance de phase φmax suffisante il faut r >> 2
5
ω 103 et alors φmax est maximale pour la pulsation
10–2 10–1 100 101 102
et vaut
Fréquence (rad/s)
Avance de phase maximale
.
arg(C)
0
Courbe exacte L’avance de phase est de φmax = 45° pour et alors
Degrés

– 50
Courbe .
asymptotique
100
ω
10–2 10–1 100 101 102 103
1 1 1 1.3 Relations entre les coefficients
Ti Td Tf selon l’expression du PID
Pour les calculs, on exprime le correcteur PID sous la forme :
Figure 3 – Diagramme de Bode du correcteur PID
et comme r >> 2 on a approximative-

ment : .
ε(t)
1 Mais bien souvent, dans les régulateurs industriels, l’expression

du PID est sous la forme :


0,5
Δε

0
t
0 1 2 3 4 5 6 7 8 9 10 car r >> 1
Les deux expressions sont égales

avec
6 u(t)
durée ≈ 3.Tf
. On note que .
A
4 vitesse Δε
Ti
variation
A .T d 1.4 Correcteur PID avec double effet
2 Δε
Tf intégral
variation
0
A.Δε t Pour annuler l’erreur de trainage, le correcteur C(p) doit être de
classe 2 ; il doit comporter deux intégrateurs en cascade.
0 1 2 3 4 5 6 7 8 9 10
La commande u est obtenue à partir de l’écart ε en cumulant les
effets P, I, D et le terme de double intégration, soit

Figure 4 – Réponse indicielle du correcteur PID .

Copyright © – Techniques de l’Ingénieur – Tous droits réservés S 7 421 – 3

SU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRQ

MODÈLES SIMPLIFIÉS DES SYSTÈMES APÉRIODIQUES POUR LEUR COMMANDE PID _____________________________________________________________

Le correcteur PID avec deux intégrations (nommé PI2D) a donc 1.5 Réglage du correcteur PID
pour fonction de transfert théorique (en pratique il faut filtrer
en imposant la marge de phase
l’effet D) : .
Il est impératif de rendre le système bouclé de la figure 1
stable ; pour cela, on impose une marge de phase suffisante.
Le numérateur ne doit pas avoir un degré supérieur à celui du
dénominateur, l’effet dérivé doit être filtré par un passe bas et pour


éviter des antirésonances néfastes, le numérateur doit être facto- On note T (p) = C (p) · F (p) et .
risé en termes du premier ordre. On peut donc mettre le correcteur
PI2D sous la forme . Le système à réguler F (p) est caractérisé par sa pulsation cri-
tique ωc et son gain critique |F (jωc)|. Par définition : arg[F (jωc)]
= – 180°.
Pour les mêmes raisons que pour le PID on doit choisir Ti2 >
Ti1 > Td > Tf. Le correcteur C (p) possède l’avance de phase maximale φmax
pour la pulsation ωm.
Le diagramme asymptotique de Bode est alors celui de la
On choisit d’imposer une marge de phase suffisante ; pour cela,
figure 5. Ce correcteur procure une avance de phase stabilisante
il faut imposer les deux conditions :
si .
|T(jωa)| = 1 et arg[T(jωa)] > –180 + φm où φm est la marge de
phase et en général on prend au moins φm = 45°.
Pour augmenter la vitesse de variation du signal de commande,
il faut choisir les paramètres temporels Ti2 et Ti1 le plus faible pos- Ces conditions sont satisfaites si l’on impose :

sible, en respectant . Comme pour le PID on choisit φmax = φm = 45° et ωm = ωc et |T(jωc)| = 1.
En effet, on a :
Ti2 = Ti1 = Td = T et . Ce choix limite le nombre de para-
arg[T(jωc)] = arg[C (jωm) · F (jωm)] = arg[C (jωm)] + arg[F (jωc)].
mètres à deux et permet d’obtenir aisément un réglage suffisant
du correcteur.
.

Le correcteur est alors de la forme . Ces trois conditions φmax = φm = 45° et ωm = ωc et |T(jωc)| = 1
permettent de déterminer les deux paramètres A et Td du correc-

teur qui assure la marge de phase


Pour obtenir une avance de phase φmax suffisante il faut r >> 3

et alors φmax est maximale pour la pulsation et vaut souhaitée.


Il suffit de connaître la pulsation critique ωc et le gain critique
.
|F(jωc)| du système à commander.
On impose |T(jωc)| = 1 pour la pulsation critique du système
L’avance de phase est de φmax = 45° pour et alors
. Ceci donne le paramètre de réglage :
. adapté au système.
Le gain du correcteur doit être tel que :

1+Ti2.p
20log(|C |) 1+Ti1.p .
1+Td.p

log(ω) Le correcteur possède le paramètre et la constante


1 1 1 1
1
Ti 2 Ti 1 Tf 1 + Tf .p
Td de temps du filtrage passe bas du bruit est .
A
Ti22 .p 2
La bande passante du système en boucle fermée sera voisine
+ 90°
de ωc. La commande PID ne permet pas d’obtenir une bande pas-
sante notablement plus grande.
0° 1 1 1 1 log(ω)
Ainsi, pour régler le correcteur PID simplifié, il suffit de caracté-
– 90° Ti 2 Ti 1 Td Tf
riser le système à commander par sa pulsation critique ωc et son
gain critique |F(jωc)|. C’est pourquoi l’on cherche à modéliser le
arg(C)
– 180°
système à commander par un modèle qui devra per-

Figure 5 – Diagramme de Bode du correcteur PID avec double mettre de trouver facilement la pulsation critique ωc à partir d’un
intégration essai indiciel.

S 7 421 – 4 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

SV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRQ

_____________________________________________________________ MODÈLES SIMPLIFIÉS DES SYSTÈMES APÉRIODIQUES POUR LEUR COMMANDE PID

L’existence d’un zéro dans le système modifie la réponse indi-


cielle de façon importante et doit donc être prise en compte. Ici,
Le réglage du correcteur PID, on se limite à la prise en compte éventuelle d’un seul zéro.
Pour posséder une pulsation critique, la fonction de transfert du
pour le système F(p) ayant la pulsation critique ωc et le gain système doit avoir un degré (différence entre le degré du dénomi-
nateur et le degré du numérateur) supérieur ou égal à 3.
critique |F(jωc)| est  ; .
Si le système n’a pas de zéro, le dénominateur doit être de
r fixe la marge de phase ; il faut r = 12 pour une marge de
phase de 45°.
degré 3 et si le système possède un zéro, le dénominateur doit
être de degré 4. Q
Les deux modèles satisfaisant ces conditions sont les suivants :

• pour un système sans zéro : ce


1.6 Limites du correcteur PID
système est caractérisé par trois paramètres à identifier : le
Après réglage |T(jωc)| = 1, la bande passante du système bouclé gain K0 et deux constantes de temps telles que τ1 > τ2 ;

sera voisine de ωc. Ceci est la limite maxi-


• pour un système avec un zéro :
male que permet d’obtenir le correcteur PID pour la « rapidité » du
système bouclé. On ne peut pas imposer n’importe quel temps de ce système est caractérisé par quatre paramètres à identi-
réponse au système bouclé. Mais cette exigence serait irréaliste fier : le gain K0, les deux constantes de temps telles que
car la puissance du système est restreinte, et c’est ce qui limite le τ1 > τ2 et la constante de temps τn du zéro.
temps de réponse.
C’est la même démarche qu’ont adopté Broïda ou Strejc en
Le principe de réglage de la marge de phase est basé sur la proposant des modèles avec peu de paramètres pour modéliser
relation arg[T(jω)] = arg[C(jω)] + arg[F(jω)] qui permet d’ajuster la la réponse indicielle des systèmes apériodiques. Mais ne dispo-
courbe de phase du diagramme de Bode du système corrigé en sant pas des moyens de calculs actuels, ils s’appuyaient sur
choisissant le correcteur. Mais le correcteur PID possède un quelques propriétés géométriques particulières de la réponse.
diagramme de Bode avec des variations « lentes » de la phase Aujourd’hui on peut aisément tracer la réponse indicielle expéri-
arg[C(jω)] en fonction de la pulsation. Il ne convient pas pour com- mentale et la réponse du modèle pour apprécier visuellement ou
mander les systèmes ayant une résonance marquée qui pos- par un critère quantitatif la « proximité » entre la réponse expéri-
sèdent un diagramme de Bode avec des variations « rapides » de mentale et la réponse estimée par le modèle. Les méthodes
la phase arg[F(jω)] en fonction de la pulsation. d’identification numérique permettent aussi d’estimer rapidement
les paramètres.
L’utilisation du correcteur PID est limitée aux systèmes apério-
diques ou ayant une résonance très amortie. Il nous faut déterminer les expressions des réponses indicielles
des modèles pour les tracer et les comparer à une réponse expéri-
Pour obtenir le réglage, il faut déterminer la pulsation critique mentale. Cela permettra de choisir le modèle le plus approprié et
du système à commander. d’estimer la valeur des paramètres par approximations succes-
sives.

2. Modèles de systèmes 2.2 Expression de la réponse indicielle


linéaires en boucle ouverte du modèle simplifié sans zéro

Le modèle est :
2.1 Critères de choix du modèle
Si le signal de commande u(t) est un échelon d’amplitude
La commande par un PID simplifié ne demande que le réglage
de deux paramètres ; cela ne nécessite pas une modélisation très la réponse indicielle a pour transformée de
rigoureuse du système, mais il faut pouvoir obtenir l’estimation
Laplace :
rapide et fiable de la pulsation critique ωc.

On souhaite aussi caractériser le système avec le minimum


d’essais expérimentaux et quelques mesures simples : l’essai indi-
ciel est le plus adapté. Le but de l’identification du modèle est
d’obtenir le réglage du correcteur PID.

Le nombre de paramètres à identifier doit être le plus faible


possible pour que l’identification ne soit pas trop dépendante du
bruit inévitable sur les signaux. La recherche de petites constantes où B, C, D sont trois nombres réels :
de temps proches ou situées au-delà de la bande passante du sys-
tème est illusoire à partir d’un simple essai indiciel. Le modèle ne À l’aide des propriétés de la transformation de Laplace on
doit pas prendre en compte de tels paramètres. On se limitera obtient l’expression temporelle de la réponse indicielle :
donc à la présence de deux constantes de temps : l’une permet de
fixer le temps de réponse et la seconde, plus petite, permet de .
caractériser la réponse au début du régime transitoire.

Copyright © – Techniques de l’Ingénieur – Tous droits réservés S 7 421 – 5

SW

SX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRP

Méthodes de synthèse
de correcteurs numériques

par Gérard ALENGRIN
Professeur à l’Université de Nice Sophia Antipolis

1. Introduction à la commande numérique des systèmes ................ R 7 420 - 2


2. Méthodes de synthèse fréquentielles ................................................ — 3
2.1 Diagrammes fréquentiels, approximation de Tustin ................................ — 3
2.2 Spécifications fréquentielles....................................................................... — 4
2.3 Procédure de détermination d’un correcteur dans le plan des w’ .......... — 4
3. Placement de pôles dans le plan de la variable complexe z ,
méthode du lieu des racines................................................................. — 5
3.1 Spécifications temporelles.......................................................................... — 5
3.2 Exemples de placement de pôles dans le plan des z , méthode du lieu
des racines ................................................................................................... — 7
3.3 Compensation de pôles ou de zéros du processus par le correcteur ..... — 10
4. Synthèse de correcteurs numériques par les équations polyno-
miales .......................................................................................................... — 11
4.1 Méthode de Volguine .................................................................................. — 12
4.2 Régulateurs numériques RST..................................................................... — 17
5. Annexe. Principaux résultats sur les équations polynomiales ... — 19
Références bibliographiques ......................................................................... — 19

et article est consacré à la commande de systèmes physiques à l’aide d’un


C calculateur numérique.
C’est un vaste domaine de recherche, et l’on se limitera à l’étude des systèmes
asservis pour lesquels on aura à définir différents types de correcteurs.
On peut voir, dans divers ouvrages sur les systèmes asservis linéaires continus,
les principales propriétés de ces systèmes en boucle fermée, notamment en ce
qui concerne la réduction de sensibilité aux perturbations ou aux variations de
paramètres.
On peut également constater (voir [9] [10] que, pour obtenir des résultats satis-
faisants en termes de réponse dynamique et de précision, une simple boucle
de retour n’est souvent pas suffisante et qu’il faut ajouter un correcteur analo-
gique.
Le développement considérable des calculateurs numériques a permis de les
utiliser dans la commande en temps réel des systèmes.
Les principaux avantages de l’utilisation d’un calculateur numérique se situent
au niveau d’une grande souplesse dans la programmation des algorithmes, ce
qui permet d’obtenir facilement des lois de commandes variées. Ceci doit être
comparé à la détermination de correcteurs analogiques, plus difficiles à réaliser
physiquement.
p。イオエゥッョ@Z@。カイゥャ@QYYV

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 420 − 1

SY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRP

MÉTHODES DE SYNTHÈSE DE CORRECTEURS NUMÉRIQUES ____________________________________________________________________________________

1. Introduction à la commande court, pas d’erreurs de quantification, etc.) et on les modélisera de


la façon suivante :
numérique des systèmes — le convertisseur analogique-numérique, qui convertit les
échantillons de l’erreur à la cadence de T secondes, sera modélisé
sous forme d’un échantillonneur parfait ;
La structure générale d’un système en boucle fermée, corrigé à — l’algorithme de calcul, programmé dans le calculateur numé-
l’aide d’un calculateur numérique, est représentée sur la figure 1. rique, sera modélisé par une fonction de transfert en z ; par exemple
la fonction de transfert en z :


— Le convertisseur analogique-numérique (CAN) va convertir
l’erreur ε (t ) entre l’entrée et la sortie en une valeur numérique et b 1 z –1 + b 2 z –2
échantillonne cette erreur toutes les T secondes. D ( z ) = ---------------------------------------------
-
1 + a 1 z –1 + a 2 z –2
— Le calculateur numérique lit la valeur numérique de l’erreur,
la met en mémoire et, à partir d’un algorithme, produit un signal correspond à la relation de récurrence :
numérique de commande u (kT ).
— Ce signal est ensuite transformé par un convertisseur numé- u ( kT ) = – a 1 u [ ( k – 1 ) T ] – a 2 u [ ( k – 2 ) T ]
rique-analogique (CNA) en un signal continu v (t ).
+ b1 ε [ ( k – 1 ) T ] + b2 ε [ ( k – 2 ) T ]
Ce signal v (t ) est généralement amplifié par un amplificateur de
puissance et appliqué au système physique à commander.
que l’on peut programmer aisément sur calculateur numérique ;
Il faut également indiquer que le convertisseur numérique-ana- — le convertisseur numérique-analogique, dont la sortie est main-
logique doit délivrer un signal de type continu. Ceci est réalisé en tenue constante entre les instants kT et (k + 1)T, sera modélisé par
conservant constante la valeur de sortie du convertisseur entre un bloqueur d’ordre zéro.
deux instants d’échantillonnage.
Le modèle idéal, constitué par ces différents éléments, est repré-
Les deux opérations de conversion (analogique-numérique et senté sur la figure 2. C’est ce modèle qui sera utilisé dans la suite
numérique-analogique) sont synchronisées au moyen d’une hor- de ce texte.
loge qui cadence ces opérations.
On rappelle que la fonction de transfert d’un bloqueur d’ordre
On voit donc que le système bouclé comprend à la fois des signaux zéro est donnée (cf. [11]) par :
numériques et des signaux analogiques et que l’on doit utiliser des
méthodes permettant d’analyser ces deux types de signaux. 1 – exp ( – Tp )
B 0 ( p ) = -------------------------------------
Plusieurs questions peuvent se poser quand on utilise des sys- p
tèmes numériques :
avec p variable de Laplace.
— les convertisseurs ne réalisent pas une conversion instantanée :
il y a toujours un certain retard dans la conversion ; Par la suite, on aura souvent recours à la fonction de transfert en
— il y a introduction d’erreurs de quantification ; z du système constitué par l’association du bloqueur d’ordre zéro
— la vitesse de calcul sera fonction de la complexité de l’algo- et du système continu. On rappelle que cette fonction de transfert
rithme de conversion. est donnée par :
G(p)
Dans la suite, on considère des fonctionnements idéaux pour les B 0 G ( z ) = ( 1 – z –1 )Z  --------------- (1)
différents organes numériques (temps de conversion infiniment  p 

où Z (.) est l’opérateur de transformée en z.

Figure 1 – Système bouclé, correction


par calculateur numérique

Figure 2 – Modélisation des différents


éléments numériques

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 420 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

TP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRP

___________________________________________________________________________________ MÉTHODES DE SYNTHÈSE DE CORRECTEURS NUMÉRIQUES

Dans le paragraphe 2, on adaptera les méthodes de correction En utilisant la transformée en z, on fait apparaître la fonction de
fréquentielles rencontrées dans les systèmes asservis linéaires transfert échantillonnée :
continus (SALC) au cas des systèmes échantillonnés.
S(z )
Dans le paragraphe 3, on appliquera la transformée en z pour ------------- = B 0 G ( z )
U(z )
déterminer des correcteurs numériques en utilisant la méthode du
lieu des racines. Ceci est également très proche des méthodes ren- et, le système étant stable et le régime permanent étant établi, seuls
contrées pour les systèmes asservis linéaires continus. les pôles z = exp (j ωT ) et z = exp (– j ω T ) de S (z ) seront pris en


Le paragraphe 4 est consacré à des méthodes de synthèse utilisant compte pour le calcul de la sortie s (kT ).
des équations polynomiales de la variable z –1 : tout d’abord, la D’où finalement les valeurs du gain G et du déphasage φ :
méthode de Volguine basée sur la compensation de pôles et de zéros
stables et conduisant aussi à une structure de correcteur numérique G = B 0 G ( exp j ω T ) 
en cascade ; enfin on présente une structure de correcteur plus éla-  (2)
borée faisant intervenir à la fois une fonction de transfert sur la chaîne φ = arg B 0 G ( exp j ω T ) 
directe et aussi sur la boucle de retour : c’est la structure dite RST.
C’est donc l’analogue de l’analyse fréquentielle pour les systèmes
continus pour laquelle on prenait, pour la fonction de transfert G (p ) :
p = j ω, ω variant de 0 à + ∞
2. Méthodes de synthèse Ici, à partir de la transformation z = exp Tp, on pose p = j ω, ωT
fréquentielles variant de 0 à π.
Cependant, les propriétés que l’on rencontrait en continu et qui
permettaient de tracer facilement des diagrammes (Bode, Black...)
On étudiera de manière assez complète dans cet article les correc- ne se retrouvent pas ici. En effet, à cause de la transformation
teurs numériques en cascade, comme celui qui est représenté sur exp (j ωT ), B 0 G ( exp ( j ω T ) ) n’est pas une fraction rationnelle de j ω.
la figure 3.
Il faut donc, pour des raisons pratiques, utiliser une autre variable.
Une première méthode de détermination de ces correcteurs va
être développée dans ce paragraphe. Elle repose sur l’utilisation de ■ Transformée en w
méthodes fréquentielles qui ont été à la base de la correction pour
Dans l’article [11], on montre que la transformée en w permet d’uti-
les systèmes asservis linéaires continus. En effet, pour ces
liser des propriétés relatives aux systèmes continus (par exemple
systèmes, on a pu définir des spécifications fréquentielles : coeffi-
pour l’étude de la stabilité) ; on rappelle qu’elle est définie par :
cient de résonance, bande passante, marge de gain, marge de
phase, etc. et déterminer le correcteur le mieux adapté : avance de z–1
phase, action intégrale, PI, PID... w = ------------ (3)
z+1
Les ingénieurs ont acquis une grande connaissance dans ce
domaine des correcteurs fréquentiels et il paraît donc intéressant et Lorsque z varie sur le cercle unité suivant la relation z = exp (j ωT ),
naturel d’essayer de transposer cette connaissance dans le cas des on a :
correcteurs numériques. exp ( j ω T ) – 1 ωT
w = ------------------------------------- = j tan --------- = j v (4)
Il faut cependant rappeler les caractéristiques nouvelles qui appa- exp ( j ω T ) + 1 2
raissent dans le cas de la réponse fréquentielle de systèmes discrets Lorsque ω T varie de 0 à π, la variable v varie de 0 à + ∞ et joue
(à une entrée A sin ω t ) : donc le rôle d’une pulsation.
π
— on ne peut faire varier la pulsation ω au-delà de ----- ; De plus, si B 0 G ( z ) est rationnelle en z, B 0 G ( w ) sera aussi
T
— la sortie du système discret est une suite d’impulsions qui va rationnelle en w, ce qui permettra de tracer aisément les principaux
produire une infinité d’harmoniques. diagrammes.
■ Transformation de Tustin
Une autre transformation utile est la transformation de Tustin, qui
2.1 Diagrammes fréquentiels, diffère de la précédente par un facteur d’échelle :
approximation de Tustin
2 z–1
w ′ = ------ · ------------ (5)
T z+1
Pour étudier la réponse fréquentielle d’un système discret, on
et lorsque z = exp (j ωT )
applique un signal d’entrée A sin ω t qui est ensuite échantillonné et
qui donne : 2 ωT
u (kT ) = A sin(ω kT ) w ′ = j ----- tan ---------- = jv ′ (6)
T 2
Sous les hypothèses habituelles de système linéaire invariant et
On remonte ensuite à la variable z par la relation :
stable, la sortie en régime permanent est donnée aux instants
d’échantillonnage par : T
1 + w ′ -----
s (kT ) = GA sin(ω kT + φ ) 2
z = ----------------------- (7)
T
1 – w ′ -----
2

Figure 3 – Modèle générique


de l’asservissement échantillonné

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 420 − 3

TQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRP

MÉTHODES DE SYNTHÈSE DE CORRECTEURS NUMÉRIQUES ____________________________________________________________________________________

On comparera les deux transformations w et w’ à la pulsation ■ Pour une entrée en échelon de position, on obtient pour l’erreur
exacte ω : la figure 4 montre, pour une période d’échantillonnage correspondante :
T = 0,1 s, l’approximation de la pulsation ω par la transformée en w
et par la transformée de Tustin. 1 1
ε p ( ∞ ) = lim ----------------------------------------------- = ---------------- (9)
z → 1 1 + D ( z )B G ( z ) 1 + Kp
On choisira l’approximation de Tustin pour deux raisons 0
principales :
où K p est la constante d’erreur de position.
2 ωT ωT
• v ′ = ---- tan ---------- approche mieux ω que ne le fait v = tan ----------


Ce résultat sera ensuite utilisé dans le paragraphe suivant où
T 2 2
l’on travaille directement sur la transformée en z.
(dans un certain domaine : 0  ω T  0,8 environ) comme le montre Ici, on utilise la transformation (7) pour obtenir :
la figure 4 ;
2 1 1
• le facteur d’échelle ----- permet d’avoir des fonctions de transfert ε p ( ∞ ) = lim ------------------------------------------------------- = ---------------- (10)
T w ′ → 0 1 + D ( w′ ) B G ( w ′ ) 1 + Kp
0
qui approchent celles du continu lorsque T → 0.
Ceci est tout à fait analogue au résultat concernant les systèmes
continus :
2.2 Spécifications fréquentielles — si D (w ′ ) B 0G (w ′ ) n’a pas de pôle en w ’ = 0,
ε p (∞) → constante ;
2.2.1 Régime transitoire
— si D ( w ′ ) B 0 G (w ′ ) a un pôle de degré  1 en w ’ = 0,
Comme dans le cas des systèmes continus, on spécifiera des εp (∞) → 0.
conditions, en particulier sur le degré de stabilité du système en
boucle fermée. ■ Pour une entrée en échelon de vitesse (ou rampe), l’erreur de
vitesse est donnée par :
Ce degré de stabilité sera généralement évalué en termes de :
— marge de gain (généralement comprise entre 8 dB et 15 dB) ; T T
ε v ( ∞ ) = lim ------------------------------------------------------- = ------- (11)
— marge de phase (comprise entre 40o et 50o) ; z → 1 ( z – 1 )D ( z ) B G ( z ) Kv
0
— facteur de résonance Q ≈ 2,3 dB.
En utilisant la transformation (7), on a :

2.2.2 Régime permanent w ′T


z – 1 = ------------------------- (12)
T
1 – w ′ -----
La précision du système en régime permanent est déterminée par 2
les valeurs des erreurs pour différents types d’entrées : échelon de ce qui conduit à :
position, échelon de vitesse, etc.
En appliquant d’abord le théorème de la valeur finale aux 1 T
ε v ( ∞ ) = = lim ----------------------------------------------------- = -------- (13)
transformées en z, on obtient pour l’erreur donnée dans le schéma w ′ → 0 w ′D ( w ′ ) B 0 G ( w ′ ) Kv
de la figure 3 :
On retrouve ici aussi les mêmes résultats que dans le cas continu :
E(z )
ε ( ∞ ) = lim ε ( nT ) = lim ( z – 1 ) ---------------------------------------------- (8) — si D ( w ′ ) B 0 G ( w ′ ) n’a pas de pôle en w ′ = 0 , ε v (∞) → ∞ ;
n→∞ z→1 1 + D ( z )B 0 G ( z )
— si D ( w ′ ) B 0 G ( w ′ ) a un pôle de degré 1 en w ′ = 0 ,
ε v (∞) → constante ;
— si D ( w ′ )B 0 G ( w ′ ) a un pôle de degré  2 en w ′ = 0 ,
ε v (∞) → 0.

2.3 Procédure de détermination


d’un correcteur dans le plan des w’

Pour déterminer le correcteur, on procédera de la manière


suivante :
➀ Déterminer la fonction de transfert en z, B 0 G ( z ) de l’ensemble
« bloqueur d’ordre zéro + système ».
➁ En utilisant l’expression reliant z et w ’, déterminer la trans-
formée en w’ : B 0 G ( w ′ ) .
➂ Tracer les diagrammes de Bode du module et de l’argument
de B 0 G ( jv ′ ) . On tracera les diagrammes asymptotiques. Il est
absolument nécessaire de tracer le diagramme de l’argument, car
généralement les systèmes en w ’ ne sont pas à minimum de phase.
➃ À partir des diagrammes de Bode, on construira le diagramme
de Black.
Figure 4 – Comparaison des approximations de la pulsation 
par la transformée en w et par la transformée de Tustin

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 420 − 4 © Techniques de l’Ingénieur, traité Informatique industrielle

TR
Régulation et commande des systèmes asservis
(Réf. Internet 42394)

1– Régulation R
2– Commande Réf. Internet page

La commande prédictive : modélisation S7424 45

Commande prédictive S7425 51

Commande adaptative des systèmes S7426 61

Commande optimale R7427 67

Systèmes dynamiques et commande S7430 71

Commande fréquentielle robuste. Application aux paliers magnétiques R7432 75

Commande modale. Application au pilotage d'un avion R7433 77

Commande en régime glissant S7435 85

Tour d'horizon sur les techniques anti-windup pour les systèmes saturés. Commande S7436 91
anti-windup
Aide au pilotage  : application agroalimentaire S7437 95

Systèmes et régulateurs lous. Déinition et cognition S7440 99

Systèmes et régulateurs lous. Applications S7441 103

Commande des systèmes par platitude S7450 107

Matlab/Simulink pour l'analyse et la commande de systèmes S7460 111

Multimodèles : analyse et synthèse. Commande et observation des modèles Takagi- S7462 115
Sugeno
Cahier des charges des automatismes. Analyse fonctionnelle S8095 119

 Sur www.techniques-ingenieur.fr
• Saisissez la référence Internet pour accéder directement aux contenus en ligne
• Retrouvez la liste complète des ressources documentaires

TS

TT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRT

La commande prédictive :
modélisation
Predictive control : Process Modelling
par Jacques RICHALET


Docteur en Sciences
Fondateur et ancien directeur d’ADERSA

Guy LAVIELLE
Consultant, ancien automaticien
Ingénieur retraité du groupe Arcelor

et Joëlle MALLET
Professeur en automatique avancée,
Institut de régulation et d’automatisation

1. Problème........................................................................................... S 7 424 – 2
1.1 État des lieux ...................................................................................... — 3
1.2 Système : état/structure ..................................................................... — 3
1.3 Complexité et complication ............................................................... — 3
1.4 Hypothèse fondamentale ................................................................... — 3
1.5 Protocole d’essai ................................................................................ — 4
1.6 Types de signaux de test ................................................................... — 4
2. Modélisation .................................................................................... — 5
2.1 Modèle ................................................................................................ — 5
2.2 Principe de la méthode du modèle ................................................... — 6
2.3 Réification ........................................................................................... — 6
2.4 Espace paramétrique ......................................................................... — 7
3. Identification ................................................................................... — 9
3.1 Prétraitement ...................................................................................... — 9
3.2 Méthodes d’identification .................................................................. — 10
3.3 Exemple industriel ............................................................................. — 11
4. Protocole d’essai............................................................................. — 14
4.1 Lien entre les espaces d’état et de structure .................................... — 14
4.2 Identification à basse et haute fréquence ......................................... — 14
4.3 Influence du protocole sur l’isodistance ........................................... — 16
5. Optimisation du protocole d’essai .............................................. — 18
5.1 Objectif ............................................................................................... — 18
5.2 Choix du protocole d’essai ................................................................ — 18
6. Qualité du modèle........................................................................... — 18
6.1 Sous-caractérisation ........................................................................... — 18
6.2 Sur-caractérisation ............................................................................. — 18
7. Conclusion........................................................................................ — 19
8. Annexe : logiciels d’identification .............................................. — 19
8.1 Programme Test ................................................................................. — 19
8.2 Programme ident_MC (méthode de Monte-Carlo) ............................ — 20
8.3 Programme ISO-D .............................................................................. — 21
8.4 Résultats graphiques .......................................................................... — 22
Pour en savoir plus.................................................................................. Doc. S 7 424
p。イオエゥッョ@Z@、←」・ュ「イ・@RPQR

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 424 – 1

TU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRT

LA COMMANDE PRÉDICTIVE : MODÉLISATION ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

C et article s’adresse aux techniciens et ingénieurs chargés d’installer dans


les sites de production industriels des systèmes de commande automa-
tique. La Commande Prédictive ici proposée est de plus en plus utilisée, car
elle a des caractéristiques qui répondent bien aux besoins des utilisateurs
avec un rapport coût/performance intéressant. C’est avec la volonté de rendre
le message facilement accessible que cette commande est présentée ici de la
façon la plus simple possible, alors que des justifications mathématiques sont
disponibles dans d’autres documents plus théoriques.
Elle se présente sous la forme d’un algorithme de commande implantable, ou
souvent déjà pré-implanté, dans les automates et systèmes de commande
actuellement disponibles industriellement.
R Tous les processus dans leurs environnements propres sont particuliers avec
des objectifs bien spécifiques ; il ne s’agit pas d’appliquer des « recettes » mais
plutôt de fournir des bases de solution à partir desquelles l’automaticien local
pourra, selon sa compétence, adapter la méthode et son réglage au cas précis.
La loi de commande utilise en temps réel un modèle dynamique du proces-
sus, dont l’identification constitue l’essentiel du travail à effectuer.
La commande PFC est la plus ancienne commande prédictive, elle a été
conçue volontairement ‘facile à comprendre’ et à implanter, mais elle assure
en général de meilleures performances en précision et stabilité que la régula-
tion PID traditionnelle, qu’elle ne cherche pas à remplacer mais dont elle sou-
haite prendre le relais lorsque celle-ci bute sur ses limites.
La commande prédictive est fondamentalement à base de modèle et nous
commençons donc par décrire les problèmes et les solutions proposées pour
obtenir ces modèles qui seront implantés et utilisés en temps réel dans l’organe
de commande.

bien sûr de connaı̂tre ce processus ! On se trouve donc en face


1. Problème d’une procédure itérative à négocier…
L’optimisation du protocole d’essai, comme nous le verrons, est
un problème délicat avec des aspects théoriques d’optimisation de
& Situation actuelle la mise en œuvre technique et des problèmes de relations
Depuis sa création (1968) la commande PFC (Predictive Functio- humaines.
nal Control) [R 7 423], [15], [16] s’est fortement renforcée et perfec- Si la qualité du modèle, c’est-à-dire son aptitude à se comporter
tionnée, elle est maintenant diffusée dans divers secteurs indus- comme le processus, n’est pas suffisante alors toute commande
triels et implantée dans pratiquement tous les automates ultérieure, quelle que soit sa qualité intrinsèque, ne donnera pas
industriels. L’augmentation du coût de l’énergie et le durcissement satisfaction.
de toutes les spécifications des produits à fabriquer font que les
industriels cherchent à avoir une meilleure maı̂trise de leur outil & Conception de la commande
de production. Au-delà du classique PID, tous les appels d’offre Le modèle de comportement du processus étant établi, l’espace
issus de l’industrie de production exigent maintenant une solution de travail est homogène : les données (le modèle) et le résultat (l’al-
« Advanced control ». gorithme de commande) sont tous deux des objets mathémati-
& Modélisation ques, que l’on va traiter en toute liberté et responsabilité, alors
que la modélisation dite de connaissance part du monde physique
La commande PFC nécessite un modèle dynamique du pro- réel, très complexe, pour terminer sur une équation mathématique,
cédé [2], [16] et c’est cette partie qui se révèle la plus critique, et en fait, très simpliste !
cela pour diverses raisons que l’on peut résumer à deux types de La commande PFC est ici volontairement limitée à des processus
contraintes : d’ordre quelconque, mais le plus souvent monovariables, allant
– l’une théorique. En effet, tout processus est extrêmement com- cependant jusqu’à des processus ayant plusieurs entrées (variables
plexe si l’on rentre dans les détails, il faut donc trouver un compro- manipulées) et sorties (variables à réguler). Ce choix s’explique
mis entre la rigueur de sa représentation et la commodité d’implan- par :
tation d’une commande juste suffisante ; – le fait qu’un très grand nombre de processus rentre dans cette
– l’autre pratique. Pour établir le modèle il faut appliquer un catégorie, domaine classique du PID ;
« protocole d’essai », sollicitations d’entrées exogènes sur le pro- – l’existence d’un algorithme de commande non itératif qui s’im-
cessus, qui ont cependant l’inconvénient de perturber légèrement plémente facilement dans tous les automates existants ;
la production. Le meilleur protocole, celui qui pose les « bonnes – le réglage, particulièrement simple, de la commande, le modèle
questions » au processus, peut être établi facilement à la condition étant validé, accessible directement à tout automaticien de terrain.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 424 – 2 est strictement interdite. – © Editions T.I.

TV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRT

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– LA COMMANDE PRÉDICTIVE : MODÉLISATION

1.1 État des lieux processus. Dans le cas du ballon d’eau, le processus est équipé de
capteurs donnant à chaque instant les valeurs des débits d’eau
Les performances de la commande des processus industriels ont entrant et sortant et les valeurs du niveau d’eau. On nomme varia-
fait dernièrement des progrès notables. Plusieurs raisons ont bles ces mesures, elles ne sont pas indépendantes et sont reliées
contribué à cette avancée : par une structure. Si Qe (t) est le débit entrant, Qs (t) le débit sortant
– des raisons techniques. Un calculateur numérique, fiable, puis- et N(t) le niveau, on peut écrire, par conservation de la matière, la
sant et bon marché, peut traiter à la fois des problèmes logiques et relation intégrale :
analytiques, de grandes dimensions, alors qu’un régulateur PID à
base de circuits électroniques était limité ; dN (t )
= K . (Qe (t ) − Qs (t )) (1)
– des raisons méthodologique. Grace à la modélisation mathé- dt
matique des processus, il est possible de simuler en temps réel l’ef-
fet d’une action de commande et d’aborder ainsi le problème de la Les variables N(t), Qe (t), Qs (t) sont reliées par une relation fonction-
régulation d’une façon totalement différente de ce que l’on pouvait nelle où le niveau est l’intégrale de la différence des débits. Le


faire avec les anciens régulateurs. vocabulaire suivant doit être strictement respecté :
Nous verrons plus tard que la démarche et les résultats peuvent – l’état. Il s’agit de l’ensemble des variables Qe (t), Qs (t), N(t) ;
même paraı̂tre très surprenants : par exemple, il n’y a pas d’inté- – la structure. Il s’agit du lien fonctionnel entre les variables
grateur explicite dans la loi de commande prédictive. Le plus sur- d’état : ici une équation intégrale (1) qui par le gain K (paramètre
prenant retour aux sources est que la régulation prédictive actuelle de structure) relie les variables d’état.
reproduit en fait, dans ses principes, la régulation qu’un opérateur
Il ne faut pas qu’il y ait de confusion mentale entre « variables :
humain utilise naturellement.
état » et « paramètres : structure ». Notons que le gain K peut varier
Exemple : un opérateur expérimenté, c’est-à-dire connaissant le dans le temps, mais il reste un paramètre.
comportement de son four, sait qu’une augmentation de débit de gaz
de 5 %, donnera dans le quart d’heure qui suit une augmentation de
température de 20  C environ. Comme il sait qu’il peut y avoir des per- 1.3 Complexité et complication
turbations, il viendra vérifier de temps en temps si la chauffe se produit
comme prévue et fera quelques corrections locales si nécessaires. Il a Les processus se révèlent souvent à la fois complexes et
la connaissance du comportement dynamique du processus, ce que compliqués.
les automaticiens nomment modèle dynamique du processus, et il Complexité : en général les processus sont soumis à plusieurs
s’en sert. Lorsque l’on compare les enregistrements de la conduite de variables d’entrée, autres que les variables d’actions, qui viennent
chauffe d’un four en mode automatique à celles en mode manuel, on perturber le comportement de façon parfois inconnue et non mesu-
observe des actions continues locales pour le PID, alors que les rable. Ce nombre de variables peut être grand, le processus étant
actions manuelles sont plus rares mais en général plus pertinentes. d’ordre élevé avec de nombreuses perturbations mesurables ou
non. La taille du processus le rend complexe.
La commande prédictive peut également être interprétée comme
Complication : la relation physique entre ces différentes entrées
une technique de scénario, comme c’est par exemple le cas en
et la sortie à réguler peut être compliquée, fortement non linéaire,
recherche opérationnelle où quelques projets d’actions sur le
instationnaire et mal connue. Par exemple, le niveau d’un ballon de
modèle du processus sont simulés et c’est le plus satisfaisant, au
chaudière est soumis à des perturbations de trempe, gonflement et
sens d’un critère préalablement défini, qui est retenu.
tassement dues à la différence d’état physique de l’eau d’alimenta-
Caractéristique fondamentale de la commande prédictive : Un tion et de l’état mixte diphasique vapeur/eau de la recirculation
projet de trajectoire temporelle [16] à suivre pour atteindre une dans les tubes écrans.
consigne donnée est défini : partant de l’état actuel mesuré connu
de la sortie du processus s(t0) à régler, on se donne, grâce au Complexité et complication seront traitées de façons distinctes.
modèle connue, un projet de comportement futur s(t0 + t), qui
tend suivant une certaine trajectoire temporelle vers la consigne
finale. C’est ce que fait naturellement l’opérateur humain pour 1.4 Hypothèse fondamentale
aller d’un point géographique A vers un point B, plusieurs routes
La relation mathématique qui lie les entrées et les sorties peut
étant possibles, à des vitesses différentes, avec une consigne ins-
être quelconque : linéaire ou non, variable avec le temps ou sta-
tantanée variable tendant vers la consigne finale.
tionnaire, etc.
Le temps de réponse en boucle fermée est fixé (dénommé
TRBF) [16]. Il est le principal paramètre de réglage de la com- On fait implicitement l’hypothèse que :
mande, de signification immédiate, en opposition avec les multi- « la structure ne dépend pas de l’état et de la nature de l’entrée. »
ples règles du PID prescrites pour l’obtention d’un résultat non Prenons un exemple simple et clair : soit un processus dyna-
totalement prévisible.
mique où la relation entrée/sortie est correctement représentable
par un processus dynamique différentiel d’ordre 1 de gain K et de
1.2 Système : état/structure constante de temps T. Lorsque qu’il est soumis à une certaine
entrée d’amplitude et de spectre limité, telle qu’une entrée en éche-
Avant de rentrer plus en avant dans la modélisation, base de la lon, il fournit une certaine réponse qui dépend du processus (K, T).
commande, il est nécessaire de présenter rapidement les quelques Appliquons maintenant au même processus inchangé une entrée
concepts qui sous-tendent tout ce qui va être exposé par la suite et sinusoı̈dale, il en sort un signal sinusoı̈dal, en régime permanent,
de définir le vocabulaire associé. Il sera choisi comme exemple élé- mais le lien qui relie entrée et sortie est le même que dans le cas
mentaire la régulation du niveau d’eau d’un réservoir, qui peut précédent de l’entrée en échelon.
apparaı̂tre simpliste et banal mais qui parfois s’avère très difficile
comme dans le cas d’un ballon d’une centrale thermique ! À partir des mesures physiques entrée et sortie, on va pouvoir
extraire ce lien, modéliser le processus, rechercher une représenta-
La commande prédictive opère dans deux espaces : l’espace tion mathématique quelconque, comme nous allons le voir en
d’état et l’espace de structure [16]. détails, rechercher sa structure et les valeurs numériques des para-
L’état d’un processus est représenté à un instant donné par l’en- mètres qui définissent qualitativement et quantitativement le pro-
semble des mesures que l’on peut ou pourrait faire sur le cessus, en fait « sa carte d’identité ». Ce modèle va servir à

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 424 – 3

TW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRT

LA COMMANDE PRÉDICTIVE : MODÉLISATION ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

concevoir une commande qui va piloter le processus soumis à dif- processus un protocole d’essai, c’est-à-dire suite de signaux d’en-
férentes consignes et perturbations. trée connus provoquant la variation de la ou les sorties que l’on
En fait, nous verrons plus loin (§ 1.5) que, suivant la nature du désire réguler.
protocole d’essai (ensemble de sollicitations appliquées au proces- On est donc en face d’un vrai processus industriel avec toutes les
sus), dans un environnement expérimental limité, le processus contraintes techniques et opératives que cela entraı̂ne. Ce moment
peut être très bien modélisé, en apparence, par un modèle qui est crucial car la qualité du modèle et la régulation qui en découle
change avec la nature de l’entrée. vont en dépendre.
Nous traiterons ce problème ultérieurement lors de l’optimisa- Un tel protocole fait souvent face à deux difficultés majeures :
tion des protocoles d’essai. – la perturbation de la production. Dans la majorité des cas le
Il existe des procédés, en particulier où intervient un opérateur processus est en cours de production et le producteur, qui a des
humain dans le processus qui peut complètement changer d’objec- objectifs à tenir, craint que toute action sur son processus vienne
tifs et modifier le comportement local du processus observé. Un perturber la production en quantité ou en qualité ;


exemple connu est celui de la spéculation boursière où pour le – l’indépendance du signal de test. Il faut appliquer un signal de
même environnement, les mêmes entrées peuvent produire des test indépendant des signaux qui circulent, issus d’une régulation
résultats très différents, suivant le changement de stratégie de automatique. Ce signal de test doit être exogène. L’erreur classique
l’opérateur humain. serait en gardant la régulation préexistante du processus perturbé
d’identifier un modèle où l’entrée serait la MV (Manipulated
La commande PFC ne procède pas ainsi. Le modèle est implanté Variable) mesurée du régulateur et la sortie la CV (Controlled
dans le calculateur de commande, alimenté par les entrées Variable) du processus, avec une consigne constante. MV et pertur-
connues du processus (variable manipulée précédente et perturba- bation sont alors fortement corrélées par le régulateur et le modèle
tions mesurées) ; il calcule en temps réel la sortie du modèle sou- du processus trouvé est alors fortement biaisé.
mis aux variables manipulées précédentes et aux perturbations
mesurées. Cette sortie rentre dans l’équation de commande
(figure 1). Cette procédure est simple à implanter car elle traite 1.6 Types de signaux de test
indépendamment la prédiction du modèle et les spécifications de
performance désirée du régulateur. & « Test unique »
C’est typiquement le cas en Chimie/Pharmacie où l’outil de pro-
duction est un réacteur dont la régulation de la température interne
1.5 Protocole d’essai se fait par une action sur la température du fluide caloporteur de la
double enveloppe. Le solvant à l’intérieur du réacteur est la charge
Le principal objet d’un protocole d’essai est la recherche du massique principale. On fait alors un test sur une charge morte,
« meilleur modèle », c’est-à-dire celui qui soumis aux mêmes sans réaction, donc sans exo/endo-thermicité intérieure et, dans ce
entrées que le processus donne un comportement le plus proche cas, en respectant les consignes de sécurité, on peut appliquer un
possible de la réalité. Que le modèle soit de connaissance c’est-à- protocole de grande amplitude.
dire défini à partir de modèles généraux que sont les lois de la phy- Mais il y a perte de production et la chance n’est donnée qu’une
sique, ou qu’il soit de représentation « boite noire » où les paramè- seule fois ou presque… Le protocole d’essai doit donc être bien
tres n’ont pas de sens physique. préparé.
Il convient donc de le valider par des essais réels. Notons que s’il Il faut cependant faire remarquer que les modèles physiques de
est de pure représentation, des essais expérimentaux plus poussés ce type de processus sont bien connus et, qu’à l’encrassement près
et plus longs seront nécessaires. On va donc appliquer au de la double enveloppe, on en a une bonne connaissance a priori.

Perturbations Perturbations
non mesurables mesurée

Modèle
de perturbation

+
Consigne
Commande
PFC Processus
+

Modèle
de processus

Mesure

Figure 1 – Schéma de commande

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 424 – 4 est strictement interdite. – © Editions T.I.

TX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRT

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– LA COMMANDE PRÉDICTIVE : MODÉLISATION

& « Test long…


… mais discret » passe dans le monde physique réel. On distingue deux types de
Le test ne doit pas perturber la production, il va donc être consti- modèles : les modèles de connaissance et les modèles de
tué d’une suite de créneaux classiques, mais de petite amplitude représentation [2] [3] [4].
devant les autres actions.
Le rapport signal/bruit est alors mauvais et pour décorréler le 2.1.1 Modèle de connaissance
signal utile du bruit ambiant il faut opérer pendant un temps long On rentre dans l’analyse du processus en le découpant en sous-
devant la dynamique du processus, ce qui implique que le proces- systèmes à l’aide des lois de la physique. Les modèles qui vont être
sus ait des caractéristiques stationnaires pendant la durée du pro- construits à partir de ces modèles de base sont dits « de connais-
tocole d’essai. sance », aussi nommés dans la littérature anglo-saxonne « First Prin-
Tous les prétraitements de filtrage parallèle que nous verrons ciples model » ; leurs paramètres ont donc « un sens physique ». Ils
plus loin (cf. § 3.1.2) sont absolument nécessaires. ont une signification universelle, ce sont des dimensions géométri-
ques, de caractéristiques physiques de la matière, etc.
& « Protocoles très bas niveau »
Il existe des processus extrêmement dangereux où tout signal
exogène pourrait provoquer des incidents graves. La régulation de
niveau de la coulée continue en sidérurgie en est un exemple type.
2.1.2 Modèle de représentation
C’est un « jeu mathématique ». Il s’agit de trouver une structure

Le rapport signal de test/bruit doit être « très petit », tel qu’un opé- mathématique, détachée de la réalité physique du processus, qui
rateur averti ne s’aperçoive pas qu’un protocole d’essai est en train soit capable de reproduire son comportement. Ce peut être une
d’être appliqué, signal non détectable à vue, noyé dans le bruit équation différentielle classique, une représentation de convolution
ambiant habituel. On va alors adapter cette démarche et utiliser (réponse impulsionelle) [13] [14] [16], éventuellement un réseau
les propriétés des fonctions propres des systèmes linéaires. neuronal, etc.
Il faut que cette représentation ait un nombre restreint de para-
On appelle entrée propre d’un système linéaire dynamique mètres structuraux inconnus à identifier et qu’il soit possible de
stable, une entrée qui en régime permanent est de même nature calculer, avec ce jeu de paramètres, la sortie du modèle pour une
que la sortie permanente du processus. Les entrées polynomiales entrée donnée. Les paramètres du modèle de représentation n’ont
ou harmoniques sont des entrées propres. Une entrée en échelon pas de sens physique particulier, on ne sait pas relier leur valeur
donne, en régime permanent, un échelon ou une rampe ou autres aux caractéristiques physiques du processus. La démarche a pour
signaux dont les pôles ont une partie réelle nulle. On va donc uti- avantage :
liser ici les entrées harmoniques dont les transformées de – de ne pas nécessiter une analyse physique complexe ;
Laplace ont bien des pôles complexes avec une partie réelle – d’être rapide et systématique ;
nulle et qui de plus ont une moyenne temporelle nulle. – d’être exécutée par un algorithme d’identification choisi parmi
On dispose maintenant de filtres « passe bande sans une grande variété de techniques d’analyse numérique (cf. § 3.2).
défauts » [7] extrêmement sélectifs, ne laissant pratiquement
passer, après un certain temps, que le signal de fréquence fixée. Elle a pour inconvénient l’obtention d’un modèle qui n’est pas
capitalisable car seulement valable pour le processus donné ; si
La procédure de création de protocoles bas niveau consiste un autre processus de même type est à identifier, il faut recommen-
donc à implanter : cer toute la procédure. De plus on n’augmente pas, ou très peu, la
– plusieurs générateurs harmoniques de fréquences adaptées connaissance du processus.
Fi comme signal de test ajoutés au signal de commande actuel ;
– plusieurs filtres parallèles centrés sur les fréquences Fi choi- Exemple industriel. Soit un processus thermique, typiquement
sies appliqués à l’entrée et à la sortie du processus. un réacteur chimique, constitué d’une masse à une certaine tempé-
rature Tm mesurable, soumis à travers une paroi de surface A à un
Il s’agit ensuite de reconstituer :
flux thermique venant d’un caloporteur de débit F et de température
– un signal d’entrée Ef en sommant les signaux d’entrée Tf (figure 2).
harmoniques ; Les variables principales, dépendant du temps, sont donc en pre-
– un signal de sortie Sf en sommant également les signaux de mière approche : Tm (t), Tf (t) et F(t).
sortie filtrés par la même batterie de filtres parallèles. On considère également leurs dérivées successives (ici les déri-
Enfin, il faut identifier les paramètres du modèle suivant une vées premières en se limitant à des systèmes d’ordre 1), par
quelconque procédure classique d’identification. dT (t )
exemple m .
dt
Cette procédure est donc simple à implanter, n’utilisant que
des opérateurs connus, cependant on doit s’assurer que la sta-
tionnarité du processus est suffisante pour être compatible avec
Tm
la dynamique des filtres passe-bande et la dynamique du pro-
cessus. Durée du protocole, largeur des filtres (leur dynamique
de réponse) et stationnarité du processus sont à ajuster.

2. Modélisation
2.1 Modèle U, A
Toutes les disciplines techniques tendent maintenant à faire des
modèles. Ces modèles sont mathématiques, car la mathématique F, Tf
est le langage de l’abstraction et qu’il est compris par les simula-
teurs numériques. On va demander au modèle, implanté dans un
calculateur numérique, de simuler en temps accéléré ce qui se Figure 2 – Processus thermique

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 424 – 5

TY

UP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

Commande Prédictive
par Jacques RICHALET
Docteur ès-sciences, Ingénieur
Formateur, Consultant, Louveciennes

Guy LAVIELLE
Ingénieur
Consultant, Montélimar


et Joëlle MALLET
Ingénieur
Formateur à l’Institut de Régulation et d’Automation. Arles 3, Bouches-du-Rhône

1. Principes élémentaires .................................................................. S 7 425 – 3


2. Contraintes....................................................................................... — 8
3. Réglages............................................................................................ — 12
4. Mise en œuvre ................................................................................. — 16
5. Autocompensateur ......................................................................... — 20
6. Conclusion........................................................................................ — 22
7. Processus particuliers ................................................................... — 25
8. Consignes variables........................................................................ — 28
9. Conclusion........................................................................................ — 30
Annexes : programmes MATLAB‚....................................................... — 16
Pour en savoir plus.................................................................................. Doc. S 7 425

L es industries de production du type pétrole, chimie, pharmacie, agro-ali-


mentaire, métallurgie, énergie, assainissement, séchage, fours, etc., utili-
sent, classiquement, depuis longtemps le régulateur PID (proportionnel, inté-
gral, dérivée) à toutes fins utiles.
Mais ce régulateur a des limites : processus difficiles, prise en compte de
contraintes, performances limitées, compromis de réglage, etc.
Dans la compétition économique mondiale, l’automatique a un rôle à jouer ;
pour ce faire on dispose maintenant de deux atouts significatifs :
 les techniques de modélisation mathématique des processus ;
 les automates industriels qui ont fait de remarquables progrès en vitesse,
puissance, facilité de programmation et coût.
Si bien que l’on peut maintenant y implanter, dans de bien meilleures condi-
tions, des commandes beaucoup plus performantes.
La commande prédictive PFC utilise au mieux l’apport de la modélisation du
processus à piloter et la puissance des organes de traitement de l’information ;
elle est facile à comprendre, à implanter et à régler, quitte à être parfois sous-
optimale, mais elle est capable de traiter de façon efficace une majorité des
problèmes de régulation se situant hors du champ d’application du régulateur
PID.
Le TRI, indicateur économique de l’industriel (temps de retour sur investisse-
ment PFC) est court, PFC est alors rapidement accepté et intégré dans la boı̂te à
outils de l’instrumentiste industriel.
p。イオエゥッョ@Z@ェオゥョ@RPQT

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 425 – 1

UQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

COMMANDE PRÉDICTIVE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Son réglage se fait avec des paramètres qui ont un sens physique clair, par
exemple : le temps de réponse en boucle fermée désiré.
Identifications et synthèses des régulateurs sont données par les programmes
MATLAB‚ et/ou SCILAB‚ joints en annexe.
La lecture de ces programmes permet la transcription dans le langage spéci-
fique des automates du site industriel.

Origine de la commande prédictive

R Dans les années 1950-1960, pratiquement, tous les États-Majors des pays de l’OTAN
financèrent des recherches concernant l’ergonomie du pilotage d’avion. Le ministère de
l’Air, en collaboration avec le Centre d’essai en vol de Brétigny, octroya donc un contrat
de recherche au laboratoire d’automatique de SUPAERO, avec la mission d’analyser le
pilotage afin d’améliorer les instruments de vol et les organes de commande. Des essais,
nombreux et variés, furent alors réalisés en imposant au pilote de suivre une assiette
sinusoı̈dale imposée, (donnée par un métronome collé sur le tableau de bord… !), afin
d’identifier le comportement de l’avion, lors de divers changements de cap, d’altitude. La
base de données recueillie était vaste mais cohérente.
À cette époque la régulation vivait sa grande période de l’automatique fréquentielle :
lieux de Black, Nyquist, Bode. Les régulateurs étaient des réseaux d’avance de phase et
l’omnipotent PID, avec déjà ses très nombreuses méthodes de réglage, régnait en maı̂tre.
Sur les mêmes consignes données à un pilote humain et à un pilote automatique on a
donc pu comparer en toute objectivité les comportements du régulateur et du pilote.
Les comportements du processus étaient assez proches, mais surprise… les variables
d’action étaient très différentes !
Pour simplifier, on peut dire que la sortie du régulateur était continue, de fréquence assez
basse, alors que celui du pilote était pratiquement une suite d’impulsions, de durées et
amplitudes variables, avec des périodes vides, en fait : la commande était rare mais très
pertinente. Le pilote a beaucoup de tâches à accomplir (plan de vol, radio, moteur, exté-
rieur, etc.), la commande ne peut donc pas être permanente et se doit d’être très efficace
quand elle agit. Le pilote a pour cela une connaissance poussée de son appareil qui com-
pense les temps vides, il sait que telle action donnera tel résultat dans le futur, et la plu-
part du temps il ne fait que vérifier que tout se comporte comme prévu.
Faire un modèle de l’opérateur humain relève d’une discipline autre que l’automatique.
Nous avons été mis en contact avec des psychologues et avons eu la chance de rencon-
trer le Professeur Jean-Claude Tabary disciple du fondateur de la psychologie cognitive
Jean Piaget de Genève.
Comment l’enfant apprend-t-il ?
a) Il se constitue peu à peu, ce qui a été appelé une « image opératoire » du monde exté-
rieur. Telle action donne tel effet. Il mémorise ce qui est utile et répétitif et oublie ce qui
est non significatif.
b) Avec l’âge, il se donne des objectifs, par exemple : attraper un jouet, mais aussi la suc-
cession des actions intermédiaires nécessaires pour l’attraper : chercher un tabouret.
c) Il agit et atteint l’objectif fixé. Si pour des raisons diverses il a été gêné, il recommen-
cera en modifiant son plan d’action.
d) Mais, avec le temps et l’usage, il améliore sa stratégie, choisit mieux le tabouret qui
convient etc., la connaissance de son environnement se perfectionne, l’image opératoire
s’adapte, elle devient plus performante.
Profitant également du fait que nous avions d’autres actions de régulation industrielle, en
particulier des commandes de colonne à distiller, il nous a été facile, lors de longues
périodes d’enregistrement de dialoguer avec de vieux opérateurs chevronnés et de leur
demander de nous raconter, quand leur PID ne donne pas satisfaction et lorsqu’ils sont
obligés de passer en mode manuel, de quelle manière ils conduisent leur unité ?
Le résultat est clair : pilote d’avion et opérateur industriel, même combat, mêmes solu-
tions : beaucoup de tâches simultanées, bonne connaissance du processus, donnant des
actions rares mais pertinentes, etc.
Nous conduisons notre automobile, non pas en regardant par la fenêtre de gauche, mais
en avant, par le pare-brise, en ayant en tête la connaissance de l’effet de l’acte précédent,
qui permet de prédire le comportement du véhicule et de choisir une commande, là
encore, rare mais pertinente.
La régulation de la température de notre douche, processus que nous connaissons bien,
consiste à tourner le mélangeur une première fois, attendre la stabilisation de la tempéra-
ture et éventuellement réajuster la position du mélangeur. Dans ces divers cas, la démar-
che devient naturelle, par la connaissance du processus et du projet que l’on se donne
pour atteindre l’objectif.
La commande prédictive n’est pas une invention mais une découverte.

S 7 425 – 2 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

UR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE PRÉDICTIVE

1. Principes élémentaires Le choix de cette trajectoire de référence est ouvert, mais pour
une raison de simplicité, on prend en pratique une trajectoire expo-
nentielle de constante de temps T, qui fixe ainsi ce qui est appelé le
TRBF de la commande (temps de réponse en boucle fermée).
La trajectoire de référence est à chaque pas d’échantillonnage réi-
1.1 Principes élémentaires nitialisée sur la mesure actuelle mesurée.
de la commande PFC 3) On fixe alors sur cette trajectoire un point objectif dans le futur
à l’instant n + h et on calcule à l’instant n un projet de variable
Ce paragraphe présente les caractéristiques élémentaires de la manipulée e (n), ici choisi constant sur l’horizon [n, n + h], que l’on
commande prédictive sur un processus d’ordre 1, simple mais fré- applique à l’entrée du processus.
quent dans l’industrie, tel qu’il est décrit dans le document
précédent. 4) À l’instant suivant n + 1, toute la procédure est identiquement
recommencée : une nouvelle trajectoire de référence est initialisée


sur le point courant mesuré. Elle est en général différente de la tra-
1.1.1 Caractéristiques de la commande jectoire précédente car le processus est perturbé et le modèle
embarqué ne représente pas exactement la réalité, mais avec le
1) Le modèle mathématique du processus identifié est implanté temps, la sortie du processus tend bien vers la consigne.
et utilisé en temps réel par le régulateur, il rentre dans le calcul de
la commande. 1.1.2 Résolution d’une équation aux différences
2) La consigne fixée est atteinte par une trajectoire dite de « réfé- finies
rence » qui part de la mesure actuelle mesurée du processus et qui
tend vers la consigne. Traitons le cas d’un processus élémentaire du premier ordre,
parce que la démarche est simple et que ce genre de processus
Elle définit ainsi le comportement désiré de la boucle fermée. Il est assez fréquent dans l’industrie. Le processus du premier ordre
apparaı̂t immédiatement que, si la sortie du processus suit effecti- d’entrée e et de sortie sp a un gain K, une constante de temps T et
vement cette trajectoire de référence, fixer la trajectoire de réfé- un retard pur R, sa fonction de transfert continue est donc :
rence revient à fixer le temps de réponse en boucle fermée K .exp ( − R .p )
(figure 2). H (p ) =
1 + τ .p
Il est échantillonné à la cadence tech, sa représentation discrète
Fig est classiquement donnée par :

sp (n ) = sp (n − 1) .ap + K .bp.e (n − 1 − r )
Consigne
e(n+h) avec bp = 1 - ap
le retard pur R étant exprimé par un nombre r de pas d’échantil-
lonnage : R = r.tech
e(n)
Dp ⎛ tech⎞
On a donc : ap = exp ⎜ − ⎟ , bp = 1 - ap
⎝ τ ⎠
CV(n)
On suppose pour commencer que le modèle sm (n) est parfait,
h
Sortie identique au processus :
processus
am = ap , bm = bp , Km = K
Équation de la trajectoire de référence (d’ordre) : e(n+h) = e(n).lh
Incrément de sortie désirée : Dp = e(n).(1-lh ) On a donc : sm (n) = sm (n - 1).am + Km .bm. e (n - 1 - r)
3.tech
l = e TRBF TRBF : temps de réponse en boucle fermée
Rappel
La solution d’une équation différentielle (ou aux différences
n finies) linéaire comporte deux termes :
– la solution dite lâchée, ou solution libre, ou sans second
Figure 1 – Trajectoire de référence membre ;

cons Perturbation=0 cv

1 + K
Cons MV + CV
t Processus t
PFC
0 0 t

Figure 2 – Boucle fermée

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 425 – 3

US
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

COMMANDE PRÉDICTIVE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

– la solution forcée, ou solution avec second membre. On souhaite qu’à l’instant n + h cet écart diminue selon une
Solution lâchée (figure 3) : l’entrée e (n) est nulle, mais non la exponentielle :
sortie sm (n) ; à l’instant 1 on a :
ε (n + h ) = ε (n ) . λh
sm (1) = sm (0) .am + 0
L’incrément de sortie souhaité Dp est alors :

⎛ tech ⎞
où am = exp ⎜ −
( )
Δp = ε (n ) − ε (n + h ) = ε (n ) . 1 − λh = (SP − CV (n )) . 1 − λh ( )
⎝ τm ⎟⎠
La trajectoire de référence de décrément l relie le point courant
sm (2) = sm (1) am = sm (0) .am 2 de la sortie à la consigne. À un point futur, dit de coı̈ncidence pris à
................................................ n + h, on souhaite qu’il y ait égalité entre les valeurs de la sortie
et à l’instant n : sm (n) = sm (n- 1).am = sm (0). amn prédite du processus et de la trajectoire de référence. Cette pres-
Solution forcée (figure 4) : partons de conditions initiales nul- cription est incrémentale, à savoir : on cherche un projet de

R les : sm (0) = 0 et appliquons une entrée unitaire, on a donc :

sm (n ) = sm (n − 1) .am + Km.bm.1, où bm = 1 − am
variable manipulée (Manipulated Variable) MV (n) tel que la varia-
tion de la variable régulée soit égale à l’incrément Dp de la trajec-
toire de référence. Toute la démarche est incrémentale :
sm (1) = (1 − am ) .Km Dm = sortie lâchée + sortie forcée - sortie actuelle, soit :
sm (2) = (1 − am ) .Km.am + (1 − am ) .Km = Km. (1 − am ) . (1 + am ) (
Δm = sm (n ) .amh + MV (n ) .Km. 1 − amh − sm (n ) )
sm (3) = Km. (1 − am ) . 1 + am ( + am 2 )
......................................................... sm(n)
(
sm (h ) = Km. (1 − am ) . 1 + am + am 2 + … + amh −1 )
1 − amh e(0)=1
Pour h suffisamment grand, sm (h ) = Km. (1 − am )
1 − am
Soit : sm (h) = Km.(1 - amh)
qui est la réponse forcée du processus à un échelon unitaire. - tech·n
SF(n) = Km·e(0)·(1-e t )
La réponse du processus sm (n) est la somme de la réponse
forcée et de la réponse libre ; e0 étant l’entrée du processus,
elle est de la forme :

sm (n ) = sm (0) .amn + e 0.Km. 1 − amn ( )


La sortie dépend donc en permanence :
e(n)=0 sm(n)=0
– des entrées antérieures par la sortie libre (entrée nulle) ; 0 n
– de l’entrée courante.
La sortie libre est subie, la sortie forcée dépend de l’entrée du
processus que le régulateur va appliquer. Figure 4 – Solution forcée

1.1.3 Trajectoire de référence Consigne


La trajectoire de référence (figure 5) est ici prise exponentielle,
pour différentes raisons de commodité. À l’instant n la sortie du e(n+h)
processus à réguler : dite CV (n), est différente de la consigne SP, Trajectoire de référence
l’écart est donc :
e(n)
Sortie processus prédite
ε (n ) = SP − CV (n ) Dp

Sortie processus
sm(n)

sm(n) Dm=Dp
Sortie modèle future

Dm

e(n) ≠ 0 Sortie modèle

MV
- tech·n
SL(n) = sm(0)·e t
Variable manipulée
n+h
Horizon
e(n) = 0 n n+h1 de coïncidence n+h2
n Passé Futur
0

Figure 3 – Solution lâchée Figure 5 – Trajectoire de référence et horizon de coı̈ncidence

S 7 425 – 4 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

UT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE PRÉDICTIVE

Appliquons donc la commande en égalant les deux incréments : Cette relation est toujours satisfaite, car elle est dans un espace
Dm = Dp mathématique abstrait qui ne dépend pas du processus et de ses
perturbations.
( ) ( ) (
MV (n ) .Km. 1 − amh − sm (n ) . 1 − amh = (SP − CV (n )) . 1 − λh ) Il n’y a donc pas d’intégrateur explicite dans ce régulateur, ce qui
On en déduit la valeur de la variable manipulée : supprime les problèmes d’initialisation et de désaturation de l’inté-
grateur. Cependant, si l’on exprime dans l’équation de commande
(SP − CV (n )). (1− λh ) + sm (n ). (1− amh ) la sortie sm (n) à l’aide des différentes entrées on retrouve bien un
MV (n ) =
(
Km. 1 − amh ) régulateur du type PI.
Sous la forme la plus élémentaire de PFC, il y a donc équivalence
h
Posons bmh = (1 - am ) : entre les régulateurs PI et PFC, ce qui réconforte les techniciens
habitués au PID.
(SP − CV (n )). (1− λh ) + sm (n ).bmh
MV (n ) = Nous partons donc sur des bases communes [1], [2], [3], [4], [5],


Km.bmh [6], [7].
Nb. – Forme générale de la variable de commande :
incrément désiré + incrément de sortie lachée 1.3 Allons de PFC vers PI(D)
MV (n ) =
nitaire
sortie forcée un
Il est important pour un utilisateur industriel, très familiarisé avec
Analysons cette commande dans le paragraphe suivant. la régulation PID, de pouvoir passer progressivement d’une régula-
tion qu’il maı̂trise à une autre.
1.1.4 Point de coı̈ncidence
Depuis Ziegler Nichols (1942) il a été publié près de 2 000 métho-
Dans le cas particulier du processus du premier ordre, la réponse des de réglage du PID, soit issues du domaine académique, soit
indicielle est maximum à l’origine, on choisit donc : h = 1. Nous des offreurs et utilisateurs industriels. Toute cette activité montre :
donnerons plus d’explications au paragraphe 1.5. Le paramètre de
réglage l, comme nous l’avons défini, est le décrément de la fonc- 1 – que le PID a un très grand intérêt académique et surtout
tion exponentielle qui, initialisée sur le point courant de la sortie du pratique ;
processus, tend vers la consigne. Le TRBF définit la dynamique de 2 – mais que les solutions proposées ne donnent pas entière-
la réponse, en boucle fermée, clairement accessible à tout utilisa-
ment satisfaction… pour tout type de processus en particulier
teur. Comme par ailleurs on connaı̂t le lien entre la constante de
ceux avec retard !
temps d’un système du premier ordre et son temps de réponse à
5 %, TRBF ≅ 3.τ , on utilise alors directement pour faciliter le Quelle que soit la méthode de réglage du PID il faut avoir au
réglage du régulateur le TRBF dans l’équation de commande. La départ une représentation quelconque du processus et une spécifi-
commande va donc être programmée sous une forme facilement cation claire du réglage recherché.
implantable dans un automate industriel :
Supposons donc ici que le processus soit représentable par un
⎡SP − CV (n )⎤⎦ .lh + sm (n ) .bm simple système du premier ordre. Il existe de nombreuses recettes
MV (n ) = ⎣ pour avoir une idée sur les ordres de grandeur du gain K et de la
Km.bm
constante de temps t du processus : inspection visuelle, méthodes
⎛ 3.tech ⎞ plus ou moins compliquées d’identification, etc. Supposons donc
avec lh = 1 − λ = 1 − exp ⎜ − et bm = 1 - am
⎝ TRBF ⎟⎠ avoir des valeurs de Km et de tm proches de la réalité. Le but est
alors de trouver le gain Gr du régulateur PI et son terme intégral Ti.
Comme déjà mentionné, si dans l’équation de commande du
1.2 Allons de PID vers PFC PFC, qui a un TRBF connu désiré, on exprime sm (n) en fonction
de la sortie du processus et de son entrée e (n), on obtient une
Représentons cette commande PFC sous une forme classique :
équation de commande qui a la même structure que celle d’un
MV (n ) = ⎡⎣SP − CV (n )⎤⎦ .A + B régulateur PI classique avec, tout calcul fait, un gain statique :
lh Km.bm.τm
Gr = et un gain de l’intégrateur : Ti = où lh a
lh sm (n ) .bm Km.bm lh
avec : A = et B = été choisi pour obtenir un certain temps de réponse en boucle
Km.bm Km.bm
fermée.
Une « lecture PID » reconnaı̂t ici une commande avec un terme
proportionnel de l’écart : Km et Gr sont connus, la variable manipulée du régulateur PI
sera donc :
sm (n )
A…, mais de façon surprenante le terme B = n’est pas du Intg (n ) = Intg (n − 1) + ⎡⎣SP − CV (n )⎤⎦ ( terme intégrateur )
Km
tout un terme intégral… !
Ce régulateur, sans intégrateur, ne devrait donc pas tenir la 1
consigne en régime permanent perturbé ? ! MV (n ) = ⎡⎣SP − CV (n )⎤⎦ .Gr + Intg (n )
Ti
Supposons donc que cette commande soit implantée et qu’elle
donne une variable manipulée stable, malgré des perturbations. L’intérêt de cette démarche, est double :
Est-il possible qu’il n’y ait pas d’erreur de position ? On aurait – le temps de réponse en boucle fermée effectif est le temps de
donc en régime permanent stable : SP - CV (n) = 0 réponse désiré,
sm (n ) – la réponse est sans surtension,
d’où : MV (n ) = 0 +
Km si bien sûr, les hypothèses de structure (Gain, Dynamique) sont
soit : sm (n) = MV (n).Km remplies.

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 425 – 5

UU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

COMMANDE PRÉDICTIVE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

SP τ
En résumé pratique On trouve donc : MV (0) ≅
On choisit le TRBF du régulateur PI, connaissant le gain Km et Km τrep
la constante de temps tm du modèle de processus
lh Nota : une équation de récurrence initialisée mathématique-
– le gain proportionnel est : Gr = avec ment à n = 0 sera dans un programme MATLAB‚ initialisée à
Km.bm
⎛ 3.tech ⎞ n = 1.
lh = 1 − λ = 1 − exp ⎜ − et bm = 1 - am ;
⎝ TRBF ⎠⎟
Km.bm.τm Si la réponse désirée en boucle fermée est plus rapide que celle
– le terme intégral est : Ti =
lh en boucle ouverte, la première commande est plus grande que sa
Km, bm, lh sont choisis pour avoir une réponse de TRBF fixé, valeur finale en régime permanent.
et non surtensive.

1.4 Temps de retard pur



Exemple
On considère un modèle de processus de gain Km = 1, de cons-
tante de temps tm = 20 sec avec tech = 1 sec et un TRBF = 40 sec. Nombre de processus industriels sont représentables par un pro-
Le temps de réponse demandé est bien plus court que le temps cessus du premier ordre, comme présenté ci-dessus, mais avec un
de réponse en boucle fermé, ce qui provoque une surtension forte de retard pur R = tech.r qui peut être grand devant la dynamique du
la variable manipulée. Les paramètres de réglage du régulateur PI processus. L’idée est alors d’initialiser la trajectoire de référence,
sont : le gain Gr = 1,15 et le terme intégral Ti = 13,5. non pas sur la sortie processus sp mesurée, mais sur la sortie pré-
dite. En effet, si le modèle est correct, la sortie prédite à l’instant
Une perturbation additive sur l’entrée affecte la sortie à l’instant n + r est calculable, car elle ne dépend que de l’entrée :
150 sec, elle est contrée par le régulateur.
sp (n + r ) − sp (n ) = sm (n ) − sm (n − r )
& Approximation
Dans le cas d’un processus du premier ordre, il est facile de cal- d’où l’on déduit la valeur de la sortie prédite à l’instant n + r, cal-
culer MV (0), première valeur de MV (n) (voir Nota). Cette valeur a culée à l’instant n :
un certain intérêt pratique car dans un changement de consigne,
elle ne doit pas dépasser la limite haute de l’actionneur. spred (n ) = sp (n ) + sm (n ) − sm (n − r )

⎡SP − CV (n )⎤⎦ .lh + sm (n ) .bm


MV (n ) = ⎣
Km.bm
Consigne
À l’instant n = 0 avec sm (0) = 0 et CV (0) = 0, la valeur de la MV Trajectoire
devient : de référence Sortie prédite
SP .lh Point de du processus
MV (0) = coîcidence
Km.bm
⎛ tech ⎞ tech
bm = 1 − am = 1 − exp ⎜ − ≅ ,
⎝ τm ⎟⎠ τm
⎛ 3.tech ⎞ 3.tech tech Sortie processus
lh = 1 − exp ⎜ − ≅ ≅
⎝ TRBF ⎠⎟ TRBF τrep n n+r n+h n

trep étant la constante de temps désirée de la réponse en boucle


Figure 7 – Commande retard pur : initialisation de la trajectoire
fermée.
de référence

A simple PID LOOP TUNER e k / sp r /


160
180

140 160

120 140

120
100

100
80
80
60
60

40
40

20 20

0
0 50 100 150 200 250 300 350 400 20 40 60 80 100 120 140 160 180 200

Figure 6 – Régulateur PID = Régulateur PFC Figure 8 – Processus sans retard pur

S 7 425 – 6 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

UV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE PRÉDICTIVE

Si l’on recherche une réponse rapide pour analyser le comporte-


160 ment transitoire, la première valeur de la variable manipulée sera
plus grande que MV (0). En partant de conditions initiales nulles
pour le processus et son modèle, on a : sm (0) = 0, CV (0) = 0,
140
SP .lh
MV (0) = avec lh = 1 - lh et bmh = 1 - amh
Km.bm
120
Pour h infini, lh = 1 et bmh = 1
100 MV (0), pour h variant de 1 à l’infini, est une fonction monotone
SP . (1 − λ)
décroissante partant de la valeur MV (0) = (cf. solution
80 Km.bm
Consigne
lâchée) pour atteindre la valeur : MV (0) = pour h infini.
60


Km

40 Exemple
Considérons un processus de gain Kp = 1 et de constante de
20 temps t = 30 s pour une période d’échantillonnage de 1 seconde et
prenons 3 valeurs de h : h = [1 20 100]. Pour un horizon court h = 1,
le processus bouclé se comporte bien comme prévu. Pour des
0 valeurs grandes de h la réponse est plus lente. En effet, la réponse
100 150 200 250 300 350 400
d’un processus du premier ordre soumis à une impulsion e (n) est
exponentielle décroissante (e (1) π 0 alors que e (n) = 0 pour tout
Figure 9 – Le même processus avec retard pur de 200 sec n > 1).

et l’équation de commande devient (avec h = 1)


Pour h = 1 le comportement est celui attendu et la réponse suit la
spécification du TRBF. Si h augmente, la variable manipulée MV (0)
spred = CV (n ) + sm (n ) − sm (n − r )
diminue et la réponse du processus est plus lente et tend vers la
réponse en boucle ouverte : pour h grand le processus répond à
une variable manipulée en échelon qui régule peu.
⎡SP − spred (n )⎤⎦ .lh + sm (n ) .bm
MV (n ) = ⎣ Inversement, si l’on veut avoir une réponse rapide en gardant
Km.bm h > 1, il faut diminuer le TRBF pour générer une MV (0) plus grande,
ce qui est à proscrire car cette MV risque de se heurter à la limite de
1.5 Choix du point de coı̈ncidence : h l’actionneur et dégrader la performance dynamique de la
régulation.
Comment choisir h qui est le point de coı̈ncidence de la sortie Cette propriété vient donc de la nature exponentielle décrois-
prédite du processus dans le futur avec la trajectoire de référence ? sante de la réponse indicielle, caractéristique unique d’un proces-
Supposons que le processus soit asymptotiquement stable, et de sus du premier ordre. Car pour les processus d’ordre supérieur à
1, l’effet maximum sur la sortie du processus de la première
gain statique Kp > 0, et que l’on s’intéresse au régime permanent.
variable manipulée, n’a pas lieu pour h = 1, mais pour une valeur
C’est en fait un essai statique que l’on réalise et la variable manipu-
de h plus grande, problème qui sera traité au paragraphe 3.
lée en régime permanent final sera un échelon constant.

PFC ÉLÉMENTAIRE
180 150
MV

160
h=1
140
SP
120 100
h=20
100
h=100
80 20 100 MV CV
1

60 50
CV

40
DV
20
sec
0 retard
20 40 60 80 100 120 140 160 180 200 0
0 50 100 150 200 250 300 350 400

Figure 10 – Effet de h sur le comportement de la réponse


du processus Figure 11 – Commande PFC : ordre 1 avec retard et perturbation

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 425 – 7

UW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

COMMANDE PRÉDICTIVE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

« Le bon conducteur ne porte pas son regard juste devant le


pare-choc de sa voiture, mais, plus en avant, à une distance compa-
tible avec la distance d’arrêt admissible » (… un tel processus est
certainement d’un ordre bien supérieur à 2 !…) (voir programme
MATLAB‚ au paragraphe 9.1). Brûleurs à gaz

Exemple :
Ta
Tech = 1s.
Tc

Définition du processus : Kp = 1, Tp = 20 s, r = 20 Ts

TRBF = 40 s, h = 1
Pièce
SP = 100

R 2. Contraintes
DV = 0 de t = 0 à 170 et DV = 20 pour t > 170

Figure 12 – Four de traitement thermique

2.1 Position du problème Ts<TsMax


P2
Vous conduisez votre automobile et soudain un obstacle imprévu
surgit sur la route ; vous êtes alors contraint de freiner immédiate- Consigne Ta
Tc
ment avec toute la puissance de freinage disponible en espérant PFC P1
éviter la collision : le futur est alors joué, et la distance d’arrêt est
fixée.
Dans le cas général, où la collision est évitable, il convient donc
de freiner de façon anticipative. Si la puissance de freinage n’était
pas limitée, il suffirait de freiner sur l’obstacle, avec une décéléra- Figure 13 – Commande de la température à cœur
tion infinie, et dans ce cas il ne serait pas nécessaire de prédire.
Ce qui amène à la conclusion suivante : « une contrainte Ta et la température à cœur Tc, ne doit pas être trop grande sinon
implique une prédiction ». la surface du métal sera oxydée et endommagée : Tc < Ts < Ta.
Ta agit donc, à travers deux systèmes P1 et P2 de dynamiques
2.1.1 Contraintes sur la variable manipulée MV différentes, sur deux températures Tc et Ts qui doivent respecter
l’une, une consigne ConsTc et l’autre, une contrainte Tsmax
Les contraintes ou limitations qui affectent un processus indus- (figure 13).
triel sont de natures diverses.
Ce second problème (avec deux dynamiques différentes) est
& Contraintes subies théoriquement plus difficile à résoudre, mais une solution sous-
Ce sont des contraintes qui viennent de la conception de l’unité, optimale est heureusement possible, car il se rencontre en fait
par exemple les limitations en amplitude et en vitesse liées à la dans pratiquement toutes les industries de production.
puissance maximale des actionneurs. Si l’unité a été surdimension-
née par rapport à son objectif nominal de production, les variables
d’action ne seront pas contraintes, mais le coût de l’unité sera au- 2.2 Contrainte sur la variable manipulée
delà de ce qui est nécessaire. Il convient donc de pouvoir fonction-
ner en étant, si la loi de commande l’exige, sur les contraintes
induites par la capacité limitée de l’unité de production. 2.2.1 Commande directe
& Contraintes volontaires Reprenons le cas élémentaire de la commande d’un processus
du 1er ordre de gain K et de constante de temps T, de variable
Il arrive que dans certaines circonstances on limite volontaire-
manipulée MV (n) et de variable régulée CV (n). À chaque instant n :
ment la vitesse ou l’amplitude de la variable manipulée, pour ne
pas « violenter » le processus ou la source d’énergie des ⎡SP − CV (n )⎤⎦ .lh + sm (n ) .bmh
actionneurs. MV (n ) = ⎣
K .bmh
2.1.2 Contraintes sur une variable d’état
du processus sm (n ) = sm (n − 1) .am + bm.MV (n − 1)

Prenons l’exemple du traitement thermique d’une pièce métal-


⎛ Tech ⎞ h
lique dans un four. am = exp ⎜ − ⎟ , bm = 1 - am, bh = 1 - am ,
⎝ τ ⎠
Il convient que la température à cœur Tc de la pièce métallique ⎛ Tech.3.h ⎞
suive un certain profil temporel fixé par le métallurgiste (figure 12). lh = 1 − exp ⎜ − ⎟ où Tech est la période d’échantillonnage, h
⎝ TRBF ⎠
On agit par un organe de chauffe quelconque sur la température le point de coı̈ncidence, et sm (n) la sortie du modèle.
de l’air Ta, avec un régulateur de niveau 0, qui peut avoir lui-même
ses propres contraintes. Si l’on veut augmenter la production en La MV et sa dérivée sont contraintes :
diminuant le temps de traitement, la température Ta va évoluer MVmin ≤ MV (n ) ≤ MVmax : contrainte en amplitude
avec des excursions de plus en plus grandes. Mais la température
de surface de la pièce Ts, intermédiaire entre la température d’air δmin ≤ MV (n ) − MV (n − 1) ≤ δmax : contrainte en vitesse

S 7 425 – 8 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

UX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE PRÉDICTIVE

On passe donc la MV (n) calculée à travers ces deux limiteurs


(figure 14) et l’on obtient la MV* (n) qui respecte la plus stricte de COMMANDE SANS PRISE EN COMPTE DE LA CONTRAINTE MV
ces quatre contraintes. La procédure consiste alors à appliquer au 400
processus P, et à l’entrée du modèle interne M la commande MV*
(n) au lieu de MV (n) ; l’équation de la sortie du modèle devient 350
alors :
300
sm (n ) = sm (n − 1) .am + bm.MV * (n − 1)

250

La prédiction du modèle interne sera donc faite avec l’entrée


MV* qui a été physiquement appliquée. Si l’on appliquait la com- 200
MV calculée non contrainte (b)
mande MV en laissant le processus faire physiquement lui-même


la limitation, le régulateur n’en serait pas informé, la prédiction du 150
modèle interne serait fausse et la commande ne serait pas perti- MV pré-contrainte non appliquée (m)
nente. En revanche, en alimentant le modèle interne avec MV* on
100
reste à la frontière du domaine non linéaire du processus, et c’est
alors le régulateur qui devient momentanément non linéaire.
CV (r)
50
Les figures 15 et 16 montrent la différence de comportement du
processus avec ou sans la prise en compte a priori des contraintes
0
physiques de l’actionneur (voir programme MATLAB‚ au 50 100 150 200 250 300 350 400
paragraphe 9.2). sec

Figure 16 – Commande sans prise en compte de la contrainte


PFC Processus physique sur la MV

2.2.2 Commande en cascade


Consigne Le montage en cascade, cas très fréquent dans l’industrie de pro-
MV MV* CV
duction, est constitué de deux régulations emboı̂tées, une régula-
R P
tion interne PFC1 d’un processus P1 et une régulation externe
PFC2 d’un processus P2 (figure 17).
L’actionneur physique est dans la boucle interne ; le régulateur
SM
M interne R1 propose donc une MV1 qui, passée à travers les limi-
teurs amplitude/vitesse de P1, devient MV1*.
Il convient là aussi d’informer le régulateur externe R2 de cette
limitation ; en effet, son modèle interne qui est le produit des trans-
ferts de la boucle interne PFC1/P1 et du processus P2 est faux car
tant que MV1 est sur une contrainte le processus P2 est en boucle
Figure 14 – Schéma de commande avec contrainte sur la MV
ouverte et le modèle interne n’est plus prédictif.
Il faut alors procéder à un « transfert de contrainte », dit aussi « back
COMMANDE AVEC PRISE EN COMPTE DE LA CONTRAINTE MV calculation », pour modifier l’entrée du modèle interne de PFC2.
400 Une bonne stratégie du régulateur externe R2 aurait été de calcu-
ler à l’instant n une MV2 (n), consigne du régulateur R1, amenant
350 celui-ci à calculer une valeur MV1 (n) égale à MV1*(n), afin que le
modèle interne de PFC2 soit alimenté, à l’échantillonnage suivant,
par une entrée compatible avec les contraintes.
300
Reprenons donc les équations du régulateur PFC1 :
250 ⎡Cons1(n ) − CV 1(n )⎤⎦ .lh1 + sm1(n ) .bmh1
MV 1(n ) = ⎣
K 1.bmh1
200
MV calculée non contrainte (b)

150 sm1(n ) = sm1(n − 1) .am1 + bm1.MV 1(n − 1)

MV pré-contrainte (m)
100 Pocessus
PFC2 PFC1

50 CV (r) Cons MV2 MV2* R1 MV1 MV1* CV1 CV2


R2
M2 M1 P1 P2

0
50 100 150 200 250 300 350 400
sec

Figure 15 – Commande avec prise en compte de la contrainte


sur la MV Figure 17 – Commande cascade

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 425 – 9

UY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRU

COMMANDE PRÉDICTIVE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Notons que le régulateur PFC2 peut lui aussi avoir des contrain-
AVEC TRANSFERT DE CONTRAINTE : MV1MAX=60 tes propres sur sa MV2 (n), indépendantes des contraintes de PFC1.
Ne pas utiliser cette procédure de transfert de contraintes peut
120
amener à des comportements fortement erronés (figures 18 et 19).

100
CV 2.3 Contrainte sur une variable d’état
80
Rappelons l’exemple du four de traitement thermique : il faut
MV1 réguler la température à l’intérieur de la pièce métallique Tc, tout
60
en respectant la température de surface Ts, en agissant par un
organe de chauffe (brûleur à gaz) sur la température d’air Ta
MV2
40 (figure 20).

R 20
Supposons que l’on doive piloter le processus P1, de consigne
SP1, par un régulateur PFC1 qui produit à l’instant n une action
MV1 (n). Mais cette commande MV1 (n) agit aussi sur un processus
sec dynamique P2 dont la sortie CV2 doit respecter une contrainte,
0
50 100 150 200 250 300 350 400 450 500 prise ici comme CV 2 (n ) ≤ CV 2max pour simplifier.
La stratégie consiste à calculer un projet habituel de commande
Figure 18 – Commande cascade avec transfert de contrainte MV1 (n + h) qui satisfasse le temps de réponse TRBF demandé au
régulateur PFC1, et qui de plus a ses propres contraintes qui seront
traitées par la procédure précédente ; ce projet MV1 (n + h) devra
SANS TRANSFERT DE CONSTRAINTE : MV1MAX=60 également dans le futur provoquer une sortie CV2 (n + h) qui res-
pecte la contrainte CV2max.
120
CV Pour ce faire, on simule la sortie future CV2 (n + h) par une pro-
cédure identique à celle utilisée lors de la prise en compte d’un
100 retard pur (paragraphe 1.4) :

CV 2 * (n + h ) = CV 2 (n ) + sm 2 (n + h ) − sm 2 (n ) ,
80
MV2 où sm2 (n) est la sortie du modèle de CV2 alimenté par le projet
MV1 MV1 (n + h).
60
Cette procédure est répétée théoriquement jusqu’à l’obtention du
TRBO (temps de réponse en boucle ouverte) du processus P2, mais
40
en pratique on calcule jusqu’à un temps limité hl compris entre h1
(point de coı̈ncidence du régulateur du processus P1) et le TRBO du
20 processus P2.
Si CV2*(n + i) < CV2max pour tout i, tel que : 1< i ≤ hl , le projet
sec est acceptable car la contrainte est respectée et la MV1 (n) proposée
0
50 100 150 200 250 300 350 400 450 500 est alors appliquée (cas (a) de la figure 21).
Si pour une certaine valeur de i, CV 2 (n + i ) ≥ CV 2max , le projet
Figure 19 – Commande cascade sans transfert de contrainte n’est pas acceptable (cas (b) de la figure 21) et il convient alors de
trouver une commande MV2 (n) qui amènerait au mieux CV2 sur sa
Cette variable manipulée MV1 (n) calculée mathématiquement va valeur limite CV2max. Cette opération est réalisée par un régulateur
être physiquement limitée et devenir MV1*(n). auxiliaire qui a comme consigne SP2 = CV2max et dont le modèle
Donc, la « bonne valeur » de Cons1 (n) qui est égale à MV2*(n) interne est alimenté par la dernière variable manipulée, quelle que
aurait dû être solution de : soit son origine, issue de PFC1 ou de PFC2.
En résumé cette méthode consiste à utiliser deux régulateurs
⎡MV 2 * (n ) − CV 1(n )⎤⎦ .lh1 + sm1(n ) .bmh1
MV 1* (n ) = ⎣ fonctionnant en permanence en parallèle :
K 1.bmh1 – PFC1 : consigne SP1, pilotant CV1, donnant MV1.
– PFC2 : consigne SP2 = CV2max, pilotant CV2, donnant MV2.
d’où découle la valeur de MV2*(n) :
– Calcul de CV2*(n + i), i = 1…… hl.
⎡MV 1* (n ) .K 1.bmh1 − sm1(n ) .bmh1⎤⎦
MV 2 * (n ) = CV 1(n ) + ⎣
lh1
P2 Ts<TsMax
L’interprétation physique est donc simple.
Le régulateur externe PFC2 calcule une valeur de consigne Tc
Consigne Ta
Cons1 (n) de PFC1 qui n’est pas suivie, mais le modèle interne de PFC P1
PFC2 en est informé, et le calcul de MV2 = Cons1, au point suivant,
prend en compte dans son modèle interne cette modification de la
valeur de consigne.
Cette propriété est importante et démarque le PFC de la régula-
tion PID. Figure 20 – Régulation du four de traitement thermique

S 7 425 – 10 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

VP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRV

Commande adaptative des systèmes

par Mohammed M’SAAD


Professeur à l’École nationale supérieure d’ingénieurs de Caen


Laboratoire d’automatique et de procédés, ISMRA, Caen
et Joël CHEBASSIER
Docteur de l’Institut national polytechnique de Grenoble
Laboratoire d’automatique de Grenoble

1. Motivations................................................................................................ S 7 426 – 2
2. Systèmes de commande sous-jacents ............................................... — 3
2.1 Modèles de commande linéaire ................................................................. — 4
2.2 Synthèse du système de commande......................................................... — 5
2.3 Stabilité et performances nominales ......................................................... — 6
2.4 Généralité de la commande prédictive...................................................... — 8
3. Commande prédictive adaptative ....................................................... — 9
3.1 Traitement des données.............................................................................. — 9
3.2 Algorithme d’adaptation paramétrique ..................................................... — 9
3.3 Algorithme de commande .......................................................................... — 11
3.4 Exemple de Rohrs........................................................................................ — 12
4. Applications .............................................................................................. — 16
4.1 Réacteur chimique....................................................................................... — 16
4.2 Système de transmission flexible .............................................................. — 20
5. Conclusion ................................................................................................. — 22
Références bibliographiques ......................................................................... –– 25

et article présente une approche pour la commande adaptative à partir


C d’une lecture critique de la littérature sur ce domaine. Elle consiste à combi-
ner une méthode de commande prédictive avec un algorithme d’adaptation
robuste sous une logique de supervision appropriée. Le choix de la commande
prédictive est motivé par sa généralité et sa simplicité de mise en œuvre. La
p。イオエゥッョ@Z@ュ。イウ@RPPP@M@d・イョゥ│イ・@カ。ャゥ、。エゥッョ@Z@ッ」エッ「イ・@RPQU

robustesse de l’algorithme d’adaptation paramétrique est particulièrement


requise pour préserver les performances du système de commande adaptative
en présence des bruits de mesure, des perturbations de charge et des dynami-
ques négligées et/ou variables dans le temps. La supervision permet d’appliquer
le principe d’équivalence certitude avec la prudence requise pour assurer l’inté-
grité du système de commande adaptative, notamment les performances du
système de commande sous-jacent.
Un ensemble de résultats de simulations est présenté autour d’un exemple
célèbre pour illustrer les problèmes de systèmes de commande adaptative, en
l’occurrence l’adaptation paramétrique. Deux applications sont présentées pour
démontrer l’applicabilité des techniques de commande adaptative pour l’auto-
ajustement et le calibrage des régulateurs. Elles concernent deux procédés
pilotes : un réacteur chimique et un système de transmission flexible.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 1

VQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRV

COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

1. Motivations commande adaptative et permettre ainsi une synthèse systéma-


tique d’un algorithme de commande adaptative intrinsèquement
stable [13] [14] [15] [16]. Ces propriétés sont assurées par un traite-
ment adéquat des données et un algorithme d’adaptation paramé-
La synthèse d’un système de commande se fait généralement en trique robuste. Le bloc de supervision permet d’assurer l’intégrité
trois étapes. La première étape consiste à élaborer un modèle de du système de commande conformément aux résultats de stabilité,
commande qui représente au mieux le comportement d’entrée- de convergence et de robustesse disponibles dans la littérature [2].
sortie du procédé par rapport aux performances requises, à partir de
la théorie de l’identification des systèmes [1] [2]. Comme les ■ Commande adaptative directe
méthodes de commande sont essentiellement prédictives, les Les paramètres du régulateur sont directement adaptés avec un
modèles de commande associés sont fondamentalement utilisés algorithme d’adaptation paramétrique approprié (figure 1 b). La
pour la synthèse de bons prédicteurs de la sortie du système et phase de détermination des paramètres du régulateur à partir de
n’ont généralement aucun sens physique particulier. La seconde ceux du modèle de commande est ainsi contournée. Tous les objec-


étape consiste à déterminer les paramètres d’un régulateur en fonc- tifs de commande pour lesquels il est possible de récrire le compor-
tion des performances requises à partir des méthodes de synthèse tement d’entrée-sortie du système à commander sous une forme
offertes par la théorie de la commande [3] [4] [5] [6]. La spécification linéaire par rapport aux paramètres du régulateur peuvent être
des performances constitue la tâche essentielle du concepteur, qui considérés, en l’occurrence la commande à variance minimale [8], la
utiliserait avec plaisir toute bonne conception assistée par ordina- commande avec modèle de référence et la commande avec modèle
teur. La dernière étape consiste à mettre en œuvre l’algorithme de interne [2]. Le traitement des données et la supervision sont utilisés
commande sur un calculateur temps réel, doté d’une bonne librairie pour les mêmes considérations que la commande adaptative indi-
d’analyse numérique et d’une interface, disponible pour ce faire. recte.
Toutes ces étapes peuvent être faites en temps réel comme le
montre la figure 1 qui représente les principaux schémas de L’ultime motivation du concept de commande adaptative a été de
commande adaptative [2] [7] [8] [9] [10] [11]. maintenir les performances requises quand la dynamique du
comportement d’entrée-sortie du système à commander varie dans
■ Commande adaptative indirecte le temps. Les résultats théoriques disponibles sur la convergence, la
Un modèle de comportement d’entrée-sortie du système à stabilité et la robustesse des algorithmes de commande adaptative
commander y est continûment mis à jour et est utilisé pour la ne permettent pas de répondre d’une manière définitive à une telle
synthèse du régulateur comme s’il était le meilleur modèle de motivation [2] [7] [8] [9] [10] [11]. En effet, un système de commande
commande que l’on aurait utilisé (figure 1 a). Les paramètres du adaptative est composé de deux boucles à contre-réaction : le
régulateur sont ainsi adaptés de manière à réaliser les perfor- système de commande sous-jacent, soit la boucle à contre-réaction
mances requises. Toutes les méthodes de commande et d’identifi- ordinaire formée par le système à commander en contre-réaction
cation basées sur un modèle de commande linéaire par rapport aux avec le régulateur, et une boucle d’adaptation des paramètres du
paramètres peuvent être combinées pour la synthèse de systèmes régulateur constituée d’un algorithme d’adaptation paramétrique et
de commande adaptative comme en témoignent les nombreux d’une méthode de synthèse dans le cas d’une commande adapta-
algorithmes de commande linéaire adaptative [2] et ceux de la tive indirecte. Les performances requises sont ainsi réalisées pour le
commande adaptative des robots [12]. L’école française a particuliè- modèle de commande en temps réel engendré par l’algorithme
rement mis en évidence les propriétés requises de l’algorithme d’adaptation paramétrique. Elles ne sont pas nécessairement satis-
d’adaptation paramétrique pour assurer la stabilité d’un système de faites pour le système à commander.

Logique de supervision Logique de supervision

Superviseur Superviseur

Algorithme Algorithme
d'adaptation d'adaptation
Synthèse paramétrique paramétrique
du
régulateur Traitement Traitement
des des
données données

v (t ) v (t )

y*(t ) y*(t ) y (t )
u (t ) y (t ) u (t )
Régulateur Procédé Régulateur Procédé

a indirecte b directe

Figure 1 – Commande adaptative supervisée

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

VR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRV

_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

Néanmoins, une recherche méthodologique a été développée Par ailleurs, on dira qu’une séquence {s (t )} est α asymptotique-
pour tirer le meilleur profit de la culture de la commande adaptative ment petite en moyenne (α – APM) si :
et a été utilisée pour faire l’ajustement automatique des régulateurs,
le calibrage automatique des régulateurs si besoin et la supervision
t = <+ k
des systèmes de commande, comme en témoignent les nombreuses 1
applications industrielles et semi-industrielles réussies [8] [17]. On lim sup lim sup -------
k→∞ <→∞ k ∑ s(t) < α
peut ainsi réduire raisonnablement le temps d’ajustement à la mise t = <+1
en œuvre, affiner les performances pourvu que toutes les conditions
d’une bonne adaptation paramétrique soient réunies et détecter des
anomalies de fonctionnement en vue de prendre les décisions qui
s’imposent [8] [18] [19]. Des régulateurs autoajustables sont d’ores
et déjà sur le marché grâce à la puissance de calcul bon marché 2. Systèmes de commande
offerte par la micro-informatique qui ne cesse d’élargir le champ
sous-jacents
d’application des techniques de commande avancée.
Cet article présente les techniques de commande adaptative en se
focalisant sur un algorithme de commande adaptative général à la

lumière des résultats disponibles. La généralité en question sera Les systèmes de commande sous-jacents peuvent être générale-
considérée au sens des propriétés fondamentales suivantes : ment représentés comme l’indique la figure 2 avec :
— P1 : une large applicabilité. Le système à commander peut être — {u (t )} et {y (t )} désignent respectivement l’entrée et la sortie
stable ou instable, inversement stable ou non et peut exhiber un du système à commander, en l’occurrence l’ensemble convertis-
retard relativement important et variable dans le temps ; seur numérique-analogique, actionneur, procédé proprement dit,
— P2 : une insensibilité de la loi de commande par rapport aux capteur, filtre antirecouvrement et convertisseur analogique-numé-
erreurs de modélisation pour assurer une bonne robustesse du sys- rique ;
tème de commande sous-jacent ; — {v (t )} représente l’ensemble des perturbations qui affectent le
— P3 : une compensation des perturbations ; fonctionnement du système à commander, en particulier les pertur-
— P4 : une simplicité de spécification des performances ; bations de charge et les bruits de mesure en entrée et en sortie du
— P5 : la robustesse de l’algorithme d’adaptation paramétrique système à commander ;
par rapport aux perturbations de charges, aux bruits de mesure, aux — {y *(t )} désigne la séquence de référence que l’on peut engen-
erreurs de modélisation et aux variations de paramètres ; drer à partir de la séquence des points de consigne {u*(t )} comme
— P6 : une souplesse de mise en œuvre. suit :

Pour ce faire, on utilisera une approche de commande prédictive


–1 –1
permettant de réaliser les propriétés P1 et P2 avec un algorithme A* ( q ) y *( t + d + 1 ) = B *( q ) u *(t ) (1)
d’adaptation paramétrique robuste au sens de la propriété P5. Le
principe du modèle interne des perturbations est utilisé pour
–1
réaliser la propriété P3. La propriété P4 peut être satisfaite en utili- B *( z )
sant le concept de modèle de référence sur l’état partiel qui permet où la fonction de transfert -------------------
–1
- représente généralement la
A* ( z )
de spécifier d’une manière indépendante les dynamiques de pour-
suite et de régulation. Plusieurs applications ont été réalisées en dynamique de poursuite dominante souhaitée et d désigne le retard
temps réel avec des périodes d’échantillonnage de l’ordre de 50 ms, pur du système à commander en périodes d’échantillonnage ;
vérifiant ainsi la propriété P6. — Wu (z –1) et Wy (z –1) sont des pondérations fréquentielles
généralement utilisées pour des considérations de robustesse. Les
Les systèmes de commande sous-jacents sont présentés d’une variables filtrées correspondantes sont définies comme suit :
manière unifiée dans le deuxième paragraphe, en l’occurrence les
modèles de commande et le concept de prédiction linéaire associé,
un objectif de commande général et la synthèse du système de –1 –1
Wyd ( q ) y f (t ) = W yn ( q ) y (t ) (2)
commande associé (§ 2). Le rôle des fonctions de sensibilité usuelles
et la généralité de la méthode de synthèse adoptée sont particulière-
ment mis en évidence. Le troisième paragraphe est dédié aux algo- –1 –1 –1
Wud ( q ) u f (t ) = D ( q ) W un ( q ) u (t ) (3)
rithmes d’adaptation paramétrique dont les performances et les
problèmes de robustesse sont illustrés à travers un ensemble de
résultats de simulation (§ 3). Deux applications sont présentées au –1 –1
Wyd ( q ) y f*(t ) = W yn ( q ) y *(t ) (4)
quatrième paragraphe pour démontrer les performances de la
méthode de commande adaptative prédictive proposée (§ 4). Quel-
ques remarques sur l’applicabilité des techniques de commande où Wun (q –1), Wud (q –1), Wyn (q –1) et Wyd (q –1) sont des polynô-
adaptative sont données en guise de conclusion (§ 5). mes d’Hurwitz [6]. Le polynôme D (q –1) représente la nature des
Par la suite, nous considérerons plus particulièrement le cas des perturbations de charge qui affectent le fonctionnement du procédé.
systèmes échantillonnés et adopterons une formulation avec Le cas D (q –1) = 1 – q –1 permet d’incorporer une action intégrale
l’opérateur retard q –1 défini par : explicite dans le système de commande indépendamment de la
méthode de synthèse à considérer. On assure ainsi une erreur sta-
q –1 s (t ) = s (t – 1) tique nulle pour les perturbations du type échelon satisfaisant ainsi
la propriété fondamentale d’une quelconque commande PID tout
où t désigne l’instant d’échantillonnage, soit t = kTe où k est un en évitant les limitations de cette dernière [20].
entier naturel et Te est la période d’échantillonnage.
La synthèse du régulateur se fait à partir d’un modèle de
L’anneau des polynômes en q –1 à coefficients réels est alors
commande du système de manière à réaliser un objectif de
utilisé pour représenter les équations aux différences sous une
commande donné. On présente dans ce qui suit la classe des
forme polynomiale :
modèles de commande considérée, un objectif de commande suffi-
samment versatile pour englober tous les objectifs de commande
nx qui ont été utilisés dans la communauté de commande adaptative et
∑ xi s ( t – i )
– nx
X ( q –1) s ( t ) = ( x 0 + x 1 q –1 + … + x nx q )s(t) = une approche de commande prédictive pour la synthèse du système
i=0 de commande sous-jacent.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 3

VS
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRV

COMMANDE ADAPTATIVE DES SYSTÈMES __________________________________________________________________________________________________

v (t )

y*(t + d + 1) uf (t ) 1 u (t ) Système à y (t )
Wy (z –1) Régulateur
Wu (z –1) commander

Wy (z –1)
yf (t )

R u (t ) entrée du système à commander


y (t ) sortie du système à commander
v (t ) ensemble des perturbations
y* (t ) séquence de référence
Wy (z –1) et Wu (z –1) pondérations fréquentielles

Figure 2 – Système de commande linéaire

2.1 Modèles de commande linéaire avec


A a (q –1) = A (q –1) W yd (q –1) W un (q –1) D (q –1) (12)
Le comportement d’entrée-sortie du système à commander est
généralement approximé par des équations aux différences de la B a (q –1) = B (q –1) W yn (q –1 ) W ud (q –1) (13)
forme :
–1 –1 C a (q –1) = C (q –1) W yn (q –1 ) W un (q – 1) (14)
A ( q ) y (t ) = B ( q ) u ( t – d – 1 ) + v (t ) + w (t ) (5)
Un tel modèle est utilisé pour déterminer un prédicteur à j pas de
–1
D ( q ) v (t ) = C ( q ) ω (t )
–1
(6) la sortie filtrée à partir des informations disponibles à l’instant t avec
une dynamique caractérisée par un polynôme donné Pp (q –1). Ce
avec prédicteur peut être déterminé à partir de la reparamétrisation
suivante du modèle de commande (11) (14) :
A ( q –1 ) = 1 + a 1 q –1 + … + a naq –na (7) –1 –1 –1
Pp ( q ) yf ( t + j ) = Pp ( q ) Gj – d ( q ) uf ( t + j – d – 1 )
–1 –1 – nb –1 –1
B( q ) = b0 + b1 q + … + b nbq (8) + Hj – d ( q ) uf ( t – 1 ) + Fj ( q ) yf ( t ) (15)
–1 –1
+ Ej ( q ) Ca ( q ) ω ( t + j )
C ( q –1 ) = 1 + c 1 q –1 + … + c ncq –nc (9)
où (Ej (q –1), Fj (q –1)) et (Gj – d (q –1), Hj – d (q –1)) représentent
respectivement les solutions uniques d’ordre minimal des divisions
D ( q –1 ) = 1 + d 1 q –1 + … + d ndq –nd (10) euclidiennes :
où d + 1 est le retard pur du modèle en périodes d’échantillonnage, P p (q –1 ) = A a (q –1 ) E j (q –1 ) + q –jF j ( q –1 ) (16)
{v (t )} et {w (t )} représentent respectivement les perturbations qui
affectent le fonctionnement du système à commander et les erreurs –1 –1 –1 –1 –j + d –1
Ej ( q ) Ba ( q ) = Pp ( q ) Gj – d ( q )+q Hj – d ( q ) (17)
de modélisation inéluctables, {ω (t )} est une séquence d’impulsions
dont les amplitudes et les instants d’occurrence sont inconnus Le meilleur prédicteur est obtenu à partir du concept de prédiction
(contexte déterministe) ou une séquence de variables aléatoires de optimale [20], en l’occurrence :
moyenne nulle et de variances finies (contexte stochastique). –1
ŷ f ( t + j ⁄ t ) = G j – d ( q ) u f ( t + j – d – 1 ) + ŷ f0 ( t + j ⁄ t ) (18)
Le modèle de commande (5) (6) peut être caractérisé par les fonc-
tions de transfert : –1 –1 –1
P p ( q ) ŷ f0 ( t + j ⁄ t ) = H j – d ( q ) uf ( t – 1 ) + Fj ( q ) yf ( t ) (19)
–d–1 –1 –1
–1 z B(z ) –1 C(z ) Les remarques suivantes sont relativement importantes pour des
3n ( z ) = --------------------------------
–1
- et * n ( z ) = -----------------
–1
A(z ) D(z ) considérations de synthèse des lois de commande prédictive.
■ La détermination des solutions (Ej (q –1), Fj (q –1)) et (Gj – d (q –1),
qui représentent respectivement la dynamique dominante du Hj – d (q –1)) pour j ∈ [ hi , hp ] des divisions euclidiennes (16) et (17)
système à commander et le modèle des perturbations externes à la peut se faire d’une manière récursive [20]. Par ailleurs, ces deux
lumière du principe du modèle interne. Le problème de commande divisions euclidiennes permettent de récrire le modèle de synthèse
est bien posé si le modèle de commande est admissible vis-à-vis de sous la forme :
l’objectif de commande, en l’occurrence la synthèse du système de
commande est faisable et ses performances sont robustes par B a ( z –1 ) –1 – j + d H j – d (z )
–1
–j B a ( z
–1
) F j (z –1 )
rapport aux erreurs de modélisation. - = Gj – d ( z ) + z
--------------------- --------------------------- + z -----------------------------------------
–1
-
–1 –1 –1
Aa ( z ) Pp (z ) Aa ( z ) Pp ( z )
La synthèse du système de commande est faite à partir d’un
modèle qui relie l’entrée filtrée à la sortie filtrée et que l’on peut qui montre que les j – d coefficients du polynôme Gj – d (z –1), soit g0,
obtenir relativement facilement après de simples manipulations g1,…g j –d – 1, ne sont autres que les premiers éléments non nuls de
algébriques effectuées sur le modèle de commande (5) (6) en la réponse du système à une entrée dont la transformée en z est
supposant que les erreurs de modélisation sont identiquement donnée par :
nulles, soit :
W y ( z –1 )
U ( z –1 ) = -------------------------
A a (q –1) y f (t ) = B a (q –1) u f ( t – d – 1 ) + C a (q –1) ω (t ) (11) W u ( z –1 )

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 426 − 4 © Techniques de l’Ingénieur, traité Informatique industrielle

VT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTRV

_________________________________________________________________________________________________ COMMANDE ADAPTATIVE DES SYSTÈMES

■ L’erreur de prédiction est donnée par l’équation : en supposant que :

Pp ( q –1
) ( y f (t + j ) – ŷ f ( t + j ⁄ t ) ) = E j ( q –1 –1
) C a ( q ) ω (t + j ) (20) u f (t + i ) = 0 pour i ∈ [ hc, hp – d – 1 ] (24)

qui fait apparaître clairement que le prédicteur est optimal, au sens avec hi entier fini tel que hi > d + 1 ,
de la minimisation de la variance de l’erreur de prédiction, si les pon- hp et hc entiers finis ou infinis,
dérations fréquentielles Wu (z –1) et Wy (z –1) sont choisies telles que : λ scalaire positif qui permet de pondérer l’effet de la séquence
d’entrée filtrée {uf (t )}.
C a ( q –1) ω ( t ) = P p (q –1 ) γ (t )
La réalisation de l’objectif de commande optimale à horizon
où {γ (t )} est une séquence de variables aléatoires indépendantes de fuyant (23) (24) peut être faite en adoptant une approche de
moyenne nulle et de variances finies σ 2. En effet, l’équation de commande prédictive généralisée lorsque les horizons de prédic-
l’erreur de prédiction associée est donnée par l’équation aux tion et de commande sont finis [20] ou une approche de commande


différences : linéaire quadratique gaussienne lorsque ces horizons sont infinis
[14]. La synthèse ci-après est faite à partir d’une approche de
commande prédictive, elle est basée sur le principe d’équivalence
y f (t + j ) – ŷ f ( t + j ⁄ t ) = E j (q –1 ) γ (t + j )
certitude qui stipule que la minimisation du critère (23) est équiva-
= γ ( t + j ) + e1 γ ( t + j – 1 ) + … + ej – 1 γ ( t + 1 ) lente à la minimisation du critère quadratique :

et sa variance est bien minimale, soit : hp


2 2
J ( U f ( t + hc – 1 ) ) = ∑ ( ŷ f ( t + j ⁄ t ) – y*f ( t + j ) ) + λ ( u f ( t + j – hi ) ) (25)
j–1
 2  2 2 j = hi
ε  ( y f (t + j ) – ŷ f ( t + j ⁄ t ) )  =  1 + ∑ e i  σ
   i=1  où ŷ ( t + j ⁄ t ) est le prédicteur optimal à j pas de la sortie du système
à l’instant t + j à partir des informations disponibles à l’instant t.
■ Les prédicateurs à j pas sur un horizon de prédiction hp peuvent En utilisant les équations du prédicteur (18) (19), on peut récrire le
se mettre sous la forme vectorielle : critère quadratique (25) sous la contrainte (24) sous la forme vecto-
rielle suivante :
Yˆ f ( t + hp ⁄ t ) = GU f ( t + hp – d – 1 ) + Yˆ f0 ( t + hp ⁄ t ) (21)
2
avec Jˆ ( U f ( t + hc – 1 ) ) = GU f ( t + hc – 1 ) + Yˆ f 0 ( t + hp ⁄ t ) – Y *f ( t + hp )
T 2
Yˆ f ( t + hp ⁄ t ) = [ ŷ f ( t + d + 1 ⁄ t )… ŷ f ( t + hp ⁄ t ) ] + λ U f ( t + hc – 1 ) (26)
T
Yˆ f 0 ( t + hp ⁄ t ) = [ ŷ f0 ( t + d + 1 ⁄ t )… ŷ f0 ( t + hp ⁄ t ) ] avec
Uf ( t + hp – d – 1 ) = [ u f ( t )… u f ( t + hp – d – 1 ) ]T * T
Y f ( t + hp ) = [ y *f ( t + hi )… y *f ( t + hp ) ]
g0 0 … … 0 (22) T
Yˆ f 0 ( t + hp ⁄ t ) = [ ŷ f0 ( t + hi ⁄ t )… ŷ f0 ( t + hp ⁄ t ) ]
g1 g0 … … 0
G = Uf ( t + hc – 1 ) = [ u f (t )… u f ( t + hc – 1 ) ]T
: … … :
:

g hp – d – 2 … … g0 0 g hi – d – 1 … g 0 0 … 0 (27)
g hp – d – 1 … … … g 0 g hi – d … g1 g0 … 0
Le prédicteur ŷ f ( t + j ⁄ t ) est complètement disponible à l’instant t G = … … … … … …
pour j < d + 1. Pour j > d + 1 , il dépend de la séquence de g hc – 1 … … … … g0
commandes { u f (t + i ) } i ∈ [ t, t + j – d – 1 ] que l’on peut déterminer à … … … … … …
partir d’un objectif de commande donné. g hp – d – 1 … … … … g hp – d – hc

Notons que la dimension de la matrice G est (hp – hi + 1) × hc ;


elle a été réduite par rapport à celle de la matrice G qui apparaît
2.2 Synthèse du système de commande dans les expressions (21) (22) des prédicteurs optimaux, soit
( hp – d ) × ( hp – d ) . Les premières hi – d – 1 lignes ont été suppri-
mées car on utilise un horizon d’initialisation hi > d + 1 , alors que
Les objectifs de commande qui ont été utilisés par la commu- les dernières colonnes ont été supprimées parce qu’on utilise un
nauté de commande adaptative sont principalement ceux de la horizon de commande hc ∈ [ 1, hp – d – 1 ] .
commande linéaire, en l’occurrence le placement des pôles et éven-
tuellement des zéros ou la minimisation d’un critère quadratique. Le vecteur de commande U *f ( t + hc – 1 ) qui minimise le critère
Tous ces objectifs de commande peuvent être obtenus à partir de la (26) (27), soit :
minimisation au sens d’un horizon fuyant, par rapport au vecteur de
commande : ∂ Jˆ ( U f ( t + hc – 1 ) )
---------------------------------------------------- = 0
∂ U f ( t + hc – 1 )
Uf ( t + hc – 1 ) = [ u f (t )… u f ( t + hc – 1 ) ]T , du critère suivant :
est obtenu à partir de l’équation :

J ( U f ( t + hc – 1 ) ) (23) T T
[ G G + λ Ihc ] U f* ( t + hc – 1 ) = – G [ Yˆ f 0 ( t + hp ⁄ t ) – Y *( t + hp ) ]


hp
2 2 Le calcul de la séquence de commande optimale U *f ( t + hc – 1 )
= ε  ∑ [ y f ( t + j ) – y*f ( t + j ) ] + λ [ u f ( t + j – hi ) ]  consiste à résoudre un système d’équations linéaires de dimension
 j = hi  hc. On utilisera pour ce faire l’une des méthodes numériques dispo-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle S 7 426 − 5

VU

VV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRW

Commande optimale
par Pierre BORNE
Ingénieur IDN
Docteur en automatique, docteur ès sciences
Professeur d’automatique à l’École centrale de Lille, Fellow IEEE
Frédéric ROTELLA

et
Ingénieur IDN
Docteur ingénieur, docteur ès sciences
Professeur d’automatique à l’École nationale d’ingénieurs de Tarbes

1. Principaux critères. Domaines d’application................................... R 7 427 - 2


2. Formulation du problème ...................................................................... — 2
2.1 Mise en équation ......................................................................................... — 2
2.2 Conditions terminales ................................................................................. — 3
2.3 Contraintes instantanées et intégrales ...................................................... — 3
2.3.1 Contraintes instantanées ................................................................... — 3
2.3.2 Contraintes intégrales ........................................................................ — 3
2.4 Choix du critère d’optimalité ...................................................................... — 3
3. Détermination de la commande optimale.
Principe du maximum............................................................................. — 4
3.1 Équations canoniques de Hamilton ........................................................... — 4
3.2 Conditions de transversalité ....................................................................... — 4
3.3 Équation de Hamilton-Jacobi ..................................................................... — 4
3.4 Prise en compte des contraintes ................................................................ — 4
4. Exemples d’applications pratiques importantes............................. — 5
4.1 Principaux critères d’optimisation ............................................................. — 5
4.2 Commande à temps minimum................................................................... — 5
4.3 Commande à énergie minimale ................................................................. — 6
4.4 Commande à consommation minimale .................................................... — 6
5. Système linéaire, critère quadratique................................................ — 7
5.1 Cas général................................................................................................... — 7
5.2 Cas stationnaire, horizon infini................................................................... — 8
5.3 Robustesse de la commande linéaire quadratique .................................. — 8
5.4 Cas des systèmes à état non complètement accessible .......................... — 9
6. Régulation optimale ................................................................................ — 10
6.1 Présentation ................................................................................................. — 10
6.2 Critères IAE et ITAE...................................................................................... — 10
6.3 Traitement du critère IES ............................................................................ — 11
6.3.1 L’approche transfert (approche polynomiale) .................................. — 11
6.3.2 L’approche d’état ................................................................................ — 11
6.3.3 Exemple d’utilisation.......................................................................... — 12
6.4 Critères ITES et EITES ................................................................................. — 12
Références bibliographiques ......................................................................... — 13

e problème général de la détermination d’une commande optimale d’un pro-


L cessus peut se résumer comme suit :
Un processus étant donné et défini par son modèle, trouver parmi les
commandes admissibles celle qui permet à la fois :
— de vérifier des conditions initiales et finales données ;
— de satisfaire diverses contraintes imposées ;
p。イオエゥッョ@Z@ェオゥャャ・エ@QYYV

— d’optimiser un critère choisi.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 427 − 1

VW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRW

COMMANDE OPTIMALE _________________________________________________________________________________________________________________

Cette définition appelle quelques commentaires :


— toute recherche de commande, et a fortiori de commande optimale, néces-
site la manipulation d’expressions mathématiques et, en particulier de celles
caractérisant l’évolution du processus, c’est-à-dire de son modèle. Le choix du
modèle s’avère donc primordial. Trop simple, il ne caractérisera pas suffisam-
ment bien le processus, et inutilement sophistiqué, il conduira à des calculs très
complexes ;
— la commande est en général soumise à diverses contraintes liées à sa réali-
sation (accélération limitée, vitesse de montée en puissance bornée, débit borné,
discontinuités exclues, réservoir de capacité limitée...) elle-même liée au matériel
disponible pour la mise en œuvre ;

R — les variables caractéristiques du processus peuvent être soumises à diverses


contraintes liées aux saturations, à la sécurité, à la construction, au confort, au
coût... ;
— les états initiaux et finaux du processus peuvent également être soumis à
diverses contraintes liées aux conditions de départ et à l’objectif à atteindre. Par
exemple un hélicoptère décollant d’un bateau pour atterrir sur un autre, tous
deux en déplacement ;
— le critère à optimiser doit correspondre à l’expression d’un choix étudié avec
soin, il peut être lié aux valeurs de l’état et de la commande pris à des instants
donnés, lié à une intégrale d’une fonction de ces variables sur un intervalle de
temps fixé ou non, ou les deux à la fois ;
— l’existence d’une commande satisfaisant un objectif donné suppose que le
processus est commandable, hypothèse qui sera faite implicitement de façon
systématique.
Nous nous limiterons, dans l’étude qui suit, au cas des systèmes à état continu
correspondant aux processus physiques. Afin de ne pas alourdir le texte, seuls
les résultats fondamentaux les plus utilisés en pratique sont présentés.
Le texte qui suit est très largement inspiré de l’ouvrage « Commande et optimisation des
processus » par Pierre BORNE, Geneviève DAUPHIN-TANGUY, Jean-Pierre RICHARD, Frédéric
ROTELLA et Irène ZAMBETTAKIS (Collection Méthodes et Pratiques de l’Ingénieur, volume 1,
Technip, 1990) ainsi que des cours dispensés par les auteurs dans divers établissements d’ensei-
gnement supérieur, écoles d’ingénieurs et universités.

1. Principaux critères. ■ Quel que soit le critère retenu, la méthode envisagée permet une
détermination rigoureuse et systématique de la commande dans une
Domaines d’application approche boucle fermée ; elle est, de plus, compatible avec d’autres
techniques de commande auxquelles elle peut être associée, comme
la commande adaptative, la commande prédictive, la commande en
L’intérêt de la commande optimale découle de la nature même mode glissant...
de sa définition : optimiser un critère de notre choix, tout en satis-
faisant des conditions de fonctionnement données et des contraintes
imposées.
Les principaux critères utilisés sont le temps minimum, les critères 2. Formulation du problème
quadratiques et les critères de type consommation.
■ Les utilisations principales du critère temps minimum sont les 2.1 Mise en équation
problèmes de sécurité et la minimisation des coûts liés à la durée ;
les applications principales se rencontrent dans les domaines de la Le système dynamique, ou processus, étudié est caractérisé par
production continue, de l’espace, de la défense et de la médecine. trois ensembles de variables :
■ La mise en œuvre de critères quadratiques intervient dans les pro- — les variables de sortie, en général directement accessibles et
blèmes de minimisation de l’énergie mise en œuvre, de stabilisation regroupées dans un vecteur y de dimension m ;
et de suivi de trajectoire ; elle concerne essentiellement les pro- — les variables de commande, regroupées dans un vecteur u de
blèmes de régulation et d’asservissement en général, ainsi que les dimension  et dont le choix permet d’agir sur l’évolution du
processus mettant en œuvre des énergies importantes. L’intérêt processus ;
apparaît à la fois au niveau de la qualité, de la sécurité et des coûts — les variables internes caractérisant l’état du processus à un
de mise en œuvre. instant donné, regroupées dans un vecteur état x de dimension n.
■ L’utilisation de critères de type consommation concerne surtout Nous notons t  0 l’instant courant.
les processus de production continue, dont on veut diminuer les
coûts de fonctionnement, et les processus autonomes à ressources
limitées dont on désire accroître la durée de fonctionnement.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 427 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

VX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTRW

________________________________________________________________________________________________________________ COMMANDE OPTIMALE

Dans une modélisation de l’évolution du processus, ces diverses 2.3 Contraintes instantanées et intégrales
variables sont liées par une équation d’état le plus souvent expli-
citée sous la forme :
2.3.1 Contraintes instantanées
dx
ẋ = ------- = f ( x , u , t ) Elles caractérisent en général les limitations physiques sur la
dt
(1) commande ou sur l’état du processus, par exemple la limitation d’un
y = h (x , u , t ) (2) débit, d’une pression ou d’une température, ou l’obligation pour un
avion de rester dans un « tube » de l’espace prédéfini (couloir).
n m 
x∈ , y∈ , u∈ , t∈t⊂ Ce type de contraintes s’exprime par des inégalités de la forme :

la notation = signifiant « égal à, par définition ».
q (x, u, t )  0 , q ∈  nq (8)
Dans le cas linéaire, les relations (1) et (2) se simplifient sous la


forme : On peut également avoir des contraintes de type « égalités »,
comme faire varier la puissance fournie par une centrale tout en
ẋ = A(t ) x + B (t ) u (3)
maintenant la tension constante ou faire évoluer un train qui doit
nécessairement rester sur ses rails.
y = C (t ) x + ( D (t ) u ) (4)
Les contraintes inégalités peuvent se ramener à des contraintes
Dans cette écriture, il vient : égalités en introduisant des variables supplémentaires.
2 2 2 2 T
A(t ) : t → 
n×n 
En effet en notant v =  v 1 , v 2 , ..., v nq  il vient :

n× q (x, u, t )  0 ⇔ q (x, u, t ) + v 2 = 0 (9)


B(t ) : t → 
m×n
C(t ) : t → 
2.3.2 Contraintes intégrales
m×
D(t ) : t → 
Elles sont le plus souvent liées à une limitation des ressources
Le cas D (t ) ≠ 0, correspondant à un transfert direct d’information (par exemple un réservoir contient une quantité limitée de produit
entre le vecteur de commande u (t ) et le vecteur de sortie y (t ), se à utiliser) ou à une limitation des résultats de nos actions : le même
rencontre peu en pratique. réservoir ne peut pas être rempli au-delà de sa contenance ou il y
a risque de débordement.
Dans beaucoup de problèmes rencontrés dans l’industrie, l’évo-
lution du processus au cours du temps étant lente en regard de l’hori- Ces contraintes s’expriment sous la forme :
zon d’observation, le choix d’un modèle stationnaire (indépendant
du temps) permet une représentation suffisante du processus. Dans
tf

ce cas, les matrices A, B, C et D sont constantes.
p (x, u, t ) dt  0 , p ∈  np (10)
t0
2.2 Conditions terminales
Comme dans le cas des contraintes instantanées, une contrainte
inégalité peut être remplacée par une contrainte égalité.
Les conditions terminales caractérisent à la fois l’ état initial, 2 T
En posant w = [w 1 , w 2 , ..., w np ] il vient :
2  2 2
c’est-à-dire l’instant où on commence à agir sur le processus, et l’état
final, après action de la commande.
tf tf
 
Par convention, l’instant initial est noté t 0 et l’état initial x 0 . De
2
même, l’instant final est noté t f et l’état final x f . p (x, u, t ) dt  0 ⇔ ( p (x, u, t ) + w ) dt = 0 (11)
Les conditions initiale et finale x 0 et x f prises aux instants respec- t0 t0
tifs t 0 et t f peuvent être fixées ou non.
■ Le cas le plus simple correspond à un changement de consigne
(par exemple, faire évoluer la pression d’un réservoir d’une valeur
P 0 = P 1 à la valeur P f = P 2 ) ou plus généralement à un changement 2.4 Choix du critère d’optimalité
d’état parfaitement défini. Les conditions terminales s’écrivent alors :
x (t 0 ) = x 0’ x (t f ) = x f (5)
Le critère d’optimalité peut prendre en compte les valeurs initiale
■ Un problème plus complexe correspond au guidage d’un véhicule et finale de l’état du processus, comme minimiser l’écart final par
qui doit rejoindre une zone déterminée (parking) sans que la place à rapport à une consigne donnée, ou tenir compte de l’ensemble des
prendre dans ce parking soit définie a priori. Les conditions termi- valeurs de l’état ou de la commande à chaque instant. Ce dernier
nales s’expriment alors par des relations vectorielles de la forme : cas apparaît, par exemple, dans un problème de minimisation de
l’écart par rapport à une trajectoire donnée ou de minimisation de
k (x 0 ) = 0 et (x f ) = 0 (6) l’énergie totale consommée.
La forme la plus générale du critère à optimiser correspond à
■ Le cas le plus général correspond au problème de rendez-vous où, l’expression :
par exemple, un véhicule spatial doit en rejoindre un autre et se main-
tenir à son côté. On obtient alors les conditions terminales sous la tf
forme :
k (x 0 , t 0 ) = 0 et (x f , t f ) = 0 (7)
J = g  x0 , t0 , xf , tf  +  r (x, u, t ) dt (12)
t0
qui exprime que les états initial et final ne sont pas indépendants
du temps.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 427 − 3

VY

WP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSP

Systèmes dynamiques et commande

par Jean LÉVINE


Mines Paris Tech, centre Automatique et Systèmes
et Pierre ROUCHON
Mines Paris Tech, centre Automatique et Systèmes R
1. Forme d’état et schéma-bloc ................................................................ S 7 430 - 2
2. Existence des solutions et problème de Cauchy............................. — 2
3. Première variation et étude de sensibilité ........................................ — 3
4. Systèmes linéaires stationnaires ......................................................... — 3
5. Systèmes linéaires instationnaires ..................................................... — 5
6. Point d’équilibre et stabilité ................................................................. — 6
7. Bifurcation de point d’équilibre ........................................................... — 7
8. Fonction de Lyapounov et stabilisation............................................. — 8
9. Régulateur PI avec « anti-windup » .................................................... — 9
10. Systèmes multi-échelles et cascade de régulateurs ...................... — 12
11. Systèmes oscillants et PLL .................................................................... — 14
12. Conclusions................................................................................................ — 17
Pour en savoir plus ................................................................................................ Doc. S 7 430

ans ce dossier, nous allons tenter de montrer comment la théorie des sys-
D tèmes dynamiques fournit, d’une part, des outils très utiles à la synthèse
de contrôleurs stabilisants (théorie des perturbations, commande hiérarchisée,
synthèse Lyapounov) et, d’autre part, un guide théorique précieux pour l’ana-
lyse de la stabilité et de la robustesse des systèmes non linéaires en boucle
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPX@M@d・イョゥ│イ・@カ。ャゥ、。エゥッョ@Z@ュ。ゥ@RPQX

fermée (stabilité au sens de Lyapounov, bifurcations, théorie de Poincaré-


Bendixon pour les systèmes plans, moyennisation).
Nous avons restreint le propos à la stabilisation de points d’équilibre, mais
des méthodes de même nature permettent de traiter la stabilisation autour
d’autres types de trajectoires comme les orbites périodiques.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 430 – 1

WQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSP

SYSTÈMES DYNAMIQUES ET COMMANDE _______________________________________________________________________________________________

1. Forme d’état
et schéma-bloc w

On considère un système décrit par : u d x = f (x,u,w) y = h (x)


dt

d
x = f (x , u , w ) , y = h (x)
dt
Figure 1 – Schéma-bloc de type fonctionnel pour le système
avec x ∈Z
n vecteur d’état, en boucle ouverte avec, comme entrées, la commande u
et la perturbation w, et sortie, la mesure y
u ∈Z
m commandes,

R w ∈Z
q perturbations,

y ∈Z
p mesures.
Les dimensions de x, u, w et y sont ici arbitraires. En général, on w
a n 5m et n 5p . Les fonctions f et h résultent de la modélisation :
on suppose souvent que f et h sont des fonctions régulières de υ u = k (y, ξ, υ) y = h (x)
d ξ = a (y, ξ, υ) d x = f (x, u,w)
leurs arguments. Ce n’est pas toujours le cas : dans certains modè- dt dt
les f et/ou h peuvent admettre en certains points des discontinuités.
Ce système est représenté par le schéma-bloc de la figure 1.
y
■On élabore une loi de commande sous la forme d’un retour
dynamique de sortie, c’est-à-dire un système dynamique (comme
l’est un régulateur proportionnel/intégral, cf. § 2) : Figure 2 – Schéma-bloc de type fonctionnel pour le système
en boucle fermée avec, comme entrée, la nouvelle commande v
(typiquement la consigne que y doit suivre) et la perturbation w,
d et comme sortie, la mesure y
ξ = a (y , ξ , v ) , u = k (y , ξ , v )
dt

avec v nouvelle commande.


Les fonctions a et k sont celles qui correspondent à la loi de Noter que, pour simuler le système en boucle fermée, il faut
rétroaction. La dimension de l’état ξ du contrôleur est a priori aussi rajouter l’intégration numérique des équations relatives
quelconque et dépend de l’algorithme de commande utilisé. On à x, l’état du modèle physique.
complète alors le schéma-bloc en boucle ouverte de la figure 1 par Cette intégration sur x n’est bien sûr pas nécessaire en
une boucle de rétroaction en montrant bien que les informations temps réel (le système est son propre simulateur).
issues de la sortie y sont utilisées de manière causale pour ajuster
la commande u de façon à atteindre un objectif précis.
Typiquement, la nouvelle commande v sera la consigne que
devra suivre y, lorsque u et y ont la même dimension, et u sera cal- Par la suite, nous ne nous intéresserons qu’à la version continue
culé de façon à ce que y suive v. On obtient ainsi le schéma en bou- du système comme sur la figure 2. Cette version continue est,
cle fermée de la figure 2 correspondant au système d’équation : pour une période δt petite, une approximation raisonnable du sys-
tème en boucle fermée.
d d
x = f (x , k (h (x) , ξ , v ) , w ) , ξ = a (y , ξ , v ) , y = h (x)
dt dt

avec (x, ξ ) vecteur d’état, 2. Existence des solutions


v nouvelle entrée, et problème de Cauchy
w perturbation,
y sortie.
La simulation en boucle ouverte (respectivement en boucle fer-
■La réalisation expérimentale d’une telle boucle fermée passe, en mée) consiste à calculer (en général numériquement, voir § 1) la
pratique, par un calculateur temps réel dont la période d’échan- loi horaire de l’état x (t ) (respectivement (x (t ), ξ (t ))) à partir de la
tillonnage δt est très petite devant les constantes de temps connaissance de l’état x 0 (respectivement (x 0, ξ 0)) et des lois
naturelles du système en boucle ouverte. Au paragraphe 6.2, ces horaires des entrées u (t ) et w (t ) (respectivement v (t ) et w (t )).
constantes de temps sont définies comme étant les valeurs propres
λ i autour d’un point d’équilibre donné ( λ i δt << 1). La principale hypothèse pour laquelle une telle solution existe
Pour chaque entier k, on note v k , ξ k , y k et u k la valeur de v, ξ, y pour des temps proches de 0 et est unique porte sur la dépen-
et u à l’instant kδt. La mise en œuvre informatique de cette boucle dance de f (respectivement f et a) par rapport à l’état. D’une part,
de rétroaction s’effectue via un sous-programme de variables cette dépendance doit être plus que simplement continue, elle doit
d’entrée (v k , y k , ξ k), de variables de sortie (u k+1 , ξ k+1). On exécute être lipschitzienne ; c’est-à-dire, pour chaque état x, il existe K > 0
ce sous-programme à chaque période d’échantillonnage kδt : il tel que, pour tout z proche de x, on ait :
donne alors la valeur de la commande u k+1 en (k + 1) δt.
Une version très simple, mais souvent suffisante en pratique, f (x , u , w ) − f (z , u , w ) 4 K x − z (K peut dépendre de u et w)
repose sur l’intégration numérique via un schéma d’Euler explicite
des équations différentielles du contrôleur [14] :
Le résultat d’existence et d’unicité est connu sous le nom de
théorème de Cauchy-Lipschitz (voir [11] et [14] pour un énoncé
ξ k +1 = ξ k + δt a (y k , ξk , v k ), u k +1 = k (y k , ξ k , v k )
précis).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 430 – 2 est strictement interdite. – © Editions T.I.

WR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSP

_______________________________________________________________________________________________ SYSTÈMES DYNAMIQUES ET COMMANDE

On peut cependant vérifier, grâce aux exemples qui suivent, d


Par exemple, la solution de x = x est x (t ) = exp (t ) x 0 : à t blo-
que la condition sur f est importante et que la solution peut ne dt
plus exister pour des temps trop grands : qué, x (t ) dépend continûment de x 0. En revanche, la différence,
d x 0 exp (t ), entre la solution qui démarre en 0 et celle qui démarre en
– l’équation x = x admet deux solutions distinctes par-
dt x 0 ≠ 0 croit exponentiellement en t, même pour des x 0 très petits.
tant de x = 0 : x (t ) = 0 et x (t ) = 4t 2 ; on remarque que x
0
Ainsi, la dépendance continue par rapport aux conditions initiales
n’est pas lipschitzienne en x = 0, bien qu’elle y soit continue (temps borné) ne doit pas être confondue avec la sensibilité par
(pente infinie) ; rapport aux conditions initiales (temps non borné) propre aux sys-
d tèmes dits « chaotiques ».
– l’équation x = x 2 admet comme solution partant de
dt
Sur l’exemple célèbre des trois équations différentielles de


1
x 0 = 1, x (t ) = : elle explose en t = 1–, bien que la fonction Lorenz :
1− t
x 2 soit lipschitzienne.  dx1
 = s (− x1 + x 2 )
 dt
Nous n’abordons pas le cas où f n’est pas lipschitzienne par  dx 2
rapport à x (cas typique où f admet des discontinuités), car alors la  = r x1 − x 2 − x1 x 3
notion de solution est nettement plus difficile à définir. Nous  dt
renvoyons à [6].  dx 3
 = − bx 3 + x1 x 2
 dt
avec s = 10, r = 28 et b = 8/3, on peut montrer que toutes les trajec-
3. Première variation toires sont bornées bien que leur comportement asymptotique pour
des temps très grands est complexe et, encore aujourd’hui, assez
et étude de sensibilité mal compris (pour une introduction aux systèmes chaotiques voir par
exemple [5]).

d
Prenons la boucle ouverte (voir nota) x = f (x , u , w ) et supposons
4. Systèmes linéaires
dt
que f est dérivable par rapport à ses variables. Soit une trajectoire (par
exemple, une solution) du système t ֏ (x (t ) , u (t ) , w (t ) , y (t )) . Les
petits écarts notés (δx, δu, δw, δy) à cette trajectoire obéissent alors aux
stationnaires
équations linéaires instationnaires suivantes, dites « première
variation » : 4.1 Exponentielle matricielle
d On rappelle maintenant quelques formules utiles sur les sys-
δ x = A (t ) δ x + B (t ) δ u + D (t ) δ w , δ y = C (t ) δ x tèmes linéaires :
dt
d
x = Ax
∂f dt
avec : A (t ) = (x (t ) , u (t ) , w (t )) ,
∂x
avec A matrice constante n × n.
∂f
B (t ) = (x (t ) , u (t ) , w (t )) , La matrice dépendant du temps exp (tA) est définie par la série
∂u absolument convergente :
∂f
D (t ) = (x (t ) , u (t ) , w (t )) ,  t2 tk 
∂w exp (t A) =  I + t A + A2 + ... + Ak + ... (1)
 2! k! 
∂h
C (t ) = (x (t )) .
∂x avec I matrice identité.
Nota : la même analyse peut être faite pour la boucle fermée. On appelle t ֏ exp (t A) l’exponentielle de la matrice A. Quel que
Ce calcul est à la base des études de sensibilité. Il correspond au soit x 0 ∈Zn , l’unique solution x (t ) du problème de Cauchy
développement limite à l’ordre 1 de f et h : d
x (t ) = Ax (t ), x (0) = x 0 s’exprime sous la forme :
dt
f (x + δ x , u + δ u , w + δ w ) = f (x , u , w ) + Aδ x + Bδ u + Dδ w + ... x (t ) = exp (t A) x 0
h (x + δ x) = h (x ) + Cδ x + ...
L’exponentielle de matrice satisfait les propriétés suivantes :
Il permet de montrer, par exemple, que la dépendance de la
solution x par rapport à sa condition initiale et aux entrées u et w exp (t A) exp (τ A) = exp ((t + τ ) A)
est continûment dérivable dès que f est une fonction continûment d
dérivable de ses arguments. (exp (t A)) = exp (t A) A = A exp (t A)
dt
exp (PAP −1) = P exp (A) P −1
Il est important de noter qu’une telle dépendance continue m
n’est valable que pour des temps t bornés. Elle n’est plus vraie  A
exp (A) = lim  I + 
en général pour des temps non bornés, le module de m→+∞  m
continuité pouvant alors devenir de plus en plus grand.
det (exp (A)) = exp (tr(A))

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 430 – 3

WS
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSP

SYSTÈMES DYNAMIQUES ET COMMANDE _______________________________________________________________________________________________

avec t et τ réels quelconques,


P matrice inversible,
« det » déterminant,
« tr » trace.
En particulier, lorsque A est diagonalisable, λ 1, ..., λ n étant ses Foyer stable Centre Foyer instable
valeurs propres et P la matrice n × n des vecteurs propres associés,
on a : λ1 λ1 λ1
PAP −1 = diag { λ 1, ..., λ n } et
0 0 0
P exp (t A) P −1 = diag {exp (t λ 1), ..., exp (t λ n )} λ2 λ2 λ2


4.2 Portraits de phases Figure 3 – Portraits de phases plans et linéaires en fonction
des valeurs propres de A, r 1 et r2 , ayant une partie imaginaire
En dimension n = 2, les principaux cas sont illustrés sur les non nulle
figures 3 et 4. On a noté λ 1 et λ 2 , les valeurs propres de A (distinc-
tes ou non, réelles ou complexes conjugées), ξ 1 et ξ 2 sont les vec-
teurs propres réels associés quand ils existent. On appelle ici plan
de phases l’espace Z2 correspondant à l’état x. Pour chaque cas,
on a représenté l’emplacement des valeurs propres de A dans le
plan complexe, et l’allure générale des trajectoires dans le plan de
d  λ 0  λ 1
phases du système x = Ax . A= <0 A= <0
 0 λ  0 λ
dt
En dimension 3, la figure 5, montre sur un exemple comment, à
partir des portraits de phases en dimension 2, on construit, dans Nœud stable Col Nœud instable
les cas génériques, le portrait de phases en dimension 3 : il suffit ξ2
ξ2 ξ2
de décomposer Z3 en somme d’espaces propres invariants de
dimension 1 ou 2. Si A a deux valeurs propres complexes
conjuguées à partie réelle négative et une valeur propre réelle ξ1 ξ1 ξ1
négative, on a convergence suivant une direction et enroulement
avec convergence (typique d’un foyer stable) suivant deux autres
directions. Pour un exposé détaillé, voir [11].
λ1 λ2 0 λ1 0 λ2 0 λ2 λ1
4.3 Polynômes caractéristiques
Les valeurs propres de A (dont la suite est appelée spectre) cor- d
Figure 4 – Portraits de phases plans et linéaires, x = Ax, lorsque
respondent aux racines de son polynôme caractéristique. Ce der- dt
d d les valeurs propres de A, r 2 , sont réelles ( 1
1 et r u et u 2 vecteurs
nier est obtenu en remplaçant, dans x = Ax , l’opérateur par s, propres de A, lorsqu’ils existent)
dt dt
la variable de Laplace, et en cherchant les conditions sur s ∈K
pour que le système linéaire de n équations à n inconnues sx = Ax
admette des solutions x non nulles, ce qui équivaut à dire que la
matrice sI – A n’est pas inversible, ou encore que son déterminant
P (s), un polynôme de degré n, est nul :
n −1
P (s ) = det (s I − A) = s n − ∑ σν sν = 0
ν =0 0
Les coefficients σν de ce polynôme P (s) se calculent à partir des 0
coefficients de la matrice A.
Soit t ֏ y (t ) ∈Z solution de :
y (n) = σ 0 y + σ 1y (1) + ... + σ n−1y (n −1) (2) Valeurs propres Trajectoire
avec. σ i. scalaires,
y (ν) ν-ième dérivée de y par rapport au temps. Figure 5 – Exemple de portraits de phases d’un système linéaire
de dimension 3 en fonction des valeurs propres de A
(1), (n–1))T
En posant x = (y, y ..., y vecteur de Zn
, cette équation
scalaire d’ordre n devient un système du premier ordre de dimen-
d
sion n, x = Ax , avec pour A la figure 6 :
dt 0 1 0 ... ... 0
0 0 1 0 ... 0
 0 1 0 … … 0 
...

...
...
... ...
...
...

 0 0 1 0 … 0  A=
0 ... 0 1 0
 
 P Y Y Y Y P  0 ... ... ... 0 1
A=  (3) σ0 ... ... ... σn-2 n-1
 0 … Y 0 1 0 
 0 … … … 0 1 
  Figure 6 – Matrice A de forme très particulière dite « compagne »
σ0 … … … σ n−2 σ n−−1 ou « canonique »

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 430 – 4 est strictement interdite. – © Editions T.I.

WT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSR

Commande fréquentielle robuste


Application aux paliers magnétiques
par Stéphane FONT
Enseignant-chercheur à l’École supérieure d’électricité, à Gif-sur-Yvette
Gilles DUC
Professeur à l’École supérieure d’électricité, à Gif-sur-Yvette R
et François CARRÈRE
Ingénieur à la Société de mécanique magnétique (S2M), à Saint-Marcel

1. Synthèse H ∞............................................................................................... R 7 432 - 2


1.1 La norme H ∞ ................................................................................................ — 2
1.2 Analyse des principaux transferts d’un asservissement.......................... — 2
1.3 Notions élémentaires de robustesse ......................................................... — 2
1.3.1 Incertitudes sur la réponse fréquentielle en basse fréquence ........ — 3
1.3.2 Incertitudes sur la réponse fréquentielle en moyenne fréquence.. — 3
1.3.3 Incertitudes sur la réponse fréquentielle en haute fréquence ........ — 4
1.4 Le problème H∞ standard ........................................................................... — 4
1.5 Mise en œuvre par le choix de pondérations fréquentielles ................... — 5
2. Le contrôle des paliers magnétiques ................................................. — 6
2.1 Généralités sur les paliers magnétiques ................................................... — 6
2.2 Modèle du système ..................................................................................... — 6
2.3 Cahier des charges ...................................................................................... — 6
3. Synthèse H∞ en temps continu ............................................................ — 7
3.1 Formulation du problème H∞ ..................................................................... — 7
3.2 Sélection des fonctions de pondération .................................................... — 7
3.3 Réduction du correcteur.............................................................................. — 8
3.4 Résultats ....................................................................................................... — 8
4. Synthèse en temps discret.................................................................... — 9
5. Conclusion ................................................................................................. — 10
Références bibliographiques ......................................................................... — 10

a synthèse H∞ prend une place de plus en plus importante parmi les méthodes
L de calcul de correcteur. Sa principale caractéristique est de permettre de
modeler différents transferts d’un système asservi, tout en garantissant la sta-
bilité de la boucle fermée. Elle permet également la prise en compte de certains
objectifs de robustesse, tels que la garantie de marges de stabilité ou la robus-
tesse aux dynamiques hautes fréquences mal connues ou non modélisées.
Nous avons mis en œuvre cette approche, dans le but de développer une
méthodologie permettant la synthèse de régulateurs pour des paliers magné-
tiques. Il s’agit d’un problème qui comporte des spécifications nombreuses et
très précises. Dans de nombreux cas, il peut être résolu par des méthodes
classiques, mais pas de façon systématique, d’où un temps de conception plus
long. Il est par ailleurs difficile de faire des campagnes d’essais pour optimiser
un aspect particulier du cahier des charges.
Pour concevoir la commande, nous avons utilisé le modèle d’un rotor flexible
sous forme modale, qui comporte, en plus de l’inertie, six modes de flexion. La
synthèse est préalablement réalisée en continu. Une synthèse discrète est ensuite
effectuée, en utilisant la transformée en w.
p。イオエゥッョ@Z@ェオゥョ@QYYW

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Informatique industrielle R 7 432 − 1

WU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSR

COMMANDE FRÉQUENTIELLE ROBUSTE ____________________________________________________________________________________________________

Dans le paragraphe 1, nous expliquons les principes de la synthèse H ∞ . Le


paragraphe 2 présente le système physique et son modèle, ainsi que le cahier
des charges traité. La synthèse H ∞ est décrite dans le paragraphe 3, en indiquant
comment sont prises en compte les spécifications (bande passante, rejet des per-
turbations, amortissement des modes, filtrage haute fréquence). Ce paragraphe
se termine par une réduction d’ordre du correcteur obtenu. Enfin, la démarche
générale est reproduite au paragraphe 4 pour obtenir un correcteur numérique.

R 1. Synthèse H ∞
1.1 La norme H ∞
Tout système linéaire et invariant peut être modélisé par une fonc-
tion de transfert ou transmittance H (p ). Si le système a q entrées
et r sorties, H (p ) est une matrice r × q. Dans le cas où le système
est stable, on définit sa norme H ∞ par : Figure 1 – Structure d’asservissement classique

H (p) ∞ : = sup λ ( H ( j ω ) H ( – j ω )T )
(1) Par ailleurs, on peut déduire très simplement l’allure de ces répon-
ω∈R ses fréquentielles (figure 2), en faisant des hypothèses sur le gain
où la notation λ ( ) désigne la plus grande des valeurs propres. de la boucle ouverte :
— dans les zones de grand gain, qui correspondent en général
Pour un système à une entrée et une sortie, cette expression
aux basses fréquences (bien en deçà de la bande passante de
devient :
l’asservissement), G ( j ω ) K ( j ω )  1 et donc 1 + G (j ω ) K (j ω ) ≈
H ( p ) ∞ : = sup H ( j ω ) G (j ω ) K (j ω ). Les approximations reportées sur la figure 2 montrent
(2)
ω∈R que le correcteur agit sur les transferts de r vers ε et de d vers ε ,
tandis qu’il est sans effet sur les transferts de r vers u et de d vers u ;
La norme H ∞ apparaît alors comme le maximum du module de — dans les zones de faible gain, qui correspondent en général aux
la réponse fréquentielle. hautes fréquences (bien au-delà de la bande passante de l’asservi-
ssement), G ( j ω ) K ( j ω )  1 et donc 1 + G ( j ω ) K ( j ω ) ≈ 1. Le cor-
recteur agit sur les transferts de r vers u et de d vers u, tandis qu’il
1.2 Analyse des principaux transferts est sans effet sur les transferts de r vers ε et de d vers ε .
d’un asservissement
Considérons le schéma-bloc de la figure 1, où G (p ) est un modèle 1.3 Notions élémentaires de robustesse
sous forme de fonction de transfert du système à asservir et K (p )
est le correcteur ; r et d sont respectivement la référence et une La mise en équation d’un processus physique nécessite des
perturbation reçue en entrée du système ; u est la commande approximations, d’où résultent par conséquent des incertitudes de
élaborée par le correcteur et y la sortie à asservir ; ε est l’erreur modèle. De plus, la synthèse du correcteur fait généralement appel
d’asservissement. à un modèle simplifié, dans lequel sont, par exemple, négligées les
On peut, à partir de ce schéma, exprimer la transformée de dynamiques hautes fréquences du système, celles des capteurs ou
Laplace de l’erreur en fonction des transformées de Laplace des des actionneurs, d’éventuels retards purs... Enfin, les paramètres du
signaux appliqués : modèle ainsi obtenus sont toujours plus ou moins entachés d’incerti-
ε (p ) = r (p ) – G (p ) (– d (p ) + K (p ) ε (p )) tudes (tolérance sur une résistance par exemple).
d’où : On dit qu’une propriété du système asservi est robuste si cette
propriété est conservée malgré ces différentes incertitudes. En parti-
1 G (p) culier, on cherchera au moins à assurer au système asservi la robu-
ε ( p ) = ---------------------------------------- r ( p ) + ---------------------------------------- d ( p )
1 + G (p) K (p) 1 + G (p) K (p) stesse de la stabilité. Une exigence plus importante consiste à
= Tε r ( p ) r ( p ) + Tε d ( p ) d ( p ) garantir la robustesse d’une performance (telle que le taux de réje-
(3)
ction d’une perturbation par exemple).
Pour la commande, on en déduit : Des méthodes systématiques d’étude de la robustesse ont été
développées depuis le début des années 80, à partir des travaux de
K (p) G (p) K (p) Doyle et Safonov [2] [8]. Leur exposé complet sort du cadre de cette
u ( p ) = ---------------------------------------- r ( p ) + ---------------------------------------- d ( p )
1 + G (p) K (p) 1 + G (p) K (p) présentation, et le lecteur intéressé pourra consulter les
= T ur ( p ) r ( p ) + T ud ( p ) d ( p ) (4) références [3] [4] [6]. Le point important de ces analyses est qu’elles
utilisent la norme H∞ . Nous allons en donner un aperçu dans les
On met ainsi en évidence 4 transferts différents. L’étude de leur lignes qui suivent en nous limitant à des concepts simples, basés
réponse fréquentielle renseigne sur les propriétés de sur les notions classiques d’Automatique fréquentielle et sur l’ana-
l’asservissement : par exemple l’asservissement est sans erreur lyse effectuée au paragraphe précédent (§ 1.2).
statique si les transferts Tε r (p ) et Tε d (p ) sont nuls en p = 0.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 7 432 − 2 © Techniques de l’Ingénieur, traité Informatique industrielle

WV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

Commande modale
Application au pilotage d’un avion
par Jean-Marc BIANNIC
Maı̂tre de recherche à l’ONERA
Chercheur affilié au LAAS-CNRS
Professeur de rang équivalent à l’ISAE/SUPAÉRO


1. Commande modale et robustesse ............................................... R 7 433v2 – 2
1.1 Préambule .......................................................................................... — 2
1.2 Rappels sur la commande modale des systèmes multi-entrées ...... — 3
1.2.1 Placement de structure propre ................................................ — 3
1.2.2 Gestion des degrés de liberté dans le cas multi-entrées ....... — 4
1.2.3 Calcul de la précommande H .................................................. — 4
1.2.4 Résumé de l’algorithme de synthèse...................................... — 5
1.3 Améliorations de la robustesse de la commande modale ............... — 5
1.3.1 Retour sur le choix des vecteurs propres : découplage
ou robustesse ? ....................................................................... — 6
1.3.2 Structure de commande utilisant des intégrateurs ................ — 6
1.3.3 Compensation modale dynamique multimodèles ................. — 7
1.3.4 De la commande modale à la synthèse H• structurée
multimodèles ........................................................................... — 7
2. Application au pilotage d’un avion civil .................................... — 8
2.1 Modèle et cahier des charges ............................................................ — 9
2.1.1 Modélisation non linéaire ....................................................... — 9
2.1.2 Équilibre et linéarisation ......................................................... — 10
2.1.3 Comportement modal de l’avion naturel ................................ — 11
2.1.4 Données numériques .............................................................. — 11
2.1.5 Objectifs de pilotage ............................................................... — 13
2.1.6 Contraintes sur les commandes ............................................. — 14
2.2 Une première loi de pilotage sans intégrateurs ............................... — 14
2.2.1 Structure du correcteur ........................................................... — 14
2.2.2 Transcription du cahier des charges ....................................... — 15
2.2.3 Calcul du correcteur et évaluations préliminaires .................. — 15
2.3 Effet des intégrateurs sur la robustesse ............................................ — 18
2.3.1 Structure du correcteur et modèle de synthèse ..................... — 18
2.3.2 Choix des pôles et calcul du correcteur.................................. — 18
2.3.3 Analyses modales et temporelles sur les pires cas ............... — 19
2.4 Structuration et robustesse ............................................................... — 21
2.4.1 Annulation des retours rapides sur les moteurs .................... — 21
2.4.2 Synthèse H• structurée ............................................................ — 22
2.5 Implantation et tests sur le modèle non linéaire .............................. — 27
2.5.1 Schéma d’implantation ........................................................... — 27
2.5.2 Résultats de simulations non linéaires ................................... — 27
2.5.3 Effets des perturbations atmosphériques ............................... — 29
3. Conclusions...................................................................................... — 31
Pour en savoir plus.................................................................................. Doc. R 7 433v2

ans le monde aéronautique, plus particulièrement depuis l’apparition des


D commandes de vol électriques (CDVE), la théorie de la commande modale
est appliquée avec succès au réglage des lois de commande de vol. Le pilotage
automatique des avions civils reste encore aujourd’hui l’application phare per-
mettant d’illustrer simplement le potentiel de ces techniques.
p。イオエゥッョ@Z@ュ。イウ@RPQS

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. R 7 433v2 – 1

WW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

COMMANDE MODALE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Après quelques rappels théoriques et détails relatifs à l’amélioration de la


robustesse des lois de commande modale, nous proposons donc dans cet arti-
cle une application relativement complète à un problème de pilotage automa-
tique en phase d’atterrissage. Du point de vue de la commande, cette phase du
vol est particulièrement exigeante quant à la précision requise sur les variables
pilotées. La sensibilité des lois de commande aux perturbations externes (vent,
turbulences atmosphériques) d’une part et aux variations de modèle (masse,
centrage) d’autre part fera donc l’objet d’une attention particulière. Nous propo-
serons dans un premier temps une solution classique, puis diverses pistes per-
mettant d’améliorer les premiers réglages.

Dans cette représentation LPV (linéaire à paramètres variant)


Variable Désignation généralisant la représentation d’état classique (voir [1] [2] pour
Variation de vitesse autour de l’équilibre projetée sur plus de détails), x ∈ℝn désigne le vecteur d’états du système consi-
ub déré, u ∈ℝm le vecteur de commandes, y ∈ℝ p le vecteur de mesu-
l’axe X de l’avion
res, z ∈ℝr le vecteur des variables à réguler et ξ ∈ℝv le vecteur des
Variation de vitesse autour de l’équilibre projetée sur paramètres (variant éventuellement dans le temps) susceptibles de
wb
l’axe Z de l’avion modifier les comportements statiques et dynamiques du système.
q Vitesse de tangage Dans cet article, nous proposons de focaliser notre attention sur
la problématique du pilotage d’un avion supposé rigide – les éven-
q Variation de l’assiette autour de l’assiette d’équilibre tuels modes souples induits par les déformations du fuselage et
des ailes seront négligés – dans le plan vertical en vue de son atter-
Pd Pression dynamique rissage. Dans ce plan, le comportement dynamique de l’avion, régi
H Altitude barométrique par les équations de la mécanique, peut être décrit par quatre varia-
bles d’états (on a donc n = 4). Les deux premières correspondent
m Masse aux projections du vecteur vitesse du centre de gravité de l’avion
dans le plan vertical. Les deux suivantes sont associées au mouve-
xcg Position du centre de gravité (centrage) ment de rotation dans ce plan autour du centre de gravité. Il s’agit
respectivement de l’assiette (angle formé par l’axe longitudinal de
dTH Variation de poussée moteur l’avion avec l’horizon) et de sa dérivée temporelle : la vitesse de
tangage. Au niveau des commandes, le pilote dispose de deux
dE Variation de braquage de la gouverne de profondeur
actions principales : la poussée moteur et le braquage de la gou-
verne de profondeur (m = 2).
vc (
Variation de la vitesse conventionnelle v c ∝ Δpd ) Pour une vitesse air et une pente de descente données, à masse,
vz Variation de la vitesse verticale centrage et configuration fixés, il est relativement aisé de détermi-
ner un régime d’équilibre maintenant la pente et la vitesse à des
valeurs constantes en l’absence de perturbations externes. À ce
régime, correspondent une poussée moteur, un braquage de la
1. Commande modale gouverne de profondeur et une assiette d’équilibre. Dans un voisi-
nage de cet état d’équilibre, les équations initialement non linéai-
et robustesse res citées plus haut sont facilement linéarisées par différenciation
au premier ordre. Cette linéarisation nous conduit naturellement à
la forme générique décrite par l’équation (1) avec :

1.1 Préambule ⎡ ub ⎤ ⎡ pd ⎤ ⎡v c ⎤
⎢w ⎥ ⎢H ⎥ ⎢v ⎥
x = ⎢ b ⎥ , ξ = ⎢ m ⎥ , u = ⎡⎢ TH ⎤⎥ , y = ⎢ z ⎥ , z = ⎡⎢ c ⎤⎥
δ v (2)
La plupart des engins aéronautiques ou spatiaux (avions, missi- q δE ⎦ q vz ⎦
⎢ θ ⎥ ⎢x ⎥ ⎣ ⎢θ⎥ ⎣
les, fusées, satellites) admettent, sur un domaine de fonctionne- ⎣ ⎦ ⎣ ⎦
⎣ cg ⎦
ment plus ou moins limité, une représentation dynamique linéaire
sous la forme suivante, devenue aujourd’hui très classique en et les notations détaillées ci-après.
automatique :
Le lecteur intéressé par la détermination des différents régimes
⎧xɺ = A (ξ ) x + B (ξ )u d’équilibre ou pseudo-équilibre de l’avion (en palier, à pente cons-
⎪ tante, en virage) et des modèles linéarisés associés pourra se repor-
⎨y = C (ξ ) x + D (ξ )u (1)
ter à l’ouvrage [3] qui est particulièrement complet dans ce
⎪z = Fy
⎩ domaine. Nous reviendrons également sur ce point dans la sec-
tion 2 de l’article.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


R 7 433v2 – 2 est strictement interdite. – © Editions T.I.

WX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE MODALE

Nous supposerons dans la suite que le système est gouvernable


Remarque 1 Sur les quatre paramètres que contient le vec- et observable [S 7 135] impliquant de fait que les matrices B et C
teur x, notons que les deux derniers sont pratiquement fixes sont toutes deux de rangs pleins (i.e. rang (B) = m, rang (C)= p). Le
(masse et centrage) tandis que les deux premiers (pression signal z désigne le vecteur des sorties à réguler. Il s’agit générale-
dynamique et altitude) sont susceptibles de varier au cours du ment d’une combinaison linéaire des sorties y. Le nombre de sor-
temps. Les variations relatives de ces dernières, par rapport à ties à réguler coı̈ncide le plus souvent avec le nombre de comman-
celles des états du système sont cependant très faibles. Dans des, de sorte que :
un voisinage assez large d’un point de linéarisation donné,
pour lequel L ∈ ℝm × p (6)
x (t) = xi, le système LPV (1) devient donc stationnaire. Son com-
portement est alors décrit par le système LTI (linéaire à temps Nous recherchons pour le système (4) une loi de commande par
invariant) : retour statique de sorties de la forme :

⎧⎪xɺ = A (ξi ) x + B (ξi )u = Ai x + Biu u = Ky + He (7)


⎨ (3)
⎪⎩y = C (ξi ) x + D (ξi )u = Ci x + Diu où le gain K ∈ ℝm × p désigne le gain de retour (feedback en anglais)
tandis que le gain H ∈ ℝm ×m correspond à la matrice de précom-
Remarque 2 Le choix des variables à réguler vc et vz par la mande (feedforward). Contrairement au gain K, ce dernier n’a pas
boucle de pilotage est ici fortement guidé par l’application. d’influence sur la stabilité du système en boucle fermée. Il ne fait
L’objectif, que nous allons préciser en section 2, est en effet de que traduire la manière dont les consignes e vont affecter le
maintenir l’avion sur une trajectoire rectiligne de descente, ce qui système.
revient à asservir l’altitude, donc la vitesse verticale. Au cours de
cette phase, on souhaite aussi maintenir la vitesse convention- Compte tenu des équations (4) et (7), le système en boucle fer-
nelle constante, ou de façon équivalente, la pression dynamique. mée s’écrit :
On garantit ainsi un comportement homogène de l’avion.
( )
⎧xɺ = A + B ( I − KD )−1 KC x + B ( I − KD )−1 He
⎪  B
Pour l’automaticien chargé du réglage des lois de pilotage d’un ⎪⎪ ABF BF

⎨ (8)
engin aéronautique, la remarque 1 est essentielle et justifie une
démarche utilisée avec succès depuis plus de trente ans. Cette ⎪
( −1
)
⎪z = L I + D ( I − KD ) K Cx + LD ( I − KD )−1 He
 D
démarche est fondée sur l’utilisation des outils de synthèse de lois ⎪⎩ CBF BF

de commande dédiés aux systèmes linéaires invariants. Ces outils,


particulièrement nombreux et efficaces, nés de la théorie de la Remarque 3 Le gain K est supposé garantir la non-singula-
commande optimale, modale, robuste, adaptative, prédictive… ont rité de la matrice I – KD sans quoi la boucle fermée n’est pas
fait l’objet, pour la plupart, d’une intégration réussie dans diverses définie. En l’absence de transmission directe (D = 0), cette hypo-
« Toolboxes » de MATLAB‚ devenu aujourd’hui l’environnement thèse est vérifiée quelque soit K.
de référence pour l’analyse et la commande des systèmes
dynamiques [S 7 460].
L’objectif est maintenant de déterminer les matrices K et H de
C’est plus particulièrement à la commande modale que nous
manière à maı̂triser les comportements statiques et dynamiques
proposons de nous intéresser dans cet article en insistant notam-
de ce système.
ment sur la robustesse des lois de commande. Après quelques rap-
pels fondamentaux, nous proposons une piste nouvelle permettant
une meilleure prise en compte des incertitudes paramétriques 1.2.1 Placement de structure propre
affectant le modèle tout en maı̂trisant la structure et la complexité Comme son nom l’indique, la commande modale vise à assurer
des lois obtenues. un comportement dynamique satisfaisant au système (8) via la
De manière pédagogique et donc progressive, les divers aspects maı̂trise des modes ou des pôles en boucle fermée. Cette approche
de la commande modale seront rappelés dans cette section puis repose donc sur les techniques de placement de pôles, ou mieux
illustrés en section 2 sur une application particulièrement réaliste de structure propre. Soit donc l une valeur propre de la matrice
et détaillée. d’évolution ABF du système en boucle fermée et v le vecteur propre
à droite associé. Il vient par définition :

1.2 Rappels sur la commande modale


des systèmes multi-entrées
( −1
ABF .v = A + B ( I − KD ) KC v = λv ) (9)

ce qui aussi s’écrire sous la forme :


Notre objectif dans le reste de cette section est de proposer au
lecteur quelques rappels succincts autour de la commande modale
B ] ⎡⎢ ⎤⎥ = 0
v
classique (voir [R 7 432] [R 7 220] [12] [9] pour plus de détails) en [A − λI ⎣w ⎦
(10)
insistant plus particulièrement sur les techniques permettant
d’améliorer la robustesse. Dans ce contexte, une approche mixte, avec :
combinant synthèse modale et synthèse H• structurée sera
−1
proposée. w = ( I − KD ) KCv (11)
Considérons un système linéaire LTI de la forme :
soit encore (après multiplication à gauche par la matrice non singu-
⎧xɺ = Ax + Bu lière I - KD) :

⎨y = Cx + Du (4)
⎪z = Ly ( I − KD )w = KCv (12)

d’où finalement :
comportant n états, m commandes et p mesures, soit :
K (Cv + Dw ) = w (13)
A ∈ ℝn ×n , B ∈ ℝn ×m , C ∈ ℝ p ×n , D ∈ ℝ p × p (5)

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. R 7 433v2 – 3

WY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

COMMANDE MODALE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Nous pouvons maintenant résumer les développements qui pré- permettant d’éliminer des modes sur les sorties régulées et de réa-
cèdent sous la forme d’un lemme : liser ainsi un découplage. Pour mieux comprendre les choses,
Lemme 1 Sur le système en boucle fermée défini par les équa- notons V = [v1, v2,…, vn] la matrice des vecteurs propres à droite
tions (8), le correcteur K place un pôle λ ∈ℂ associé au vecteur pro- de ABF, dont les p premières colonnes ont été placées via l’Algo-
pre v ∈ℂn si et seulement s’il existe un vecteur w ∈ℂm tel que les rithme 1. Notons ensuite x (t) le vecteur d’état dans la base modale
relations (10) et (13) soient satisfaites. Dans le cas d’une valeur pro- définie par V. Par définition, dans cette base, la composante xi du
pre non réelle, les relations conjuguées : vecteur n’est affectée que par le mode li : xi (t) = exp (lit). Par ail-
leurs, la relation entre l’état « physique » x (t) et l’état « modal »
x (t) s’écrit :
⎡⎣ A − λI B ⎤⎦ ⎡ v ⎤ = 0 (14)
⎢⎣w ⎦⎥ n
x (t ) = V ξ (t ) = ∑ ξi (t )v i (21)
i =1
K (Cv + Dw ) = w (15)


Intéressons nous maintenant à la contribution modale sur la j-ième
devront en outre être satisfaites pour préserver le caractère réel du sortie régulée zj. En notant CBFj la j-ième ligne de la matrice CBF,
gain K.
cette contribution s’écrit :
En résumé, placer une valeur propre l en boucle fermée s’effec-
n
tue en deux étapes particulièrement simples et très rapides sur le
plan numérique : CBFj x (t ) = CBFjV ξ (t ) = ∑ ξi (t )CBFj v i (22)
i =1
1. Calcul du noyau N (λ ) ∈ ℝ(n +m )×m de la matrice M (λ ) ∈ ℝn × (n +m )
La présence du i-ième mode sur la j-ième sortie régulée est donc
définie par :
caractérisée par le coefficient CBFj v i . Si ce coefficient est nul, le
M (λ ) = [ A − λI B ] (16) mode est absent de cette sortie. Remplaçons maintenant CBF par
son expression (8). Utilisons ensuite la relation (13), entre les vec-
2. Choix de vecteurs v et w tels que : teurs placés vi et wi, il vient après quelques manipulations
matricielles :
⎡v ⎤ = N λ ζ
⎢⎣w ⎥⎦ ( ) (17)
CBFj v i = LjCv i + Lj Dw i , i = 1… p , j = 1…m. (23)

où z est un vecteur quelconque de ℝm et détermination du gain K Ainsi, pour découpler le i-ième mode de la j-ième sortie régulée,
par résolution du système d’équations linéaires caractérisées par il suffit de construire la matrice :
les relations (13) et éventuellement (15).
⎡A − λ I B ⎤
M ( λi ) = ⎢ L C i L D ⎥ (24)
⎣ j j ⎦
Remarque 4 En notant que le gain K ∈ ℝm × p
du correcteur
contient mp degrés de liberté et que chaque relation (13) intro- Pour un système comportant m entrées et m sorties régulées, on
duit m contraintes linéaires en K, il est facile de voir que, par voit par cette technique qu’il est possible de découpler chaque
cette approche, on peut réaliser un placement exact de p pôles mode placé de m - 1 sorties.
de la boucle fermée. La procédure est décrite par l’algorithme 1.
Exemple 1 Les matrices M (l1) et M (l2) suivantes :
Algorithme 1 – Placement exact de p pôles
⎡ A − λ1I B ⎤ ⎡ A − λ 2I B ⎤
1. Choisir un ensemble auto-conjugué {l1, l2,…, lp} de p valeurs ⎢ L2C L2D ⎥ ⎢ LC L2D ⎥
M (λ1) = ⎢ , M (λ2 ) = ⎢ 2 (25)
propres réelles ou complexes à placer ; ⋯ ⋯ ⎥ ⋯ ⋯ ⎥
⎢ L C L D⎥ ⎢ L C LmD ⎥⎦
2. Calculer les noyaux N (li) ; ⎣ m m ⎦ ⎣ m
3. Choisir les vecteurs vi et wi formant un ensemble auto-
permettent par exemple de découpler les deux premiers pôles placés
conjugué ; l1 et l2 de toutes les sorties régulées sauf la première. Autrement
4. Calculer K, solution de (13) et (15) : dit, ces pôles l1 et l2 sont ainsi affectés à la première sortie régulée
z1.
( )
−1
K = ⎡⎣w 1…w p ⎤⎦ C ⎡⎣v 1…v p ⎤⎦ + D ⎡⎣w 1…w p ⎤⎦ (18)
1.2.3 Calcul de la précommande H
1.2.2 Gestion des degrés de liberté dans le cas
multi-entrées Nous avons vu dans le paragraphe précédent que dans le cas des
systèmes multi-entrées, il était possible d’exploiter les degrés de
Dans le cas des systèmes multi-entrées (m > 1), la relation (17) fait liberté surnuméraires dans l’algorithme de placement de pôles
clairement apparaı̂tre une infinité de possibilités dans le choix des pour réaliser un découplage modes-sorties. La technique repose
vecteurs vi et wi associés à une valeur propre li. Il convient donc de sur l’introduction de contraintes linéaires sur les vecteurs propres
gérer ces degrés de liberté surnuméraires. L’approche la plus simple à droite vi et les vecteurs wi encore appelés les directions d’entrées.
consiste à ajouter m - 1 lignes à la matrice M (li) qui devient alors :
& Découplage dynamique
⎡A − λ I B ⎤
M (λi ) = ⎢ C i D ⎥ ∈ ℝ(n +m −1)× (n +m ) (19)
Afin d’assurer le découplage entrées-sorties généralement requis
⎣ vi wi ⎦
dans la pratique, il convient maintenant de réaliser un découplage
et dont la dimension du noyau (sauf cas dégénérés) devient main- entrées-modes. Illustrons ces propos en reprenant l’exemple 1. Si
tenant égale à 1. Ces lignes introduisent sur les vecteurs vi et wi, nous souhaitons que la première consigne e1 affecte la sortie z1 et
des contraintes de la forme : seulement cette sortie, il convient de s’assurer que cette entrée e1
n’agisse que sur les pôles l1 et l2 affectés à z1. Autrement dit, tous
Cv i v i + Dw i w i = 0 (20) les pôles placés autres que les deux premiers, (i.e. l3,…, lp) doivent
être découplés de e1.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


R 7 433v2 – 4 est strictement interdite. – © Editions T.I.

XP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE MODALE

Ces nouvelles contraintes peuvent être gérées via la matrice de 1.2.4 Résumé de l’algorithme de synthèse
précommande H dont la fonction est précisément de distribuer les
consignes sur les commandes. Notons U = V-1 la matrice des vec- Rassemblons les éléments qui précèdent pour en déduire un
teurs propres à gauche et ui le vecteur ligne associé à la valeur pro- algorithme de synthèse classique d’une loi de commande modale
pre li correspondant à la i-ième ligne de U. Avec ces notations, on combinant découplage modes-sorties dynamique, d’une part, pour
établit aisément que la j-ième entrée (ej) n’affecte pas le mode li si le calcul du gain K, puis, un découplage entrées-sorties statique,
la condition suivante, de découplage entrée-mode est vérifiée : d’autre part, pour le calcul du gain de précommande H.

−1
Algorithme 2 – Synthèse d’une loi de commande modale
ui BBFj = ui B ( I − KD ) H j = 0 (26)
1. Définir la structure de commande et déterminer les matrices A, B,
C, D et L associées à la représentation d’état du modèle de synthèse ;
où Hj désigne la j-ième colonne de la matrice H.
2. Définir une répartition modale : distribution des modes placés
Exemple 2 Poursuivons l’exemple 1 en découplant maintenant sur les sorties régulées ;
l’entrée e1 des pôles l3,…, lp, ceci afin de garantir une action exclu-


3. Définir les valeurs numériques li des pôles en fonction des
sive de e1 sur z1 et donc un découplage entrée-sortie. Compte tenu contraintes (temps de réponse souhaités, amortissement) ;
du résultat qui précède, ces conditions s’écrivent ici :
4. Former les matrices M (li) définies par les relations (19) de
⎧u B ( I − KD )−1H = 0 façon compatible avec la répartition modale choisie à l’étape 2 ;
⎪ 3 1
5. Calculer les vecteurs propres et directions d’entrée vi et wi via
⎨ ⋮ ⋮ (27)
⎪u B ( I − KD )−1H = 0 les noyaux des matrices M (li) ;
⎩ p 1
6. Déterminer le gain K du correcteur à partir de la relation (18) ;
ou encore, en utilisant une écriture plus générique : 7. Calculer la précommande H via la relation (31).
H1 ∈ker (W1) (28) Notons que les deux premières étapes de cet algorithme n’ont
pas encore fait l’objet de discussions approfondies dans cette sec-
avec la notation : tion. Ces étapes assez délicates sont largement dépendantes de
l’application traitée. Nous aurons donc l’occasion d’y revenir en
⎡u 3 ⎤ section 2 de l’article. Nous reviendrons cependant sur la notion de
−1
W1 = ⎢ ⋮ ⎥ B ( I − KD ) (29) structure dès cette section, dans le volet dédié à la prise en compte
⎢u ⎥ des contraintes de robustesse.
⎣ p⎦
La troisième étape de l’algorithme est relativement naturelle, dans
la mesure où un lien assez direct existe entre les valeurs numériques
des pôles du système et son comportement temporel. C’est d’ail-
Remarque 5 Pour éviter que les conditions qui précèdent ne leurs un point fort de la commande modale. On prendra garde tou-
génèrent la solution triviale H1 = 0, ce qui rendrait totalement tefois à ne pas placer des pôles trop rapides par rapport aux dynami-
inactive l’entrée e1 !, il faut s’assurer que le noyau de W1 soit ques non maı̂trisées et dimensionnantes du système (les
au moins de rang 1. Sur notre exemple, nous avons actionneurs). On prendra garde également à ne pas placer de pôles
W1 ∈ ℝ(p − 2) ×m . La condition de rang est donc vérifiée ici dès l’ins- multiples ou trop proches les uns des autres. Cela génère en effet
des singularités dans la matrice V (présence de vecteurs propres
tant où p - m < 2. Plus généralement, pour que le découplage
colinéaires) et le calcul de K via la relation (18) génère des gains
entrée-mode soit réalisable, la différence p - m entre le nombre
énormes quand il ne devient pas tout simplement impossible.
de mesures et de commandes doit rester strictement inférieure
au nombre de pôles affectés par chaque entrée. Cette contrainte Rappelons enfin, que dans le cas le plus fréquent en pratique du
peut donc devenir particulièrement restrictive quand on a choisi retour de sorties (p < n), le placement de pôles (nous l’avons vu)
(ce n’est pas toujours un choix d’ailleurs…) de n’affecter qu’un n’est que partiel. Il en résulte des dynamiques non maı̂trisées,
seul pôle à une entrée. Cela implique en effet p = m, ce qui est qu’il sera donc également impossible d’affecter à telle ou telle sor-
très rarement le cas en pratique… tie. Par conséquent, ces dynamiques pourront introduire des « per-
turbations » dans le découplage. Encore une fois, le principal
& Découplage statique remède repose sur un choix pertinent de la structure de com-
Compte tenu des limitations relativement sévères dont souffre la mande, de l’affectation modes-sorties et des valeurs numériques
technique de réglage de la précommande H par découplage choisies pour les pôles placés. Il convient d’éviter au mieux toute
« entrées-modes » (il s’agit en fait d’un découplage dynamique) interaction forte entre les dynamiques maı̂trisées et celles qui ne
que nous venons rapidement de présenter, une approche alterna- le sont pas en « éloignant » les pôles.
tive fondée sur le découplage statique mérite considération.
Cette approche, particulièrement simple consiste à déterminer la 1.3 Améliorations de la robustesse
matrice H de sorte que le gain statique de la boucle fermée (8) soit
unitaire :
de la commande modale
−1 B Dans le premier volet ce cette introduction rapide à la commande
DBF − CBF ABF BF = I
(30)
modale, nous avons limité notre propos à la synthèse d’un correc-
teur dans une situation idéale où le modèle utilisé représente par-
d’où il vient immédiatement une caractérisation algébrique directe faitement le processus d’une part et en l’absence de perturbations
de la matrice H : d’autre part. La réalité est malheureusement assez éloignée de
cette situation. La présence d’incertitudes paramétriques (par
(
H = ( I − KD ) LD − CBF ABF
−1 B
)−1 (31) exemple sur la masse, le centrage, les coefficients aérodynami-
ques…), les méconnaissances de certains éléments mal identifiés
Par cette approche on garantit ainsi un comportement entrée-sor- du processus (dynamiques hautes fréquences introduites par des
tie parfaitement découplé en régime permanent, ce qui correspond modes de structure, limitations des actionneurs et capteurs…) et
à une exigence pratique très fréquente. C’est donc généralement les perturbations externes (vent, turbulences atmosphériques)
cette technique de réglage que l’on va privilégier, en vérifiant a pos- sont autant d’éléments qu’il convient de prendre en compte au
teriori que le régime transitoire est correct. plus tôt dans la conception des lois de commande.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. R 7 433v2 – 5

XQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

COMMANDE MODALE ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Nous allons donc explorer quelques pistes dans ce qui suit pour En présence d’incertitudes non localisées, les rangs des matrices
améliorer les propriétés de robustesse des lois de commande DA et DB devenant élevés, l’approche précédente n’est plus appli-
modale. Pour cela, nous reviendrons dans un premier temps sur cable. Une technique classique, proposée dans [8], repose sur la
le choix des vecteurs propres avant de proposer des solutions fon- majoration suivante :
dées sur des lois de commande dynamiques. Enfin, une piste nou-
velle exploitant des outils récents de synthèse H• structurée sera δ λi ≤ ui v i Δ A + ui w i ΔB (39)
proposée, puis mise en œuvre à la section 2.
On introduit alors un critère J de la forme :
1.3.1 Retour sur le choix des vecteurs propres : n
découplage ou robustesse ? J = ∑ ui v i + ui w i (40)
i =1
Dans la section qui précède, nous avons indiqué un algorithme
au sein duquel des contraintes sont introduites dans le choix des dont la minimisation peut être réalisée par des techniques d’optimi-


vecteurs propres afin de garantir un découplage entre les pôles et sation non linéaire classiques du premier ou second ordre. Dans
les sorties régulées. Nous allons maintenant mettre en évidence cette approche, la structure des incertitudes paramétriques n’est
que ces mêmes vecteurs propres ont une influence directe sur la plus prise en compte de manière précise. Il s’agit en effet d’une
sensibilité des pôles en présence d’incertitudes paramétriques. technique d’insensibilisation de l’ensemble des pôles du système
à des petites variations de l’ensemble des coefficients des matrices
Revenons tout d’abord au système linéaire (4) et supposons que A et B. Nous obtenons plus de flexibilité, en revanche, puisque la
les matrices A et B de ce système soient soumises à des incertitu- minimisation du critère J peut être réalisée conjointement au
des paramétriques additives DA et DB, de sorte que l’équation d’évo- découplage via l’exploitation des degrés de liberté éventuellement
lution en boucle ouverte s’écrive maintenant : disponibles sur les vecteurs vi et wi. Des outils de synthèse modale
associés à ces techniques sont disponibles avec la boı̂te à outils
xɺ = ( A + Δ A ) x + (B + ΔB )u (32) MATLAB‚ [11].

La matrice ABF en boucle fermée devient dans ces conditions : 1.3.2 Structure de commande utilisant
ABF = A + Δ A + (B + ΔB ) ( I − KD ) KC
−1 (33) des intégrateurs
La technique d’insensibilisation des lois de commande modales
Intéressons-nous à présent aux petites variations δ λi induites sur proposée dans le paragraphe précédent s’avère rapidement limitée
les pôles de la boucle fermée par de telles incertitudes en suppo- dès que le nombre de degrés de liberté ne permet plus de gérer
sant que leurs amplitudes restent suffisamment faibles. Au premier convenablement le compromis découplage/robustesse. Par ail-
ordre, on peut écrire l’approximation suivante (rappelons ici confor- leurs, cette technique réservée aux incertitudes paramétriques de
mément aux notations introduites plus haut que vi désigne le vec- faible amplitude ne permet pas non plus de minimiser l’effet de
teur propre à droite de la matrice ABF nominale associé à la valeur perturbations externes en entrée du système.
propre nominale li) : Pour atteindre cet objectif de « rejet de perturbations » en entrée
du système, une technique classique consiste à introduire des inté-
( )
ABF ⋅ v i ≈ λi + δ λi v i (34) grateurs dans les lois de commande en utilisant des structures de
type P.I. ou P.I.D. [R 7 405]. La synthèse de ce type de correcteur
Remplaçons ABF par son expression (33), il vient après quelques dont la structure générale est illustrée par le schéma de la figure 1
manipulations matricielles : peut s’envisager sans aucune difficulté via les techniques dévelop-
pées plus haut. Il suffit en effet de raisonner sur un système aug-
Δ Av i + ΔBw i = δ λi v i (35) menté. Introduisons comme l’indique le schéma m intégrateurs
sur l’erreur e entre les consignes e et les sorties régulées z. Notons
d’où, après multiplication à gauche par le vecteur ligne ui (rappe- ( )
x le vecteur d’états associé à ces intégrateurs ξɺ = e − z . Définissons
lons que ce vecteur, appelé vecteur propre à gauche, correspond à ensuite x a ∈ ℝn +m le vecteur d’état augmenté, résultant de la conca-
la i-ième ligne de V-1 et vérifie donc la relation uivi = 1) :
ténation de x et x. Il en résulte la représentation d’état :
δ λi = ui Δ Av i + ui ΔBw i (36)
⎧ɺ ⎡ A 0⎤ ⎡ B ⎤ ⎡0 ⎤
⎪x a = ⎢⎣ − LC 0⎦⎥ x a + ⎣⎢ − LD ⎦⎥ u + ⎣⎢ I ⎦⎥ e
Une solution évidente a priori pour réduire la sensibilité des pôles ⎪  
⎪ Aa Ba
aux incertitudes paramétriques contenues dans les matrices A et B ∑a (s ) : ⎨ (41)
consiste donc à imposer les contraintes linéaires suivantes sur les ⎪y = ⎡ 0 I ⎤ x + ⎡ 0 ⎤ u
vecteurs vi et wi placés : ⎪ a ⎢⎣C 0⎥⎦ a ⎢⎣D ⎥⎦


⎩ Ca Da
Δ Av i + ΔBw i = 0 (37)

ce qui peut être réalisé en redéfinissant les matrices M (li) de


l’équation (19) sous la forme :
H
A − λi I B ⎤
M (λi ) = ⎡⎢ (38) e + 1
⎣ ΔA ΔB ⎥⎦ e
ya +
+ u SYSTÈME y z
− s K L
(A,B,C,D)
Cette approche n’est toutefois envisageable que si les matrices DA
et DB sont très creuses, de sorte que la matrice [DA DB] comporte
au plus m – 1 lignes indépendantes. En outre, ces nouvelles
contraintes vont généralement entrer en conflit avec les contraintes
de découplage établies plus haut. Sauf en présence de commandes
en nombre suffisant, il est rarement possible d’agréger toutes les
contraintes pour envisager un découplage robuste. Figure 1 – Structure de loi de commande utilisant des intégrateurs

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


R 7 433v2 – 6 est strictement interdite. – © Editions T.I.

XR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
rWTSS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– COMMANDE MODALE

dont la sortie augmentée y a ∈ ℝm + p résulte de la concaténation des classique et de généraliser le lemme 1 de placement de structure
erreurs intégrées d’une part et des mesures classiques y d’autre propre sous la forme suivante (démontrée dans [10]) :
part : Lemme 2 Sur le système en boucle fermée représenté par le
schéma de la figure 2, le correcteur dynamique K (s) place un pôle
⎡ ξ (t ) ⎤ ⎡ ∫ (e (τ ) − z (τ )) dτ ⎤
t
λ ∈ℂ et un vecteur v a ∈ℂna correspondant au na premières compo-
y a (t ) = ⎢ ⎥=⎢ 0 ⎥ (42)
⎣y (t )⎦ ⎢⎣ y (t ) ⎥⎦ santes du vecteur propre associé v ∈ ℂna +nc si et seulement s’il
existe un vecteur w a ∈ℂm tel que :
Le rebouclage de ce système augmenté via le retour de sorties
Ba ] ⎡⎢ a ⎤⎥ = 0
v
statique : [ Aa − λI ⎣w a ⎦
(46)
u = Ky a + He (43)

K (λ ) (Cv a + Dw a ) = w a (47)


conduit à la boucle fermée illustrée par le schéma de la figure 1.
Nous venons donc ici de montrer que le calcul d’une loi de com- Dans le cas d’une valeur propre non réelle, les relations conjuguées :
mande dynamique de type P.I. ou P.I.D. pouvait facilement se rame-
ner à la détermination d’un retour de sorties statique sur un sys-
tème augmenté comportant maintenant n + m états et p + m
()
K λ (Cv a + Dw a ) = w a (48)

mesures. Il résulte que le calcul du nouveau gain K ∈ ℝm × (p +m ) devront en outre être satisfaites pour préserver le caractère réel des
peut être effectué sans problème par une technique de placement matrices Ac, Bc, Cc et Dc de la représentation d’état du correcteur.
de structure propre. Les m nouveaux pôles induits par la présence D’apparence similaire au lemme 1 que nous avons établi dans le
des intégrateurs pourront être placés. premier volet de la section, une différence fondamentale apparaı̂t
dans le résultat que nous venons d’énoncer au niveau des rela-
Remarque 6 Dans cette nouvelle structure, le gain de pré- tions (47) et (48). Ces dernières sont en effet beaucoup moins res-
commande H ne joue plus le même rôle. Le gain statique uni- trictives que leurs « homologues statiques » (13) et (15) dans la
taire du transfert entre les consignes e (qui entrent dans le sys- mesure où les contraintes relatives à un pôle placé l portent ici
tème via les intégrateurs) et les sorties régulées z est garanti par sur le gain du correcteur dynamique évalué en ce pôle :
la présence des intégrateurs dans la loi de commande. La for-
K (λ ) = K (s ) s = λ.
mule (31) de calcul de H visant à assurer le découplage statique
n’a donc plus lieu d’être ici. Les degrés de liberté disponibles Ces degrés de liberté supplémentaires peuvent être exploités de
dans H pourront donc être utilisés pour améliorer le découplage multiples façons, parmi lesquelles le placement de pôles multimo-
dynamique. Nous verrons en section 2 que ce gain n’est plus dèles détaillé dans [10] présente un intérêt pratique évident pour
forcément utile. Le choix H = 0 présente l’avantage en effet de améliorer les propriétés de robustesse de la commande modale.
réduire les sollicitations sur les gouvernes. En présence de satu- Dans cette approche, plutôt que de considérer un seul modèle
rations sur les actionneurs, un tel choix peut s’avérer judicieux. nominal caractérisé ici par les matrices [Aa, Ba], on considère une

1.3.3 Compensation modale dynamique


{
famille de modèles ⎡⎣ Aai , Bai ⎤⎦ }
i =1…N
à laquelle on associe une

multimodèles {
famille d’ensembles de valeurs propres à placer λ1i , …, λip }i =1…N.
Les degrés de liberté disponibles dans le correcteur sont exploités
Si la structure précédente n’apporte toujours pas suffisamment de
de manière à réaliser cette affectation de pôles multimodèles.
degrés de liberté, un correcteur dynamique d’ordre quelconque nc :
Pour des raisons techniques visant à préserver la convexité du pro-
K (s ) = ⎡⎢ c
A Bc ⎤
(44) blème d’optimisation qui découle de cette approche, il est nécessaire
⎣Cc Dc ⎥⎦ de fixer a priori les pôles du correcteur K (s). Seuls les coefficients des
peut être considéré. Ce cas de figure est illustré par le schéma de la numérateurs de la matrice de transfert K (s) entrent dans la liste des
variables du problème d’optimisation. Cette contrainte requiert donc
figure 2.
une certaine expertise de la part de l’utilisateur de ce type de tech-
Via une démarche similaire à la précédente, on peut montrer dans nique qui devra correctement choisir les pôles du correcteur.
ce cas de figure plus général, que la boucle fermée illustrée par le
Par ailleurs, quand la prise en compte d’un nombre important de
schéma se ramène de nouveau à un retour de sortie statique :
modèles devient nécessaire pour assurer la robustesse voulue, il
᏷ = ⎡⎢ c
A Bc ⎤ faut nécessairement augmenter le nombre de degrés de liberté ce
(45)
⎣Cc Dc ⎦⎥ qui implique une augmentation nécessaire de l’ordre du correcteur.
Des difficultés d’implémentation peuvent en résulter, en particulier
sur un nouveau système augmenté d’ordre na + nc dont le vecteur quand il devient nécessaire d’interpoler les correcteurs en fonction
d’état agrège ceux du système augmenté précédent (xa) d’une part du point de fonctionnement. En aéronautique il est fréquent que
et ceux du correcteur (xc) d’autre part. Cette écriture de la boucle l’on doive modifier les gains par exemple en fonction de la vitesse.
fermée permet ainsi d’adapter les résultats de commande modale
1.3.4 De la commande modale à la synthèse H•
structurée multimodèles
H
Améliorer la robustesse des lois de commande modale, dont le
e + réglage sur un modèle nominal est particulièrement simple et intui-
e 1 ya + u
− s CORRECTEUR + SYSTÈME y z tif, tout en préservant la simplicité initiale du correcteur reste un
(Ac,Bc,Cc,Dc) L
(A,B,C,D) problème particulièrement difficile. La solution que nous propo-
sons pour conclure cette section repose sur un outil de synthèse
très récent [7] [6] disponible depuis la version R2010b de MATLAB‚.
Pour un système donné (voire même une famille de systèmes), cet
outil permet de déterminer une loi de commande structurée,
d’ordre fixé, stabilisant la boucle fermée (voire la famille) tout en
Figure 2 – Loi de commande dynamique minimisant un critère H•.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. R 7 433v2 – 7

XS

XT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSU

Commande en régime glissant

par Jean-Marc BIANNIC


Ingénieur de recherches à l’ONERA


Professeur vacataire à SUPAÉRO
et André FOSSARD
Ancien professeur à SUPAÉRO
Ancien directeur de recherches à l’ONERA

1. Présentation générale............................................................................. S 7 435 - 2


2. Principe de la méthode .......................................................................... — 2
2.1 Introduction par l’exemple aux notions fondamentales .......................... — 2
2.2 Généralisation.............................................................................................. — 9
3. Attractivité et systèmes variants ........................................................ — 10
4. Extension au cas multivariable ............................................................ — 12
4.1 Approche itérative ....................................................................................... — 12
4.2 Approche directe.......................................................................................... — 13
5. Poursuite de modèle ou de trajectoire .............................................. — 13
5.1 Poursuite parfaite de modèle ..................................................................... — 13
5.2 Poursuite approchée.................................................................................... — 14
6. Application ................................................................................................ — 16
6.1 Introduction.................................................................................................. — 16
6.2 Description du modèle ................................................................................ — 16
6.3 Surface de glissement................................................................................. — 18
6.4 Calcul des gains ........................................................................................... — 19
6.5 Synthèse d’un observateur......................................................................... — 19
6.6 Réglage de la non-linéarité ......................................................................... — 21
6.7 Implantation et validation ........................................................................... — 22
7. Conclusion ................................................................................................. — 24
Références bibliographiques ......................................................................... — 24

n présente, dans cet article, les fondements de la commande en régime


O de glissement. On mettra notamment en évidence les principales forces
de cette technique que sont sa robustesse ainsi que la grande variété des pro-
blèmes qu’elle permet de traiter. On détaillera également sa principale faiblesse
liée au phénomène de réticence, en particulier dans le cas des systèmes
variants, mais aussi les moyens d’y remédier. Une application complète au pilo-
tage d’un engin rapide est proposée à la fin de l’article.
p。イオエゥッョ@Z@ェオゥョ@RPPU

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 435 − 1

XU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSU

COMMANDE EN RÉGIME GLISSANT _______________________________________________________________________________________________________

1. Présentation générale

x = f (x, u+)
La commande en régime glissant (ou plus exactement la s (x) > 0
commande à structure variable générant un régime glissant) a
essentiellement pour vocation de permettre l’obtention, en boucle
fermée, d’une dynamique largement indépendante de celle du pro- S
cessus et surtout de ses variations éventuelles. En ce sens, elle peut
être considérée comme appartenant à la classe des commandes •
robustes. x = f (x, u –)
s (x) < 0 s (x) = 0
Sur le plan théorique, elle repose essentiellement sur l’utilisation
d’une commande discontinue ayant pour but de maintenir l’évo-


lution du système sur une surface de commutation judicieusement
choisie, qui fixe de fait la dynamique résultante (un peu de manière Figure 1 – Surface de glissement
analogue à ce que fait la transmittance de retour dans un système
à grand gain). Autrement dit, la commande ne sert qu’à amener
puis maintenir l’évolution du système sur la surface. Cette surface Pour y parvenir, on devra donc concevoir une loi de commande
fixe alors les performances obtenues. u permettant de rendre la surface attractive en tout point de
l’espace d’état. Autrement dit, si par exemple à un instant donné le
Sur le plan pratique, l’utilisation d’une commande discontinue système se trouve en un point situé dans la région de l’espace
peut évidemment poser a priori des problèmes, puisque, idéa- d’état telle que s (x ) > 0, alors en ce point on devra vérifier que
lement, la commande bat à haute fréquence. Ces problèmes ṡ ( x ) < 0 . De même, tous les points de la région définie par
peuvent toutefois être largement réduits en utilisant une commande ṡ ( x ) < 0 devront rendre la dérivée temporelle positive. L’attractivité
constituée de deux composantes : de la surface S peut donc se résumer par l’inégalité :
— une composante continue, la « commande équivalente » en
glissement ;
— une composante discontinue (d’amplitude réduite) qui a pour s ( x )ṡ ( x ) < 0 (3)
fonction essentielle de maintenir l’évolution sur la surface choisie
en dépit des variations du processus. On conçoit aisément qu’une telle commande rendant la surface
S attractive ne peut être que discontinue :
De plus, la composante discontinue peut être linéarisée dans un
voisinage de la surface de commutation, permettant ainsi d’éviter
le phénomène gênant de commutations à haute fréquence. s (x) > 0 ⇒ u = u +
(4)
s (x) < 0 ⇒ u = u –
Parmi les intérêts de la commande à structure variable, il faut noter
sa très grande versatilité dans la mesure où elle permet de traiter :
On notera enfin que, dès l’instant où la surface est atteinte, alors
— les systèmes non linéaires aussi bien que les systèmes linéaires ; toute évolution ultérieure du système est « condamnée » à se pro-
— les systèmes multivariables aussi bien que les systèmes duire exclusivement sur cette surface avec une dynamique bien
monovariables ; particulière – largement indépendante de celle du processus initial
— les problèmes de poursuite de modèles ou de trajectoires – que l’on pourra en outre maîtriser.
aussi bien que les problèmes de régulation.
Dans cet article, il s’agit donc avant tout de réaliser une synthèse
des principales forces, mais aussi des faiblesses de la commande
en régime glissant en insistant plus particulièrement sur les aspects 2.1 Introduction par l’exemple
pratiques de mise en œuvre qui restent au centre des préoccu- aux notions fondamentales
pations de l’ingénieur. Des compléments utiles ou des dévelop-
pements plus approfondis sur certains points pourront être trouvés
dans les ouvrages [9] [11] [12] ou dans les rapports d’études [6] [7]. Notions fondamentales :
Un exemple d’application concernant le pilotage longitudinal — glissement et dynamique en glissement ;
d’un véhicule aérien permettra d’illustrer quelques points essentiels — commande équivalente et réticence.
de la commande à structure variable et de mettre en évidence les
principales étapes de sa mise en œuvre [2].
Afin de faire apparaître le plus simplement possible les carac-
téristiques essentielles (qui seront généralisées ensuite) de la
commande en régime glissant, on envisage d’abord le cas du
2. Principe de la méthode « double intégrateur », si souvent considéré en automatique.

2.1.1 Position du problème


Le principe de la méthode est exposé, pour plus de simplicité,
dans le cas d’un système monoentrée.
Le processus à commander se réduit donc à une inertie pure, de
1
Soit un système, linéaire ou non linéaire, défini par l’équation : transmittance ------------ . En prenant comme variables d’état x 1 = – y et
Jp 2
ẋ = f ( x, u ) (1) x 2 = –y˙ (cf. figure 2) – donc, au signe près, la position et la vitesse
et soit une surface : de la charge – les équations d’état du système inertiel s’écrivent :
(S ) : s (x ) = 0 (2)

冢 冣 冢 冣冢 冣 冢 冣
séparant l’espace d’état en deux régions, l’une où s (x ) > 0, l’autre x˙ 1 0 1 x1 0
= + 1 u (5)
où s (x ) < 0 (cf. figure 1). L’idée est d’amener, puis de maintenir x˙ 0 0 x2 – -----
l’évolution du système (1) sur la surface S. 2 J

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 435 − 2 © Techniques de l’Ingénieur

XV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSU

_______________________________________________________________________________________________________ COMMANDE EN RÉGIME GLISSANT

région II. En revanche, partant de M 1 , on arrive maintenant au


point B à partir duquel plus aucune évolution, ni dans la région I
1 ni dans la région II, ne semble possible. La différence entre ces
e=0 + ε σ0 + p s M u y
J p2
deux cas provient des conditions d’attractivité de la surface S (cf.
– –M équation (3)). Compte tenu de l’expression de s (x ), on obtient ici :

M
ṡ = σ 0 x˙ 1 + x˙ 2 = σ 0 x 2 – ------- sign ( s ) (10)
J
Figure 2 – Commande en glissement d’un système inertiel et, si on veut qu’au moment où s devient négatif, ṡ devienne
positif, la condition suivante doit être vérifiée :


x 2 > – ------------ (11)
x2 J σ0
A’
M
Symétriquement, on obtient aussi la condition :
J σ0
P M
B’ x 2 < ------------ (12)
J σ0
Région I s (x) > 0
montrant ainsi que la condition d’attractivité n’est vérifiée que sur
M1 M0 le segment PQ de la droite de commutation.
x1
Zone de glissement 2.1.2 Glissement
B Dans une telle situation – qui est celle qui nous intéresse ici – la
Région II s (x) < 0 théorie conventionnelle des équations différentielles continues ne
Q s’applique plus. Elle conduirait au point B à un point d’arrêt,
M puisqu’à partir de ce point, plus aucune trajectoire ne semble

J σ0 A possible. Pourtant, cela est physiquement impossible, car la vitesse
s = σ0 x1 + x2 = 0
est non nulle au point B.
La théorie des équations différentielles discontinues, dite de Fili-
pov [5], permet de résoudre le problème. Sans entrer dans les
Figure 3 – Trajectoires dans le plan de phase détails de cette théorie, retenons ici simplement que le mouvement
ultérieur (après le point B) :
La surface de commutation S est supposée définie par l’équa- — se fait sur la surface S. On dit alors qu’il y a glissement sur
tion : cette surface ;
x1 — est régi par une fonction convexe des mouvements dans cha-
( S ) : s ( x ) = σ0 x 1 + x 2 = ( σ0 1 )
x2
=0
冢 冣
(6) cune des deux régions σ > 0 et σ < 0.
La dynamique associée est donc définie par :
Il s’agit donc d’une droite dans l’espace d’état formé par le plan
(x 1 x 2). Enfin, la commande devant être discontinue de part et x˙ g = α f ( x, u + ) + ( 1 – α ) f ( x, u – ) (13)
d’autre de S, on suppose simplement que :
où α ∈ [0, 1] est tel que :
s (x) > 0 ⇒ u = u + = M
(7)
s ( x ) < 0 ⇒ u = u – = –M ṡ = α s˙ + + ( 1 – α ) ṡ – = 0 (14)
Toutes ces hypothèses sont visualisées sur la figure 2 sous
traduisant ainsi le fait que l’on reste bien sur la surface.
forme d’un schéma fonctionnel.
Les équations du système en boucle fermée ayant la forme
suivante : 2.1.3 Dynamique équivalente en glissement
x˙ 1 = x 2
Sur l’exemple proposé, on a :
M (8)
x˙ 2 = – ------- sign ( σ 0 x 1 + x 2 )
J
x2 x2
on en déduit, par intégration, que les trajectoires de phase sont des f ( x, u + ) = , f ( x, u – ) = (15)
paraboles d’équation : M M
– ------- -------
J J
2 2 2M
x 2 – x 20 + ----------- ( x 1 – x 10 ) sign ( σ 0 x 1 + x 2 ) = 0 (9)
J d’où il vient :
M M
L’équation (9) montre que l’on obtient deux familles de paraboles s˙ + = σ 0 x 2 – ------- , s˙ – = σ 0 x 2 + ------- (16)
d’axe x 2 = 0 et de concavités opposées selon le demi-plan J J
(s (x ) > 0 ou s (x ) < 0) auquel elles appartiennent (voir figure 3).
soit, d’après (14) :
Par référence à la figure 3, on voit que, selon les conditions
M
initiales, deux cas peuvent se présenter. Partant de M 0 , on observe s˙ = σ 0 x 2 + ( 1 – 2 α ) ------- = 0 (17)
au point A une commutation normale de la région I vers la J

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 435 − 3

XW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSU

COMMANDE EN RÉGIME GLISSANT _______________________________________________________________________________________________________

Or, d’après (13), il vient :


M
x2 s = σ0 x1 + (1 – σ0 θ) x2 – θ (1 – σ0 θ/2) = 0
J
x˙g = (18)
M
( 1 – 2 α ) ------- x2
J M 1 – σ0 θ/2
θ
J 1 – σ0 θ x1
d’où finalement, en utilisant (17) : M1
M 1 – σ0 θ/2 B6
0 1 x1 – θ
x˙ g = = Ae x g (19) J 1 – σ0 θ B4 Région I
B7 σ>0
0 – σ0 x 2
B5
B2


La matrice A e appelée matrice équivalente définit la dynamique
en glissement. On notera qu’elle a une valeur propre nulle, tandis
B3
que l’autre, égale à – σ 0 , est indépendante de l’inertie J. Plus pré-
cisément, elle est fonction uniquement de la droite de commutation B
choisie. Autrement dit, une fois la droite de commutation atteinte Région II
au point B, l’évolution se fait selon la loi : σ<0
B1
M Q
(1 – σ0 θ/2)
x˙ 1 = x 1B exp ( – σ 0 t ) (20) J σ0

indépendante de la commande u qui ne sert qu’à maintenir les


s = σ0 x1 + x2 = 0
conditions de glissement. M
s = σ0 x1 + (1 – σ0 θ) x2 + θ (1 – σ0 θ/2) = 0
J
2.1.4 Commande équivalente
On peut noter que le mouvement obtenu est le même que si le Figure 4 – Illustration du phénomène de réticence
processus était soumis à une commande u e continue telle que :
1
x˙ 2 = – ----- u e = – σ 0 x 2 (21) définie précédemment. Ces propos sont illustrés par la figure 5 sur
J laquelle on présente un résultat de simulation avec les données
soit : numériques suivantes :
ue = J σ0x 2 (22) J = σ0 = 1
θ = 0,1 s (23)
Cette commande est appelée commande équivalente en glisse-
ment. x 10 = 1 , x 20 = 0

2.1.5 Phénomène de réticence (chattering) Ici on a volontairement choisi une valeur élevée pour le retard
Les notions précédentes de glissement sur S, de dynamique à la commutation (θ ) afin de rendre plus visible le phénomène
équivalente (continue) et de commande équivalente (continue), ne de réticence.
doivent pas faire oublier qu’un tel fonctionnement n’est possible
que grâce aux discontinuités sur la commande qui obligent le sys-
tème à rester sur la surface de commutation. Cela signifie donc 2.1.6 Réduction ou élimination de la réticence
que la commande « bat » de + M à – M à une fréquence infinie (si
la commutation est instantanée). Le phénomène de réticence décrit précédemment (§ 2.1.5) peut se
révéler particulièrement nuisible dans la mesure où il est suscep-
Pour comprendre physiquement ce qui se passe, le plus simple tible de générer une fatigue importante des actionneurs allant par-
est de supposer qu’on a un retard θ à la commutation. Ainsi, la fois jusqu’à la rupture. Il est donc important de pouvoir limiter, voire
commutation va se produire non pas exactement sur la surface au supprimer, ce phénomène. On présente ici deux techniques,
point B, mais en un point voisin B 1 appartenant donc à la région II complémentaires, pour y parvenir.
(cf. figure 4). Il est facile de voir, d’après l’équation (9), que la tra-
jectoire d’évolution est constituée d’une succession d’arcs de para-
2.1.6.1 Utilisation de la commande équivalente
boles de concavités opposées et situés entre deux droites parallèles,
–1 Jusqu’à présent, la commande utilisée :
de pente
冢 θ – -------
σ 冣
1
0
- décalées de l’origine de la valeur :
u = M sign (s ) (24)
M 1 – σ 0 θ /2 ne comportait qu’une partie discontinue. Si on ajoute maintenant
± ------- θ --------------------------
- une composante continue correspondant à la commande équi-
J 1 – σ0 θ
valente en glissement définie précédemment :
Lorsque le retard θ tend vers zéro, on observe alors une infinité
u = ue + M ′ sign (s) = J σ 0 x 2 + M ′ sign (s) (25)
d’arcs, d’amplitude nulle, d’où le nom de glissement sur la surface.
En pratique, θ est petit mais jamais nul et on se trouve alors en pré- il est facile de voir que :
sence de « vibrations » à fréquence élevée autour de la surface
venant se superposer au mouvement de glissement, plus lent, le u M′
long de cette dernière. Dans tous les cas, la commande bat à haute 冢 J 冣
ss˙ = s σ 0 x 2 – ----- = – --------- s
J
(26)
fréquence entre u + et u –. Le signal est donc constitué d’une série
de créneaux modulés en largeur, dont la valeur moyenne, au signe Autrement dit, la surface de glissement devient toujours attractive
près, correspond en fait à la commande équivalente en glissement même pour des discontinuités d’amplitude très faibles. Il est ainsi

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 435 − 4 © Techniques de l’Ingénieur

XX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSU

_______________________________________________________________________________________________________ COMMANDE EN RÉGIME GLISSANT

0,4 x2
x2
0,2

0 ᑞ
– 0,2

– 0,4
x1
– 0,6

– 0,8
s=f
–1


0 0,2 0,4 0,6 0,8 1 s = s0 x1 + x2 = 0
x1 s=–f
0
y
– 0,2 uᐍ

– 0,4 M

– 0,6 g = M’/f
–f
– 0,8 f s

–1
0 1 2 3 4 5
t
1,2
s (x)
1 Figure 6 – Linéarisation au voisinage de S
0,8

0,6

0,4 Il reste néanmoins possible de mettre en œuvre une


commande discontinue plus élaborée utilisant un gain M’ élevé
0,2 lorsqu’on se trouve loin de la surface et devenant plus faible à
0 mesure que l’on s’en rapproche.
• Par la nécessité de préserver le phénomène de glissement en
– 0,2
dépit de perturbations d’origines externes ou internes pouvant
0 1 2 3 4 5 agir sur le système : si par exemple, le système est soumis à des
t
perturbations additives δ, à l’entrée du processus, on a alors :
1
1
u et ue ss˙ = – ----- ( M′ s + δ s ) < – ρ s (29)
J
0,5
ce qui impose :
M ′ > J ρ + |δ |
0

2.1.6.2 Linéarisation au voisinage


– 0,5 de la surface de glissement
Une autre solution, complémentaire de la précédente, pour éviter
–1 la réticence, consiste à définir un domaine Ᏸ au voisinage de la
0 1 2 3 4 5 surface de commutation S et à l’intérieur duquel la commande dis-
t continue est linéarisée. Une technique de linéarisation classique
consiste à remplacer la fonction signe par une fonction saturation
Figure 5 – Résultats de simulation à grand gain (cf. figure 6).
À l’extérieur du domaine Ᏸ , rien n’est changé par rapport à la
possible de diminuer le paramètre M et donc de réduire considé- situation précédente. Par contre, à l’intérieur du domaine, en uti-
rablement le phénomène de réticence. lisant donc une commande de la forme :

Dans la pratique, la diminution de M est cependant limitée : M′


u = u e + u ᐉ = J σ 0 x 2 + ------- ( σ 0 x 1 + x 2 ) (30)
• Par le fait que, avant de rester sur la surface, il faut l’atteindre φ
avec une certaine vitesse : si on impose par exemple une vitesse
d’attractivité telle que : les équations (19) s’écrivent :

ss˙ < – ρ s (27)


x˙ 1 0 1 x1
on doit avoir : = (31)
M ′ > Jρ (28) x˙ 2 –g σ 0 – σ0 – g x2

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 435 − 5

XY

YP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSV

Tour d’horizon sur les techniques


anti-windup pour les systèmes saturés
Commande anti-windup
par Sophie TARBOURIECH
Directrice de recherche
LAAS, CNRS, Toulouse, France

et Isabelle QUEINNEC
Directrice de recherche
LAAS, CNRS, Toulouse, France

1. Bref historique des techniques anti-windup ........................................ S 7 436 - 2


2. Systèmes saturés ......................................................................................... — 3
2.1 Systèmes considérés ....................................................................................... — 3
2.2 Stabilité des systèmes non linéaires .............................................................. — 4
2.3 Outils mathématiques ..................................................................................... — 5
2.3.1 Fonctions de Lyapunov .......................................................................... — 5
2.3.2 Approximation de la saturation (condition de secteur
généralisée) — 5
3. Architecture générale de l’anti-windup ................................................. — 6
3.1 Principe ............................................................................................................. — 6
3.2 Architectures de compensateurs anti-windup............................................... — 6
3.3 Formulation des problèmes ............................................................................ — 7
4. Réglage de correcteurs anti-windup ....................................................... — 7
4.1 Réglage d’anti-windup statique ...................................................................... — 7
4.2 Réglage heuristique dans le cas SISO............................................................ — 8
5. Illustrations .................................................................................................... — 8
5.1 Exemple de synthèse d’un correcteur anti-windup ...................................... — 8
5.2 Évaluation expérimentale d’un anti-windup statique pour un système
monovariable ................................................................................................... — 11
6. Extensions ...................................................................................................... — 11
7. Conclusion...................................................................................................... — 12
8. Sigles, notations et symboles................................................................... — 13
Pour en savoir plus ............................................................................................... Doc. S 7 436

n procédé commandé implique la mise à jour d’une entrée de commande,


U calculée en utilisant l’erreur entre une mesure de la sortie et sa consigne, au
travers d’un actionneur. Dans le cas idéal, l’actionneur peut être représenté par un
« fil » reliant la sortie du contrôleur et l’entrée du système. Dans la pratique,
l’actionneur peut présenter un comportement dynamique, mais surtout une plage
de fonctionnement limitée entre deux bornes, inférieure et supérieure. Ces limites
sur la zone de fonctionnement linéaire de l’actionneur se traduisent par la notion
de saturation de l’actionneur. Il s’agit d’un phénomène non linéaire qui a comme
effets indésirables de dégrader le comportement nominal du système, dans le
meilleur des cas, voire de destabiliser le système contrôlé dans les cas extrêmes.
Pour éviter les effets indésirables de la saturation de l’actionneur, une solu-
tion classiquement utilisée est de surdimensionner l’actionneur, ce qui induit
p。イオエゥッョ@Z@。カイゥャ@RPRP

Copyright © – Techniques de l’Ingénieur – Tous droits réservés S 7 436 – 1

YQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSV

TOUR D’HORIZON SUR LES TECHNIQUES ANTI-WINDUP POUR LES SYSTÈMES SATURÉS _________________________________________________________

un coût supplémentaire tant du point de vue de la charge transportée, de


l’énergie dépensée, que du prix de l’actionneur lui-même. Une deuxième solu-
tion classique est de limiter les performances (rapidité) du contrôleur pour
éviter, autant que possible, de s’approcher des limites de fonctionnement
linéaire de l’actionneur.
La commande anti-windup est une alternative permettant d’utiliser au mieux
les capacités de l’actionneur en autorisant les saturations tout en préservant la
stabilité (et les performances) du système commandé dans la plage de fonc-
tionnement prévue pour le système. Son principe est de réinjecter l’erreur
commise par l’actionneur en entrée du système de commande. Cette retouche
du contrôleur n’est active que lorsque l’actionneur est saturé. Ainsi, le compor-

R tement nominal du système commandé, conçu à l’origine sans se préoccuper


des non-linéarités de l’actionneur, n’est pas modifié. Dans sa version la plus
simple, la synthèse d’une commande anti-windup peut s’apparenter à la syn-
thèse d’un simple gain supplémentaire, et ne présente pas plus de difficulté
que la synthèse d’un correcteur PID.
Par extension, la commande anti-windup s’applique aussi pour contrer les
saturations en vitesse ou de dynamiques supérieures de l’actionneur, voire
d’autres types de non-linéarités d’actionneurs, bien que ceci ne soit pas traité
dans cet article.
Nota : le lecteur trouvera en fin d’article un tableau des sigles, notations et symboles utilisés tout au long de l’article.

d’effets peut en particulier être observé lorsque le contrôleur a des


1. Bref historique modes lents ou des modes critiquement stables (pôles sur l’axe
des techniques imaginaire). Afin d’éviter la dégradation de performance, voire la
perte de la stabilité, générée par l’occurence de la saturation, une
anti-windup boucle additionnelle de commande, appelée « compensation anti-
windup », peut être ajoutée au système en boucle fermée.

Le terme « windup » est relié historiquement à l’effet de la satura- Le principe de base d’une stratégie anti-windup consiste à utili-
tion de l’actionneur dans une boucle de contrôle incluant une action ser la différence entre le signal en sortie du contrôleur (yc(t)) et le
intégrale [1], [2]. Dans ce cas, lorsque l’entrée sature, le terme inté- signal effectivement appliqué au système à contrôler (sat(yc(t))).
gral continue à se charger alors que cela n’est pas nécessaire. La Cette différence est alors réinjectée dans le contrôleur via une
sortie de l’intégrateur est alors dite en « windup ». Cette charge non boucle statique (un simple gain) ou une boucle dynamique (un
nécessaire produit des effets indésirables sur la réponse transitoire compensateur dynamique). Cette nouvelle boucle est appelée
du système tels que des oscillations autour du point d’équilibre ou « compensateur anti-windup ». Ce principe général est décrit dans
bien encore une convergence lente au point d’équilibre. Ce type la figure 1.

w w
r z
yc u
Contrôleur
Procédé
non contraint
uc yp

− +

Compensateur
AW

Figure 1 – Schéma de principe de l’architecture anti-windup

S 7 436 – 2 Copyright © – Techniques de l’Ingénieur – Tous droits réservés

YR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSV

__________________________________________________________ TOUR D’HORIZON SUR LES TECHNIQUES ANTI-WINDUP POUR LES SYSTÈMES SATURÉS

L’idée avec cette boucle additionnelle est de modifier (ou corri-


ger) les états du contrôleur nominal (c’est-à-dire celui conçu sans
tenir compte des saturations) lorsque la saturation est active. Il est
important de remarquer qu’en l’absence de saturation on a
sat(yc(t)) – yc(t) = 0 et donc la boucle anti-windup n’est pas active,
laissant ainsi le système bouclé se comporter avec les perfor-
mances déterminées par le contrôleur nominal. C’est l’une des rai- Il existe dans ce cas trois points d’équilibre, à savoir l’origine,
sons qui fait que cette stratégie est très utilisée dans la pratique
(voir par exemple [3], [4], [5], [6]). et , qui sont obtenus en examinant les différentes valeurs pos-
L’objectif lorsque l’on synthétise une boucle anti-windup peut sibles de l’entrée u. Le système n’est plus globalement asymptoti-
être bien sûr de garantir un certain niveau de performance pour le quement stable et, selon l’état initial, les trajectoires peuvent
système en présence de saturation, et en particulier de diminuer converger vers l’origine ou vers l’un des autres points d’équilibre, ou


la dégradation des performances linéaires (obtenues sans satura- bien encore diverger vers l’infini.
tion), mais aussi de permettre d’agrandir la région d’attraction de
l’origine (ou au moins son estimé) du système bouclé. Le lecteur De manière similaire, si une perturbation en amplitude w affecte le
peut consulter par exemple [7], [8], [9], [10], qui proposent des système pendant deux secondes en agissant sur l’entrée de com-
descriptions détaillées des techniques anti-windup ainsi qu’un mande (u est remplacé par u + w), selon la valeur de w, u peut satu-
tour d’horizon des problèmes associés. rer de manière transitoire, et la trajectoire du système bouclé peut
diverger (par exemple pour w = 6 dans le cas du système considéré
dans cet exemple), bien que le système soit « BIBO-stable », c’est-à-
dire satisfait la propriété « entrée-bornée – sortie-bornée ».
2. Systèmes saturés De manière générique, une représentation locale linéaire à
temps invariant (LTI) du procédé à commander est considérée,
sous la forme d’état standard :
2.1 Systèmes considérés
Nota : tout au long de l’article, la dépendance explicite au temps des variables est
omise afin de simplifier les notations. (4)

L’interconnection d’un procédé avec un système de commande


met en jeu des capteurs, pour transmettre les informations du pro- avec l’état du procédé, l’entrée de commande,
cédé au contrôleur, et des actionneurs, pour transmettre la com- l’entrée de perturbation, la sortie mesurée et
mande au procédé. Dans cet article, la problématique des capteurs la sortie à contrôler. Les matrices Ap, Bpu, Bpw, Cp, Cz, Dpu,
n’est pas explicitement abordée, mais les résultats présentés Dpw, Dpu et Dzw sont des matrices constantes de dimensions
peuvent généralement être étendus assez directement à la présence appropriées et les paires (Ap, Bpu) et (Cp, Ap) sont supposées
de non-linéarités au niveau de ceux-ci. De manière générale, les contrôlables et observables, bien que ces hypothèses puissent
actionneurs sont des systèmes dynamiques comportant des être relâchées en stabilisabilité et détectabilité.
contraintes, sous forme de saturations, tant en position que sur les
De manière similaire, les contrôleurs sont aussi décrits sous
dynamiques d’ordre supérieur. Ainsi, dans cet article, on considère
forme d’état :
que l’actionneur délivre un signal u prenant ses valeurs dans un
ensemble compact, noté S (Im,umin,umax) et défini par :
xc =Acxc +BcUc +Bcww
(5)
(1) yc =Ccxc +DcUc +Dcww

Le symbole signifie que l’inégalité est calculée élément par élé- avec l’état du contrôleur, l’entrée du contrôleur
ment et umin et umax sont des vecteurs de à éléments positifs, et la sortie du contrôleur. Les dimensions des entrées et
à savoir umin(i) > 0, umax(i) > 0, ∀ i = 1,…, m. Dans la suite de cet sorties du contrôleur sont considérées égales aux dimensions res-
article, seul est considéré le cas des saturations symétriques, en pectives des sorties et entrées du procédé. La présence d’alloca-
considérant umax = umin = u0. teurs n’est pas abordée explicitement dans cet article [12], [13],
mais ceux-ci pourraient être intégrés au contrôleur. Les matrices
Dans la pratique, la présence de ces non-linéarités inhérentes à des contrôleurs (Ac , Bc , Cc , Dc), de dimensions appropriées, sont
l’actionneur doit être prise en compte, car elles peuvent générer des supposées avoir été synthétisées pour garantir des propriétés
dégradations du comportement attendu du système contrôlé, allant pour le système en boucle fermée (stabilité, rapidité, rejet de per-
d’oscillations non désirées à la perte de stabilité selon les cas, ou turbations…) dans le cas idéal sans saturation. Bcw et Dcw sont les
imposent des restrictions sur la plage de fonctionnement du sys- matrices d’entrées de perturbations exogènes pouvant agir direc-
tème [S 7 192]. Ceci est illustré sur l’exemple de motivation suivant. tement sur le contrôleur.
Exemple 1 – Exemple de motivation Différentes classes de perturbations exogènes peuvent être
Soit le modèle instable d’un pointeur oscillant décrit dans l’ouvrage considérées, telles que les perturbations bornées en amplitude,
de Kailath [11] : qui permettent aussi de représenter des changements de réfé-
rence, et des perturbations en énergie. Seules ces dernières sont
considérées ici. Il s’agit de perturbations appartenant à un
(2) ensemble défini comme suit :

Le contrôleur K = [13 7] stabilise globalement asymptotiquement (6)


l’origine du système en l’absence de bornes sur la commande (les
valeurs propres de Ap + Bpu K sont –3 et –4). et exprimant que l’énergie de la perturbation est bornée par δ−1,
Si l’on considère à présent des limitations de l’actionneur entre –5 δ étant un scalaire positif. Plus précisément, cet article considère
et +5, le système en boucle fermée devient non linéaire : le cas où R (matrice symétrique définie positive) est en fait égale à
la matrice identité (de dimension q), ce qui fait que représente
(3) l’ensemble des perturbations bornées- .

Copyright © – Techniques de l’Ingénieur – Tous droits réservés S 7 436 – 3

YS

YT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSW

Aide au pilotage : application


agroalimentaire

par Corinne CURT


Ingénieur de Recherche
Unité Mixte de Recherche en génie industriel alimentaire

Équipe Automatique et Qualité Alimentaire Cemagref
Joseph HOSSENLOPP
Directeur de Recherche
Unité Mixte de Recherche en génie industriel alimentaire
Équipe Automatique et Qualité Alimentaire Cemagref
Nathalie PERROT
Équipe Automatique et Qualité Alimentaire Cemagref
Unité Mixte de Recherche en génie industriel alimentaire
et Gilles TRYSTRAM
Docteur
Professeur à l’École nationale supérieure des industries alimentaires ENSIA
Directeur de l’unité mixte de recherche en génie industriel alimentaire
Cemagref, ENSIA, INA Paris-Grignon, INRA

1. Recueil et formalisation de la connaissance humaine .................. S 7 437 - 3


1.1 Méthode ....................................................................................................... — 3
1.2 Formalisation des mesures sensorielles réalisées par l’expert
sur le produit................................................................................................ — 3
1.3 Formalisation des actions réalisées par l’opérateur sur les paramètres
procédés ....................................................................................................... — 5
2. Transmission du savoir-mesurer .......................................................... — 6
2.1 Méthode ....................................................................................................... — 6
2.2 Déroulement ................................................................................................ — 7
2.3 Traitement des données.............................................................................. — 7
3. Application de la méthode à l’étuvage du saucisson sec ............ — 8
3.1 Qualité sensorielle : propriétés essentielles pour le consommateur ...... — 8
3.2 Étuvage : étape clé pour les propriétés sensorielles du produit final ..... — 8
3.3 Dispositif d’étude......................................................................................... — 8
3.4 Indicateurs sensoriels ................................................................................. — 9
3.5 Évaluation de la cible qualité pendant l’étuvage ...................................... — 9
3.6 Principe du contrôle de l’étuvage............................................................... — 10
3.7 Essais en atelier ........................................................................................... — 11
3.8 Système d’aide au pilotage ........................................................................ — 11
3.9 Transmission du savoir-mesurer ................................................................ — 14
4. Conclusion ................................................................................................. — 14
Références bibliographiques ......................................................................... — 14

L es savoir-faire développés par les employés d’une entreprise constituent


souvent pour celle-ci une véritable richesse. Ces savoir-faire, au gré des
mouvements de personnel au cours du temps, peuvent rester stables, s’enri-
chir ou au contraire régresser dans le cas où cette connaissance ne serait pas
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPU

formalisée. Dès lors, il peut être essentiel pour l’entreprise de capitaliser ces
savoir-faire d’une manière qui permette de les exploiter par la suite, voire de
les transmettre à d’autres employés. La « mémoire d’entreprise » concerne

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 437 − 1

YU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSW

AIDE AU PILOTAGE : APPLICATION AGROALIMENTAIRE ________________________________________________________________________________________

ainsi, a priori, tous les secteurs de l’économie et plusieurs démarches de capi-


talisation de la connaissance ont été réalisées. On peut citer en exemple :
l’entreprise Usinor-Sacilor pour la mise au point d’un outil informatique qui
optimise la conduite de hauts-fourneaux à partir de la connaissance détenue
par des hauts-fournistes (Système SACHEM), la SNCF pour la mise au point de
guides de détection d’avaries sur les tunnels, ponts..., le LCPC pour la produc-
tion d’outils d’aide à la détection de dégradations des routes, l’EDF et le Cema-
gref pour le suivi et le diagnostic des défaillances des barrages (CD-Rom Vigie
Barrages), le CEA pour la capitalisation des connaissances et l’expérience
acquises dans le domaine des réacteurs nucléaires (projet REX).
Dans le domaine de l’industrie alimentaire, les opérateurs qui conduisent le

R procédé sont généralement des acteurs importants de la maîtrise de la qualité


du produit et leur expertise forme un capital de l’entreprise. Cela est lié à deux
points principaux.
D’une part, il n’existe pas toujours de mesures instrumentales directes ou
indirectes permettant d’évaluer les propriétés d’un produit en cours de fabrica-
tion. Le développement ou l’utilisation d’appareils de mesure est difficile du fait
des propriétés :
— du produit lui-même : les produits alimentaires sont des produits biologiques
élaborés dont la nature et la composition peuvent être variables dans le temps ; en
outre, ils ne sont pas toujours homogènes et le système d’évaluation doit prendre
en compte, voire rendre compte de cette hétérogénéité ;
— des capteurs et instruments de mesure :
• les capteurs doivent être nettoyables et il est par ailleurs souhaitable qu’ils
soient non invasifs et non destructifs,
• ils doivent répondre à des contraintes sévères telles que par exemple, la
nettoyabilité ou le fonctionnement en milieu très humide,
• le fonctionnement de certains appareils de mesure peut nécessiter un per-
sonnel formé à son utilisation,
• un certain nombre de systèmes de mesure ne sont pas utilisables directe-
ment en ligne parce que les temps de réponse sont trop longs,
• des critères de coût, de caractéristiques métrologiques (précision, fidélité,
rapidité...) et de temps de développement sont à prendre en compte.
D’autre part, les procédés alimentaires ne sont généralement pas robustes par
rapport à des variations de caractéristiques des matières premières par exemple.
La compréhension des interactions entre produit et procédé est souvent partielle
notamment du fait du déroulement de réactions souvent compliquées mettant en
jeu des mécanismes de natures diverses, physico-chimiques et/ou biologiques.
Tous ces points rendent le développement de modèles décrivant les relations
entre les variables du produit et celles du procédé long et difficile [F 1 290], réf. [1].
Pour pallier ces manques, les opérateurs des entreprises alimentaires déve-
loppent un « savoir-mesurer » et un « savoir-piloter », qu’ils acquièrent généra-
lement progressivement au fur et à mesure de leurs mois de pratique. Le
« savoir-mesurer », basé sur la réalisation d’évaluations à l’aide des sens (tou-
cher, vue, odorat...), leur permet, éventuellement en combinaison avec les infor-
mations issues de capteurs, de déterminer l’évolution des caractéristiques de
qualité des produits pendant la fabrication. Le « savoir-piloter » est l’ensemble
des décisions et des actions prises par l’opérateur pour ajuster les paramètres
du procédé de manière à minimiser la variation des caractéristiques du produit.
Dans cet exposé, nous proposons une méthode qui permet d’utiliser, de capi-
taliser et de valoriser ce « savoir-mesurer » et ce « savoir-piloter » dans le but
d’une meilleure maîtrise des propriétés du produit en cours de transformation.
L’objectif est d’une part, de construire des systèmes d’aide au pilotage qui puissent
être facilement utilisés sur la ligne par l’opérateur et d’autre part, de transférer
le savoir-faire détenu par un opérateur expérimenté vers un opérateur novice.
Nous avons développé cette approche pour le procédé de fabrication du saucisson
sec. La maîtrise de cette opération dépend encore souvent du savoir-faire d’un
ou deux opérateurs confirmés qui ont développé une stratégie de mesure sen-
sorielle des caractéristiques des produits en cours de fabrication et qui ont une
connaissance approfondie des interactions entre produit et procédé [2].

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 437 − 2 © Techniques de l’Ingénieur

YV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTSW

_______________________________________________________________________________________ AIDE AU PILOTAGE : APPLICATION AGROALIMENTAIRE

1. Recueil et formalisation de
la connaissance humaine Phase de compréhension
théorique
Lecture bibliographie

Observations et interviews
1.1 Méthode Phase de recueil sur site libres
et modélisation
Formalisations intermédiaires
1.1.1 Déroulement
Le recueil du savoir-faire consiste à réaliser un transfert des Entretiens formels
connaissances d’un « praticien observé », ici l’expert chargé de la Phase de recueil formel
conduite des étuves, vers un « observateur », la personne chargée et modélisation
du recueil.
La méthode de recueil et de formalisation du savoir-faire de
Formalisations intermédiaires

l’expert en termes de mesures sur le produit et d’actions sur le pro- Formalisation finale
cédé comporte quatre phases principales présentées sur la
Phase de validation
figure 1. Pour la partie mesure, les entretiens ont tous eu lieu sur
non
site et aucun entretien formel n’a été réalisé. Validation
La première phase consiste à déterminer, à partir de la littérature oui
existante, les principales évolutions que subit le produit et
l’influence des paramètres du procédé sur les caractéristiques du Fin
produit. Pendant cette étape, il est également important pour
l’observateur d’acquérir, autant que faire se peut, les termes tech- Figure 1 – Différentes étapes du recueil et de la formalisation
niques communément employés dans les usines afin de faciliter la du savoir-piloter
relation future avec les experts qui seront interviewés.
Les deuxième et troisième phases correspondent à la phase de
recueil et de modélisation de la connaissance. Ce sont des cycles
de recueil et de formalisation qui s’enchaînent : des experts doit être maintenue. Plusieurs outils sont utiles pour
— des séances d’observations et des entretiens libres : l’expert répondre à cet objectif. L’observateur doit ainsi :
effectue la tâche à réaliser dans son cadre habituel, en donnant les — tenir les experts au courant des progrès du projet, leur mon-
différents éléments nécessaires à la réalisation de celle-ci. Les trer l’avancement du recueil et de la formalisation avec des outils
questions posées lors des entretiens sont souvent ouvertes qui permettent une visualisation rapide de cet avancement sous la
c’est-à-dire que l’expert s’exprime librement ; forme de courbes essentiellement, tableaux, schémas, développe-
— des entretiens pendant lesquels l’expert travaille à partir d’un ment d’outils comme des interfaces... ;
questionnaire sont réalisés. Ils ont pour but de compléter les infor- — montrer et transmettre son enthousiasme ;
mations acquises à l’issue de la première phase : il n’est en effet — se rendre disponible quand les experts le sont. Les experts
pas possible, sauf à suivre le procédé sur une période très longue, sont souvent peu disponibles car ils ont d’autres tâches à réaliser,
de pouvoir observer tous les cas. Il faut donc les simuler à partir mais un expert motivé se rendra a priori disponible plus facilement
de questionnaires. Ces derniers doivent être simples à comprendre qu’un expert non motivé ;
par l’expert, même si l’observateur est présent et peut aider à
— se placer dans une situation d’écoute tout en dirigeant les
l’analyse ;
entretiens.
— l’observateur enregistre les actions de l’expert et effectue des
formalisations intermédiaires de la connaissance nécessaire pour Le nombre d’experts est généralement faible dans les usines,
mener à bien la tâche. toutefois, plusieurs experts peuvent être amenés à gérer le même
Lors des entretiens, quelques outils peuvent faciliter la procédé. C’est le cas, par exemple, lorsque plusieurs équipes sont
compréhension et resituer l’expert dans le contexte comme des présentes sur le site de production. Deux experts peuvent ainsi
illustrations, des exemples simples. Il est également opportun de : arriver au même diagnostic pour un problème donné alors qu’ils
n’auront pas mis en œuvre les mêmes stratégies de résolution. La
— commencer par les cas les plus simples et d’amener les cas
mise au point d’un outil de contrôle du procédé passe par l’obten-
plus compliqués au fur et à mesure ;
tion d’un compromis entre les experts et la gestion de problèmes
— s’assurer que les questions s’enchaînent logiquement ; de vocabulaire pouvant se poser, les experts n’ayant pas forcément
— passer éventuellement à un cas suivant si le cas traité pose une terminologie commune.
un problème à l’expert ; il suffit alors d’y revenir plus tard ;
— de laisser à l’expert le temps de réfléchir et de se replacer dans
le contexte de l’atelier notamment pour la quantification des
actions. 1.2 Formalisation des mesures
Dans une quatrième phase, une formalisation définitive des sensorielles réalisées par l’expert
connaissances extraites est menée puis validée par l’expert. sur le produit
1.1.2 Relation expert-observateur La formalisation des mesures sensorielles réalisées par l’expert
dans l’atelier de fabrication s’inspire de la métrologie sensorielle
La relation entre l’expert et l’observateur est essentielle dans la classique, et plus particulièrement de l’analyse sensorielle descrip-
construction de la démarche proposée et la phase de recueil peut tive [F 4 000], réf. [3]. Les mesures sensorielles réalisées par les
être considérée comme une phase critique. Les experts doivent être experts sur la ligne, sur le produit en cours de fabrication, ont été
prêts à divulguer leur savoir : il s’agit d’instaurer dès le départ un nommées « indicateurs sensoriels » car elles indiquent à l’opéra-
climat de confiance entre l’expert et l’observateur qui passe notam- teur l’évolution du produit en liaison avec le procédé [4]. Nous
ment par une description précise des objectifs du recueil et de la avons décrit les indicateurs sensoriels à l’aide de sept éléments
formalisation. Une fois le climat de confiance installé, la motivation répartis en trois catégories :

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 437 − 3

YW

YX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTP

Systèmes et régulateurs flous


Définition et cognition
par Jean-Camille DE BARROS
Post-doctorant à University of Oxford – Department of Engineering Science et Université


d’Aix-Marseille III – LaGEM
Daniel HISSEL
Maître de Conférences HDR à l’Université de Technologie de Belfort-Montbéliard (UTBM)
Pascal MAUSSION
Maître de Conférences HDR à l’Institut Universitaire de Formation des Maîtres de Midi-
Pyrénées
Michel THOLOMIER
Professeur à l’Université d’Aix-Marseille III – LaGEM
André TITLI
Professeur à l’INSA de Toulouse et LAAS du CNRS

1. Représentation multivariables et implémentation ......................... S 7 440 — 2


1.1 Définitions préliminaires............................................................................. — 2
1.2 Structure d’un système ou d’un régulateur flou....................................... — 4
1.3 Algorithme du système et régulateur flous............................................... — 9
1.4 Synthèse....................................................................................................... — 10
2. Synthèse et réglage du régulateur flou ............................................. — 10
2.1 Synthèse du régulateur flou ....................................................................... — 10
2.2 Principales structures pour un régulateur flou de type PID ..................... — 13
2.3 Méthodes de réglage du régulateur flou ................................................... — 14
Pour en savoir plus ........................................................................................... Doc. S 7 442

epuis sa définition par L.A. Zadeh [30] et l’introduction des principes du


D contrôleur flou par E.H. Mamdani [15], la logique floue est en passe de
devenir un outil standard pour l’ingénieur.
Les objectifs de cet article et du suivant [S 7 441] sont multiples. En l’associant
aux articles [A 120] ou [R. 7 032] de A. Kaufmann [20] et [R 7 428] de J.-P. Barrat,
M. Barrat et Y. Lécluse [28], il doit permettre au non-spécialiste, au technicien et
à l’ingénieur de se familiariser avec les systèmes flous et plus particulièrement
avec les régulateurs flous, dans une description qui se voudra volontairement
« pédagogique ». Il étendra donc certaines définitions théoriques proposées par
A. Kaufmann et les notions pratiques introduites par J.-P. Barrat, M. Barrat et
Y. Lécluse. Ainsi, par les extensions multiples que nous y proposons, cet article
apporte à l’automaticien des arguments scientifiques et/ou empiriques permet-
tant de bien se poser la problématique quant au choix de la logique floue, et de
l’orienter ensuite dans le choix de la solution technique la plus pertinente.
Ce sujet fait l’objet de deux articles, chacun divisé en deux parties.
1. La première partie de [S 7 440] sera consacrée au rappel des principes et
définitions des systèmes et régulateurs flous multivariables : multientrées et
multisorties (MEMS ou MIMO en anglais, pour Multi-inputs – Multi-Outputs). Un
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPU

algorithme détaillé destiné à l’implantation logicielle et matérielle sera ensuite


présenté.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 440 − 1

YY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTP

SYSTÈMES ET RÉGULATEURS FLOUS _______________________________________________________________________________________________________

2. Dans la deuxième partie de [S 7 440], nous traiterons tout d’abord de la


synthèse de régulateurs flous en présentant un ensemble de règles empiriques
et les structures les plus courantes pour les régulateurs flous de type PID ; puis
nous intéresserons au réglage des régulateurs flous par : soit une méthode de
réglage qualitative, soit une méthode d’autoréglage calquée sur l’approche de
Ziegler-Nichols définie pour les régulateurs conventionnels.
3. La première partie de [S 7 441] décrira une application expérimentale con-
crète sur un hacheur-dévolteur.
4. Finalement, nous terminerons en [S 7 441] par une synthèse des idées prin-
cipales développées ici, par quelques pistes de solutions industrielles pour la
réalisation pratique d’un système ou contrôleur flou, et par un aperçu des
R recherches actuelles menées dans ce domaine.

1. Représentation Cette première partie apportera donc au non-spécialiste, au tech-


nicien et à l’ingénieur les éléments théoriques, présentés dans une
multivariables approche « traditionnelle », permettant de définir les systèmes
flous, les régulateurs flous multivariables et les éléments pratiques
et implémentation permettant d’implanter une solution floue.

Le premier objectif de ce paragraphe est d’étendre les principes


théoriques introduits en [A 120] ou [R 7 032] par A. Kaufmann [20] et 1.1 Définitions préliminaires
J.-P. Barrat, M. Barrat et Y. Lécluse [28], afin de les adapter au cas de
systèmes et régulateurs flous multivariables : multientrées multi-
sorties (MEMS ou MIMO) [R 7 220] [27]. Cette extension se fera sur La fuzzification (« action de rendre flou ») est le passage de gran-
la base d’un formalisme matriciel, lequel devra permettre de repré- deurs physiques (déterminées, théoriques ou mesurées) à des
senter un système flou ayant un nombre arbitraire d’entrées et un variables linguistiques, ou variables floues, qui peuvent être alors
nombre arbitraire de sorties (non nécessairement identique aux traitées par les règles de la logique floue.
entrées) ; chacune de celles-ci fuzzifiée par un nombre arbitraire de
fonctions d’appartenance, identiques ou non. La définition modu- Cette dernière, permettant de modéliser des connaissances
laire devra permettre par ailleurs le rajout de nouveaux types de imprécises ou vagues (exemple : vitesse forte, position proche, etc.),
moteur d’inférence et/ou de défuzzification ultérieurs sans remise est donnée par un triplet [9]
en cause fondamentale.
Nous donnerons tout d’abord quelques rappels fondamentaux et ᐂ ᏸ = ( ␹, ⺕, ⺤ ␹ )
la présentation des principales fonctions d’appartenance rencon-
trées. Ensuite, nous présenterons une écriture matricielle du sys-
avec ␹ variable floue (vitesse, position...) sur un univers
tème ou régulateur flou, et nous introduirons les matrices de
de référence ⺕ ;,
normalisation du vecteur d’entrée, de fuzzification des variables
d’entrées, de fuzzification des variables de sorties, les matrices de ⺕ ensemble fini ou infini (ensemble des réels, des
prémisses et de prémisses actives, les matrices de conclusions et de entiers...) ;,
conclusions actives, le vecteur numéro de règles et numéros de
règles actives. Puis, nous présenterons les principaux types de ⺤␹ ensemble de sous-ensembles flous de ⺕ utilisé
moteurs d’inférence rencontrés aujourd’hui : Mamdani, Larsen,
Som-Prod. Nous présenterons également les principales méthodes pour caractériser ␹ , de fonctions d’appartenance
de défuzzification, à savoir le centre de gravité, le centre de la respectives µ Ꮽ1 ( ␹ ) , µ Ꮽ2 ( ␹ ) , ..., µ Ꮽi ( ␹ ) , ...,
somme, le milieu des maxima, le premier maximum, la hauteur, et
le centre de la plus grande surface. Enfin, nous présenterons le sys- µ Ꮽn ( ␹ ) définies sur ⺕ et à valeurs dans [0, 1]. ⺤ ␹
tème ou régulateur flou de Sugeno. définit ainsi les restrictions des valeurs que
Le second objectif de ce paragraphe est de donner un algorithme prennent ␹ dans ⺕ (exemple : vitesse faible,
détaillé destiné à l’implantation logicielle et matérielle telle qu’on la vitesse moyenne, vitesse importante).
définit en génie logiciel. Le but est ici de montrer, de la phase d’ini-
tialisation jusqu’au calcul du ou des résultats finaux, les différentes Les principales fonctions d’appartenance utilisées sont données
étapes nécessaires pour réaliser un système flou multivariable. dans le tableau 1.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 440 − 2 © Techniques de l’Ingénieur

QPP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTP

______________________________________________________________________________________________________ SYSTÈMES ET RÉGULATEURS FLOUS

(0)

Tableau 1 – Principales fonctions d’appartenance


Nom Fonction d’appartenance Graphique

␹–m
Max 0 ;  1 + --------------- si ␹ ⭐ m µ᐀g
 α 
µ ᐀g ( ␹ ) = 1
␹–m
Max 0 ;  1 – --------------- si ␹ ⭓ m
Triangle  
β


m–α m m+β χ

␹ – m1
Max 0 ;  1 + ----------------- si ␹ ⭐ m 1 µ᐀p
 α  1
µ ᐀p ( ␹ ) = ␹ – m2
Max 0 ; 1 – ----------------- si ␹ ⭓ m 2

Trapèze  β 
1 ailleurs

m1– α m1 m2 m2 + β χ

1 si ␹ ⭐ m
µᏳ
µᏳ ( ␹ ) = ␹–m
Max 0 ;  1 – --------------- si ␹ ⭓ m
1
 
Ouverte à gauche β

m m+β χ

␹–m
Max 0 ;  1 + --------------- si ␹ ⭐ m µᏰ
µᏰ ( ␹ ) =  α  1
1 si ␹ ⭓ m
Ouverte à droite

m–α m χ

1 si ␹ = m µ᏿g
µ ᏿g ( ␹ ) = 0 ailleurs
1
Singleton

m χ

Dans ce tableau, m est appelé valeur modale telle que [9] :


Tableau 2 – Noms standards des sous-ensembles flous
µ(m) = 1 (1)
Français Anglo-saxon
et on a :
Symbole Désignation Symbole Désignation
α > 0 ; β > 0 ; m1 > m2 et m, m1, m2 et ␹ ∈ ⺢ (2)
NG Négatif Grand NB Negative Big
Le tableau 2 donne les noms standards des sous-ensembles flous
usuels. NM Négatif Moyen NM Negative Medium
(0) NP Négatif Petit NS Negative Small

Tableau 2 – Noms standards des sous-ensembles flous EZ Environ Zéro Z Zero


PP Positif Petit PS Positive Small
Français Anglo-saxon
PM Positif Moyen PM Positive Medium
Symbole Désignation Symbole Désignation PG Positif Grand PB Positive Big
NTG Négatif Très Grand NVB Negative Very Big PTG Positif Très Grand PVB Positive Very Big

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 440 − 3

QPQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTP

SYSTÈMES ET RÉGULATEURS FLOUS _______________________________________________________________________________________________________

Normalisation Fuzzification Inférence Défuzzification Dénormalisation

r χ µχ µᒒ u* u
N µ(χ) Ꮽj , Ꮾj , ᏾j ᒒ D

Choix


Choix Choix Choix Choix
des fonctions
des valeurs des règles de la méthode des valeurs
d'appartenance

Connaissances expertes

Figure 1 – Système flou général

1.2 Structure d’un système 1.2.2 Fuzzification des variables


ou d’un régulateur flou
1.2.2.1 Fuzzification des variables d’entrée
Chaque variable d’entrée ␹ i est fuzzifiée par mi (ne pas confondre
Par opposition au régulateur/système multivariables classique, avec m valeur modale) sous-ensembles flous Ꮽ d’indice ji. Les
un régulateur ou un système flou ne traite pas directement des rela- indices ji sont donc :
tions mathématiques bien définies, mais utilise notamment des
variables linguistiques et des règles d’inférence pour calculer le j 1 = 1, 2, ..., m 1 ; j 2 = 1, 2, ..., m 2 ; ... ;
signal de commande/sortie. Nous proposons la structure générale (6)
j i = 1, 2, ..., m i ; ... ; j n = 1, 2, ..., m n
du système/régulateur flou [3] de la figure 1.
Les différents nombres m1, m2, ..., mi, ..., mn des fonctions
d’appartenance respectivement des variables d’entrées ␹ 1 , ␹ 2 , ...,
1.2.1 Normalisation des entrées ␹ i , ..., ␹ n peuvent avoir une valeur quelconque. Ainsi, l’indice i est
utilisé pour caractériser la variable d’entrée et l’indice ji les sous-
ensembles (donc les fonctions d’appartenance) attachés à cette
Dans la figure 1, afin de garder une homogénéité dans l’écriture variable. De ce fait, pour chaque variable d’entrée, nous aurons la
du régulateur/système flou, nous avons pris, bien que les variables possibilité de définir, sans ambiguïté, l’ensemble de ses sous-
soient différentes, les mêmes notations que celles du régulateur/ ensembles flous et des opérations qui lui seront appliquées.
système multivariable. De ce fait, nous posons (nous noterons les
Attachons à chaque variable ␹ i normalisée, une variable linguisti-
dimensions par [Ligne(s) × Colonne(s)]) :
que ᐂ ᏸ␹i :
■ r : vecteur d’entrée physique non normalisé de dimension [n × 1] mi
Ᏺ i, ji  
Ce vecteur contient les n variables pertinentes décrivant le com- ␹i ᐂ ᏸ␹i =  ␹ i, ⺕ i, ⺤ ␹i  où ⺕ i = ⺢ et ⺤ ␹i = ∑ Ꮽ i, ji (7)
portement dynamique du système. En général, il est défini par   ji = 1
l’erreur, la dérivée de l’erreur, l’intégrale de l’erreur, des variables
d’état, etc. Il sera le vecteur d’entrée du régulateur flou (normale- À chaque sous-ensemble flou Ꮽ i, ji , nous faisons correspondre
ment r[κ], mais l’indice κ sera omis afin d’alléger l’écriture) :
une fonction d’appartenance µ Ꮽi, j ( ␹ i ) qui est le degré d’apparte-
i

r = [r1 r2 ... ri ... rn]T avec i = 1, 2, ..., n (3) nance d’une variable d’entrée ␹ i à Ꮽ i, ji (valeur floue de la variable

■ ␹ : vecteur d’entrée normalisé de dimension [n × 1] ␹ i ). En notation matricielle, nous aurons :

Ce vecteur est constitué par n variables d’entrées normalisées : µ ␹1


...
χ = [ ␹ 1 ␹ 2 ... ␹ i ... ␹ n ] T avec i = 1, 2, ..., n (4) µ ␹i
Ꮽ [ n × M ] = [ Ꮽ i, ji ] et µ ␹ = = Ᏺ ␹[ n × M ] = µ Ꮽi, j ( ␹ i ) (8)
i

La normalisation (en généralisant la formule donnée en [R 7 428], ...


réf. [28] permet d’exprimer, par une transformation linéaire, les varia- µ ␹n
bles d’entrée r ∈ [r min ; r max], en ␹ ∈ [ ␹ min ; ␹ max ] (pour les ␹ i varia-
bles normalisées, le domaine de normalisation choisi est en général : n
[− 1 ; 0], [0 ; + 1] ou [− 1 ; + 1]), par application de la relation suivante : avec M = Max [ m i ]
i = 1
␹ imax – ␹ imin r imax ⋅ ␹ imin – r imin ⋅ ␹ imax et M est donc le plus grand nombre de fonctions d’appartenance uti-
max min
- ⋅ r i + --------------------------------------------------------------
␹ i = ------------------------------ - (5) lisées par la fuzzification. Dans la matrice Ᏺ ␹ , les variables pour les-
ri – ri r imax – r imin quelles le nombre de fonctions d’appartenance est inférieur à M, se

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 440 − 4 © Techniques de l’Ingénieur

QPR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTQ

Systèmes et régulateurs flous


Applications
par Jean-Camille DE BARROS
Post-doctorant à University of Oxford – Department of Engineering Science et Université


d’Aix-Marseille III – LaGEM
Daniel HISSEL
Maître de Conférences HDR à l’Université de Technologie de Belfort-Montbéliard (UTBM)
Pascal MAUSSION
Maître de Conférences HDR à l’Institut Universitaire de Formation des Maîtres de Midi-
Pyrénées
Michel THOLOMIER
Professeur à l’Université d’Aix-Marseille III – LaGEM
André TITLI
Professeur à l’INSA de Toulouse et LAAS du CNRS

1. Application expérimentale du régulateur flou ................................ S 7 441 — 2


1.1 Dispositif expérimental ............................................................................... — 2
1.2 Commande avec le PID-Flou Standard ...................................................... — 3
1.3 Commande avec le PID-Flou Robuste........................................................ — 4
1.4 Commande avec le PID-Flou Amplitude .................................................... — 7
1.5 Synthèse de l’étude comparative PID-Flou standard. PID traditionnel ... — 8
2. Conclusion ................................................................................................. — 9
2.1 Synthèse....................................................................................................... — 10
2.2 Solutions industrielles................................................................................. — 10
Pour en savoir plus ........................................................................................... Doc. S 7 442

e sujet fait l’objet de deux articles.


C Le premier paragraphe de [S 7 440] a été consacré au rappel des principes
et définitions des systèmes et régulateurs flous multivariables : multientrées et
multisorties (MEMS ou MIMO en anglais, pour Multi-inputs – Multi-Outputs). Un
algorithme détaillé destiné à l’implantation logicielle et matérielle a été ensuite
présenté.
Dans le deuxième paragraphe de [S 7 440], nous avons traité tout d’abord de
la synthèse de régulateurs flous en présentant un ensemble de règles empiri-
ques et les structures les plus courantes pour les régulateurs flous de type PID ;
puis nous nous sommes intéréssés au réglage des régulateurs flous par : soit
une méthode de réglage qualitative, soit une méthode d’autoréglage calquée
sur l’approche de Ziegler-Nichols définie pour les régulateurs conventionnels.
Dans le premier paragraphe de cet article sera décrit une application expéri-
mentale concrète sur un hacheur-dévolteur.
Finalement, nous terminerons cet article par une synthèse des idées principa-
les développées ici, par quelques pistes de solutions industrielles pour la
réalisation pratique d’un système ou contrôleur flou, et par un aperçu des
recherches actuelles menées dans ce domaine.
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPU

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 441 − 1

QPS
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTQ

SYSTÈMES ET RÉGULATEURS FLOUS _______________________________________________________________________________________________________

1. Application expérimentale
du régulateur flou

L’exemple présenté ici porte sur un hacheur-dévolteur et sur le


PID-Flou autoréglé défini dans le paragraphe 2.3.2 de [S 7 440]. On
présentera tout d’abord le système physique étudié, puis nous don-
nerons les résultats expérimentaux obtenus grâce au PID flou, les-
quels seront comparés au cas du PID traditionnel de Broïda.

R 1.1 Dispositif expérimental

1.1.1 Présentation du hacheur-dévolteur

Dans cette partie, nous nous intéresserons à la régulation de ten-


sion d’un hacheur 1 kW de type Buck. L’intérêt principal de cet exem- a Hacheur dévolteur
ple est de montrer que la régulation floue temps-réel de systèmes à
grande dynamique est dorénavant possible avec les processeurs de
nouvelle génération ; ce qui n’était pas le cas il y a quelques années
encore car la commande floue requiert un plus grand nombre
d’opérations mathématiques qu’un régulateur PID conventionnel.

Le schéma de principe d’un tel hacheur est donné par la figure 1.


Il est ici commandé en mode courant (imposition du courant crête
traversant l’inductance de lissage L). L’intérêt est un fonctionnement
à fréquence fixe et un contrôle parfait du courant dans le dispositif.
Nous effectuerons un asservissement flou de tension de type cas-
cade. La charge non-linéaire est une résistance que nous connecte-
rons ou déconnecterons suivant le cycle de fonctionnement que
nous nous sommes fixé. Il est à noter que les phases de fonctionne-
ment à vide de ce cycle de fonctionnement seront en réalité réa-
lisées par une résistance de charge minimale de 150 Ω.

Les photographies données sur la figure 2 présentent le hacheur-


dévolteur utilisé au cours des expérimentations ainsi que ce même
hacheur commandé par logique floue grâce à un DSP (Digital Signal
Processor).

b Banc de test

Figure 2 – Hacheur-dévolteur utilisé au cours de l’expérimentation

T1
1.1.2 Implémentation et cycle de test

Ve L Is ≤ 10 A
La loi de commande floue a été codée en langage C et implantée
sur un DSP de type TMS320C31 (carte dSpace® qui est un système
200 V 1,3 mH de prototypage clé en main, et dont le coût n’est pas négligeable)
compte tenu de la rapidité du processus à commander. De nom-
0 < Vs ≤ 100 V

150 Ω
T2 Cs breux dispositifs numériques à base de microcontrôleurs, outre que
IImage Rs le système de prototypage rapide dSpace®, permettent néanmoins
165 µF d’envisager une implantation plus simple et moins coûteuse de
18,75 Ω notre loi de commande.

Pour limiter l’influence du bruit de mesure, nous avons placé un


Mode filtre passe bas du premier ordre de fréquence de coupure 500 Hz
IRef sur la mesure de la tension Vs.
Courant
αmin = 0,05
L’horizon temporel que nous nous sommes fixé pour l’ensemble
de nos essais expérimentaux est de 0,5 s. Le cycle de fonctionne-
Figure 1 – Schéma de principe du hacheur-dévolteur ment est le suivant :

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
S 7 441 − 2 © Techniques de l’Ingénieur

QPT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTTQ

______________________________________________________________________________________________________ SYSTÈMES ET RÉGULATEURS FLOUS

1. Démarrage à vide à t = 0 s : Rs = ∞ (valeur théorique ; Rs = 150 Ω Lors du passage en charge, le retour vers la consigne s’effectue
en réalité) et échelon de consigne Vs = 60 V. très lentement dans le cas du PID-Flou mais avec une erreur maxi-
male inférieure à 2 % donc très largement en dessous des 5 % liés
2. Mise en charge intervient en t = 0,166 s (le tiers de l’horizon) :
au temps de réponse. Dans le cas du PID de Broïda, ce passage en
Rs = 40 Ω.
charge s’avère catastrophique avec des dépassements pouvant
3. Brusque remise à vide s’effectuant en t = 0,333 s (les deux tiers atteindre près de 40 %. Ce comportement est cependant relative-
de l’horizon). ment logique. En effet, ce dernier contrôleur a été dimensionné à
Le basculement de la charge est géré par le DSP lui-même grâce partir d’un essai à vide en boucle ouverte en asservissement ; il n’est
à un programme codé en langage C. Celui-ci permet de fournir très donc pas adapté à un fonctionnement en régulation (c’est-à-dire une
rapidement des commandes d’allumage et d’extinction pour les modification des paramètres en cours de fonctionnement). L’intérêt
grilles des MOSFET de puissance qui commandent la mise en d’un contrôle flou est ici souligné de manière remarquable.
charge.


1.2.2 Amélioration locale de la commande

1.2 Commande avec le PID-Flou Standard Pour ce qui est du contrôleur flou, un affinage des réglages préé-
tablis reste cependant possible. En effet, en tolérant une éventuelle
modification des règles activant la fonction d’appartenance centrée
sur zéro (EZ) et en rendant cette dernière linéairement dépendante
1.2.1 Résultats expérimentaux des entrées, il est possible de remédier au problème cité de lenteur
du retour à la consigne lors des passages en charge [5] (p. 78-82). La
Les réglages du contrôleur PID-Flou Standard nécessitent un envi- figure 4 présente ainsi des résultats expérimentaux obtenus avec
ronnement peu ou pas bruité. modification locale de la base de règles autour de zéro.
En conséquence et de manière à pouvoir valider ces réglages sur Sur cette réponse expérimentale en tension, nous mesurons à
le dispositif expérimental envisagé, lequel est relativement bruité, il présent un critère IAE∆V = 0,449 V · s ; ce qui constitue encore une
est nécessaire de réaliser un filtrage passe-bas sévère sur le signal de amélioration de 14 % de ce critère. De plus, le comportement lors du
mesure. La présence de ce filtre de mesure ralentit bien évidemment passage en charge est à présent bien meilleur que dans le cas des
la réponse du système ; celle-ci est alors une composition des modes réglages optimisés en considérant une table de règles floues anti-
dû au système à commander lui-même et du mode dû au filtre. diagonale. En effet, l’erreur maximale mesurée n’excède pas 1 %
environ lors de ce fonctionnement. Cependant, cette modification
Dans le cas présent, le filtre passe-bas sur la mesure a été posi- locale des règles floues n’est pas sans conséquence sur la dynami-
tionné à 50 Hz. Nous avons alors procédé à un essai en boucle que de la commande (cf. figure 4 b). Nous pouvons observer sur
ouverte du nouveau système ainsi constitué (hacheur + filtre) de celle-ci une augmentation substantielle de sa dynamique, laquelle
manière à identifier les paramètres KB, TB et τB de l’équation du se traduit par une plus grande sensibilité aux bruits de mesures.
modèle de Broïda de ce système. On obtient :
Nous pouvons donc conclure à la validité et à l’efficacité des régla-
e – 0 ,0028 ⋅ p ges préétablis du contrôleur flou avec modification locale de la base
H
FT 50 = 14 ,7 ⋅ -------------------------------------- (1)
Hz ( p ) de règles. Il convient néanmoins de faire deux remarques à leur sujet.
1 + 0, 0174 ⋅ p
Les résultats expérimentaux, en réponse à une sollicitation en
Plus encore que l’amélioration comportementale générée
tension de 60 V, grâce au PID-Flou Standard sont présentés sur la
par cette nouvelle table de règles floues, l’apport essentiel de
figure 3 en comparaison des résultats obtenus grâce à un PID
cette étude complémentaire réside dans la démarche
conventionnel réglé selon Broïda.
d’obtention des résultats. Elle repose en effet sur la mise en
De manière à comparer les deux réponses obtenues, nous utili- évidence d’un problème localisé et démontre l’aptitude d’une
sons un critère de type IAE (intégrale de la valeur absolue de l’erreur structure de commande floue à y répondre de façon éga-
entre l’échelon de consigne et la réponse en tension obtenue sur un lement localisée, sans trop affecter le reste de la réponse du
horizon temporel de 0,5 s). Ainsi, l’utilisation du régulateur flou PID système.
Standard nous conduit à un critère IAE∆V = 0,521 V · s. Une amélioration comportementale plus poussée encore
Cette valeur est à comparer à celle obtenue avec un régulateur aurait pu être envisagée en dissymétrisant la table de règles
PID de Broïda (cf. figure 3) pour laquelle nous mesurons un critère floues ou en envisageant une stratégie de contrôle flou plus
IAE∆V = 1,696 V · s. Les résultats expérimentaux que nous obtenons complexe (par exemple en définissant deux tables de règles sui-
ici mettent donc en évidence une amélioration du critère IAE∆V de vant le point de fonctionnement et en commutant de l’une à
près de 70 %. De plus, le comportement du contrôleur PID flou, dont l’autre grâce à une supervision floue). Une implantation expéri-
les paramètres ont été calculés à partir d’un seul essai en boucle mentale rapide et aisée d’un tel contrôleur ainsi que sa portabi-
ouverte, est bien meilleur que le PID Broïda placé dans les mêmes lité dans l’optique d’une utilisation industrielle ne sont alors pas
conditions, tant en asservissement qu’en régulation. garanties a priori.
L’amélioration comportementale est cependant plus sensible en
régulation qu’en asservissement ; cela s’explique en comparant les
courants de commande générées par les deux types de contrôleurs (cf. 1.2.3 Domaine de validité des réglages
figure 3). En effet, dans le cas de la commande floue, nous constatons
que le courant de référence passe par des valeurs négatives, ce qui Puisqu’un modèle ou une méthode ne valent que par la connais-
n’est pas physiquement réalisable sur le hacheur dévolteur considéré. sance de leurs limites, il est indispensable de définir le domaine de
Ainsi, lors des transitoires de courant de référence négatifs, le courant validité des réglages préétablis « standards » proposés. Ce domaine
réel ne pourra pas suivre sa référence et restera constamment positif de validité est également le prix à payer pour garantir une améliora-
ou nul. Or, la symétrie comportementale du système à commander tion assez spectaculaire des performances dynamiques. Parmi ces
pour des références positives ou négatives est un présupposé lors de limitations, nous pouvons citer :
l’obtention des réglages préétablis. Il serait néanmoins assez aisé de — la nécessité de travailler sur des signaux de mesure pas ou très
remédier à ce problème en n’utilisant pas une table de règles floues peu bruités. Cela est directement lié au processus retenu pour
antidiagonale ou en n’imposant pas une symétrie autour de zéro des l’obtention des réglages préétablis. Cette limitation n’est cependant
fonctions d’appartenance du contrôleur flou. que peu pénalisante, dans la mesure où l’utilisation d’un filtre

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur S 7 441 − 3

QPU

QPV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTUP

Commande des systèmes


par platitude

par Frédéric ROTELLA


Professeur des Universités

Enseignant d’Automatique
École Nationale d’Ingénieurs deTarbes
et Irène ZAMBETTAKIS
Professeur des Universités
Enseignant d’Automatique
IUT deTarbes, Université Paul Sabatier deToulouse

1. Contexte ..................................................................................................... S 7 450 - 2


2. Platitude d’un modèle ............................................................................ — 3
3. Planification de trajectoire ................................................................... — 5
3.1 Génération de trajectoire sur z (t) .............................................................. — 5
3.2 Génération de trajectoire sur y (t).............................................................. — 5
3.3 Trajectoire géométrique et évolution......................................................... — 5
4. Commande par platitude ....................................................................... — 6
4.1 Commande par platitude directe................................................................ — 7
4.2 Commande par platitude numérique......................................................... — 9
5. Cas des systèmes linéaires ................................................................... — 11
6. Mise en évidence de la platitude......................................................... — 12
6.1 Platitude et accessibilité.............................................................................. — 12
6.2 Critère des variétés réglées ........................................................................ — 14
6.3 Condition nécessaire et suffisante de platitude ........................................ — 15
7. Systèmes non plats ................................................................................. — 16
8. Conclusion ................................................................................................. — 18
Références bibliographiques ......................................................................... — 18

a propriété de platitude d’un système est une notion relativement récente


L en Automatique qui a été proposée et développée, à partir de 1992, par
M. Fliess, J. Lévine, P. Martin et P. Rouchon [1]. Cette propriété, qui permet de
paramétrer de façon très simple le comportement dynamique d’un système,
est basée sur la mise en évidence d’un ensemble de variables fondamentales
du système : ses sorties plates. Ce point de vue, comme nous allons le voir, a
de multiples et intéressantes conséquences relativement à la commande des
systèmes.
En premier lieu, cela permet de remettre au centre de la commande d’un pro-
cessus la notion de trajectoire que le système doit exécuter, c’est-à-dire que le
mouvement demandé à un système doit avant tout être réalisable par ce sys-
tème. Cela permet ainsi d’éviter de nombreux problèmes auxquels sont
p。イオエゥッョ@Z@ウ・ーエ・ュ「イ・@RPPW

confrontés les automaticiens. L’une des premières étapes de la commande par


platitude consiste alors à générer une trajectoire désirée adéquate qui tient
compte implicitement du modèle du système.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. − © EditionsT.I. S 7 450 − 1

QPW
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTUP

COMMANDE DES SYSTÈMES PAR PLATITUDE _______________________________________________________________________________________________

En deuxième lieu, cette commande implique également la conception d’un


contrôle par bouclage permettant la poursuite de cette trajectoire. On retrouve
ainsi un des principes de base de la boucle de rétroaction : elle sert essentiel-
lement à compenser les erreurs inhérentes à toute modélisation. Nous verrons
de plus que, bien qu’utilisant le modèle non linéaire du processus à
commander, ce bouclage, élaboré dans l’optique d’une poursuite asymptotique
de la trajectoire à réaliser, sera conçu dans un cadre linéaire.
Enfin, et ce n’est pas le moindre de ses intérêts, ce type de commande peut
être conçu et appliqué en adoptant un strict point de vue d’ingénierie. En effet,
et nous nous attacherons à privilégier cet angle, cette commande, qui peut


directement être mise en œuvre à partir du modèle non linéaire, ou même dans
certains cas, sur des modèles faisant intervenir des équations aux dérivées par-
tielles, simplifie notablement la conception de la commande des systèmes sans
faire appel à toute la lourde panoplie des outils utilisés habituellement dans le
cadre des systèmes non linéaires [5]. Elle permet ainsi de se tourner vers une
démarche plus pragmatique, mais néanmoins très performante, qui a donné
lieu à de nombreuses applications industrielles dans des domaines aussi
divers, et sans prétendre ici être exhaustifs, que l’aéronautique, l’automobile,
le génie chimique, ou l’agro-alimentaire, c’est-à-dire dans tous les domaines où
s’applique l’art de l’ingénieur.

1. Contexte C’est-à-dire que la connaissance de l’évolution des variables arti-


culaires impose celle de toutes les autres variables du système.
Cela met en évidence l’étape essentielle de génération de trajec-
De façon à comprendre intuitivement la notion de platitude, toire sur un ensemble particulier de variables du système et
considérons un robot manipulateur décrit par le modèle dyna- constitue le premier point important de la platitude.
mique en les variables articulaires q (t ) [6] [19] : Le deuxième point important concerne le suivi de cette trajec-
toire. En effet, si on impose Γd (t ) au niveau des commandes
H ( q ( t ) ) q¨ ( t ) + NL ( q ( t ), q˙ ( t ) ) = Γ ( t ) (1) d’axes du robot, l’imprécision sur la connaissance des valeurs des
paramètres du modèle, les perturbations et les conditions initiales
avec H (q) matrice d’inertie (toujours définie positive), mal connues font que la trajectoire désirée qd (t ) ne va pas être
exactement exécutée. La méthode intuitive du couple calculé [6]
NL ( q, q˙ ) vecteur des non-linéarités (termes de Coriolis, de [19] donne le bouclage statique :
gravité, d’entraînement,...),
Γ ( t ) = H ( q ( t ) )v ( t ) + NL ( q ( t ), q˙ ( t ) ) (2)
Γ (t) vecteur des couples articulaires qui constitueront,
dans un premier temps, les commandes de ce sys- avec v (t ) nouvelle commande.
tème.
Il conduit au système linéaire découplé :

Les notions que nous allons décrire dans la suite font large- q¨ ( t ) = v ( t )
ment appel, dans le cas des modèles continus, à l’opération de Si dans (2), on considère :
dérivation temporelle ; nous utilisons la notation habituelle :
v ( t ) = q¨ d ( t ) + K 1 (q˙ d ( t ) – q˙ ( t ) ) + K 0 ( q d ( t ) – q ( t ) )
dk f ( t )
pour tout entier k, f ( k ) ( t ) = --------------------
dt k avec q (t ) trajectoire effective du robot,
et pour les premières dérivées : K 1 et K 0 deux matrices diagonales positives,
alors la commande :
f˙( t ) = f ( 1 ) ( t ) et f¨ ( t ) = f ( 2 ) ( t )
Notons que dans un cadre linéaire, nous utilisons la notation Γ ( t ) = H ( q ( t ) ) ( q¨ d ( t ) + K 1 (q˙ d ( t ) – q˙ ( t ) ) + K 0 ( q d ( t ) – q ( t ) ) )
opérationnelle f (k) (t ) = pk f (t ) où p désigne l’opérateur de déri- + NL ( q ( t ), q˙ ( t ) )
vation temporelle.
conduit à une erreur qd (t ) – q (t ) qui tend asymptotiquement vers
0. On obtient ainsi une poursuite de la trajectoire désirée.
Ainsi lorsque l’on désire faire exécuter une trajectoire au robot
sous la forme d’un déplacement articulaire qd (t ) sur un intervalle Une autre particularité de cette commande concerne le fait que
de temps t ∈ τ = [t0, tf ], on peut calculer les commandes à imposer la propriété qui a été utilisée pour la concevoir est conservée à
pendant τ sous la forme : travers la mise en série. On peut ainsi, dans une étude plus pous-
sée prendre en compte les actionneurs et les capteurs qui instru-
mentent un processus, sans que le principe qui a été initialement
Γd ( t ) = H ( q d ( t ) ) q¨ d ( t ) + NL ( q d ( t ), q˙ d ( t ) ) utilisé soit remis en question. En ce qui concerne notre exemple du

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 450 − 2 est strictement interdite. − © EditionsT.I.

QPX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTUP

_______________________________________________________________________________________________ COMMANDE DES SYSTÈMES PAR PLATITUDE

robot manipulateur, nous allons regarder successivement la prise


en compte des actionneurs et le fait que l’on conçoive initialement En résumé, nous avons vu sur cet exemple simple que la mise
la trajectoire d’un robot dans un espace opérationnel et non dans en évidence de variables permettant de paramétrer les autres
l’espace articulaire. variables du système, dont en particulier les commandes,
conduit à construire une commande qui répond à un objectif de
En robotique, un modèle unifié d’actionneurs (électriques ou
poursuite de trajectoire désirée. Remarquons ici que, d’une part,
hydrauliques) permet d’écrire entre le vecteur des commandes
ce paramétrage a été obtenu sans intégrer de système différen-
envoyées aux cartes d’axes, U (t ), et Γ (t ), une relation de la forme :
tiel, donc sans difficulté, et que d’autre part, il n’a pas été remis
U (t ) = A 3Γ(3) (t ) + A 2Γ(2) (t ) + A1Γ(1) (t ) + A 0Γ (t ) en cause par des mises en série imposées par la prise en
compte, par exemple, d’actionneurs ou de fonctions de sorties.
où les matrices A 3 à A 0 sont, dans la plupart des cas, diagonales On peut ainsi construire des commandes à différents niveaux,
et positives. La prise en compte du modèle (1) de la partie mécani- suivant que l’on tient compte ou non des différentes échelles
que articulée conduit à : dynamiques présentes dans tout processus opératif.

U ( t ) = Φ ( q ( 5 ) ( t ), …, q˙ ( t ), q ( t ) )
Malgré un modèle plus complexe, on s’aperçoit que la
(3)
Toutes ces caractéristiques sont des avantages de la commande
par platitude dont nous allons détailler les principes dans la suite.

connaissance de l’évolution des variables articulaires permet Dans une optique résolument tournée vers la pratique et la mise en
encore de paramétrer la commande des actionneurs. On peut ainsi œuvre de cette commande, nous n’abordons pas les principes fon-
appliquer à nouveau le principe de commande précédent. La damentaux qui la justifient. Ces principes sont basés sur des
commande de suivi asymptotique de la trajectoire qd (t ) s’écrira concepts théoriques rigoureux comme l’algèbre différentielle [2]
donc, au niveau des actionneurs, sous la forme : ou la géométrie différentielle des jets infinis [3]. Nous invitons bien
sûr les lecteurs désireux d’approfondir ces questions à les
U ( t ) = Φ ( w ( t ), q ( 4 ) ( t ), ..., q˙ ( t ), q ( t ) ) consulter. Dans la suite, nous insistons plutôt sur des procédures
pratiques de conception d’une commande par platitude et sur des
avec exemples applicatifs.
4
(5) (i)
w (t ) = q d (t ) + ∑ Ki ( q d ( t ) – q ( i ) ( t ) )
i=0
2. Platitude d’un modèle
où les Ki , pour i = 0 à 4, sont des matrices diagonales telles que les
4
coefficients polynomiaux de p 5 + ∑ Ki p i aient leurs zéros à partie Définition 1
i=0 Un système défini par l’équation :
réelle négative.
Φ (x˙ ( t ), x ( t ), u ( t ) ) = 0 (4)
Les mêmes considérations peuvent être menées lorsque l’on
considère des trajectoires générées dans l’espace opérationnel. où x (t ) est l’état et u (t ) est la commande, est plat s’il existe un
Soit X (t ) les coordonnées opérationnelles du robot, c’est-à-dire vecteur z (t ) tel que :
l’ensemble des variables indépendantes qui définissent la position
et l’orientation de l’organe terminal dans un référentiel fixe. z (t ) = h (x (t ), u (t ), u (1) (t ), ..., u (δ) (t )) (5)
Comme il est plus pratique de concevoir un déplacement dans
dont les composantes soient différentiellement indépendantes
l’environnement du robot, les trajectoires sont définies dans
et deux fonctions A (.) et B (.) telles que :
l’espace opérationnel sous la forme Xd (t ). L’utilisation du modèle
géométrique de la partie mécanique articulée [6] [19] : x (t ) = A (z (t ), z (1) (t ), ..., z (α) (t )) (6)
g (X ) = f (q) u (t ) = B (z (t ), z (1) (t ), ..., z (β) (t )) (7)
permet de construire (localement et hors des singularités éventuel- où α, β, et δ sont trois entiers finis.
les) les modèles géométriques :
— direct : X = F (q) ;
— inverse : q = G (X ). Le vecteur z (t ) qui apparaît dans cette définition s’appelle la
sortie plate du système. Par l’introduction des fonctions A (.) et
∂G B (.), cette sortie plate est composée d’un ensemble de variables
De ce dernier modèle, on obtient par dérivation q˙ = ---------- X˙ , et
∂X qui permet de paramétrer toutes les autres variables du système,
de façon plus générale pour tout entier k, q (k) = φ (X, ..., X (k)). Ces l’état, la commande, mais également la sortie y (t ). En effet, si la
relations, utilisées dans (3), donnent l’expression de la commande sortie du système est définie par une relation de la forme
en fonction de la connaissance des coordonnées opérationnelles : y (t ) = Ψ (x (t ), u (t ), ..., u (p) (t )), alors nécessairement (6) et (7) per-
mettent d’affirmer qu’il existe un entier γ tel que :
U ( t ) = Ψ ( X ( 5 ) ( t ), ..., X˙ ( t ), X ( t ) )
y (t ) = C (z (t ), ..., z (γ) (t )) (8)
Cela permet de faire la commande directement dans l’espace
opérationnel : Comme les composantes de z (t ) sont différentiellement indé-
pendantes, la sortie plate regroupe toutes les variables libres (non
— par génération de trajectoire (commande en boucle ouverte) :
contraintes) du système. Mais on peut dire également, par la
(5) relation (5), qu’elle ne dépend que de l’état et de la commande, ce
U d ( t ) = Ψ ( X d ( t ), ..., X˙ d ( t ), X d ( t ) )
qui en fait une variable endogène du système, contrairement par
exemple à l’état d’un observateur qui est une variable exogène du
— par poursuite de trajectoire (commande en boucle fermée) :
système observé. Par ailleurs, et la notion d’équivalence différen-
4
tielle au sens de Lie-Bäcklund le montre bien [3], le nombre de
冢 (5)
U (t ) = Ψ X d (t ) + ∑ ki ( X d
(i)
( t ) – X ( i ) ( t ) ), ..., X˙ ( t ), X ( t ) 冣 composantes de z (t ) est donné par celui de la commande :
i=1 dim z (t ) = dim u (t )

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. − © EditionsT.I. S 7 450 − 3

QPY
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTUP

COMMANDE DES SYSTÈMES PAR PLATITUDE _______________________________________________________________________________________________

Cette propriété essentielle permet de connaître a priori le Un modèle dynamique très simplifié [10] peut s’écrire :
nombre de variables libres que l’on doit trouver sur un modèle
pour mettre en évidence sa platitude. x¨ ( t ) = – sin θ ( t )u 1 ( t ) + ε cos θ ( t )u 2 ( t )
Un des avantages de la propriété de platitude est que la défini- h¨ ( t ) = cos θ ( t )u 1 ( t ) + ε sin θ ( t )u 2 ( t ) – 1
tion précédente n’est pas restreinte aux modèles d’état, mais à tout
modèle de la forme : θ¨ ( t ) = u 2 ( t )
Φ (x (n) (t ), ..., x (1) (t ), x (t ), u (m) (t ), ..., u (1) (t ), u (t )) = 0
cela permet ainsi de partir directement des équations régissant le Comme il vient :
système (fournies par les lois du domaine concerné : mécanique,
chimie, thermodynamique, économie, etc.) sans avoir à reformuler
l’ensemble des équations sous la forme d’une équation d’état. u1 ( t ) – sin θ ( t ) cos θ ( t )
= x¨ ( t )


Nous verrons sur les exemples que les diverses relations nécessaires cos θ ( t ) sin θ ( t )
u2 ( t ) ------------------------- ----------------------- h¨ ( t ) + 1
à la mise en évidence de la platitude ont chacune leur utilité mais ε ε
que la plus importante pour la conception de la commande est la
relation (7). La relation (6) permet de vérifier que z (t ) est effective- l’élimination de u 2 (t ) conduit à :
ment la sortie plate d’un système. En effet, toutes les composantes
de x (t ) doivent pouvoir s’exprimer à l’aide de z (t ) et de ses dérivées. εθ¨ ( t ) = cos θ ( t ) x¨ ( t ) + sin θ ( t ) ( h¨ ( t ) + 1 )

Exemple 1 : et la multiplication du premier membre par cos2 θ + sin2 θ = 1, donne :


Considérons le système :
cos θ ( t ) ( x¨ ( t ) – ε cos θ ( t ) θ¨ ( t ) ) = – sin θ ( t ) ( h¨ ( t ) + 1 – ε sin θ ( t ) θ¨ ( t ) )
x˙1 ( t ) = x 2 ( t ), x˙2 ( t ) = u ( t )
Avec X (t ) = x (t ) – ε sin θ (t ) et H (t ) = h (t ) + ε cos θ (t ), on a :
Si on définit les variables :
— z (t ) = x 2 (t ), malgré u ( t ) = z˙ ( t ) , elle ne peut être considérée x¨ ( t ) – ε cos θ ( t ) θ¨ ( t ) = X¨ ( t ) – ε sin θ ( t ) θ̇ 2 ( t )
comme sortie plate car on a seulement :
h¨ ( t ) – ε sin θ ( t ) θ¨ ( t ) = H¨ ( t ) + ε cos θ ( t ) θ̇ 2 ( t )

t
x 1 ( t ) = x 1 ( t0 ) + z (τ) dτ soit :
t0

— z (t ) = x1 (t ), alors : cos θ ( t ) X¨ ( t ) = – sin θ ( t ) ( H¨ ( t ) + 1 )

x 2 ( t ) = z˙ ( t ) et u ( t ) = z¨ ( t )
Pour simplifier, plaçons-nous dans le cas ( H¨ ( t ) + 1 ) 2 + X¨ ( t ) 2 ≠ 0 .
qui indique que x1 est une sortie plate de ce système.
On tire de la relation précédente que lorsque H¨ ( t ) + 1 = 0 alors
En conséquence ce système est plat de sortie plate z (t ) = x1 (t ).
θ = (2k + 1) π/2 sinon :
La relation (8) permet quant à elle de relier l’évolution de la
sortie plate à celle de la sortie. Elle sera utile lors de la phase de X¨ ( t )
θ ( t ) = – arctan -------------------------
génération de trajectoire. ¨
H (t ) + 1
Dans les paragraphes 3 et 4, nous allons décrire les implications Comme :
de la notion de platitude concernant la mise en œuvre de la
commande d’un système et ceci à divers niveaux. Mais auparavant X¨ ( t )
traitons de l’exemple de l’avion à décollage vertical. Cet exemple sin θ = – ------------------------------------------------------------
offre la particularité d’être assez simple dans sa formulation tout en X¨ ( t ) 2 + ( H¨ ( t ) + 1 ) 2
nous permettant de mettre en évidence, dans la suite, la puissance et
de la commande par platitude relativement à une commande non H¨ ( t ) + 1
linéaire habituelle. De plus, nous y verrons que, comme dans beau- cos θ = ------------------------------------------------------------------------- ,
coup de situations pratiques, certaines sorties plates particulières X¨ ( t ) 2 + ( H¨ ( t ) + 1 ) 2
possèdent souvent une interprétation physique. on en déduit :
Exemple 2 : avion
x ( t ) = x 冢X ( t ), X¨ ( t ), H¨ ( t )冣 et h ( t ) = h 冢H ( t ) , X¨ ( t ), H¨ ( t )冣
Considérons le mouvement dans le plan vertical d’un avion à décol-
lage vertical, schématisé dans la figure 1. En utilisant les coordonnées
réduites : De θ¨ ( t ) = u 2 ( t ) :
xG hG J sin α
x = ------- -, ε = ----------------------------------------------------------
- , h = ------- - u2 (t ) = u2 (X (2) (t ), H (2) (t ), X (3) (t ), H (3) (t ), X (4) (t ), H (4) (t )) (9)
g g mg ( ᐉ cos α + δ sin α )
et des relations
( F 1 + F 2 ) cos α ( F 1 – F 2 ) sin α
u1 -,
= ---------------------------------------- u2 = --------------------------------------
- X¨ ( t ) = – sin θ ( t ) ( u 1 ( t ) – εθ̇ 2 ( t ) )
mg ε mg
H¨ ( t ) + 1 = cos θ ( t ) ( u 1 ( t ) – εθ̇ 2 ( t ) )
avec m masse de l’avion,
J son inertie, on tire
g accélération due à la pesanteur, u1 (t ) = u1 (X (2) (t ), H (2) (t ), X (3) (t ), H (3) (t ))
α angle que font les poussées F1 (t ) et F2 (t ) avec la verti-
cale, Cet ensemble de relations indique que (X (t ), H (t )) est une sortie
( ᐉ, δ ) paramètres fournissant les coordonnées dans le réfé- plate de ce système. Remarquons qu’elle admet une interprétation
rentiel inertiel de l’avion des points d’application des physique immédiate puisqu’il s’agit du centre de rotation de Huygens
poussées. du pendule équivalent.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 450 − 4 est strictement interdite. − © EditionsT.I.

QQP
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVP

Matlab/Simulink pour l’analyse


et la commande de systèmes
par Yassine HADDAB
Maı̂tre de conférences en automatique à l’ENSMM Besançon


Bernard LANG
Maı̂tre de conférences en automatique à l’ENSMM Besançon

et Guillaume LAURENT
Maı̂tre de conférences en automatique à l’ENSMM Besançon

1. Brève introduction à Matlab et Simulink ................................... S 7 460 – 2


1.1 Matlab ................................................................................................. — 2
1.2 Simulink .............................................................................................. — 2
2. Représentation d’un modèle......................................................... — 3
2.1 Représentation d’un système linéaire avec Matlab .......................... — 3
2.2 Représentation d’un système avec Simulink .................................... — 4
3. Identification paramétrique.......................................................... — 7
3.1 Outil interactif d’identification paramétrique .................................... — 7
3.2 En ligne de commande ...................................................................... — 8
4. Analyse des systèmes linéaires stationnaires .......................... — 9
4.1 Analyse temporelle............................................................................. — 9
4.2 Analyse fréquentielle.......................................................................... — 9
4.3 LTI Viewer ........................................................................................... — 10
5. Synthèse des systèmes bouclés................................................... — 10
5.1 Régulation industrielle ....................................................................... — 10
5.2 Méthodes de synthèse avancées ....................................................... — 13
6. Pilotage d’un processus réel à l’aide de Matlab/Simulink
et dSPACE......................................................................................... — 16
Pour en savoir plus.................................................................................. Doc. S 7 460

D e nombreux logiciels performants sont aujourd’hui à la disposition des


ingénieurs et permettent de réaliser des études simples ou complexes de
façon très conviviale. Le logiciel Matlab‚ et son extension Simulink‚ sont par-
ticulièrement bien adaptés pour appréhender des problèmes d’automatique,
notamment pour réaliser l’analyse et la commande de systèmes modélisés
par des équations différentielles ordinaires.
Après une brève introduction à Matlab‚ et Simulink‚, nous utilisons certains
outils disponibles pour représenter un modèle de comportement d’un système
en illustrant la démarche à l’aide de deux exemples.
Des procédures d’identification du modèle sont proposées à travers l’utilisa-
tion de la boı̂te à outils System Identification avant d’aborder l’analyse tempo-
relle et fréquentielle des systèmes linéaires stationnaires et les outils associés
(LTI Viewer, etc.).
On aborde enfin les moyens mis à disposition de l’utilisateur pour effectuer la
synthèse des systèmes bouclés. Dans un premier temps les méthodes tradition-
nelles en régulation industrielle sont mises en œuvre, à l’aide notamment du
p。イオエゥッョ@Z@ュ。イウ@RPQP

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 460 – 1

QQQ
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVP

MATLAB/SIMULINK POUR L’ANALYSE ET LA COMMANDE DE SYSTÈMES ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

SISO Design Tool. Dans un second temps, des méthodes de synthèse avancées
sont utilisées avec application à un exemple multivariable.
Pour terminer cette analyse, le pilotage en temps réel d’un processus à l’aide
d’un outil de type dSPACE‚ est abordé.

1. Brève introduction
R à Matlab et Simulink

1.1 Matlab
Matlab‚ est un logiciel de calcul numérique développé et com-
mercialisé par la société américaine The MathWorks. Ses différen-
tes fonctions peuvent être utilisées par l’intermédiaire d’une ligne
de commande ou à travers un script écrit dans un langage propre
à Matlab‚.
Matlab‚ manipule les données principalement sous la forme de
vecteurs et de matrices, mais aussi sous des formes plus structu-
rées (enregistrements). Les variables sont stockées dans des espa-
ces mémoires internes dont le principal est le workspace pour les
variables globales.
Matlab‚ est complété par de nombreuses boı̂tes à outils (tool-
box) spécialisées dans des domaines très divers. Plusieurs de ces
boı̂tes à outils se rapportent à l’automatique ; on peut notamment
citer :
– la boı̂te à outils Control System pour la simulation, l’analyse et
la commande des systèmes linéaires,
– la boı̂te à outils System Identification pour la détermination de
modèles mathématiques de systèmes dynamiques à partir de don-
nées d’entrée/sortie mesurées,
– la boı̂te à outils Robust Control pour la commande robuste, Figure 1 – Répertoire des bibliothèques de blocs Simulink
– la boı̂te à outils Model Predictive Control pour la commande
prédictive. & Construction d’un schéma-bloc
Dans cet article, nous décrivons l’emploi des principales com- Un schéma-bloc est constitué de blocs reliés par des liens trans-
mandes des boı̂tes à outils Control System et System Identification portant des signaux des sorties vers les entrées des blocs. Les
ainsi que l’utilisation de Simulink‚. Nous supposons que le lecteur signaux peuvent être réels ou complexes, scalaires ou vectoriels.
connaı̂t les concepts et commandes de base de Matlab‚. Dans le
Un bloc peut comporter des entrées, des sorties et des paramè-
cas contraire, nous renvoyons le lecteur à l’article de Jacques
tres. Les blocs sans entrée sont des sources. Les blocs sans sortie
Prado [6] également paru dans les Techniques de l’Ingénieur.
sont des puits (sinks). Les blocs sources permettent de générer tou-
tes sortes de signaux : constants, périodiques, aléatoires, etc. Les
1.2 Simulink blocs puits permettent d’afficher ou de mémoriser les données.
Pour créer un nouveau schéma-bloc, on choisit New Model dans
& Présentation générale le menu File. Une fenêtre de travail vierge s’ouvre. On fait alors
Simulink‚ est un environnement graphique interactif pour la glisser, du répertoire des bibliothèques à la fenêtre de travail, les
modélisation et la simulation des systèmes dynamiques linéaires blocs dont on a besoin pour construire le schéma. On relie enfin
et non-linéaires. Simulink‚ est fondé sur l’utilisation de schémas- les blocs entre eux à l’aide de la souris.
blocs, ce qui le rend particulièrement convivial et intuitif par rap- Si l’entrée d’un bloc doit être connectée à la sortie d’un bloc déjà
port à la boı̂te à outils Control System de Matlab‚. relié, on crée un lien entre l’entrée du bloc et n’importe quel point
Simulink‚ est pleinement intégré à Matlab‚, permettant ainsi un du lien existant. Cette action crée un nœud entre les liens, qui peut
accès direct aux nombreux outils de développement algorithmique, être déplacé par la suite à la souris comme l’ensemble des autres
de visualisation et d’analyse de données de Matlab‚. objets du diagramme.
Pour ouvrir Simulink‚, il suffit d’exécuter la commande simulink Un fois le schéma réalisé, il est nécessaire de régler les différents
ou de cliquer sur le bouton dédié dans la barre d’outils de Matlab‚. paramètres des blocs. Un double-clic sur un bloc ouvre une fenêtre
Une nouvelle fenêtre s’ouvre répertoriant les bibliothèques de permettant de changer les paramètres du bloc. Le bouton Help
blocs disponibles (figure 1). Cet ensemble de bibliothèques est per- donne accès à la documentation en ligne du bloc.
sonnalisable et peut être étendu pour des applications spécifiques Afin d’expliciter les différents éléments du schéma, il est possible
via des boı̂tes à outils (blocksets) spécialisées. de nommer les blocs et les liens. Pour modifier le nom du bloc, il

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 460 – 2 est strictement interdite. – © Editions T.I.

QQR
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVP

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– MATLAB/SIMULINK POUR L’ANALYSE ET LA COMMANDE DE SYSTÈMES

Électrodes
u 1 y
s 2 + s +2 +
Step Scope n(t)
Transfer function δ (t)

Figure 2 – Diagramme Simulink Couche Couche


passive piézoélectrique
(Cu) (PZT)

Figure 4 – Structure et fonctionnement d’un bilame piézoélectrique

utilisé pour l’actionnement de microsystèmes (systèmes de très


petite taille). Il sera approximé par un modèle linéaire d’ordre
deux, très utilisé dans l’étude de systèmes simples. Le second, un

système de roue à aubes permettra de présenter une manière inter-
active de prendre en compte les non-linéarités.

Figure 3 – Tracé de l’oscilloscope pour le schéma-bloc de la figure 2 2.1 Représentation d’un système linéaire
avec Matlab
suffit de cliquer sur son intitulé. Pour donner un nom à un lien, on
double-clique sur le lien. Pour ajouter un commentaire, on double- & Bilame piézoélectrique
clique dans une zone vierge de la fenêtre. Les bilames piézoélectriques sont des actionneurs fréquemment
Une fois le schéma terminé, on peut l’enregistrer dans un fichier utilisés dans les microsystèmes. La figure 4 présente la structure
via la commande Save As du menu File. Les fichiers Simulink por- d’un bilame constitué d’une couche de matériau piézoélectrique
tent l’extension .mdl. (PZT : Plomb zirconate titane) équipée d’électrodes et d’une couche
Par exemple, si l’on souhaite tracer la réponse indicielle d’un sys- de cuivre (matériau passif). Cet actionneur exploite l’effet piezoélec-
tème du deuxième ordre ayant pour transmittance : trique inverse [8] pour produire un déplacement d à son extrémité
1 sous l’effet d’une tension électrique V appliquée sur les électrodes.
G (s ) = 2 . L’une des applications de ces actionneurs est l’ouverture et la fer-
s +s +2 meture de micro-pinces pour la manipulation d’objets de très fai-
On réalise le schéma-bloc de la figure 2 à l’aide d’un bloc éche- bles dimensions.
lon (step) de la bibliothèque Sources, d’un bloc oscilloscope virtuel Pour de faibles déplacements, le comportement du bilame peut
(scope) de la bibliothèque Sinks et d’un bloc fonction de transfert être approximé par un modèle linéaire invariant dans le temps
(transfer function) de la bibliothèque Continuous. (LTI) représenté par la transmittance suivante :
& Simulation
δ (s ) 0,842.10−3
Avant de passer à la simulation du modèle réalisé, il est indis- G (s ) = = (1)
ν (s ) 5,699.10−8 s 2 + 4,774.10−6 s + 1
pensable de régler les paramètres de l’algorithme d’intégration
numérique. Ces réglages sont accessibles par la commande Confi-
dans laquelle s désigne la variable de Laplace. Les coefficients de
guration Parameters du menu Simulation. On peut notamment
cette transmittance ont été évalués à partir de données d’entrée/
définir l’instant de départ (start time) et l’instant d’arrêt (stop
sortie (§ 3).
time), et choisir la méthode d’intégration (méthode à pas fixe ou à
pas variable) et ses paramètres. & Représentation d’une transmittance
Par exemple, pour le schéma-bloc de la figure 2 et un instant
La transmittance précédente G(s) peut être introduite dans l’envi-
d’arrêt fixé à 20 secondes, on obtient sur l’oscilloscope virtuel le
ronnement Matlab‚ à l’aide de la commande tf (transfer function) :
tracé de la figure 3.
G=tf([0.842e-3], [5.699e-8 4.774e-6 1])
Différents blocs et possibilités de Simulink‚ seront présentés au
fil de l’article. La première étape étant d’établir un modèle du pro- La commande tf nécessite l’introduction sous forme de vecteurs
cessus à commander, nous allons maintenant étudier plus en détail des coefficients du numérateur et du dénominateur dans l’ordre
la modélisation d’un système dynamique à l’aide de Matlab‚ et de décroissant des puissances de s.
Simulink‚. Il est également possible d’introduire une transmittance de la
manière suivante :
s=tf(’s’)
2. Représentation d’un G=0.842e-3 / (5.699e-8*s^2+4.774e-6*s+1)

modèle Dans les deux cas, Matlab‚ répond par :


Transfer function :
0.000842
Dans cette section, nous nous intéressons à l’introduction de -------------------------------
modèles dans l’environnement Matlab‚/Simulink‚. Ces modèles
serviront à l’analyse et à la simulation du comportement des systè- 5.6699 e−008 s^2 + 4.774e−006 s+1
mes modélisés ainsi qu’à la synthèse de correcteurs. Deux systè- Ce qui signifie que Matlab‚ a bien reconnu G comme une
mes seront utilisés pour illustrer la démarche et les commandes à variable de type LTI. Les variables de type LTI permettent de passer
utiliser. Le premier, un bilame piézoélectrique, est un système très facilement d’une représentation à une autre.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. – © Editions T.I. S 7 460 – 3

QQS
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVP

MATLAB/SIMULINK POUR L’ANALYSE ET LA COMMANDE DE SYSTÈMES ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

& Passage d’une représentation à une autre


Le comportement de la poutre peut également être représenté
par un modèle d’état dont la forme est :
v Delta
G
⎧ dX
⎪ = A.X + B.ν
⎨ dt (2)
Step LTI System Scope
⎪⎩δ = C .X + D .ν

Dans ce modèle, X désigne l’état du système.


Une réalisation d’état peut être obtenue à partir de la transmit- Figure 5 – Illustration de l’utilisation du bloc LTI System
tance G grâce à la commande ss (qui signifie state space ou repré-
sentation d’état). Gd 1 = ss (Gd)
Matlab‚ répond par :


G1=ss(G)

Matlab répond par : a=
a= x1 x2
x1 x2 x1 1.9687 − 0.99665
x1 − 83.77 − 4284 x2 1 0
x2 4096 0 b=
b= u1
u1 x1 0.0039063
x1 2 x2 0
x2 0 c=
c= x1 x2
x1 x2 y1 0.00301154 0.003012
y1 0 1.804 d=
d= u1
u1 y1 0
y1 0 Sampling time: 4e − 005
Continuous - time model. Discrete - tim e model.
La commande zpk (zéro, pole, gain) permet de mettre un modèle Cette forme correspond au modèle d’état récurrent suivant :
LTI sous une forme factorisée laissant apparaı̂tre les pôles, les zéros
et le gain du système. ⎧X k +1 = A.X k + B.νk
⎨ (3)
De manière générale, les commandes tf, ss, et zpk sont utilisa- ⎩δk = C .X k + D .νk
bles à la fois pour créer une variable de type LTI à partir de données
formatées (coefficients des polynômes dans le cas d’une transmit- & Exploitation d’un modèle LTI sous Simulink‚
tance, coefficients des matrices pour une représentation d’état, etc.) Une variable de type LTI peut être exploitée directement dans
mais aussi pour passer d’une forme à une autre (passage d’une Simulink‚ à l’aide du bloc LTI System de la bibliothèque Control
transmittance à une représentation d’état, d’une représentation System Toolbox. Par exemple, si l’on souhaite tracer la réponse
d’état à une transmittance, etc.). indicielle du modèle LTI décrit par la variable G, on réalise le
& Discrétisation d’un modèle schéma-bloc de la figure 5.
Dans le but de permettre la synthèse de correcteurs discrets, il
convient de déterminer un modèle discret du système. Matlab‚ 2.2 Représentation d’un système
permet l’obtention d’un modèle discret, à partir d’un modèle LTI
continu et d’une période d’échantillonnage choisie, à l’aide de la avec Simulink
commande c2d (continuous to discrete). & Système de roue à aubes
Te=4e-5
Une roue à aube est actionnée par un débit de fuite Qf dans une
Gd=c2d(G,Te,’zoh’) conduite forcée (figure 6). Ce débit est dû à l’écoulement libre de
Le paramètre ’zoh’ signifie que l’on considère la présence d’un l’eau d’une cuve de section constante S. La hauteur H d’eau pré-
bloqueur d’ordre zéro en amont de la transmittance G. sente dans la cuve est régulée par le débit Qe délivré par une
vanne pilotée par un moteur électrique. La vitesse angulaire de la
Matlab‚ répond par :
roue à aubes est notée W(t). Sachant qu’une cuve percée possède
Transfer function : un débit de fuite proportionnel à la racine carrée de la hauteur
1.178e-005z + 1.177e-005 d’eau présente dans la cuve, il vient :
------------------ Qf (t ) = kf H (t ) (4)
z^2 - 1.969z + 0.9967
Sampling time: 4e-005 On peut alors décrire le fonctionnement de la cuve à l’aide de
l’équation différentielle non-linéaire suivante :
On obtient ainsi une fonction de transfert en z associée à une
période d’échantillonnage. dH (t )
S = Qe (t ) − Qf (t ) = Qe (t ) − kf H (t ) (5)
Il est également possible d’obtenir une représentation d’état dt
discrète à l’aide de la commande ss.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


S 7 460 – 4 est strictement interdite. – © Editions T.I.

QQT
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVR

Multimodèles : analyse et synthèse


Commande et observation des modèles
Takagi-Sugeno
par Mohammed CHADLI
Maı̂tre de Conférences HDR

et
Université de Picardie Jules-Verne d’Amiens

Pierre BORNE

Professeur des universités
École centrale de Lille

1. Comment obtenir les multimodèles ............................................ S 7 462 – 2


1.1 Transformation polytopique .............................................................. — 2
1.2 Approches et outils utilisés ............................................................... — 3
1.2.1 Approche de Lyapunov ............................................................ — 3
1.2.2 Inégalités linéaires matricielles (LMI) ..................................... — 4
2. Stabilité des multimodèles continus .......................................... — 5
2.1 Analyse de stabilité ............................................................................ — 5
2.2 Stabilité robuste ................................................................................. — 5
2.3 Conclusion .......................................................................................... — 6
3. Estimation d’état des multimodèles ........................................... — 6
3.1 Synthèse de multiobservateurs ......................................................... — 6
3.2 Synthèse d’observateurs à entrées inconnues ................................. — 7
3.3 Conclusion .......................................................................................... — 8
4. Stabilisation des multimodèles.................................................... — 8
4.1 Commande par retour d’état ............................................................. — 8
4.2 Commande par retour d’état reconstruit ........................................... — 9
4.3 Commande par retour de sortie statique .......................................... — 11
5. Conclusion........................................................................................ — 13
Pour en savoir plus.................................................................................. Doc. S 7 462

C es dernières années, une approche globale basée sur de multiples modèles


LTI (linéaires à temps invariant) autour de différents points de fonctionne-
ment a été proposée. Cette approche, dite multimodèle, est une représentation
polytopique convexe pouvant être obtenue soit directement à partir d’un
modèle mathématique non linéaire, soit par transformation mathématique,
soit par linéarisation autour de différents points de fonctionnement. De nom-
breux travaux concernant la stabilité de cette classe de systèmes non linéaires
ont été publiés ces dernières années. Dans un premier temps, ces travaux se
sont inspirés des techniques de commande des systèmes linéaires.
Ce dossier présente des résultats sur l’analyse de la stabilité et la synthèse de
lois de commande et d’observateurs pour les multimodèles. Dans le but d’as-
seoir ces problèmes d’analyse et de synthèse sur des bases numériques, les
résultats proposés sont basés essentiellement sur la deuxième méthode de Lya-
punov et la formulation LMI (Linear Marix Inequality).
Ce dossier est organisé comme suit :
– la représentation multimodèle et les outils utilisés sont tout d’abord présen-
tés ;
p。イオエゥッョ@Z@ュ。イウ@RPQT

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 462 – 1

QQU
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVR

MULTIMODÈLES : ANALYSE ET SYNTHÈSE –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

– puis quelques conditions suffisantes de stabilité des multimodèles utilisant


des fonctions de Lyapunov quadratiques et non quadratiques sont proposées ;
– la synthèse d’observateurs est par la suite considérée. L’estimation d’état en
présence d’entrées inconnues est traitée et des conditions de synthèse sous
forme LMI sont proposées ;
– enfin, la stabilisation par retour d’état et de sortie non linéaire est considé-
rée. Les performances des multimodèles en boucle fermée sont assurées par
placement de pôles dans des régions LMI.
Des exemples illustratifs sont traités.


fonction h (x (t)) bornée de [a, b] Æ R pour tout x 2 [a, b] avec (a,
1. Comment obtenir b) 2 R2, il existe deux fonctions.
les multimodèles F i (.) : [a, b ] → [0, 1] , i ∈ I2 (4)

Nous pouvons dénombrer trois méthodes pouvant être x (t ) ֏ F i ( x (t ))


employées pour l’obtention d’un multimodèle :
1) par identification lorsque l’on dispose de données sur les avec F1 (x (t)) + F2 (x(t)) = 1 et deux scalaires a et b tels que :
entrées et les sorties ;
h ( x (t )) = F 1 ( x (t )) α + F 2 ( x (t )) β (5)
2) par linéarisation autour de différents points de
fonctionnement ;
Une décomposition évidente de h (x (t)) est de considérer sur [a, b]
3) par une transformation polytopique convexe lorsque l’on dis-
pose d’un modèle analytique. β ≤ h ( x (t )) ≤ α (6)
Les travaux portant sur l’analyse de stabilité des multimodèles,
dits également modèles Takagi-Sugeno [8], ainsi que la synthèse avec :
de lois de commande ou d’observateurs, adoptent la représenta-
tion d’état afin d’étendre au cas non linéaire les techniques de com- ( )
β = min h ( x (t )) , α = max h ( x (t ))
x ∈[a ,b ] x ∈[a ,b ]
( )
mande par retour d’état, par retour de sortie, ainsi que la construc-
tion d’observateurs non linéaires en se basant sur les observateurs
classiques largement utilisés dans le domaine linéaire. h ( x (t )) − β α − h ( x (t ))
F 1 ( x (t )) = , F 2 ( x (t )) = (7)
La forme généralement retenue d’un multimodèle continu est : α−β α−β
N
xɺ (t ) = ∑ µi (z (t )) ( Ai x (t ) + Bi u (t )) (1) Cette méthode de décomposition, qui n’est pas unique, sera uti-
i =1
lisée par la suite.
En effet, considérons le cas général d’un système non linéaire
avec les fonctions d’activation mi (.) i 2 IN (avec IN = {1, 2,…, N}), affine en la commande de la forme :
obéissant à la propriété de convexité :
N ⎛ xɺ (t )⎞ ⎛ A ( x (t )) B ( x (t ))⎞ ⎛ x (t )⎞
⎜⎝ y (t )⎟⎠ = ⎜ C ( x (t )) D ( x (t ))⎟ ⎜⎝ u (t )⎟⎠ (8)
∑ µi (z (t )) = 1, µi (z (t )) ≥ 0 (2) ⎝ ⎠
i =1
avec x (.) 2 Rn, u (.) 2 Rm, y (.) 2 Rl, A (.) 2 Rn.m, B (.) 2 Rn.m, C (.) 2 Rl.n,
x (.) 2 Rn est le vecteur des variables d’état, u (.) 2 Rm le vecteur des
et D (.) 2 Rl.m.
entrées, z (.) 2 Rq le vecteur des variables de décision et N le nom-
bre de modèles adoptés. On pose :
La forme similaire pour les multimodèles discrets est :
⎛ A ( x (t )) B ( x (t ))⎞
E ( x (t )) = ⎜ (9)
⎝ C ( x (t )) D ( x (t ))⎠
N ⎟
x (t + 1) = ∑ µi (z (t )) ( Ai x (t ) + Bi u (t )) (3)
i =1
Sous l’hypothèse que E (x (t)) est continue et bornée et en consi-
dérant chaque terme non constant, la matrice E (x (t)) peut être
1.1 Transformation polytopique transformée sous la forme suivante :
Notons que la méthode d’obtention de multimodèles la plus uti- N
E ( x (t )) = ∑ µi (z (t )) Ei , Ei = ⎛⎜ i
lisée est celle obtenue par transformation polytopique des formes A Bi ⎞ (10)
non linéaires. La méthode proposée utilise uniquement la borni- ⎝ Ci Di ⎟⎠
i =1
tude des termes non linéaires [1]. Cette méthode est basée sur
une transformation polytopique convexe de fonctions scalaires à Le nombre de modèles locaux N issus de la transformation se
l’origine de la non linéarité. Elle permet de réduire le nombre de trouve par conséquent dépendre du nombre s des non-linéarités
modèles LTI au minimum (i.e. 2 modèles LTI). En effet pour une contenues dans la matrice E (x). Ce nombre est égal à N = 2s.

S 7 462 – 2 Copyright © - Techniques de l’Ingénieur - Tous droits réservés

QQV
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sWTVR

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– MULTIMODÈLES : ANALYSE ET SYNTHÈSE

L’avantage de cette méthode est de ne pas engendrer d’erreur Ainsi, on aboutit à quatre modèles locaux, obtenus à partir des
d’approximation et de réduire le nombre de modèles locaux par quatre combinaisons possibles des bornes des termes non cons-
rapport à la méthode de linéarisation. Rappelons que la réduction tants de h1 (x1 (t)) et h2 (x2 (t)). Ces quatre modèles sont représentés
du nombre de modèles LTI permet de réduire le nombre de par les matrices Ei décrites en (9) :
contraintes matricielles (de stabilité ou de stabilisation), ce qui aug-
mente les chances de trouver une solution. ⎛ 5 1 1⎞ ⎛ 5 1 1 ⎞
E1 = ⎜ − 1 2 a 3 ⎟ , E2 = ⎜ − 1 2 − a 3 ⎟
L’exemple suivant illustre cette méthode. ⎜⎝ a 3 1 0 ⎟⎠ ⎜⎝ − a 3 1 0 ⎟⎠
⎛ 5 −1 1 ⎞ ⎛ 5 −1 1 ⎞
Exemple
Considérons le modèle non linéaire suivant : E3 = ⎜ − 1 2 a 3 ⎟ , E4 = ⎜ − 1 2 − a3⎟
⎜⎝ a 3 1 0 ⎟⎠ ⎜⎝ − a 3 1 0 ⎟⎠
⎧xɺ 1 (t ) = 5x1 (t ) + cos ( x1 (t )) x 2 (t ) + u (t )
⎪⎪ En prenant l’opérateur produit comme opérateur de conjonction,
⎨xɺ 2 (t ) = − x1 (t ) + 2x 2 (t ) + x 2 (t )u (t )

3 (11) les fonctions d’activation, au nombre de 4, sont obtenues à partir

⎪⎩y (t ) = x 2 (t ) x1 (t ) + x 2 (t ) des produits : F11ou 2 ⋅ F21ou 2
3

que l’on peut réécrire de la forme (8) avec : µ1 ( x (t )) = F11 ( x1) ⋅ F21 ( x 2 ) , µ2 ( x (t )) = F11 ( x1) ⋅ F22 ( x 2 ) (17)

⎛ 5 cos ( x1 (t ))⎞ ⎛ 1 ⎞
A ( x (t )) = ⎜ ⎟⎠ , B ( x (t )) = ⎝⎜ x 3 (t )⎠⎟
⎝− 1 2 2 µ3 ( x (t )) = F12 ( x1) ⋅ F21 ( x 2 ) , µ4 ( x (t )) = F12 ( x1) ⋅ F22 ( x 2 ) (18)
C ( x (t )) = ( x 23 (t ) )
1 , D ( x (t )) = 0
La description multimodèle du système non linéaire (11) n’est valide
que dans le domaine U = R x [- a, a] de l’espace d’état. Par consé-
quent, l’analyse de la stabilité de (11) basée sur son multimodèle (1)
L’objectif est d’écrire E (x (t)) définie en (9) sous la forme (10). La n’est que locale, même si la stabilité établie pour ce dernier est glo-
matrice E (x (t)) présente deux termes non constants : bale. Dans le cas des matrices E (x (t)) bornées 8 x (t) 2 Rn, la représen-
tation multimodèle se confond avec son modèle non linéaire.
h1 ( x1 (t )) = cos ( x1 (t )) , h2 ( x 2 (t )) = x 23 (t ) (12)

Remarquons que le terme non constant h1 (x1 (t)) est borné x (t) 2 R2 1.2 Approches et outils utilisés
alors que le terme h2 (x2 (t)) ne peut l’être que sur un compact borné 1.2.1 Approche de Lyapunov
[- a, a], a > 0 (figure 1). Ainsi, on peut transformer les termes non
linéaires h1 (x1 (t)) et h2 (x2 (t)) 8 x (t) 2 U avec U = R x [- a, a], La méthode directe de Lyapunov s’appuie sur l’analyse de l’éner-
a > 0 tels que : gie totale dissipée dans un système (mécanique) : si cette énergie
est continûment dissipée (on parle de système dissipatif), alors on
h1 ( x1 (t )) = F11 ( x1) ⋅ 1 + F12 ( x1) ⋅ ( − 1) (13) peut espérer que le système tende vers un point d’équilibre. Ainsi,
l’idée de Lyapunov consiste à examiner la variation d’une fonction
scalaire pour étudier la stabilité d’un système donné [7] [1].
h2 ( x 2 (t )) = F21 ( x 2 ) ⋅ a 3 + F22 ( x 2 ) ⋅ − a 3 ( ) (14) Considérons tout d’abord le système non linéaire en régime libre
décrit par :
avec :
xɺ (t ) = f ( x (t )) (19)
F11 ( x1) =
1
2
( ) 1
(
1 + cos ( x1 (t )) , F12 ( x1) = 1 − cos ( x1 (t ))
2
) (15)
avec f (x(t)) 2 C1, f (.) : Rn Æ Rn
Le système (19) est dit en équilibre autour de x0 si, en l’absence
F21 ( x 2 ) =
1
( ) 1
x 3 (t ) + a 3 , F22 ( x 2 ) = 3 a 3 − x 23 (t )
2a 3 2 2a
( ) (16) d’influence externe, son état ne varie pas au cours du temps ; x0 est
alors appelé point d’équilibre.

Définition du point d’équilibre : x0 est appelé point d’équilibre


du système (19) si f (x0) = 0, 8t > t0, t0 est l’origine du temps.
h2 ( x2)
Par la suite, on considérera, sans perte de généralité, que l’ori-
gine de l’espace d’état est point d’équilibre (x0 = 0) du système (19).
En effet, si x0 π 0 est point d’équilibre de (19) alors z0 = 0 est point
+ a3 d’équilibre du système zɺ = f (z (t ) + x 0 ).

Théorème 1 : soit une fonction scalaire V (x) vérifiant les condi-


-a tions de Lyapunov, en particulier V (x) encadrée par deux fonc-
tions positives scalaires de x (t ) , non décroissantes et continû-
+a x2
∂V ( x )
ment dérivables. Si f ( x ) < 0, ∀x (t ) ≠ 0 alors le point
- a3 ∂x
d’équilibre x (t) = 0 de (1) est globalement asymptotiquement
stable.

Dans le cas général, il n’existe pas de méthode systématique per-


mettant de choisir une fonction de Lyapunov parmi toutes les fonc-
tions candidates possibles. Dès lors, la théorie de Lyapunov conduit
Figure 1 – Terme non constant h2 (x2 (t)) = x32 (t) à des conditions suffisantes de stabilité dont le conservatisme

Copyright © - Techniques de l’Ingénieur - Tous droits réservés S 7 462 – 3

QQW

QQX
r←ヲ←イ・ョ」・@iョエ・イョ・エ
sXPYU

Cahier des charges des automatismes.


Analyse fonctionnelle

par Michel ROUX


Consultant en ingénierie productique R
1. Définitions et rappels concernant les automatismes................... S 8 095 – 2
1.1 Définition du cahier des charges ................................................................ — 2
1.2 Cahier des charges et qualité...................................................................... — 2
1.3 Particularités de l’automatisme .................................................................. — 2
1.4 Architecture CIM .......................................................................................... — 3
1.5 L’automatisme comme un lot séparé ......................................................... — 3
2. Présentation des cahiers des charges................................................ — 4