Vous êtes sur la page 1sur 5

CGE06

EMP, ALGER, 13-14 Avril, 2009

Commande PID Adaptative des Systmes non


Linaires Affines en la Commande
A. Boubakir, S. Labiod, and T.M. Guerra
LAMEL, Facult des Sciences de lIngnieur, Universit de Jijel BP.98, Ouled Aissa, 18000,
Jijel, Algrie
ah_boubakir@yahoo.fr, labiod_salim@yahoo.fr
LAMIH, UMR CNRS 8530, Universit de Valenciennes et du Hainaut-Cambrsis
Le Mont Houy 59313 Valenciennes Cedex 9 France
guerra@univ-valenciennes.fr

Abstract Ce travail prsente une stratgie de commande


PID adaptative pour une classe de systmes non linaires
incertains affines en la commande. Les paramtres rglables
du contrleur PID sont ajusts par un algorithme
dadaptation de type gradient. Cet algorithme est slectionn
pour minimiser une fonction de cot quadratique de lerreur
entre une loi de commande idale inconnue et la loi de
commande PID utilise. La stabilit du systme global boucl
est prouve analytiquement par la mthode directe de
Lyapunov. Une simulation est effectue sur le modle dun
pendule invers pour montrer la faisabilit de la stratgie de
commande propose.
Keywords Algorithme du gradient, commande
adaptative, contrleur PID, systmes non linaires.

I. INTRODUCTION

a commande des systmes est lun des domaines les


plus riches en terme dalgorithmes et doutils de
dveloppement. Au cours des deux dernires dcennies, un
nombre trs important de publications a t consacr au
problme de lanalyse et de la synthse de lois de commande
pour les systmes non linaires. Ce problme prsente
beaucoup de challenges parce que les systmes non linaires
- contrairement au cas de systmes linaires pour lesquels
lautomatique fournit une panoplie de mthodes pour la
synthse de la commande - ne disposent pas doutils et de
mthodes gnrales pour raliser cette analyse et/ou synthse
des lois de commande. Ceci est d au fait que les systmes
non linaires peuvent possder des dynamiques complexes et
des structures extrmement varies.
La commande des systmes non linaires a tout dabord
repos sur la thorie de l'automatique linaire [1].
Lapproche principale consistait linariser la dynamique
non linaire du systme autour dun point de
fonctionnement de telle sorte que les outils de la
commande linaire puissent tre exploits pour la synthse
dune loi de commande assurant les performances
recherches. Cependant, la ncessit de garantir des
performances sur une plage importante de fonctionnement
des systmes a impos la prise en compte de leur
dynamique non linaire globale dans la synthse des lois
de commande.

Lintroduction du formalisme de la gomtrie


diffrentielle et en particulier la technique de linarisation
entre-sortie a connu un succs certain. Elle entre dans le
dveloppement de lois de commande pour une classe de
systmes non linaires, affines en la commande
linarisables par bouclage [1], [2]. Cette classe de
systmes na pas uniquement un intrt mathmatique
mais galement une grande importance pratique, car,
beaucoup de systmes physiques appartiennent cette
classe, tels que les systmes mcaniques et les machines
lectriques. Lide de base de la linarisation par bouclage
est la transformation dun systme non linaire en un
systme linaire, permettant lutilisation des outils de
synthse du linaire. Cependant, cette technique ne peut
tre utilise que pour les systmes non linaires dont le
modle dynamique est suffisamment bien connu. Pour
pallier ce problme, plusieurs approches de commande
adaptative ont t proposes [1], [3], [4]. Dans ces
approches, on suppose que le modle du systme non
linaire peut tre exprim sous la forme dun produit de
fonctions non linaires connues laide de paramtres
inconnus. Malheureusement, il est souvent difficile, voire
impossible de dcrire tous les phnomnes mis en jeu dans
un systme partir de fonctions non linaires connues,
notamment pour un systme physique complexe.
Pour ce type de systmes,
dautres approches
adaptatives utilisant les systmes flous et/ou les rseaux de
neurones ont connu un certain succs [5]. Dans ces
schmas adaptatifs, ltude de la stabilit est fonde sur
lapproche directe de Lyapunov. Deux approches de
commande adaptative ont t investies [5], [6] : lapproche
indirecte et lapproche directe. Dans lapproche indirecte,
les systmes flous et/ou les rseaux de neurones sont
utiliss pour estimer la dynamique du systme, et la loi de
commande se calcule partir de ces estimes [5]-[10]. Par
contre, les approches directes se basent sur
lapproximation par des systmes flous et/ou des rseaux
de neurones de lois de commande idales inconnues et les
paramtres de lapproximateur utilis sont ajusts par une
loi dadaptation issue dune fonction candidate de
Lyapunov [5], [6], [8], [11]-[13].
Dans les applications industrielles, la commande PID
par sa simplicit de conception est la commande la plus

utilise. La synthse dune commande PID consiste


dterminer trois paramtres savoir : le gain proportionnel
K p , le gain dintgration K i et le gain de drivation K d .
Pour les systmes linaires, la mthode de Ziegler-Nichols
[14], est la mthode la plus utilise pour dterminer les
gains K p , K i et K d . En revanche, pour les systmes non
linaires il ny a pas de mthodes systmatiques pour
trouver ces trois gains. Pour cette classe de systmes, la
tendance actuelle est vers la commande PID adaptative
[15], [16], et la commande PID robuste [17], surtout pour
le cas de systmes non linaires incertains ou perturbs.
Dans [15] et [16], les auteurs dveloppent des approches
de commande PID adaptative pour des systmes non
linaires monovariables avec un gain de commande
suppos connu.
Dans ce travail, une approche de commande PID
adaptative pour une classe de systmes non linaires
monovariables affines en la commande est propose. Un
contrleur PID est utilis pour approcher en ligne une loi
de commande idale inconnue. Contrairement aux travaux
de [6], [15], [16], o la loi dadaptation est slectionne
pour assurer la dcroissance dune fonction candidate de
Lyapunov sur lerreur de sortie, la loi dadaptation, dans
ce travail, est slectionne pour minimiser par la mthode
du gradient un critre quadratique de lerreur lentre du
systme, i.e. de lerreur entre la commande idale
inconnue et la sortie du contrleur PID.
Cet article est structur de la manire suivante : la classe
concerne de systmes non linaires monovariables et les
objectifs de la commande sont dcrits dans la section 2.
Lapproche de commande PID adaptative propose est
introduite dans la section 3 avec ltude de la stabilit de
la loi dadaptation et du systme global boucl. Dans la
section 4, la nouvelle stratgie de commande est utilise
pour la commande en poursuite dun pendule invers.
II. POSITION DU PROBLEME
Nous considrons la classe des systmes non linaires
monovariables affines en la commande dcrits par
x1 = x2 , x2 = x3 , , xn 1 = xn

(1)
xn = f ( x ) + g ( x ) u
y = x
1

ou, encore
y ( n) = f ( x ) + g ( x ) u
(2)
avec x = [ x1 , , xn ]
T

mesurable, y

est le vecteur dtat suppos

est la sortie du systme, u

est

lentre de commande, f ( x ) et g ( x ) sont des fonctions


non linaires supposes inconnues.
Le gain de commande g ( x ) est suppos non nul, born
et de signe connu. g ( x ) est donc soit strictement positif,
soit strictement ngatif. Sans perte de gnralit, nous
supposons 0 < g ( x ) < g . Notons que le rsultat de ce
papier peut tre facilement adapt au cas g ( x ) < 0 .
Remarque 1 : Dans les approches directes prsentes
dans [15], [16], le gain de commande g ( x ) est suppos

connu. Par contre, la connaissance de g ( x ) nest plus


ncessaire ici.
Notre objectif est la synthse dune loi de commande
PID adaptative de telle sorte que la sortie y ( t ) suive au
mieux une trajectoire de rfrence yd ( t ) borne et
drivable, tout en garantissant la bornitude de tous les
signaux de la boucle ferme.
Pour atteindre lobjectif de commande, on dfinit
lerreur de poursuite par
e ( t ) = yd ( t ) y ( t )
(3)
et une erreur filtre par
n 1
d

(4)
s (t ) = + e (t ) , > 0
dt

s ( t ) = 0 est une quation diffrentielle qui possde la

solution e ( t ) = 0 . De plus, si s ( t ) avec une


constante positive, lerreur de poursuite et ses drives
vrifient [1],
e( ) ( t ) 2i i n +1, i = 0,1, , n 1
i

(5)

De ce fait, lobjectif de commande devient la


dtermination dune loi de commande avec sa loi
dadaptation paramtrique afin de garantir la convergence
du signal s ( t ) .
La drive temporelle de lerreur filtre (4) peut tre
crite sous la forme
s = v f ( x) g ( x)u
(6)
avec
v = yd( n ) + kn 1e( n 1) +

+ k1e

et
k j = Cnj11 n j

Si les non linarits du systmes sont parfaitement


connues, i.e., si les fonctions non linaires f ( x ) et g ( x )
sont connues, pour atteindre les objectifs de commande, la
loi de commande idale u * suivante est une solution
( f ( x ) + v + s + tanh ( s ) )
u = u* =
(7)
g ( x)
avec > 0 , > 0 , et une constante positive petite.
Effectivement, par substitution de (7) dans (6), il vient
(8)
s = s tanh ( s )
Choisissons la fonction candidate suivante
1
V = s2
(9)
2
la drive temporelle de (9) le long des trajectoires de (8)
se majore par
V s 2
(10)
Ce qui implique la convergence vers zro de s ( t ) et,
par consquent, la convergence de lerreur de poursuite
e ( t ) . Bien entendu, la commande (7) est idale au sens o
les fonctions non linaires

f ( x)

et

g ( x)

sont

videmment inconnues. Le but consiste alors essayer


dapprocher cette loi de commande inconnue.

Remarque 2 : La fonction continue tanh ( ) est utilise

dans (7) afin de doter la loi de commande adaptative qui


sera propose ultrieurement dune certaine robustesse.
III. COMMANDE PID ADAPTATIVE
Dans cette section, un contrleur PID adaptatif sera
utilis pour approcher au mieux la commande idale
inconnue (7). Les trois gains de ce contrleur PID, i.e., le
gain K p , K i et K d seront considrs ici comme les
paramtres rglables. Pour ce faire, un mcanisme
dadaptation sera dvelopp pour minimiser un critre
quadratique de lerreur entre la commande idale inconnue
u * et la commande fournie u pid , issue du contrleur PID.
A. La loi de commande
La loi de commande idale (7) est alors approche par
une commande PID de la forme
t
de ( t )
u = u pid = K p e ( t ) + K i e ( ) d + K d
(11)
0
dt
ou bien
(12)
u = T ( e )
t
de ( t )

avec ( e ) = e ( t ) , e ( ) d ,
, et le vecteur
0
dt

des paramtres ajusts durant la commande, qui est dfini


T

par = K p , K i , K d et e est lerreur de poursuite.

cette quation montre bien que mme si lerreur eu nest


pas disponible, la quantit g ( x ) eu est mesurable. Ce fait

sera exploit pour le choix de la loi dadaptation


paramtrique.
Considrons la fonction de cot quadratique
2
1
1
J ( ) = eu2 = ( u * T ( e ) )
(18)
2
2
une mthode de type gradient est alors utilise pour
minimiser le critre (18). La loi de mise jour propose
pour les paramtres est de la forme
= g ( x ) J ( )
(19)
avec > 0 . De (18), il vient
J ( ) = ( e ) eu

(20)

et par consquent, (19) devient


= ( e ) g ( x ) eu

(21)

a partir de (17), la loi dadaptation des paramtres est


donne par
= ( e ) {s + s + tanh ( s )}
(22)
Pour monter que cette loi dadaptation garantit la
bornitude de lerreur paramtrique , on considre la
fonction suivante
1
V = T
(23)
2
dont la drive temporelle est
V = T

La loi de commande tant choisie, il nous reste alors


dterminer la loi de mise jour des paramtres rglables
.
B. La loi dadaptation paramtrique
Nous supposons que les valeurs optimales recherches
* des paramtres vrifient
u* = T ( e ) *
(13)

en utilisant le fait que = , (24) devient


V = g ( x ) eu2

(24)
(25)

du fait que la fonction g ( x ) est suppose positive, on


peut alors dduire de (23) et (25) que L , i.e.

= supt 0 ( t ) < .

On suppose donc que la commande idale (7) peut tre


reconstruite avec une prcision arbitrairement petite par la
commande PID (12). A partir des quations (7), (12) et
(13), lquation (6) peut tre crite sous la forme
s = s tanh ( s ) + g ( x ) ( u * u )
(14)

Remarque 3 : Il est noter que dans la loi dadaptation


(22) s nest pas disponible cause des incertitudes du
systme. Dans ce papier, s est approche par
s (t ) s (t t )
s (t )

ou, encore
s = s tanh ( s ) + g ( x ) T ( e )

o t est un temps.

(15)

avec = *
Puisque notre but est dapprocher la loi de commande
idale (7) par la commande PID (12), la loi de mise jour
des paramtres est slectionner pour minimiser
lerreur lentre du systme eu dfinie par
eu = u * u = u * u pid = T ( e )

(16)

et pour garantir galement la bornitude de lerreur


paramtrique . Cependant, du fait que u * est inconnue
dans (16), lerreur eu ne peut tre dtermine. Nanmoins,
partir de (14) on peut crire
g ( x ) eu = s + s + tanh ( s )
(17)

C. Convergence de lerreur de poursuite


Pour tudier la convergence de lerreur de poursuite
ainsi que la stabilit de la boucle ferme, nous considrons
la fonction candidate suivante
1
1
(26)
V = s2 + T
2
2

par drivation et en supposant que * 0 , on obtient


1
V = ss T

(27)

en utilisant les quations (14) et (22), lquation (27)


scrit

V = s 2 s tanh ( s ) + sg ( x ) eu

(28)

T ( s + s + tanh ( s ) )

par substitution de (16) et (17) dans (28), on obtient


V = s + sg ( x ) eu s tanh ( s ) g ( x ) e
2

2
u

( 0 ) = 0 . Les paramtres de synthse sont


(29)

en utilisant lingalit
1
1
g ( x ) seu g ( x ) s 2 + eu2
2
2
et comme s tanh ( s ) 0 , lquation (29) peut tre

borne par

g ( x) 2 1
2
V
s g ( x ) eu
2
2

La commande PID (12) avec la loi dadaptation (22)


sont appliques au pendule invers. Les conditions
initiales choisies sont : x1 ( 0 ) = 0, 2 ; x2 ( 0 ) = 0 ;

(30)

choisis

comme suit : = 5 ; = 3 ; = 5 ; = 0, 01 ; = 20 .
Les rsultats de simulation de y = x1 et y = x2 sont
donns respectivement dans les figures 2 et 3. Le signal de
commande u ( t ) et lerreur filtre s ( t ) sont montrs dans
les figures 4 et 5. La figure. 6 montre lvolution de la
norme des paramtres ajusts ( t ) . Les gains de

(31)

g
, alors on
2
en dduit la bornitude de et la convergence vers zros
de s ( t ) et par consquent la convergence de lerreur de

Si on suppose que est choisi tel que

poursuite e ( t ) vers zros quand t .


IV. RESULTATS DE SIMULATION
Pour valider lapproche de commande PID adaptative
propose, nous considrons le problme de commande en
poursuite dun pendule invers (Fig. 1). Le modle
dynamique de ce dernier est donn par [5], [8], [12].
x1 = x2

(32)
x2 = f ( x ) + g ( x ) u + d
y = x
1

avec
x1

commande K p , K i et K d , sont montrs respectivement


dans les figures 7, 8 et 9. On remarque que les trajectoires
relles convergent vers les trajectoires dsires, et que le
signal de commande et les paramtres estims sont borns.
V. CONCLUSION
Dans cet article, nous avons propos un schma de
commande PID adaptative pour les systmes non linaires
monovariables affines en la commande. Le schma est
compos dune loi de commande PID avec sa loi
dadaptation. Dans ce schma, un contrleur PID est
utilis pour approcher en ligne une commande idale
inconnue, et la loi de mise jour des paramtres rglables
du contrleur PID est slectionne afin de minimiser
lerreur lentre du systme, i.e. pour minimiser une
fonction quadratique de lerreur entre la commande idale
inconnue et la sortie du contrleur PID qui reprsente le
signal de commande. Cette approche nexige pas la
connaissance du modle dynamique du systme et garantit
la bornitude de tous les signaux de la boucle ferme et la
convergence vers zro de lerreur de poursuite. Les
rsultats de la simulation effectue sur un pendule invers
permettent dillustrer lanalyse thorique.

2l

y
u

mc

yd
Fig. 1. Systme pendule invers utilis en simulation.
f ( x) =

g sin x1 m m p x22 cos x1 sin x1

(4 3 m m

g ( x) =

cos 2 x1 )

m cos x1

(4 3 m m

cos 2 x1 )

(33)

Fig. 2. Sortie du systme y , sortie dsire yd .


(34)

avec m = 1 ( m p + mc ) , x1 est la position angulaire du


pendule et x2 sa vitesse angulaire. Dans cet exemple, les
valeurs suivantes sont utilises : g = 9,8 m s 2 , mc = 1 kg ,
m p = 0,1 kg , = 0,5 m , et d est une perturbation externe

y
yd

donne par d = 0,5sin ( 2t ) e 0,1t . Notre objectif est de


forcer la sortie du systme de suivre la trajectoire :
yd ( t ) = 0.5sin ( t ) .

Fig. 3. Evolution temporelle de y et yd

Fig. 4. Signal de commande u applique au systme.

Fig. 9. Gain de drivation K d


REFERENCES
[1]
[2]
[3]
[4]
[5]

Fig. 5. Erreur filtre s .

[6]
[7]
[8]

[9]
[10]

Fig. 6. Norme ( t ) .

[11]
[12]
[13]
[14]
[15]

Fig. 7. Gain proportionnel K p

[16]
[17]

Fig. 8. Gain dintgration K i

J. E. Slotine and W. Li, Applied nonlinear control. Prentice Hall,


Englewood Cliffs, NJ, 1991.
A. Isidori, Nonlinear control systems. 2nd Ed. Springer Verlag,
Berlin, Germany, 1989.
P. A. Ioannou and J. Sun, Robust adaptive control. Englewood
Cliffs, NJ: Prentice-Hall, 1995.
M. Krstic, I. Kanellakopoulos, and P. Kokotovic, Nonlinear and
adaptive control design. New York: Weley Interscience, 1995.
L. X. Wang, Adaptive Fuzzy Systems and Control: Design and
stability analysis. Prentice-Hall, Englewood Clifs, NJ, 1994.
J. T. Spooner and K. M. Passino, Stable adaptive control using
fuzzy systems and neural networks, IEEE Trans. Fuzzy Syst., vol.
4, no. 3, pp. 339-359, 1996.
R. Boukezzoula, S. Galichet, and L. Foulloy, Apprentissage de lois
de commande floues pour les systmes non linaires (synthse
directe et indirecte), in Conf. LFA98, Rennes, 1998, pp. 19-27.
Y. C. Chang, Adaptive fuzzy-based tracking control for nonlinear
SISO systems via VSS and H approaches, IEEE Trans. Fuzzy
Syst., vol. 9, no. 2, pp. 278-292, Apr 2001.
S. Labiod, M. S. Boucherit, and T. M. Guerra, Commande
adaptative floue dune classe de systmes non linaires
monovariables, in Conf. LFA03, Tours, 2003, pp. 169-176.
S. H. Tong, Q. Li, and T. Chai, Fuzzy adaptive control of a class of
nonlinear systems, Fuzzy sets and Systems, vol.101, no. 1, pp. 3139, 1999.
V. Gazi and K. M. Passino, Direct adaptive control using dynamic
structure fuzzy systems, in Proc. ACC, Illinois, June 2000, pp.
1954-1958.
S. Labiod and M. S. Boucherit, Direct stable fuzzy adaptive
control of a class of SISO nonlinear systems, Archives of Contr.
Sci., vol. 13, no. 1, pp. 95-110, 2003.
Y. Tang, N. Zhang, and Y. Li, Stable fuzzy adaptive control for a
class of nonlinear systems, Fuzzy sets and Systems, vol. 104, no.
22, pp. 279-288, 1999.
K.J. Astrom and B. Wittenmark, Adaptive control. AddisionWesley, New York, 1995.
W.D. Chang, R.C. Hwang, and J.G. Hsieh, A self-tuning PID
control for a class of nonlinear systems based on the Lyapunov
approach, J. of Process Contr., vol. 12, no. 2, pp. 233-242, 2002.
M. Feki, An adaptive feedback control of linearizable chaotic
systems, Chaos, Solitons and Fractals, vol. 15, no.5, pp. 883-890,
2003.
E.M. Jafarov, M.N.A. Parlak1, and Y. Istefanopulos, A new
variable structure PID-controller design for robot manipulators,
IEEE. Trans. On Contr. Syst. Tech., vol. 13, no. 1, pp. 122-130,
2005.