Mii 00013

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE LARBI BEN M’HIDI OUM EL BOUAGHI

FACULTE DES SCIENCES ET DE LA TECHNOLOGIE
DEPARTEMENT DES SCIENCES ET DE LA TECHNOLOGIE
Master Informatique Industrielle
THEME
Commande du système pendule – chariot

par les techniques de l'espace d'état
Encadré par: Réalisé par:

G. Debbache Tioura Amina
Zeroual Wassila
Promotion: 2010/2011
Sommaire
Introduction générale………………………………………………………….1
Chapitre 1 : Description et modélisation du système pendule - chariot
1.1. Introduction…………………..............…………………………………………………..2
1.2. Description………………………………………………………………………………..2
1.3. Modélisation mathématique……..………………………………………………..….….2

1.4. Linéarisation du modèle…………..………………………………………...…………...4
1.5. Etude de stabilité……….……………………………………………………......……….5
1.6. Conclusion………………………………………………………….…………………..…7
Chapitre 2 : Commande par placement de pôles
2.1. Introduction……..…..……………………………………………………………………8
2.2. Principe de la commande par placement de pôles……………….………………….....8

2.2.1. Contrôlabilité…...………….………………………………………………...………....9
2.2.2. Calcul du gain du retour d'état…...………...…………………….………………….10
2.2.3. Placement de pôles avec MATLAB...…………………………………….……….…11
2.2.4. Application au pendule inversé………...………………………………………….…11
2.3. Commande par placement de pôles plus action intégrale……………………………13
2.4. Conclusion……….………………………………………………………………………15
Chapitre 3 : Commande linéaire quadratique
3.1. Introduction……..…..…………………………………………………………………..16
3.2. Principe de la commande LQR………………………...………….…………………...16

3.3. Choix des matrices de pondération…......………….………………………...………..17
3.4. Application au pendule inversé………......………………………………………….…17
3.5. Commande LQR avec action intégrale…………………………..……………………20
3.6. Conclusion……….………………………………………………………………………23
Conclusion générale…………………………………………………………………….24
Bibliographie……………………………………………………………………………...25
Introduction générale
Introduction générale
La plupart des procédés physiques montrent un comportement hautement non linéaire, et de ce

fait ils présentent un défi des points de vue modélisation, analyse et commande. Dans ce cadre,
le système pendule – chariot représente un exemple type des systèmes non linéaires et instables;
il est très utilisé comme outil de test que ce soit sur le plan pédagogique ou sur le plan de
recherche.
L'objectif de ce travail est d'appliquer deux techniques de la commande dans l'espace d'état, à
savoir, la commande par placement de pôles et la commande linéaire quadratique (LQR). Le but
est d'évaluer les performances de ces techniques de commande linéaire sur un système test non
linéaire et instable.
Le présent mémoire est organisé comme suit:
Dans le premier chapitre, nous présenterons une description physique du système pendule –
chariot sujet de cette étude. Nous utiliserons le formalisme de Lagrange Euler pour établir les
équations dynamiques du système. La linéarisation du modèle non linéaire obtenu autour du
point d'équilibre désiré, nous fournira un modèle linéarisé. Ce modèle linéarisé sera par la suite
notre outil pour l'analyse de la stabilité en boucle ouverte et la conception des techniques de
commande dans les chapitres 2 et 3.
Dans le chapitre 2, nous commencerons par donner un aperçu sur la commande dans l'espace
d'état par la technique de placement de pôle. Nous établirons aussi les conditions de son
application. Par la suite, la commande par placement de pôle est appliquée au système pendule –
chariot pour assurer sa stabilité. Pour éliminer les effets des perturbations statiques, il est
nécessaire d'ajouter une action intégrale à la technique de commande par placement de pôle.
Dans le chapitre3, nous commencerons par donner un bref description de la commande linéaire
quadratique (LQR). L'application de LQR au système pendue – chariot est étudiée. Pour
éliminer l'effet de frottement sec, nous appliquerons la commande LQR au système augmentée
par l'introduction de l'action intégrale.
1
CHAPITRE 1: Description et modélisation du système pendule - chariot
CHAPITRE 1
Description et modélisation du système pendule - chariot
1.1. Introduction :
Dans ce chapitre nous allons décrire et modéliser le système pendule - chariot, objet de notre
étude de commande. La section 2 portera sur la description physique du système pendule -
chariot, la section 3 présentera la modélisation mathématique, et la section 4 traitera la
linéarisation du modèle non linéaire du pendule autour du point d'équilibre choisi. La section 5
étudie la stabilité du système en boucle ouverte et la section 6 conclut le chapitre.
1.2. Description
Le système considéré est un pendule simple monté sur un chariot. Le mouvement du chariot doit
maintenir le pendule dans sa position d'équilibre instable (masse dirigée vers le haut). Voici un
schéma du dispositif.
Fc
Figure 1.1. Description du système pendule – chariot.

Le pendule de longueur 2l et de masse m dont l'axe de suspension est lié au chariot de masse
M et soumis à une force F , peut se déplacer sur un axe horizontal. Initialement le système est
au repos, les frottements situés au niveau de l'axe de rotation sont négligés, les frottements dus
au déplacement du chariot sont notés Fc .
Le principe du système est très simple en théorie : quand le pendule penche vers la droite, le
chariot doit le rattraper en effectuant un mouvement vers la droite et inversement. La difficulté
c'est de régler le déplacement horizontal du chariot en fonction de l'angle que le pendule fait
avec la verticale.
1.3. Modélisation mathématique

Pour obtenir les équations d'état de ce système, nous allons faire appel à la formulation de
Lagrange-Euler. Etant donné un système à n degré de liberté ou ayant n coordonnées
généralisées, une énergie potentielle E p et une énergie cinétique Ec , la formulation de
Lagrange Euler s'écrit comme:
2
d æç ¶L ö÷ ¶L
ç ÷- = ui , i = 1..n (1.1)
dt çè ¶qi ÷ø÷ ¶qi
.
où qi est i-ième coordonnée généralisée, q i est la première dérivée de qi , L = Ec - E p est le
Lagrangien du système, est ui est la i-ième force généralisée qui agit sur qi .
x
y m
q V
lq
l
u(F
t)
M x
Fc
Figure 1.2. Forces et vitesses du système pendule – chariot.

Les énergies cinétique et potentielle du système pendule - chariot sont données par
1 1 1
EC = mV 2 + J q 2 + Mx 2
2 2 2 (1.2)
E p = mgl cos q
où le vecteur vitesse est

V 2 = x 2 + (l q)2 + 2l qx cos q (1.3)
D'où
1 1
Ec = (m + M )x 2 + (ml 2 + J )q 2 + ml qx cos q (1.4)
2 2
Le Lagrangien du système est L = Ec - E p . On procède aux calculs nécessaires pour établir
(1.1).
¶L
= (m + M )x + ml q cos q
¶x (1.5)
¶ ¶L
= (m + M )x + ml q cos q - ml q 2 sin q
¶t ¶x
Puisque
¶L
=0 (1.6)
¶x
Nous avons
¶ ¶L ¶L
- = F - Fc (1.7)
¶t ¶x ¶x
Donc
(m + M )x + ml q cos q - ml q2 sin q = F - Fc (1.8)
3
De même
¶L
 = (ml 2 + J )q + mlx cos q
¶q (1.9)
¶ ¶L
 = (ml 2 + J )q + mlx cos q - ml qx sin q
¶t ¶q
et
¶L
= -ml qx sin q + m lg sin q (1.10)
¶q
On a
¶ ¶L ¶L
- =0 (1.11)
¶t ¶q ¶q
Ce qui donne:
(ml 2 + J )q + mlx cos q - mgl sin q = 0 (1.12)
Enfin, les équations de mouvement du chariot-pendule sont:
(ml 2 + J )q + mlx cos q - mgl sin q = 0
(1.13)
(m + M )x + ml q cos q - ml q 2 sin q = F - Fc
Soit encore:
é ml cos q (ml 2 + J )ù éxù é mgl sin q ù é0 ù
ê úê ú = ê ú + ê ú (F - F )
ê ú ê ú ê  2 ú ê1 ú c (1.14)
(m + M ) ml cos q q ml q sin q
ëê ûú ëê ûú ëê ûú êë úû
Soit
-1
éxù é ml cos q (ml 2 + J )ù æç é mgl sin q ù é0ù ö
ê ú=ê ú çê ú + ê ú (F - F )÷÷÷
ê ú ê ú çê ú ê ú c ÷ (1.15)
êëqûú êë(m + M ) ml cos q úû èçç ëêml q sin q ûú êë1 úû ÷
2
ø÷
é .2
ù é
éxù ê l 2m 2 1-(cos2 q +) mMl 2 +J (m +M ) - l 2m 2 1-cos
ml 2 +J lm q sin q gl 2m 2 cos q sin q
ú ml 2 +J ù
ê ú=ê ( ) ( 2
q )+mMl +J (m +M ) ú
2
ê l m (1-cos q)+mMl 2 +J (m +M ) ú
2 2 2
ê ú ê ú + êê ú (F - Fc )
êëq ûú ê 2 2 (M2+m ) glm sin q .2
l 2m 2 q cos q sin q ú
-lm cos q ú
êë l m (1-cos q)+mMl 2 +J (m +M ) - l 2m 2 (1-cos2 q)+mMl 2 +J (m +M ) úû ëê ( ) ûú
2 2 2 2
l m 1-cos q + mMl +J (m + M )
(1.16)
1.4. Linéarisation du modèle:

La linéarisation du modèle nous permet d'étudier le comportement local du système pendule
chariot autour d'un point d'équilibre choisi. De plus, cette linéarisation est nécessaire pour le
calcul d'un régulateur linéaire capable de stabiliser le système autour de ce point d'équilibre.
A cet effet, nous avons choisi comme de stabiliser le système au point (0,0,0,0), c-à-d que le
système sera étudié et contrôlé pour rester ou revenir à ce point à chaque fois qu'il est perturbé.
En considérons qu'autour du point (0,0,0,0), q est très petite, alors cos q » 1 et sin q » q , nous
obtenons une première approximation:
4
é 2 .2
ù
éxù ê (ml 2+J )lm q q - 2gl 2m 2q ú é 2ml 2 +J ù
ê ú=ê mMl +J ( m + M ) mMl +J (m + M ) ú + êê mMl +J (m +M ) úú (F - Fc ) (1.17)
ê ú ê (M +m ) glmq ú ê 2 -lm
êëq úû ê 2 mMl +J (m +M ) úû
.2
- l 2m 2 q q ú
ë mMl +J (m +M ) mMl +J (m +M ) û ë
2
. .
En prenant comme variables d'état x 1 = x , x 2 = x , x 3 = q, x 4 = q , les équations d'état non
linéaires du système pendule - chariot sont données par:
é x. 1 ù é x2 ù é 0 ù
ê ú ê ú ê ú
ê . ú ê (ml 2 +J )lm ú
êx 2 ú ê mMl 2 +J (m +M ) x 3x 42 - mMl 2 gl+Jm(m +M ) x 3 ú êê mMl 2ml+J+(mJ +M ) úú
2 2 2
ê ú=ê ú+ê ú (F - Fc ) (1.18)

ê. ú ê x4 ú ê 0 ú
x
ê ú ê3
ú ê
ê . ú ê (M +m ) glm ú
ú ê 2 -lm ú
êx 4 ú ê 2 x - l 2m 2
x x 2
ú
êë úû ë mMl +J (m +M ) 3 mMl 2 +J (m +M ) 3 4 û êë mMl +J (m +M ) úû
Enfin, si on opère un développement de Taylor du premier ordre des termes non linéaires autour
du point d'équilibre (0,0,0,0), nous aurons les équations d'état linéaires du système pendule -
chariot données par:
é x. 1 ù é0 1 0 0ù é 0 ù é 0 ù
ê ú ê ú éx1 ù ê ú ê ú
ê. ú ê 2 2 ú ê ú ê ml 2 +J ú ê ml 2 +J ú
êx 2 ú ê 0 0 - mMl 2 gl+Jm(m +M ) 0ú êx 2 ú ê mMl 2 +J m +M ú ê mMl 2 +J (m +M ) ú
ê ú ê úê ú+ê ( )
ê ú Fc
ê . ú = ê0 0 0 1 ú êx 3 ú ê 0
ú
ú
u -
ê 0 ú
(1.19)
êx 3 ú ê úê ú ê ú ê ú
ê. ú ê (M +m ) glm ú êx 4 ú ê ú ê ú
êx 4 ú ê0 0
-lm
0ú ë û êë mMl 2 +J (m +M ) úû
-lm
êë mMl 2 +J (m +M ) úû
êë úû ë mMl 2 +J (m +M ) û
Où u = F est le signal de commande. Le dernier terme dans (1.19) représente la perturbation
introduite par les forces de frottement sur les roues du chariot.
Pour les valeurs des paramètres physiques M = 2Kg ,m = 0.1Kg ,l = 0.5m ,g = 9.81m / sec2 et
1
J = ml 2 , nous avons le modèle linéaire suivant:
3
é. ù
ê x 1 ú éê0 1 0 0ù é x1 ù é
úê ú ê
0 ù
ú
é
ê
0 ù
ú
ê. ú ê
êx 2 ú ê0 0 -0.3633 0úú êx 2 ú êê 0.4938 úú ê 0.4938 ú
ê ú
ê ú=ê úê ú+ê úu - ê ú Fc (1.20)
ê . ú ê0 0 0 1 ú êx 3 ú ê 0 ú ê 0 ú
êx 3 ú ê ú êêx úú ê ú ê ú
ê ú
êx. 4 ú ëê0 0 15.26 0ú ë 4 û ê-0.7407 ú ê-0.7407 ú
êë úû û ë û ë û
1.5. Etude de stabilité:

Le concept de stabilité est très important dans le fonctionnement de tout système physique. Dans
cette section nous allons étudier la stabilité en boucle ouverte du système pendule chariot.
Une méthode simple pour l'évaluation de la stabilité d'un système linéaire est de calculer les
valeurs propres de sa matrice d'évolution, données par la solution du polynôme caractéristique.
Avec la matrice d'évolution du modèle linéarisé du système pendule chariot:
5
é0 1 0 0ù
ê ú
ê0 0 -0.3633 0úú
ê
A=ê ú
ê0 0 0 1ú
ê ú
ê0 0 15.26 0ú
ë û
le polynôme caractéristique est donné par.
lI - A = l 4 - 15.26l 2 = l 2 (l 2 - 15.26)
D'où nous avons l1 = l2 = 0,l3 = 3.9,l4 = -3.9 ; donc deux valeurs propres nulles et une
valeur propre positive. Le système est donc instable à ce point d'équilibre.
Ce résultat est confirmé par la réponse en boucle ouverte montrée sur la figure 1.3.
700
600
500
400
θ(t)
300
200
100
0
0 0.5 1 1.5 2
t (sec)
-2
-4
-6
x(t)
-8
-10
-12
-14
-16
0 0.5 1 1.5 2
t (sec)
Figure 1.3. Réponse en boucle ouverte du système pendule chariot.
6
1.6. Conclusion
Ce chapitre a permet d'établir le modèle du système étudié. La linéarisation a permet d'obtenir
un modèle d'état linéaire autour du point d'équilibre considéré. L'analyse de stabilité a montré
que le système est instable, et nécessite donc une correction pour fonctionner proprement.
7
CHAPITRE 2: Commande par placement de pôles
CHAPITRE 2
Commande par placement de pôles
2.1. Introduction
Dans cette section nous présenterons une méthode de commande appelée la technique du
placement de pôles. Nous supposerons que toutes les variables d'état sont mesurables et sont
disponibles pour la rétroaction. Si le système considéré est complètement contrôlable, alors les
pôles du système en boucle fermée peuvent être placés à n'importe quel endroit désiré au moyen
d'un retour d'état à travers une matrice de gain approprié.
2.2. Principe de la commande par placement de pôles

Considérons les équations d'état linéaires du système pendule - chariot données par:
.
x = Ax + Bu - BFc (2.1)
Avec
é0 1 0 0ù é 0 ù
ê ú ê ú
ê 0 -0.3633 0úú ê 0.4938 ú
ê0 ê ú
A=ê ú,B = ê ú
ê0 0 0 1ú ê 0 ú
ê ú ê ú
ê0 0 15.26 0ú ê-0.7407 ú
ë û ë û
Le but de la commande par placement de pôles est d'imposer au système un comportement
spécifié ou des performances désirées à travers l'application d'une loi de commande qui place les
pôles du système en boucle fermée aux positions qui réalisent ces performances. La
détermination des pôles désirés en boucle fermée est basée sur des critères de réponse transitoire
et/ou de réponse fréquentielle, telles que la vitesse, l'amortissement, ou la bande passante, aussi
bien que sur des conditions sur le régime permanant.
Im
Placement
de pôles
Re
Pôles en BO
Pôles en BF
Figure 2.1. Principe du placement de pôles.
Cette tâche peut être accomplie en utilisant la loi de commande suivante:
8
u = -Kx (2.2)
Ce qui signifie que le signal de commande est déterminé par le vecteur d'état instantané. Une
telle loi de commande est appelée retour d'état. La matrice K de dimension (1 ´ n ) est
appelée matrice de gain.
La figure 2.2 montre le système défini par l'équation (2.1), en boucle ouverte puis en boucle
fermée, sous l'effet de la loi de commande (2.2).
u x x
B
+
Ä ò B
+
Ä ò
+ +
u
A A
-K
a b
Figure 2.2. (a) Système en boucle ouverte, (b) Système en boucle fermée avec u = -Kx .
La substitution de l'équation (2.2) dans l'équation (2.1) donne:

.
x = (A - BK )x (2.3)
La solution de cette équation est donnée par:
x (t ) = e (A-BK )t x (0) (2.4)
où x (0) est l'état initial. Les caractéristiques de stabilité et de la réponse transitoire sont
déterminées par les valeurs propres de la matrice [A - BK ] . Si la matrice de gain K est
choisie correctement, la matrice [A - BK ] peut être une matrice stable, et pour chaque
x (0) ¹ 0 , il est possible que le vecteur x (t ) tend vers 0 quand t tend vers l'infini. Les valeurs
propres de la matrice [A - BK ] sont appelées les pôles de régulation. Si ces pôles de régulation
sont placés dans le côté gauche du plan s , alors x (t ) tend vers 0 lorsque t tend vers l'infini.
Mais avons tout ça, le système doit vérifier une condition nécessaire et suffisante pour pouvoir
placer ses pôles via un retour d'état.
2.2.1 Contrôlabilité
Le système décrit par l'équation (2.1) est dit contrôlable à t = t0 s'il est possible de construire
un signal de commande sans contrainte qui transférera l'état initial à n'importe quel état final
dans un intervalle fini de temps t0 £ t £ t1 .
Si chaque état est contrôlable, alors le système est dit complètement contrôlable.
La condition nécessaire et suffisante pour que le système (2.1) est complètement contrôlable, est
que le rang de la matrice (n ´ n ):
M = éêB AB  An -1B ùú (2.5)

ë û
9
(dite matrice de contrôlabilité) est n .
2.2.2 Calcul du gain du retour d'état

Pour calculer la matrice de gain K nécessaire pour le placement de pôles, plusieurs méthodes
existent dans la littérature. Dans ce qui suit nous exposerons trois d'entre elles.
Substitution directe
Pour les systèmes d'ordre inférieur ou égal à 3, on peut substituer le gain K = éêk1 k2 ... kn ùú
ë û
directement dans le polynôme de caractéristique de sI - [A - BK ] . Si le comportement désiré
est spécifié à travers la sélection de n valeurs propres désirées m1, m2 ,..., mn , alors le polynôme
caractéristique désiré en boucle fermée est donné par:
pBF (s ) = (s - m1 )(s - m2 )...(s - mn ) = s n + a1s n -1 + ... + an -1s + an (2.6)
Comme le système en boucle fermée doit avoir comme pôles ceux du polynôme désiré pBF (s ) ,
l'égalité suivante doit être vérifiée:
sI - [A - BK ] = pBF (s ) = s n + a1s n -1 + ... + an -1s + an (2.7)
Ce qui donne comme solution les éléments du vecteur gain k1, k2 ,..., kn .
Forme contrôlable
Si le système est contrôlable (qui est la condition nécessaire et suffisante pour le placement des
pôles), on peut définir la transformation d'état x = Tz , avec la matrice de transformation
T = MW , avec
éan -1 an -2  a1 1 ù
ê ú
êan -2  a1 1 0úú
ê
ê ú
W =ê    . ú
ê ú
ê a1 1 . 0 ú
ê ú
ê 1 0  0 0úú
êë û
Et
sI - A = s n + a1s n -1 + ... + an -1s + an .
Alors le vecteur gain est donné par la formule:
K = éêan - an an -1 - an -1 ... a1 - a1 ùú T -1 (2.8)

ë û
Formule d'Ackermann
La formule d'Ackermann pour la détermination de la matrice de gain K est donnée par
l'équation suivante :
K = éê0 ... 0 1ùú M -1F(A) (2.9)

ë û
où
10
F(A) = An + a1An -1 + ... + an -1A + an I (2.10)
2.2.3 Placement de pôles avec MATLAB

Sous matlab, on peut utiliser la formule suivante:
K = place(A, B, Pbf).
Ou la formule d'Ackermann:
K = acker(A, B, Pbf).
2.2.4 Application au système pendule - chariot

Dans cette section, nous allons appliquer la commande par retour d'état pour stabiliser le système
pendule chariot à la position zéro, et ceci quelque soit les conditions initiales.
Nous avons vu dans le chapitre 1 que les valeurs propres en boucle ouverte du système pendule
chariot sont l1 = l2 = 0,l3 = 3.9,l4 = -3.9 ; donc deux valeurs propres nulles et une valeur
propre positive. Le système est donc instable à ce point d'équilibre.
Pour stabiliser le système nous avons choisi un comportement décrit par le polynôme désiré:
pBF (s ) = (s 2 + 4s + 4)(s 2 + 8s + 16)
Soit un amortissement unité, et des valeurs propres désirées : l1 = l2 = -2,l3 = l4 = -4 .

Le calcul sous matlab avec la commande acker donne le vecteur de gain :
K = [-8.8073 -13.2110 -96.6726 -25.0073 ]
Et la loi de commande est donnée par:

u = -Kx = 8.8073x 1 + 13.2110x 2 + 96.6726x 3 + 25.0073x 4
L'application au système est schématisée par la figure 2.3.
x1
Mesure des
variables d'état
u
x3 x
Fc
-K
Figure 2.3. Schéma de commande par placement de pôles du système pendule chariot.
Les résultats de simulation pour un frottement nul, sont donnés par la figure 2.4. On peut
remarquer qu'après un bref transitoire les positions du pendule et du chariot se stabilisent à la
position désirée. La commande est un peu forte, mais c'est le prix à payer pour une dynamique
rapide qui permet de minimiser les oscillations du pendule.
11
0.6 1
0.5
0.5
0.4
0.3 0
0.2
-0.5
dθ(t)/dt
θ(t)
0.1
-1
0
-0.1 -1.5
-0.2
-2
-0.3
-0.4 -2.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
1.6 3
1.4 2.5
2
1.2
1.5
1
1
dx(t)/dt
x(t)
0.8
0.5
0.6
0
0.4
-0.5
0.2 -1
0 -1.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
60
50
40
30
u(t)
20
10
-10
-20
0 2 4 6 8 10
t (sec)
Figure 2.4. Performances de la commande avec frottement nul.
Le deuxième test concerne l'analyse de l'effet du frottement sur les performances de la

commande. A cet effet, un frottement sec Fc = d .sign (x 4 ) est introduit avec d = 5 . Les résultats
de simulation sont donnés par la figure 2.5. On peut remarquer que cette technique de commande
ne peut supprimer l'effet du frottement sur la position du chariot. Ceci s'explique par le fait que le
mouvement s'arrête dés que la vitesse du chariot s'annule.
12
0.6 0.5
0.5
0
0.4
0.3 -0.5
0.2
dθ(t)/dt
θ(t)
-1
0.1
0 -1.5
-0.1
-2
-0.2
-0.3 -2.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
2 2.5
2
1.5
1.5
1
1
dx(t)/dt
x(t)
0.5 0.5
0
0
-0.5
-0.5
-1
-1 -1.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
60
50
40
30
u(t)
20
10
-10
-20
0 2 4 6 8 10
t (sec)
Figure 2.5. Performances de la commande avec frottement.
2.3. Commande par placement de pôles plus action intégrale

Pour annuler l'effet d'une perturbation statique, il est bien connu que l'action intégrale est très
bénéfique. La technique consiste à introduire un intégrateur sur l'état sujet à cette perturbation,
puis réaliser la commande par placement de pôles sur le système augmenté.
Considérons les équations d'état linéaires du système pendule - chariot données par (2.1). La
position du chariot est l'état perturbé par le frottement sec. Alors l'intégrateur est défini par l'état:
x5 = ò x3 (2.11)
13
D'où nous aurons le système augmenté d'ordre n + 1 donné par:

.
x = Aa x + Bau - Ba Fc (2.12)
Avec
é0 1 0 0 0ù é 0 ù
ê ú ê ú
ê0 0 -0.3633 0 0úú ê 0.4938 ú
ê ê ú
ê ú ê ú
Aa = ê0 0 0 1 0ú , Ba = ê 0 ú
ê ú ê ú
ê0 0 15.26 0 0ú ê-0.7407 ú
ê ú ê ú
ê0 0 1 0 0úú ê 0 ú
êë û êë úû
Et
T
x = éêx 1 x 2 x 3 x 4 x 5 ùú
ë û
La commande par placement de pôles est donnée par:
u = -Kx (2.13)
Avec : K = éêk1 k2 k 3 k 4 k5 ùú
ë û
Où le terme k5 est lié à l'action intégrale.
Le système augmenté décrit par l'équation (2.12) est toujours contrôlable.
Le comportement désiré est spécifié à travers la sélection de n + 1 valeurs propres désirées
m1, m2,..., mn +1 , alors le polynôme caractéristique désiré en boucle fermée est donné par:
pBF (s ) = (s - m1 )(s - m2 )...(s - mn )(s - mn +1 ) = s n +1 + a1s n + +a2s n -1... + ans + an +1

Les techniques de calcul du gain K sont les mêmes décrites dans la section 2.2.2.
Pour stabiliser le système pendule chariot, nous avons choisi un comportement décrit par le
polynôme désiré:
pBF (s ) = (s + 6) (s 2 + 4s + 4)(s 2 + 8s + 16)
Soit un amortissement unité, et des valeurs propres désirées :

l1 = l2 = -2,l3 = l4 = -4,l5 = -6 .
Le calcul sous matlab avec la commande acker donne le vecteur de gain :
K = [-88.0734 -59.738 -246.716 -64.125 -52.844 ]

u = -Kx = 88.073x 1 + 59.738x 2 + 246.716x 3 + 64.125x 4 + 52.844 ò x 3
Les résultats de simulation pour un frottement sec, sont donnés par la figure 2.6. On peut
remarquer qu'après un bref transitoire les positions du pendule et du chariot se stabilisent à la
position désirée. La commande est sensiblement augmentée à cause de l'action intégrale qui doit
être limitée en pratique.
14
0.6 1
0.5
0.4 0
-0.5
0.2 -1
dθ(t)/dt
-1.5
θ(t)
0 -2
-2.5
-0.2 -3
-3.5
-0.4 -4
0 5 10 15 0 5 10 15
t (sec) t (sec)
1.4 4
1.2
3
1
0.8
2
0.6
dx(t)/dt
x(t)
0.4 1
0.2
0
0
-0.2
-1
-0.4
-0.6 -2
0 5 10 15 0 5 10 15
t (sec) t (sec)
200
150
100
u(t)
50
-50
0 5 10 15
t (sec)
Figure 2.6. Performances de la commande avec action intégrale et frottement.
2.4. Conclusion
Dans ce chapitre nous avons montré qu'il est possible de stabiliser le système pendule chariot,
non linéaire et instable, à l'aide d'une commande linéaire qui est le placement des pôles.
L'introduction de l'action intégrale a permet d'éliminer l'effet du frottement sec et la convergence
des états du système vers le point d'équilibre désiré.
15
CHAPITRE 3: Commande linéaire quadratique
CHAPITRE 3
Commande linéaire quadratique
3.1. Introduction
Dans ce chapitre nous allons étudier l’application de la commande linéaire quadratique (LQR) à la
stabilisation du système pendule chariot. Nous commencerons par rappeler le principe de la commande
LQR. Nous verrons ensuite son application au système étudié. Enfin, nous discuterons l'introduction
d'une action intégrale pour éliminer l'effet du frottement sec.
3.2. Principe de la commande LQR

On parle de commande linéaire quadratique: LQ ou LQR pour linear quadratic regulator. Le
système est et le critère est. La commande optimale est un retour d'état.
Soit le système linéaire :
.
x = Ax + Bu (3.1)
Et la condition initiale x (0) = x 0 .
Soit le critère quadratique de performance:
1 ¥ T
(x Qx + uT Ru )dt
2ò0
J (x 0 , u ) = (3.2)
Les matrices Q et R étant symétriques avec Q ³ 0 et R > 0 .

Le problème consiste à déterminer la commande "optimale" qui minimise le critère (3.2). Ce
problème peut être formulé comme suit:
déterminer la commande u(t ) qui minimise J (x 0 , u )
.
x = Ax + Bu (3.3)
sous les contraintes
x (0) = x 0
Le problème (3.3) est un problème d'optimisation sous contrainte. Il peut être transformé en un
problème d'optimisation sans contraintes comme suit:
1 ¥ T
J *(x 0 , u ) = ò
2 0
(
x Qx + uT Ru + lT (Ax + Bu - x ) dt
.
) (3.4)
où le multiplicateur de Lagrange l Î Rn est appelé état-adjoint ou co-état. Les critères J (x 0 , u )

et J *(x 0 , u ) ont le même minimum, ce qui revient à dire que la minimisation de J *(x 0 , u )
implique celle de J (x 0 , u ) .
Le calcul variationnel permet d'obtenir l'expression de la commande optimale comme:
16
u = -R-1BT Px (t ) (3.5)
La matrice P est alors obtenue en résolvant l'équation algébrique de Riccati suivante:
PA + AT P - PBR-1BT P + Q = 0 (3.6)
Il est intéressant de noter que la commande optimale obtenue s'écrit comme un retour d'état
u(t ) = -Kx (t ) avec K = R-1BT P (3.7)
La différence avec la commande par placement de pôles apparaît dans le fait que la matrice de
gain K est calculé en fonction des contraintes imposées sur le système, contraintes qui
s'expriment à travers les pondérations R et Q .
3.3. Choix des matrices de pondération

La détermination du signal de commande demande de fixer les matrices de pondération R et
Q . Ce degré de liberté permet de gérer quelques problèmes pratiques. Par exemple, Q peut
être choisi relativement large dans les premiers instants pour pénaliser les erreurs initiales
généralement importantes puis diminuer en régime permanent. Cependant, pour simplifier la
détermination de ces matrices, il est généralement préféré de les rendre invariantes et diagonales.
En effet, en procédant ainsi, on se ramène au choix de m scalaires pour R et n scalaires
pour Q . Une approche simple consiste à:
1) choisir simplement des matrices de pondération de type identité ;
2) accélérer ou décélérer globalement la dynamique du système en multipliant la matrice Q
par un scalaire supérieur ou inférieur à 1, jusqu'a obtenir une dynamique moyenne adaptée.
Si l'analyse du système met en évidence que certains états présentent des dynamiques
relatives trop lentes (resp. rapides), les éléments diagonaux correspondants peuvent alors être
augmentes (resp. diminues) .
3) modifier les valeurs des éléments diagonaux de la matrice R en fonction des sollicitations
admissibles au niveau des actionneurs.
Ces étapes sont généralement réitérées jusqu'à obtenir un correcteur satisfaisant le cahier des
charges. Remarquez que la multiplication de ces matrices par un même scalaire laisse inchangée
la matrice K .
3.4 Application au système pendule - chariot

Dans cette section, nous allons appliquer la commande LQR pour stabiliser le système pendule
chariot à la position zéro, et ceci quelque soit les conditions initiales.
Pour stabiliser le système nous avons choisi les pondérations suivantes:
Q = 10I 4 , r = 0.1
Le calcul sous matlab avec la commande
[K,P,Poles_BF] = lqr(A,B,Q,r);
donne:
17
é17.5031 10.3179 33.0078 8.2286 ù

ê ú
ê10.3179 14.6948 49.5452 12.1594 ú
P=ê ú
ê33.0078 49.5452 214.8161 49.4758úú
ê
ê 8.2286 12.1594 49.4758 12.5623 úû
ë
Le vecteur gain:
K = [-10 -17.5031 -121.8195 -33.0078 ]
Et les valeurs propres en boucle fermées:

é-10.0040 ù
ê ú
ê-2.3895 + j 1.1771ú
Poles _ BF = ê ú
ê-2.3895 + j 1.1771ú
ê ú
ê-1.0238 ú
ë û
u = -Kx = 10x 1 + 17.5031x 2 + 121.8195x 3 + 33.0078x 4
Les résultats de simulation pour un frottement nul, sont donnés par la figure 3.1. On peut
remarquer que les positions du pendule et du chariot se stabilisent à la position désirée après un
régime transitoire d'environ 5 secs. Les niveaux des dépassements et l'amplitude de la commande
sont plus faibles, comparés au même cas avec placement de pôles, ce qui marque une
amélioration sensible des performances.
Le deuxième test concerne l'analyse de l'effet du frottement sur les performances de la

commande. A cet effet, un frottement sec Fc = d .sign (x 4 ) est introduit avec d = 5 . Les résultats
de simulation sont donnés par la figure 3.2. On peut remarquer une erreur statique sur la position
du chariot due à l'effet du frottement. Notons que les dépassements et l'amplitude de l'erreur
statique sont plus faibles comparés avec le cas de la commande par placement de pôles.
18
0.6 0.5
0.5
0
0.4
0.3 -0.5
0.2
dθ(t)/dt
θ(t)
-1
0.1
0 -1.5
-0.1
-2
-0.2
-0.3 -2.5
0 5 10 15 0 5 10 15
t (sec) t (sec)
1.6 3
1.4 2.5
1.2
2
1
1.5
0.8
dx(t)/dt
x(t)
1
0.6
0.5
0.4
0
0.2
0 -0.5
-0.2 -1
0 5 10 15 0 5 10 15
t (sec) t (sec)
70
60
50
40
30
u(t)
20
10
-10
-20
0 5 10 15
t (sec)
Figure 3.1. Performances de la commande avec frottement nul.
19
0.6 0.5
0.5
0
0.4
0.3 -0.5
0.2
dθ(t)/dt
θ(t)
-1
0.1
0 -1.5
-0.1
-2
-0.2
-0.3 -2.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
2 2.5
2
1.5
1.5
1
1
dx(t)/dt
x(t)
0.5 0.5
0
0
-0.5
-0.5
-1
-1 -1.5
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
70
60
50
40
30
u(t)
20
10
-10
-20
0 2 4 6 8 10
t (sec)
Figure 3.2. Performances de la commande avec frottement.
3.5. Commande LQR avec action intégrale

Nous avons vu au chapitre 2, que pour annuler l'effet du frottement sec sur la position du chariot,
on introduit l'intégrateur :
x5 = ò x3 (2.11)
D'où nous aurons le système augmenté donné par:

.
x = Aax + Bau - BaFc (2.12)
20
Avec
é 0 1 0 0 0ù é 0 ù
ê ú ê ú
ê-0.3633 0 0 0 0úú ê 0.4938 ú
ê ê ú
ê ú ê ú
Aa = ê 0 0 0 1 0ú , Ba = ê 0 ú
ê ú ê ú
ê 15.26 0 0 0 0ú ê-0.7407 ú
ê ú ê ú
ê 0 0 1 0 0úú ê 0 ú
êë û êë úû
Et
T
x = éêx 1 x 2 x 3 x 4 x 5 ùú
ë û
Pour stabiliser le système nous avons choisi les pondérations suivantes:
é50 0 0 0 0 ù
ê ú
ê 0 10 0 0 0 ú
ê ú
ê ú
Q=ê 0 0 50 0 0 ú , r = 0.03
ê ú
ê 0 0 0 10 0 ú
ê ú
ê 0 0 0 0 10ú
êë úû
Le choix de la matrice Q indique que nous mettons plus de poids sur les positions du chariot et
du pendule, et ceci pour une meilleure performance.
Le calcul sous matlab avec la commande
[K,P,Poles_BF] = lqr(Aa,Ba,Q,r);
donne:
é 87.4059 41.0010 117.4227 29.7938 30.3318ù
ê ú
ê 41.0010 28.9676 86.1496 21.5545 13.4965 ú
ê ú
P = êê117.4227 86.1496 294.6500 68.0574 38.2250úú
ê 29.7938 21.5545 68.0574 17.1961 9.7371 úú
ê
ê 30.3318 13.4965 38.2250 9.7371 33.2662úúû
êë
Le vecteur gain:
K = [-60.7354 -55.3781 -262.33 -69.7889 -18.2574 ]
Et les valeurs propres en boucle fermées:

é-16.7642 ù
ê ú
ê-2.4347 + j 1.3215ú
ê ú
Poles _ BF = êê-2.4347 - j 1.3215 úú
ê-2.2580 ú
ê ú
ê-0.4567 ú
êë úû
21
u = -Kx = 60.7354x 1 + 55.3781x 2 + 262.33x 3 + 69.7889x 4 + 18.2574 ò x 3
Les résultats de simulation pour un frottement sec, sont donnés par la figure 3.3. On peut
remarquer que les positions du pendule et du chariot se stabilisent à la position désirée après un
bref transitoire de 5secs. Les dépassements et les temps d'établissement sont sensiblement plus
grands que ceux obtenus avec le placement des pôles; mais ceci est prévisible puisque nous
avons diminué l'effort de commande avec le choix de r = 0.03 .
0.6
1
0.4
0
0.2
-1
dθ(t)/dt
θ(t)
0 -2
-0.2 -3
-0.4 -4
0 2 4 6 8 10 0 2 4 6 8 10
t (sec) t (sec)
1.4 4
1.2
3
1
0.8
2
0.6
dx(t)/dt
x(t)
0.4 1
0.2
0
0
-0.2
-1
-0.4
-0.6 -2
0 5 10 15 0 2 4 6 8 10
t (sec) t (sec)
200
150
100
u(t)
50
-50
0 2 4 6 8 10
t (sec)
Figure 3.3. Performances de la commande avec action intégrale et frottement.
22
3.6. Conclusion
La commande LQR a montré son efficacité dans la stabilisation du système pendule chariot, non
linéaire et instable. Le réglage de la commande est plutôt simple, puisque les deux paramètres de
pondération sont les seuls à définir par l'utilisateur pour obtenir un compromis entre les
performances souhaitées et l'effort de commande admis.
23
Conclusion générale
Conclusion générale
Le présent travail a porté sur la modélisation du système pendule – chariot et sa commande en

utilisant les techniques de l'espace d'état. Le système pendule – chariot n'est pas simplement un
système mécanique, mais il représente une large classe de systèmes industriels, tels que les
satellites, les grues ou les missiles; de ce fait il est très utilisé comme benchmark pour les
techniques de commande développées.
Les résultats de l'application des commandes par placement de pôles et LQR ont fourni des
performances très acceptables; ce qui montre que ces techniques linéaires sont capables
d'assurer la stabilité et les performances des systèmes non linéaires instables, et ceci avec une
simplicité de conception et peu de paramètres de réglage.
Ce travail nous a permis d'approfondir nos connaissances dans les deux domaines suivants:
1. La modélisation des systèmes physiques.
2. La commande dans l'espace d'état.
Ce travail peut être compléter et valorisé par une réalisation pratique qui permettra aux étudiants
d'appréhender pratiquement le problème de la commande.
24
Bibliographie
Bibliographie
[1] N. Goléa, Commande dans l’espace d’état, cours de Masters Génie électrique &
Informatique industriel M1, Université d’Oum El Bouaghi, Algérie, 2010/2011.
[2] D. Xue, Y-Q. Chen, D. P. Atherton Linear Feedback Control: Analysis and Design
with MATLAB, SIAM, USA 2007.
[3] R. L. Williams and D. A. Lawrence, Linear state-space control systems, John Wiley
& Sons, USA, 2007.
[4] Matlab 7 Mathworks®.
31

Mii 00013

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Mii 00013

Transféré par

Droits d'auteur :

Formats disponibles

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE LARBI BEN M’HIDI OUM EL BOUAGHI

Master Informatique Industrielle

Commande du système pendule – chariot

Encadré par: Réalisé par:

1.3. Modélisation mathématique……..………………………………………………..….….2

Chapitre 2 : Commande par placement de pôles

2.2. Principe de la commande par placement de pôles……………….………………….....8

Chapitre 3 : Commande linéaire quadratique

3.2. Principe de la commande LQR………………………...………….…………………...16

La plupart des procédés physiques montrent un comportement hautement non linéaire, et de ce

Description et modélisation du système pendule - chariot

Figure 1.1. Description du système pendule – chariot.

1.3. Modélisation mathématique

Figure 1.2. Forces et vitesses du système pendule – chariot.

où le vecteur vitesse est

1.4. Linéarisation du modèle:

ê ú=ê ú+ê ú (F - Fc ) (1.18)

1.5. Etude de stabilité:

Figure 1.3. Réponse en boucle ouverte du système pendule chariot.

Commande par placement de pôles

2.2. Principe de la commande par placement de pôles

Figure 2.1. Principe du placement de pôles.

Cette tâche peut être accomplie en utilisant la loi de commande suivante:

La substitution de l'équation (2.2) dans l'équation (2.1) donne:

M = éêB AB  An -1B ùú (2.5)

(dite matrice de contrôlabilité) est n .

2.2.2 Calcul du gain du retour d'état

K = éêan - an an -1 - an -1 ... a1 - a1 ùú T -1 (2.8)

K = éê0 ... 0 1ùú M -1F(A) (2.9)

F(A) = An + a1An -1 + ... + an -1A + an I (2.10)

2.2.3 Placement de pôles avec MATLAB

2.2.4 Application au système pendule - chariot

Soit un amortissement unité, et des valeurs propres désirées : l1 = l2 = -2,l3 = l4 = -4 .

Et la loi de commande est donnée par:

Figure 2.4. Performances de la commande avec frottement nul.

Le deuxième test concerne l'analyse de l'effet du frottement sur les performances de la

Figure 2.5. Performances de la commande avec frottement.

2.3. Commande par placement de pôles plus action intégrale

D'où nous aurons le système augmenté d'ordre n + 1 donné par:

pBF (s ) = (s - m1 )(s - m2 )...(s - mn )(s - mn +1 ) = s n +1 + a1s n + +a2s n -1... + ans + an +1

Soit un amortissement unité, et des valeurs propres désirées :

Et la loi de commande est donnée par:

Figure 2.6. Performances de la commande avec action intégrale et frottement.

Commande linéaire quadratique

3.2. Principe de la commande LQR

Les matrices Q et R étant symétriques avec Q ³ 0 et R > 0 .

où le multiplicateur de Lagrange l Î Rn est appelé état-adjoint ou co-état. Les critères J (x 0 , u )

Le calcul variationnel permet d'obtenir l'expression de la commande optimale comme:

3.3. Choix des matrices de pondération

3.4 Application au système pendule - chariot

é17.5031 10.3179 33.0078 8.2286 ù

Et les valeurs propres en boucle fermées:

Le deuxième test concerne l'analyse de l'effet du frottement sur les performances de la

Figure 3.1. Performances de la commande avec frottement nul.

Figure 3.2. Performances de la commande avec frottement.

3.5. Commande LQR avec action intégrale

D'où nous aurons le système augmenté donné par:

Et les valeurs propres en boucle fermées:

u = -Kx = 60.7354x 1 + 55.3781x 2 + 262.33x 3 + 69.7889x 4 + 18.2574 ò x 3

Figure 3.3. Performances de la commande avec action intégrale et frottement.

Le présent travail a porté sur la modélisation du système pendule – chariot et sa commande en