Vous êtes sur la page 1sur 155

MI

NISTEREDEL’
ENSEIGNEMENTSUPERI EURETDELA RECHERCHE SCIENTIFIQUE
UNIVERSITE MOULOUD MAMMERI, TIZI-OUZOU

I
FACULTE DE GENIE ELECTRIQUE ET D’NFORMATI
QUE
DEPARTEMENT AUTOMATIQUE

Mémoire de Magister

en Automatique

Option : Automatique des Systèmes Continus et Productique

Présenté par

Ferhat LAHOUAZI
Ingénieur UMMTO

Mi
see
nœuvr
ed’
unes
tratégie de commande neuro floue :
Application à un pendule inversé

Soutenu le , 16.03.2011 de
vantl
eju
ryd’
exa
menc
ompos
éde:

DIAF Moussa Professeur, UMM de Tizi-Ouzou Président


DJENNOUNE Saïd Professeur, UMM de Tizi-Ouzou Rapporteur
HAMMOUCHE Kamal M.C, classe A UMM de Tizi-Ouzou Examinateur
MELLAH Rabah M.C, classe A UMM de Tizi-Ouzou Examinateur
MAIDI Ahmed M.C, classe A UMM de Tizi-Ouzou Examinateur
AVANT-PROPOS

L’
ens
embl
ede
str
ava
uxpr
ése
nté
sda
nsc
emé
moi
reaé
tée
ffe
ctuéa
uLa
bor
atoi
rede
Conc
ept
ione
tdeCondui
tede
sSy
stè
mesdePr
oduc
tion(
L2CSP)del
’Uni
ver
sit
édeTi
ziouz
ou.

J
eti
enst
outd’
abor
dàe
xpr
ime
rme
ssi
ncè
resr
eme
rci
eme
ntsàmon promoteur Monsieur
DJENNOUNE Saïd, Professeur à l
’UMMTO,quiaa
cce
ptédem’
enc
adr
ere
tgui
derme
s
t
rava
uxj
usqu’
àlar
éal
isation de ce mémoire.Qu’
ilt
rouvei
ci,l
eté
moi
gna
gedemapr
ofonde
gratitude et ma reconnaissance pour l
esc
ons
eil
squ’
iln’
acessé de me prodiguer et pour la
c
onf
ianc
equ’
ilm’
aac
cor
dée
nac
cept
antdedi
ri
gerc
emé
moi
re.

J
’aié
tépr
ofondé
menthonor
équeMons
ieurDIAF Moussa,Pr
ofe
sse
uràl
’UMMTO,ait
a
cce
ptéd’
exa
mine
rcet
rava
ile
tdepr
ési
derl
ejur
yde soutenance de ce mémoire.

Je tiens à exprimer ma reconnaissance à Monsieur MELLAH Rabah, Maître de


conférences classe A àl
’UMMTO,pourl
aconf
ianc
eetl
’honne
urqu’
ilm’
acc
ordee
nac
cept
ant
de participer à ce jury. Ainsi pour les conseils et son aide assez précieuse qu’
ilm’
aprodigué tout
au long de la durée de ce mémoire.

Je remercie très vivement Monsieur HAMMOUCHE Kamal, Maître de conférences


classe A à l
’UMMTO,pourl
aconf
ianc
eetl
’honne
urqu’
ilm’
acc
ordee
nac
cept
antdepa
rti
cipe
r
à ce jury.

Mes vifs remerciements vont également à Monsieur MAIDI Ahmed, Maître de


conférences classe B àl
’UMMTO,pour avoir accepté de participer au jury de soutenance. Ainsi
pourm’
avoi
rai
dée
tconseillé durant la durée de ce mémoire.

Que Monsieur MANSOURI Rachid, Maître de Conférenc


esàl
’UMMTO c
las
seA,t
rou
vei
ci
l
’expr
ess
iondeme
ssi
ncè
resr
eme
rci
eme
ntspours
ona
idequ’
ilapor
téàmoné
gar
d.Ses conseils
judicieux ont été pour moi une aide précieuse.

Je tiens à remercier également tous les membres du L2CSP qui ont contribué à rendre ce
c
adr
edet
rava
ila
gré
abl
e,t
antd’
unpo
intdevuet
echni
quequ’
humain.

Enfin, je ne saurais terminer cet avant-propos sans remercier toute ma famille et ma très
chère copine REMIDI Rachida pour leurs soutiens pendant toutes mes études.
Dédicaces

Je dédie ce travail

A la mémoire de mon père,


A ma mère.
Sommaire

.
Introduction générale….……………………………………………………………….....…….1

Chapitre I
Description et modélisation du pendule inversé

I.1 Introduction………………………………………………….…………………....…………. ..4


I.2Et a tdel ’artdel ac omma nded’ unpe ndul einve r
sé……………………………....…………. ..4
I.3I ntér ê
tdel '
é tuded' unpe ndul ei nversé………………………………….……....……………. .5
I.4Pr é sentationdupe ndul ei nve rsé………………………………………….....…………………6
I.4.1 De s
c ri
ptiondel ama que tte…………………………………………………………….....…6
I.4.2Di spo si
tifdec ontrôlee tdec omma nde ………………………………………………….......7
I.4.3Ar moi redec omma nde ……………………………………………………………….....…. ..8
I.4.4Ca r
ted ’ac qui sit
ion:ADVANTECHPCI1711……………………………………….....…. 9
I.5Envi r
onne me ntdedé ve l
oppe me nt………………………………………………………......10
I.6Pr inc ipedef onc ti
onne me nt …………………………………………….....…………………. 12
I.7Pa rtic
ul ari
té sdec es ystè me ……………………………………………….....………………. 12
I.7.1 Stabilité du système ……………………………………………………….....……………12
I.7.2 Système sous actionnés ……………………………………………………. …....………. .
.12
I.7.3Système holonome ………………………………………….....………………. …………. ..13
I.7.4Sy stèmenonl iné a
ire………………………………………….....………………. ………. ..13
I.8Coor donné esg énéraliséedus ys tème……………………………….....……………………. .
.14
I.8.1Modé li
sa t
iondus ystèmeade uxde g r
é sdel ibert
é…………………. .
..
.…………. .
.….……15
I.8.2Ene r gi
ec i
né t
iquedus y stèmee nmouve me nt…………………………....………………. .
.15
I.8.3Ene r gi
epot e ntie
lledus y stème………………………………………………………….....16
I.8.4L’ équa t
iondeLa grange ………………………………………………………………....…16
I.8.4.1L’ équa tiondeLa gr ang epourl edeg rédel iber
té(t ) x (t ) ....…………………………16
I.8.4.2L’ équa tiondeLa gr ang epourl edeg rédel iber
té(t ) (t ) …....…………………. …..
.17
I.9Li né arisationdumodè lea utourde spointsd’ équil
ibr
e………………....………………. ….
.17
I.9.1Pos itiond’ é qui l
ibrei ns table…………………………………………….................………. 18
I.9.2Pos itiond’ é qui l
ibres tabl e………………………................…………………………. ……20
I.10Re présenta tiond’ état……………………………....………………………………………22
I.10.1 Avec la force F c ommes ig nald’entrée…………................……………………………22
I.10.2 Modélisation en tenant compte du moteur électrique …………. …………………. .
……. 23
I.10.2.1Li néa risationde sé qua tionsdupe ndul ei nver
sé…………………….....………………. .24
I.10.3 Redressement du pendule avec une commande non linéaire ……………....……………. .25
I.11.1Ré s ult
a tsdes imul atione te xpé r
ime ntaux…………………………………......…………. 27
I.11Conc lusion……………………………………………………………………….....………. 28

Chapitre II
Commandes classique du pendule inversé

II.1.Intr oduc
tion………………………………………………………………………...…. .
. ...29
II.2.1.Comma ndel i
néa
irequa dratique……………………………………………………....…. 29
II.2.2.Ra ppel
ss url
ast
a bil
it
é,dé t
e cta
bil
ité………….....………………………………………. 29
II.2.3.For mulati
ondupr oblè
meLQe tsasolut
ion………....…………………………………. ..
30
II.2.3.1. Commande LQ à horizon fini
………………………....………………………………. .
30
II.2.3.1.1.Résoluti
ond’unprobl èmed ec omma ndeLQ………....……………………………. ..
31
II.2. 3.2.Co mma ndeLQàhor izoni nfini…………………………....…………………………. ..32
II.2.4. Commande LQ pour système invariant avec un horizon infini....………………………. .32
II.2. 4.1.Ré s olut iondel ’équa t
iondeRi ccati………………………….....……………………. .33
II.2.5. Choix des matrices de pondération ……………………………….....…………………. ..34
II.2. 6.Comma ndeLi né aireQua dratiq ueGa us sienne ……………………….....………………. ..
34
II.2.6.1. systèmes à état non compl è t
e me ntacce ssible………………………….....……………. 35
II.2. 6.2.Fi ltra gedeKa lma n,c omma ndeLQG………………….....……………………………. 35
II.2. 6.2.1.Pos itiondupr oblè me ……………………………………………….....………………35
II.2. 6.2.2.Fi ltredeKa lma n……………………………………………………….....…………. ..36
II.2.6.2.3. Comma ndeLQG………………………………………………………….....………. .38
II.2. 6.3.Sy nt hè sed’ unec omma ndeLQG………………………………………………....…. ....38
II.2. 7Sy nth è sedel ac omma ndeLQR…………………………………………………….....…. .39
II.2. 7.1Re c he rc hede sma tr
ic esdepoi dsQe tR……………….....……………………………. .39
II.2.7. 2Ré s ulta tsdes i
mul ation...
…………………………………....……………………. .........40
II.2. 7.3I nte rpr éta t
ionde sr ésultatsdes i
mul ations ………………….....………………………. ..40
II.2.7.4 Es tima tionde sé tatsnonme surables………………………….....…………………. ..…41
II.2.7.5 Sy nt hè sedel ’obs erva teur:………………………………………....……………………41
II.2. 8I mpl éme nt at
iondel ac omma nd eLQR……………………………….....………………. ..42
II.2. 8.1I nte rpr éta t
ionde sr ésultatse xpérime ntaux………………......…………………………. .43
II.2.8. Résultats expérimentaux… …………………………………....…………….………………46
II.3.1. Commande pa rmodedeg lisseme nt…. ……………………....…………………. …...…. .47
II.3.1.1.Définition. ....
...
....
..…………………………………………....…………………………47
II.3. 2.Di f
f ére nte sSt r
uc turesduCont rôlepa rModedeGl i
ssement…....………………………48
II.3.3. Théorie de la Commande par Mode de Gl iss ement…..…..………...…………………. ....48
II.3. 4.Con ce ptiondel ac omma ndepa rmodeg li
s sant………..……………...…. ……………. ...
49
II.3. 4.1Ch oixde sSur fac esdeGl iss eme nt…………………………………….....……………. .49
II.3. 4.2Co ndi tiondeGl isse me nt………………………………………………….....…………. 50
II.3.4. 3Ca lc uldel aComma nde……………………………………………………….....……. .51
II.3. 5Sol utionpours uppr essionduPh é
nomè neduCha tt
eri
ng…………………………....…. ..54
II.3. 6Ava nta ge se tinc onvé ni entsdel acomma ndepa rmodeg li
ssa
nt……………. ….….
..
....…55
II. 3.7 Synthèse de la Commandepa rmodeg l
issa ntd’unpe ndul
einversé…………………. .....56
II. 3. 7.1For mul a ti
onma théma ti
que …………………………………………………………. .....56
II.3. 7.2Re dr e sse me nte ts t
a bili
sationdupe ndul einve rs
épa rmodeg l
is
s ant
…....……………. ..58
II.3.7.2.1 Lap re mi èreé tape …………………………………………………………....…………. 59
II.3.7.2.2 Lade uxiè meé tape …………………………………………………………....………. 59
II.3. 7.3Ré s ulta tsdes i
mul ation..…………………………………………………………....…. ..60
II.3.7.3.1 I n te rpré t
ationde sr ésultatsdes imulations ……. .
……………. .………………….....…63
II.3.7.4 Résultats expérimenta ux……………………………………………………………. ......64
II.3. 7.4.1I n te rpré t
ationde sr ésultatse xpé r
ime ntaux………………....…………………………67
II.4Conc lus ion………. …………………………………………. .…….....…………. …………. .70

Chapitre III
Commandes floue et neuro-floue du pendule inversé
III.1I ntr
oduc ti
on…………………………………………………………. ..
..
…. .
.…………….
..
71
III.2Log i
quef louee tlac omma ndefloue…………. …………………………....………………71
III.2.1Introduc t
ion………………………………………………………………………....…. ..
71
III.2.2Lal og i
quef l
oue ………………………………………………………………………......72
III.2.3 Notion de sous-ensembleflou……………………………...............……………………. .72
III.2.4Uni versdedi s
c ours…………………………………………………...............…………. .72
III.2.5Va riablee tvaleursdevariableli
ngui
st
ique
……………………..............………………..73
III.2.7.2Rè gle sd’ inf ére nc e……………………………………………………..............………. 73
III.2.6Re prés ent ationde sf onc tionsd’ appa rt
e na nc e …………...............………………………. .73
III.2.7.3Opé r ationss url ese ns e mbl esf lous……………………………..............………………74
III.2.7.4St ruc tured’ unr é gla g epa rlog iquef loue ………………………………....……………. 77
III.2.8Conf ig ura tioni nt erned’ uns ystè med’ i
nf é re nc ef lou……………………….....……. ..…77
III.2.8.1Fuz zif i
c ation………………………………………………………………...................78
III.2.8.1.1Fuz zifica tionnumé rique …………………………………………........................……78
III.2.8.1.2Fuzzification symbol ique …….........................………………………………………. .78
III.2.8.2Ba seder è g lesf loue s …………...................……………………………………………. 79
III.2.8.3Lemot e urd’ infé renc ef l
ou………………...................………………………………. ..79
III.2.8.4Dé fuz zific a tion………………………………………...................…………………….80
III.2.8.4.1Dé f uzz ific ationnumé rique ……………………………………….......................…. ...81
III.2.8.4.2Dé f uzz ific ations y mbol ique …………........................……………………………….82
III.2.3Le sdif fére nt ss y stème sd’ inférenc eflou………………....……………………………. .82
III.4.4 Synthèse du correcteur PID classique…………………….....……………………. ..
.........84
III.2.12Le sdi f f
é re nt sc or rec te ur spa rlog iquef loue ………………....…………………………. 85
III.2.12.1Cor recte ur sPpa rl og iquef loue ……………………………..............……………. ......85
III.2.12.2Cor recte ur sPDpa rl og iquef loue ……………………………………..............……. ...86
III.2.12.3Cor recte ur sPIpa rl og iquef loue……...............……………………………………. ..87
III.2.12.4Cor recte ur sPI Dpa rl og iquef loue ……………….........…………………………........88
III.2.12.5 Relations de pa s sage …………………………………….........……. ..........
..
..
.....
.........89
III.2.13.Ré gla ged’ unc ont r ôl eurf l
ou…………………………………………. .......
..
..
.....
.........90
III.2.14.Ava nt ag ese tdé sava nt ag edur é glagepa rl og iquef l
oue…………………………….....90
III.2.15 Application de lac omma ndef loues url epe ndul einve r
sé…………………………. ......91
III.2.15.1.Ana lys edupr obl è me ………………………………………………………… . .
….....91
III.2.15.2.St ruc tur edel ac omma ndef loue …………………………………………………......91
III.2.15.2.1 .Enonc édel amé t hode ………………………………………………………….......91
III.2.15.2.2 .Choi xde sé léme nt sde sré gulateur sf lous …………………………………….…....92
III.2.15.2.2 .
1 .Choi xdel af or mede scla sses……………………………………………….....…92
III.2.15.2.2 .
2 .Dé fini tionde sr é férentielspourl e squa treva riabl
esd’e
ntr
ées
………………..... .92
III.2.15.2.3 .Dé finiti onde sr é fé rentiel
spourl esva ria bl esdes orti
e……………………….....…93
III.2.15.2.4 .
Ta ble auxder èg les ………………………………………………………………..... 94
III.2.15.2.5 .Lemot eurd’ i
nf é re nc e………………………………………………………. .….....95
III.2.15.2.6. La transformation symboliquenumé rique ………………………………….....……96
III.2.15.3Ré s ultatsdes imul a tion. .………………………………………………………............96
III.2.15.4I nte rpré ta tionde sr é s ultatsdes imul ation. .………………………………….....……. ..98
III.2.15.5I mpl éme nt a tiondel ac omma ndef loue ……………………………………....………. 99
III.2.15.6Ré s ultatse xpé rime nt aux………………………………………………….....……. …101
III.2.15.7Ana lys ede sr é sulta tse xpé r
ime ntaux…………………………………….....……. …. 103
III.3Le sré sea uxdene ur one s………………………………………………….........…………. 104
III.3.1I ntroduc t
ion……………………………………………………....……..........…………104
III.3.2Ne uro neBi ol og ique …………………………………………………. ............…....……. 104
III.3.3Ne uro nea rtif iciel……………………………………………….........……. ..….....……105
III.3.4 Le sa r
c hite c tur esne ur ona l
e s.
..
………………………………………………….....……. 106
III.3.4.1 Les réseaux de neurone snonbouc l
é s……………………………………….....……. ..106
III.3.4.1.1 Réseaux non boucles Mono-Couc he ……………………………………….....……. .106
III.3.4.1.2 Les réseaux non boucles Multi-Couc he ………………………………….....………. 107
III.3.4.2Le sr ése auxdene ur one sbouc lés…………………………………………….....……. .108
III.3.4.3Le sr ése auxdene ur one sàc onne xionsc ompl e xe s…………………….....…………. ..108
III.3.5Pr oc ess usd’ a ppr e ntis sa g e…………………………………………….....……………. ..108
III.3.5.1Appr ent i
s sa g es upe rvi s é…………………………………………....………………. ..109
III.3.5.1.1La rétro-propagation du gra di entdel ’ er re ur ……………………....………………. ..109
III.3.5.2Appr ent is sa g enons upe r vi sé ……………………………………....…………………. 111
III. 4 Systèmes Neuro-Fl ous ……………………………………………. ....………………. .....111
III.4.1Dé finition………………………………………………………....……………………. 112
III.4.2 Méthodes des combinaisons Neuro-Fl oue s……………………....……………………. .113
III.4.2.1Ré sea uf loune ur ona l………………………………………....………………………. 113
III.4.2.2Sy stèmene ur ona l/flous imul ta né me nt …………………….....…………. ……………. 113
III.4.2.3 Modèles neuro-f lousc oopé ra tif s………………………………....…………………. ..113
III.4.2.4 Modèles neuro-f loushy br ide s....……………………………....…………. …………. .113
III.4.3 Le sty pe sd’ impl é me nt a tionde sr é s e auxne ur o-f lous ………….....……………………. .114
III.4.3.1Sy stème sd’ inf é re nc ene ur o-f loua da pt a tifs (ANFI S) ….....…………………………. ..115
III.4.3.1.1 Algorithme d' a ppr e nt is sa g e ………………....……………………….……………. ..117
III.4.3.2 Inférence Neuro-f lou( I NF) …………………....……………………………………. ..118
III.4.4Application de la commande Neuro-f loue …....…………………………...…………. .…119
III.4.4.1Architectur edus y stè medec o nt rôl e ………………………………………. .................119
III.4.4.2Mé t
hodol og iedec onc e pt ion………………………………………………. ................120
III.4.4.3 Régulateur Neuro-flou (2×2)…………………………………………….....................120
III.4.4.3.1Al gor i thmedec omma nde ……………………………………………. .....................120
III.4.4.3.2 Al gor i thmed' a ppr e nt is sa g e ………………………………………. ...........................121
III.4.4.5.1 Struc tur edur é se a uc ont rôl e ur ………………………………………. .......................122
III.4.4.5.2 résultats de simulation................................................................................................124
III.4.4.5.3 Interprétation des résultats de simulation...................................................................125
III. 4.4.5.4Implémentation de la commande Neuro-f loue ………………………………….......126
III. 4.4.5.5Résul ta tse xpé r ime nt a ux…..…………………………………………. ....……. ….....126
III. 4.4.5.6Analyse des résultats expérimentaux..........................................................................130
III.5Comparaison des résultats obtenus avec les commandes appliquées...................................130
III. 5 Conclusion..........................................................................................................................132
Conclusion générale et perspectives…………………………………………………………. 133
Annexe........................................................................................................................................136
Références bibliographiques…………………………………………………………………. 143
Introduction générale

Da
nsl
edoma
ines
cie
nti
fi
quee
tce
luidel
’ens
eig
neme
nt,l
’aut
oma
tiqueas
ouve
nt
recours à de
sca
s d’
étude
s pa
rti
culiers, qui sont représentatifs de grandes classes
d’
appl
ica
tions
.Depl
us,a
vecl
’expé
rie
nce
,lac
onna
iss
anc
edec
esc
ass
’es
taf
fi
néee
til
s
f
our
nis
senta
ujour
d’huiuneba
sei
déa
lepourc
ompa
rerdef
açonva
labl
ele
sava
nta
gese
tle
s
i
nconvé
nie
ntsd’
appr
oche
sdi
ff
ére
nte
s.Lepe
ndul
einve
rsée
stl
’undec
esc
ast
ypi
quequi
oc
cupeunepl
acei
mpor
tant
eda
nsl
’i
ndus
tri
ecommeunout
ildet
rans
por
t,d’
ins
pec
tione
t
d’
int
erve
nti
onda
nsde
smi
li
eux hos
ti
les
,enpa
rti
cul
ierqua
ndl
esc
apa
cit
ésdemouve
ment
autonome sont exigées.

La description du pendule inversé muni de son actionneur et ses capteurs ainsi que les
divers phénomènes physiques présents lors du fonctionnement, montrent la forte complexité
due aux nombreuses non linéarités ainsi que la difficulté à modéliser parfaitement la
dynamique du système pendule inverse -capteurs- actionneur. Le contrôle du pendule inversé
pour le redressement et la stabilisation devient ardue, car la connaissance du système se révèle
imprécise et imparfaite.

Par ailleurs, les problèmes de représentation et d'utilisation des connaissances sont au


centre d'une discipline scientifique relativement nouvelle : l'intelligence artificielle. Cette
discipline a mis l'accent, de façon exclusive, sur le traitement symbolique de la connaissance,
par opposition à la modélisation numérique utilisée traditionnellement dans les sciences de
l'ingénieur. Plus récemment, on a assisté à un retour du numérique dans les problèmes de
l'intelligence artificielle avec les réseaux de neurones et la logique floue. Alors que les
réseaux de neurones proposent une approche implicite de type " boite noire" de la
représentation des connaissances, très analogue à la démarche de l'identification des systèmes
en automatique. La logique floue permet de faire le lien entre modélisation numérique et la
modélisation symbolique, à partir d'algorithmes très simples de traduction de connaissances
symboliques en entités numériques et inversement.

Depuis la première application du formalisme de la logique floue à la commande des


systèmes proposée par Mamdani, plusieurs travaux ont montré que le contrôle à logique floue
est une méthode adéquate pour la commande des procédés mal définis ou complètement
inconnus et qui ne peuvent pas être modélisés mathématiquement d'une manière précise.
L'approche traditionnelle pour la conception floue est basée sur des connaissances acquises
par des experts formulées sous forme de règles. Cependant il se peut que les experts ne

1
Introduction générale

puissent pas transcrire leurs connaissances et expériences sous forme d'un contrôleur par
logique floue. C'est à partir de ces constatations qu'ont été développées plusieurs méthodes
optimales et systématiques pour la conception des contrôleurs flous. Parmi ces méthodes,
nous avons retenu l'approche connexionniste qui consiste à combiner les capacités
d’
appr
ent
is
sagedes réseaux de neurones artificiels et les systèmes flous pour former les
systèmes neuro-flous. La c
ombi
nai
son de c
es de
ux a
ppr
oche
s pe
rme
td’
expl
oit
erl
es
caractéristiques de chacune pour accomplir une tâche performante et efficace pour la
commande des systèmes complexes.

En outre, la commande de ces systèmes non linéaires sous actionnés représente encore
un champ très large et intéressant dans les travaux de recherche de nos jours, où la conception
de
scont
rôl
eur
spourl
ess
yst
ème
sso
usa
cti
onné
snes
eli
mit
epa
sàl
’i
nté
rêtdec
omma
nde
r
ceux-ci, mais elle présente un avantage pour les systèmes qui sont entièrement actionnés et
qu’
il
sonta
uss
ibe
soi
nd’
avoi
rde
scont
rôl
eur
sdec
ege
nre
,ce
scont
rôl
eur
ssonti
mpl
éme
nté
s
en raison de sécurité dans le cas ou un des actionneurs de ces systèmes subit un échec.

Notre travail est appliqué à un système pendule inversé, qui est un système non
linéaire, instable, SIMO (Single Input Multiple Output) ; sous actionné, à pl
usd’
unde
gré
sde
l
ibe
rté
,tr
èss
ens
ibl
eauxr
eta
rde
tauxf
rot
teme
nts
,af
ind’
il
lus
tre
retc
ompa
rerl
esdi
ff
ére
ntes
lois de commandes linéaires et non linéaires, leurs tests de performances et de robustesse mis
e
nœuvr
eeti
mpl
éme
nté
sré
ell
eme
nts
urunba
ncd’
ess
aisdi
sponi
blea
ula
bor
atoi
reL2CSP
é
pour le redressement et stabilisation du pendule depuis sa position d’qui
li
bres
tabl
eve
rsl
a
pos
it
iond’
équi
li
brei
nst
abl
e.

Ce mémoire est organisé comme suit:

Chapitre I
La première partie du chapitre est consacrée à la description précise du système et de
son interfaçage avec le PC. Ensuite, nous avons traité en détail l'environnement logiciel c'est-
à-dire le schéma général sous Simulink associé à une interface graphique développée sous
Control Desk. Dans la suite du c
hapi
tr
e,nousé
labor
onsl
emodè
lema
thé
mat
iqued’
un
pendule inversé en nous basant sur le formalisme d’
Eul
er-Lagrange suivi d'une linéarisation
autour des deux points d'équilibre possibles. Ensuite, nous présenterons le système dans
l
’es
pac
ed’
état avec f
orc
eens
uit
elat
ens
ionc
ommes
igna
ld’
ent
rée
.

2
Introduction générale

Ces
yst
èmenouss
ervi
radeba
ncd’
ess
aipours
imul
eret implémenter les lois de
commande qui seront développées dans les chapitres suivants.

Chapitre II

Dans ce chapitre, nous présentons un bref rappel théorique sur les différents outils de
commandes classiques dont nous aurons besoin lors de la synthèse des commandes. En
l
’oc
cur
renc
elac
omma
ndel
iné
air
equ
adr
ati
quequ’
onme
ttr
aenœuvr
elor
sdel
apha
sede
stabilisation du pendule, la commande par mode de glissement qui nous servira lors de la
phase du balancement et la phase de stabilisation du pendule.

Chapitre III

Dans le troisième chapitre, nous étudierons les différentes techniques de l'intelligence


artificielle à savoir: les bases théoriques de la logique floue, les réseaux de neurones, les
structures neuro-floues qui nous serviront lors de la phase de stabilisation du pendule, le
concept de variable linguistique, les notions de signification et de description floues ainsi que
la topologie SIF. Ensuite nous étudions la structure multicouche du réseau de neurones en
tenant compte des différentes méthodes d'apprentissage. Nous nous concentrerons en
particulier sur la projection des systèmes flous dans un réseau de neurone afin de former un
système neuro-flou en tirant profit de la logique floue et des réseaux de neurones.

A la fin de la synthèse de chaque type de commande, nous présenterons les résultats de


simulation suivies de
sré
sul
tat
sexpé
rime
nta
uxdus
yst
èmec
omma
ndémi
sàl
’épr
euvede
perturbations et de variations paramétriques, choses qui nous permettront d’
éva
lue
rle
s
performances et la robustesse de ces commandes.

Enfin, nous terminons notre travail par une conclusion générale résumant les différents
résultats obtenus, quelques perspectives et les difficultés rencontrées.

3
Chapitre I Description et modélisation du pendule inversé

I.1 Introduction
Nouspr
ése
nte
ronsda
nsc
ech
api
tr
e,e
n pr
emi
erl
ieu
,un mod
èlen
on l
iné
air
ed’
un
système classique souvent utilisé en automatique, plus particulièrement dans les applications de
commande: le pendule inversé qui e
stu
nepl
at
efor
med’
ess
aiq
uipos
eunpr
obl
èmed’
ins
tabi
li

àl
’ang
le0 , Il nous servira notamment, plus loin dans les chapitres suivants pour les tests des
différentes commandes synthétisées.

Par la suite, nous développerons un modèle dynamique qui sera présenté sous forme
d’
équ
ati
onsd
iff
ére
nti
el
lesdé
dui
te
sàp
art
irduf
orma
li
smed’
Eul
er-Lagrange qui constitue une
a
ppr
oches
yst
éma
ti
ques
impl
eàme
tt
ree
nœuv
re.Pu
is,n
ouspr
ése
nte
rons ce système dans
l
’es
pac
ed’
éta
tda
nsl
esde
uxc
irc
ons
tanc
es;pr
emi
ère
mentl
afor
cec
ommes
ign
ald’
ent
rée
,
de
uxi
ème
men
tlat
ens
ionc
ommes
igna
ld’
ent
rée
.

Une implémentation de ces modèles sous MATLAB/SIMULINK sera également


présentée ainsi que les différents résultats de simulation numérique de leurs comportements en
boucle ouverte.

I
.2Et
atdel
’ar
tdel
acommanded’
unpe
ndul
einve
rsé
Le pendule inversé est un système instable, SIMO (Single Input Multiple Output) et
possède des non-linéarités non négligeables dues à sa structure dynamique et aux forces de
f
ri
ct
ion
.C’
estu
nout
ild
ida
cti
quee
tunpr
obl
èmec
las
siqueu
til
is
éena
utoma
ti
que
.C’
estpou
rquoi
il est souvent utilisé pour tester les performances et la robustesse de nouvelles lois de commande
[LAU.03]. Par ailleurs, on peut trouver dans la littérature plusieurs travaux appropriés à la
c
omma
nded’
uns
imp
lepe
ndul
ein
ver
sépa
rde
sloi
sbasées sur:

Unpr
obl
èmed
econ
trô
led
el’
éne
rgi
e[As
tr
oime
tFu
tur
ai1
996
]as
soc
iée
sàun
esé
que
nce
e
de balancme
ntqu
ipe
rme
tder
ele
verl
epe
ndul
edes
apos
it
iond’
équi
li
bres
tabl
e[We
ietAl
1995], [Vermeiren 1998].
a
L’ppl
ic
ati
onder
ése
auxne
uro
nau
x[An
der
son8
9]
La méthode des moments [Jacobi 1995]
La commande non linéaire [Wei et Al 1995].

4
Chapitre I Description et modélisation du pendule inversé

La commande floue, soit en utilisant la notion des ensembles flous et un régulateur du


type Mamdani [Yamakawa 1989] [Kandel et Al 1993] [Lo et Kuo 1998] [Wei et Al 1995]
[Bastian 95]. Soit par la commande adaptative floue [Wang et Al 1996] ou encore en utilisant les
modèles de type Takagi Seguno [Vermeiren 1998].

I.3 Intérêt de l'étude d'un pendule inversé

L'étude du pendule inversé a assez bien d'importance. Il y a plusieurs raisons à cela :

- L'homme est un pendule double inversé dont les deux axes de rotation principaux sont
les chevilles et les hanches. Quand nous sommes en position debout, nos articulations travaillent
sans arrêt pour nous y maintenir. Les spécialistes qui travaillent à la réalisation de prothèses pour
les hanches sont amenés à utiliser le modèle du pendule double inversé pour calculer l'ensemble
des contraintes qui sont soumises à la prothèse.

- Dans le même ordre d'idée, la robotique utilise ce genre de concept.

- On voit apparaître des moyens de locomotion dotés de deux roues montées sur un même
axe sur lequel on est en position debout. On accélère en se penchant en avant et on ralenti en se
penchant en arrière. Le système est le même que le pendule inversé. La stabilité est aussi assurée
par des gyroscopes mais nous n'entrerons pas dans ce genre de détails.

- Les étudiants en automatique, en robotique … f


ontde
sla
bor
atoi
resde recherches avec
ce genre de dispositif. Parce qu'ils font intervenir beaucoup de notions intéressantes pour eux :
og
pr r
amma
tio
n,a
utoma
ti
sat
ion,mé
cani
que

5
Chapitre I Description et modélisation du pendule inversé

I.4 Présentation du pendule inversé


I.4.1 Description de la maquette

Le but de la manipulation consiste à maintenir en équilibre vertical une tige en aluminium


àl
’ext
rémitéd el aquell
ee stvi sséeu nema sse
lottedef ormec yl
indriqu e.Ce t
tet igee stf i
xéepa r
une ar
ti
cul
ati
onpivot
ant
esuruncha
rio
tquipeuts
edé pl
ace
rengli
ssa
ntlel
ongd’u
nr ai
lde
guida
gehorizont
al
e.Le mouve
mentd er
ota
tiond’un mot
euré
lec
tri
quees
ttra
nsfor
mée n
mouv eme ntdet ranslat
iond uchariotpa rl’i
nt er
mé diair
ed’ une nsembledede uxpo uliese td’u ne
courroie crantée. Le déplacement du chariot dans un sens ou dans un autre assure par réaction
l’équi
libreve rt
icaldub ra
sdupe ndu le.Enf a
it,ceg enredemé canis
mee sttrèsf réqu ent.One n
trouve dans toutes les imprimantes à jet d'encre ou dans toute les machines à écrire électriques.
Voici le schéma du dispositif :
Capteur de position
Pendule
Centre
Chariot
Poulie Switcher

Courroie
crantée

Moteur

Articulation
Rail de guidage

Pied de la maquette

Figure I.1 : synoptique de la maquette du pendule inversé


6
Chapitre I Description et modélisation du pendule inversé

I.4.2 Dispositif de contrôle et de commande :

Un e
nse
mbl
edec
apt
eur
setd’
act
ion
neu
res
tins
tal
lés
url
ama
que
tt
e.De
uxc
apt
eur
ssont
disponibles :

Un capteur de position délivre une image de la position du chariot sur son rail de guidage
par rapport au centre de ce dernier. Si le chariot est situé à droite du centre, une valeur positive
est mesurée. Le capteur utilisé est un potentiomètre multi-tours solidaire sur l
’axed
umot
eur
.

Unc
apt
eurdepos
it
iona
ngu
lai
ref
our
nitl
’ang
lee
ntr
elebr
asdupe
ndu
lee
tlav
ert
ic
ale
.Si
i
le pendule penche vers la droite, un angle positfe
stme
sur
é.Lec
apt
eure
stc
ons
ti
tuéd’
un
potentiomètre fixé sur le pivot du pendule.

Les informations délivrées par les deux capteurs sont conditionnées par une
électronique associée et les tensions de sortie varient dans une plage de -10V à +10V. On notera
qu’
unf
il
tr
epa
sse
-bas est intégré dans la chaine de conditionnement de chaque entrée, ce filtre
a
yan
tpourf
onc
ti
ond
eli
mit
erl
ala
rge
urd
eba
ndede
ssi
gna
uxdeme
sur
eetd
’évi
te
rler
epl
ie
ment
dus
pec
treq
uir
is
quedes
epr
odu
irel
orsdel
’opé
rat
iond’
écha
nti
ll
onna
ge.

De plus, la course du chariot est limitée respectivement à gauche et à droite par deux
but
éesmé
cani
que
s.Pa
rsé
cur
it
épo
url
emot
eurd’
ent
raî
neme
ntduc
har
iot
,de
uxi
nte
rrup
teur
sde
fin de course sont placés en avant des butées mécaniques. Le passage du chariot entraîne la
fermeture d’
uni
nte
rrup
teurpr
ovo
qua
ntl
acou
pur
edel
’al
ime
nta
ti
ondumo
teuré
lec
tri
que
.

L’
act
ion
neu
res
tun mo
teu
rél
ect
ri
queàc
our
antc
ont
inue
tà a
ima
ntpe
rma
nent
c
omma
ndépa
rl’
indu
it.

La commande du moteur entraînant le chariot est effectuée par un signal variant entre 0
e
t+5V.L’
ampl
if
ica
ti
ond
epu
iss
anc
epa
rmo
nta
gep
ush
-pull est assurée, de la même façon, par
l
’él
ect
roni
quea
sso
cié
e.

7
Chapitre I Description et modélisation du pendule inversé

I.4.3 Armoire de commande

Àl
’ar
ri
èredel
’ar
moi
reont
rouvel
esdi
ff
ére
nte
scon
nec
ti
que
ssuivantes figure(I.2):

 Connecteur ON / Off : fiche DIN pour connecter la boit


edel
’i
nte
rce
pte
urON/
OFFdu
moteur.
 Sélecteur 110/220v
 Fi
ched’
ali
ment
ati
on110/
220V
 Connecteur CN3 : i
lsebr
anc
hea
vecl
ePL1del
aboi
ted’
ada
pta
ti
on,a
vecun
ela
rge
nappe 40 pistes. Les signaux sont ceux des deux capteurs de position,c
’es
tde
ssi
gna
ux
digitaux sur 16 bits.
 Connecteur CN2 : il se branche avec PL3, avec une nappe 20 pistes. Les signaux sont les
tensions de commande du moteur.
 Connecteur CN1 ; il se branche avec la partie mécanique. Les signaux sont ceux du
moteur.

SCSI

Connecteur ON / Off CN1


Sélecteur 110/220v

Fi
ched’
ali
ment
at
ion

CN2
CN3
Figure I.2 : Diagramme de connexion du dispositif de contrôle et de commande

8
Chapitre I Description et modélisation du pendule inversé

I
.4.
4L’
adapt
ate
ur(SCSI)
L’
ada
pta
teurSCSIdonné à la figure (I.2) ac
ommer
ôled’
ada
pte
rle
ssi
gna
uxe
ntr
elac
art
e
d’
acq
uis
it
ione
tle
sdi
ff
ére
ntsc
onn
ect
eur
sdel
aba
sed’
ali
men
tat
ion
,eta
uss
isé
par
erc
esdi
ff
ére
nts
signaux en fonction de leurs types. La boite dispose de quatre connecteurs :
 un connecteur 68 pins pour connecter le câble global 68 pin SCSI de la carte
d’
acq
uis
it
ion
.
 un grand connecteur PL1 pour les entrées digitales des capteurs de positions (deux
encodeurs optiques).
 un petit connecteur PL2 ou PL3 pour la sortie analogique (tension de commande du
moteur).

I
.4.
5Ca
rted’
acqui
si
ti
on: ADVANTECH PCI 1711 [pci1711]

C’
estu
nec
art
ed’
acqui
si
ti
on uni
ver
sel
lequ
ies
tins
tal

esurl
epor
tPCIdu PC de
commande et dispose de connecteurs extérieurs pour des entrées/sorties analogiques et digitales.
Ces principales caractéristiques sont :
 La fonction Plug & play
 16 entrées analogiques configurables simples (single-ended) ou source flottante
 Convertisseurs A/D industriels normalisés à approximations successives
 12 bits utilisés pour la conversion des entrées analogiques
 Laf
réque
ncema
xima
led’
écha
nti
ll
onna
gee
std
e100
KHz
.
 Gamme des entées analogiques est programmables et contrôlable par software
 Chaque canal à sa gamme individuelle stockée dans la RAM de la carte
 2 sorties analogiques (convertisseur D/A)
 1
6ca
nau
xd’
ent
éesd
igi
tal
es
 16 canaux de sorties digitales
 Un compteur/timer programmable
 Scanne automatique des gains/canaux.
So
npr
inc
ipa
lrôl
eda
nsn
otr
eappl
ic
ati
on,c
’es
tqu
’el
lep
erme
tlac
omma
nded
igi
tal
ed’
un
système continu à travers un PC, en convertissant les signaux analogiques en numériques et vice-
versa. Dans notre cas, on utilise :

9
Chapitre I Description et modélisation du pendule inversé

Une sortie analogique (convertisseur D/A) pour délivrer la tension de commande de


référence.
Les e
ntr
éesdi
git
al
esde
sde
uxe
ncod
eur
sop
tiq
uespo
urme
sur
erl
’ang
ledupe
ndu
lee
tla
position du chariot.
Une entrée analogique (convertisseur A/D) pour récupérer le retour tachymétrique du
moteur.

I.5 Environnement de développement


Ceb
ancd
’es
saiu
til
is
eunea
ppr
ocheno
vat
ri
ced’
impl
éme
nta
ti
on,qu
ijou
itd’
unef
lexi
bil
it
é
a
ccr
ue e
td’
une a
rchi
te
ctur
etot
al
eme
nto
uve
rte
,ce
tt
eap
proc
hee
sta
ppe
lée HI
Lpour
« Hardware-In the-Loop ». Ou bien « Rapid Prototyping »
Avec le « hardware-in the-loop », on peut tester d
ire
cte
mentl
econ
trô
leurq
u’on a
synthétisé en simulation sur le système physique réel, avec un simple PC de développement. En
e
ffe
ttou
sceq
u’onabe
soi
nes
t:
 un PC standard (pour le développement et pour la commande)
 u
nec
art
ed’
acq
uis
it
ion pour la conversion A/D et D/A
 le système physique à commander
 les logiciels nécessaires

Les logiciels utilisés sont :


MATLAB : i
ljouel
erôl
ed’
unepl
at
efor
me,oùt
ousl
esa
utr
esc
ompos
ant
ss’
exé
cut
ent
,
c
’es
tl’
envi
ron
neme
ntl
epl
usut
il
is
éda
nsl
emonde par les ingénieurs, il fournit plusieurs
routines sophistiquées de calculs numériques .

SIMULINK : C’
estu
nla
nga
ged
eha
utni
vea
ugr
aphi
que
,av
ecl
equ
elonpr
ogr
amme
avec des objets ou blocks, ces objets peuvent être soit des blocks standards ou bien des blocks
s
péc
ial
is
ésé
cri
tpa
rl’
uti
li
sat
eurc
ommede
sS-functions

REAL TIME WORKSHOP : c


’es
tlep
rog
ramme l
e pl
us i
mpo
rta
nt,qui génère
automatiquement du code source C++ optimisé, à partir du modèle Simulink. De plus, ce code est
b
paramétralep
ourpl
usi
eur
sta
rge
ts(
cibl
e)d’
impl
éme
nta
ti
on.

10
Chapitre I Description et modélisation du pendule inversé

Compilateur C++ :i
lcompi
lel
ecodeg
éné
répa
rre
alt
imewo
rks
hope
tfa
itl
’édi
ti
onde
s
l
ien
spou
rgé
nér
eru
nexé
cut
abl
equic
ommu
niquea
vecl
aci
bled’
impl
éme
nta
tio
n(t
arg
et)
,da
ns
notre cas, le compilateur est VISUAL C++ 6.0 PRO.

REAL TIME WINDOWS TARGET :Da


nsl
eca
sd’
une
nvi
ron
neme
ntWI
NDOWS,c
e
petit noyau, est essentiel, son rôle est primordial, il assure le temps réel pour notre régulateur. Car
WI
NDOWSe
stu
nOSé
véne
ment
ie
ldo
nci
ln’
estp
ast
empsr
éel
.Ils
’exé
cut
ecommeu
nse
rvi
ce
résident dans le niveau zéro (mode noyau) et intercepte les interruptions matérielles avant
WINDOWS, par la suite, ilc
ommu
niquea
vecl
’exé
cut
abl
edur
égu
lat
eure
tint
erf
acea
vecl
e
t
système physique à travers la cared
’ac
qui
si
ti
on, en vue de contrôler le flux de données et de
signaux du modèle (maintenant exécutable) vers le système physique et vice versa.

La figure (I.3) montre le schéma qui illustre la relation qui existe entre les différents modules.

Figure I.3 : Processus de génération du code exécutable

11
Chapitre I Description et modélisation du pendule inversé

I.6 Principe de fonctionnement

Le principe de fonctionnement du système est très simple en théorie : quand le pendule


penche vers la droite, le chariot doit le rattraper en effectuant un mouvement vers la droite. Et
inversement.

La difficulté c'est de régler l'intensité et la forme de la réaction du chariot en fonction de


l'angle que le pendule fait avec la verticale.

I.7 Particularités de ce système

•I
nst
a ble
•Non-linéaire
•Mo
dèl
edec
onna
iss
anc
einc
omp
let
•Uns
eula
cti
onn
eur(
sousa
cti
onné
)
•2g
ran
deu
rsàa
sse
rvi
r(mul
tivariables)

I.7.1 Stabilité du système linéaire:

La stabilité en boucle ouverte du système linéaire est déterminée par la position dans le
plan complexe des valeurs propres de la matrice A d
esonmo
dèl
ed’
éta
t(voire figure II.4), qui
sont les pôles de la fonction de transfert réparties comme suit :

Le
squa
rte
spôl
ess
ontr
éel
s,l
’une
stc
onf
ond
uave
cl’
ori
gine
,le
sde
uxa
utr
ess
ontda
nsl
a
moitié gauche du plan S, donc le système est stables. Le dernier pôle se trouve dans le demi-plan
c
omp
lexed
edr
oit
eett
rad
uitl
’exi
st
enc
ed’
unmo
dei
nst
abl
e:l
’équ
ili
brei
nst
abl
edubr
asdu
pendule inverse.

I.7.2 Système sous actionné :

On considère le système mécanique, décrit par :

f (q, q) G (q) u


q ( I .1)

qe
stv
ect
eurd’
éta
tdec
oor
don
née
sgé
nér
ali
sée
s
f (.) est le champ de vecteur qui capture les dynamiques du système

12
Chapitre I Description et modélisation du pendule inversé

qvecteur de vitesse généralisé.


G est la ma
tri
ced’
ent
rée
.
u est le vecteur des entrées généralisés.

Le système (I.1) serait sous actionné si les entrées externes généralisées ne sont pas
c
apa
bledec
omma
nde
rins
tan
tané
men
tle
sac
cél
éra
tio
nsda
nst
out
esl
esd
ire
cti
onsdel
’es
pac
ede
configuration. Ceci se produit si m rang (Gq) n dim(q) ,e
nd’
aut
ret
ermel
ess
yst
ème
s sous
a
cti
onn
éso
ntmoi
nsd’
act
ionn
eur
squ
ele
urs variables de configuration.

I.7.3 Système holonome [BOU 06] [LAM 03]

Un système mécanique S est holonome si la position de ses différentes parties peut être
caractérisée par n variables indépendantes q1 ,..., qn , appelées coordonnées généralisées du

système. On dit alors que S est un système holonome à n degrés de liberté.


Le pendule inversé est également un système holonome avec pour coordonnées
généralisées q1 x et q2 .

I.7.4 Système non linéaire

Un système linéaire est un système dont le théorème de superposition est vérifié :


f (x y ) f ( x) f ( y ) ( I . 2)
où x et y s
ontde
sve
cte
ursd’
ent
ré, et  sont des scalaires et f (.) la sortie du
e
système ; contrairement aux systèmes linéaires ; dans le cas de systèmes non linéaires, le
t
héor
èmed
esu
per
pos
it
ionn’
estp
asvé
rif
ié[Zay 01].
ede
A caus ste
rme
sdec
oup
lag
eent
rel
esc
omp
osa
nte
sdel
’ét
at
,te
lqu
esin x3 x42 ,i
ls’
agi
t
l
àd’
uns
yst
èmen
onl
iné
air
eenl
’ét
at.Ce
pend
antonr
ema
rquequ
eles
yst
èmee
stl
iné
air
een
l
’ent
réeu mais les coefficients ne sont pas des constants

13
Chapitre I Description et modélisation du pendule inversé

I.8 Coordonnées généralisées du système

L’
ens
embl
educ
har
iotp
endu
leàde
uxd
egr
ésdel
ibe
rtéquis
ontr
epr
ése
nté
espa
rde
ux
coordonnées généralisées, x pour le déplacement horizontal du chariot,  pour la rotation du
pendule. La direction positive de x e
stl
ese
nsàdr
oit
eenmè
tree
tce
luid
el’
ang
lee
stl
ese
nsde
s
a
igui
ll
esd
’unemo
ntr
eenr
adi
an.

y
(t) (I,m)
x

d
l
F(t)
(M)

b
X(t)
Figure I.4 : Schéma del
’ens
emb
lec
har
iote
tpe
ndu
lei
nve
rsé

Soit :

m : masse du pendule b : frottements de déplacement du chariot

M : masse du chariot x(t ) : position du chariot

l : demi longueur du pendule (t ) : l' angle du pendule

F (t ) : force exercée sur le chariot g : intensité de pesanteur


d : frottements du pendule

14
Chapitre I Description et modélisation du pendule inversé

I.8.1 Modélisation du système a deux degrés de liberté [WEI 95][BUG 03][MCG 02]

On utilise pour cela la méthode de Lagrange définie par les équations suivantes :

L T * V (I.3)

d L L D
  Fj (I .4)

dt   j 
j   
j

Degrés de liberté, dans ce cas x (t ) et (t ) .


D Énergie dissipée par frottement.
F j Force généralisée dans le sens du degré de liberté j .

T * Énergie cinétique.
V Énergie potentielle.

L’
ava
nta
ged
ecef
orma
lis
mer
ési
ded
ansl
’él
imi
nat
iond
ese
ffor
tsd
’in
ter
act
ion.

I.8.2 Energie cinétique du système en mouvement


L’
éne
rgi
eci
nét
iqueduc
har
iote
stdo
nné
epa
rl’
équa
tion:
1
TM*  M x2 ( I .5)
2
L’
éne
rgi
eci
nét
iquedupe
ndul
ees
texp
rimé
epa
rl’
équa
ti
on:
1 1
Tm*  mv c v c  I2 (I .6)
2 2
La position du centre de gravité du pendule a partir de ces coordonnées:

rc ( x l sin)ˆ
i l cosˆ
j (I .7)
D’
oùl
avi
tes
sed
uce
ntr
edeg
rav
itédup
end
ulee
st:
dr 
l cos 
v c  c ( x )ˆ 
i l sinˆ
j (I .8)
dt

15
Chapitre I Description et modélisation du pendule inversé

Ens
ubs
ti
tua
ntl
esé
qua
ti
ons(
I.
7)e
t(I
.8)d
ansl
’équa
ti
on(
I.
6)ont
rouv
e:
1  2) 1 I 
2 l 2 sin2  2
Tm*  m( x
2
l cos
2 x l 2 cos2  (I .9)
2 2
Ave
csi
mpl
if
ica
ti
onl
’éq
uat
ion(
I.
9)l
’éne
rgi
eci
nét
iquepr
enda
lor
sl’
expr
ess
ion:
1  2) 1 I
2
Tm*  m ( x
2
l cos 
2 x l 2 ( I .10)
2 2
L’
éne
rgi
eci
nét
iquedel
’en
sembl
echa
riot(
I.
5)e
tpe
ndul
e(I
.9)e
ste
xpr
imé
epa
r:
1 1  2 ) 1 I
2
l cos
T * TM* Tm*  M x2  m( x2 2 x l 2 (I .11)
2 2 2
I.8.3 Energie potentielle du système
L’
éne
rgi
epot
ent
iel
leduc
ent
redeg
ravi
tédel
aba
rree
st:
V mglcos (I .12)
I.8.4 Equation de Lagrange

d L  
L
 Fj (I .13)
dt 

 
j  j

Le lagrangien du système est la différence entre son énergie cinétique et son énergie potentielle

L T * V (I.14)
Enu
til
is
antl
’expr
ess
ion(
I.
11)e
t(I
.12
) le lagrangien peut être écrit:
1 1   1 2
l cos
L  M x2  m( x2 2 x l 22
)  I mglcos ( I .15)
2 2 2
I
.8.
4.1L’
équa
tio
ndeLagr
ang
epourl
ede
grédel
ibe
rté(t ) x (t )

d L L
  F b x (I .16)
dt 
x 
x
La dérivée partielle du lagrangien suivant xet t s
’éc
rit:

d 
ml cos
(M xm x ) 0 F b x ( I .17)
dt
Donc la première équation de Lagrange :

(M m) 
x 

mlcos 2F b x
mlsin (I .18)

16
Chapitre I Description et modélisation du pendule inversé

I
.8.
4.2L’
équa
tio
ndeLagr
ang
epourl
ede
grédel
ibe
rté(t ) (t )

d  L 
L 

 
 d  (I .19)
 
dt  
et t s
La dérivée partielle du lagrangien suivant  ’éc
rit:

d I
 mgl sin) d 

cosml2
(ml x sin
) (ml x ( I .20)
dt
Donc la deuxième équation de Lagrange :


(ml2 I )mlcosmlx
x sin
 sin
mlx  
mglsind  (I.21)
Lemodè
ledec
onna
iss
anc
edus
yst
èmec
har
iotp
end
ulee
stdo
nnépa
rles
yst
èmed’
équa
ti
ons
suivant :


(M m)
 ml cos
bx
x 

ml sin
2
F
 
 
(I .22)

ml
 cos(ml2 I )
x dmglsin0

I
.9Li
néar
isat
iondumodè
leaut
ourde
spoi
ntsd’
équi
li
bre

Ava
ntde pr
océ
derà l
’ana
lys
edu modè
le de système, on linéarise les équations
différentielles (I.22). Il ad
euxp
oint
sd’
équi
li
bre: (0) point d’
équ
ili
br nstable et ()
ei
poi
ntd’
équi
li
bres
tab
le.

Pour des petites variations de a


utourdup
ointd
’équ
ili
bre0

0 
 ( I .23)


Ledé
vel
opp
eme
nte
nsé
riedeTa
ylordupr
emi
eror
dred
’unef
onc
ti eest donné par :
ond


 df
f () f (0 )  (I .24)

 d0

Et les termes du haut ordre sont négligés


2
0 (I .25)

17
Chapitre I Description et modélisation du pendule inversé

I
.9.
1Pos
it
iond’
équi
li
brei
nst
abl
e(=0)
Si on se limite aux petites variations de  autour du point de fonctionnement 0 0
correspondant à la position verticale de la barre.
Pour (0) , le développement limite du premier ordre des équations (I.23) et (I.24) est :

coscos(0) [sin(0)] 1

sinsin(0) [cos(0)]  ( I .26)
2
 0

En substituant ces linéarisations da


nsl
esy
stè
med’
équa
ti
on(
I.
22)e
ten négligeant les
t
erme
sduha
utor
dre
,ont
rou
vel
esy
stè
med’
équ
ati
onl
iné
ari
sés
uiva
nt:


(M m)
 xbx 

mlF
  
(I .27)

ml
 (ml I )
x 2
d mgl0

Ena
ppl
iqua
ntl
atr
ans
for
méed
eLa
pla
ces
url
esy
stè
med
’équa
tio
nli
néa
ris
éci
-dessus, on
trouve :


(M m)s 2 X (s) bsX (s) mls2(s) F (s)

 2 (I .28)

mls X (s) (ml2 I )s 2 (s) ds(s) mgl(s) 0

Où X (s) L( x(t )) et (s) L((t ))
En substituant pour éliminer X (s ) ou (s) dans (I.28), on trouve les deux fonctions de
transfert suivantes :
X (s) a s 2 a s a
G1 (s)   4 2 3 1 20 (I .29)
F (s) b4 s b3s b2 s b1s
(s) c2 s
G2 (s)   3
F (s) b4 s b3s 2 b2 s b1
Avec
a2 ml 2 I
a1 d
a0 mgl

18
Chapitre I Description et modélisation du pendule inversé

b4 (M m)(ml2 I ) m2l 2


b3 (M m)d (ml2 I )b (I .30)
b2 (M m)mgl db
b1 m glb
c2 ml
Les fonctions de transfert respectivement de la position du chariot et de la rotation du pendule
sont :

X (s) (ml2 I )s 2 ds mgl


G1 (s)  
F (s) ((M m)(ml2 I ) m2l 2 )s 4 [(M m)d (ml2 I )b]s 3 [(M m)mgl db]s 2 m glbs
(s) mls
G2 (s)   (I .31)
F (s) ((M m)(ml I ) m l )s [(M m)d (ml2 I )b]s 2 [(M m)mgl db]s m glb
2 2 2 3

Les variables et les paramètres du système chariot pendule sont:


M =2.4 kg, m =0.23 kg, g =9.81 m/s2, l =0.36 m, I =0.099 kg.m2, b =0.05 Ns/m, d =0.005 Nms/rad.

Les zéros, pôles et diagramme de Bode de ces fonctions de transfert (I.31) sont présentées
dans la figure suivante :

(Pole et Zero du Charriot) (Pole et Zero du Pendule)


1 1

0.5 0.5
Im a g in a r y A x is

Im a g in a r y A x is

0 0

-0.5 -0.5

-1 -1
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
Real Axis Real Axis

(Diagramme de Bode du Charriot) (Diagramme de Bode du Pendule)


100 -20
P h a s e ( d e g ) M a g n itu d e ( d B )

P h a s e ( d e g ) M a g n itu d e ( d B )

0 -40

-100 -60
-90 90

45

-180 0
-3 -2 -1 0 1 -3 -2 -1 0 1
10 10 10 10 10 10 10 10 10 10
Frequency (rad/sec) Frequency (rad/sec)

Figure I.5:Carte des Pôle-Zér


ose
tDi
agr
ammedeBodedus
yst
èmel
iné
ari
séau
tou
rpo
intd’
équ
ili
bre(0)

19
Chapitre I Description et modélisation du pendule inversé

Simulation du système libre


1 3

Vitesse du chariot (m/s)


Position du chariot (m)

2
0.5

0
0

-0.5 -1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Temps (s) Temps (s)

30 80

Vitesse du pendule (rad/s)


Position du pendule (rad)

60
20
40

20
10
0

0 -20
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Temps (s) Temps (s)

Figure I.6: Résultats de simulation en boucle ouverte d’ un eré pon seimpulsionnelle d’


unedur
ée

0.01 sec, amplitude 0.1 (N) et conditions initiales [x, x,,] [0,0,0,0]

I
.9.
2Pos
it
iond’
équi
li
bres
tabl
e()
Pour () , le développement limite du premier ordre des équations (23) et (24) est :

coscos()(sin) 1

sinsin() () cos() 
 ( I .32)

2 0

La substitution de ces linéarisations da


nsl
esy
stè
med’
équa
ti
on(
I.
22)e
tla négligence des
termes du haut ordre, permettent de trouver l
esy
stè
med’
équa
tio
nli
néa
ris
ésu
iva
nt:


(M m) 
 b xml 
x 
F
 
 
(I .33)

ml 
 (ml 2 I )
x d mgl0

En
finl
’ap
pli
cat
iondel
atr
ans
for
méedeLa
pla
ces
url
esy
stè
med’
équa
ti
onl
iné
ari
séc
i-
dessus, se traduit par :


(M m)s 2 X (s) bsX (s) mls2(s) F (s)
 (I .34)

mls X (s) (ml I )s (s) ds(s) mgl(s) 0
2 2 2

20
Chapitre I Description et modélisation du pendule inversé

En substituant pour éliminer X (s ) ou (s) dans (I.34), on trouve les deux fonctions de
transfert suivantes :

X ( s) a s 2 a s a
G1 (s)   4 2 3 1 20
F (s) b4 s b3 s b2 s b1s
(s) c2 s
G2 (s)   3 ( I .35)
F (s) b4 s b3 s 2 b2 s b1
Avec
a2 ml 2 I
a1 d
a0 mgl

b4 (M m)(ml2 I ) m2l 2


b3 (M m)d (ml2 I )b (I .36)
b2 (M m)mgl db
b1 m glb
c2 ml
Les fonctions de transfert respectives de la position du chariot et de la rotation du pendule sont :

(ml2 I )s 2 ds mgl


G1 (s) 
((M m)(ml2 I ) m2l 2 )s 4 [(M m)d (ml2 I )b]s 3 [(M m)mgl db]s 2 m glbs
mls
G2 (s)  (I .37)
((M m)(ml I ) m l )s [(M m)d (ml2 I )b]s 2 [(M m)mgl db]s mglb
2 2 2 3

Les zéros, pôles et diagramme de Bode de ces fonctions de transfert (I.37) sont présentées dans
la figure suivante :
(Pole et Zero du Charriot) (Pole et Zero du Pendule)

2 2

1 1
Imaginary Axis

Imaginary Axis

0 0

-1 -1

-2 -2

-0.04 -0.035 -0.03 -0.025 -0.02 -0.015 -0.01 -0.005 0 -0.04 -0.035 -0.03 -0.025 -0.02 -0.015 -0.01 -0.005 0
Real Ax is Real Axis

(Diagramme de Bode du Charriot) (Diagramme de Bode du Pendule)


200 100
Magnitude (dB)

Magnitude (dB)

100 50

0 0

-100 -50

-200 -100
360 180
Phase (deg)

Phase (deg)

270 0

180 -180
-3 -2 -1 0 1 -3 -2 -1 0 1
10 10 10 10 10 10 10 10 10 10
Frequenc y (rad/sec ) Frequency (rad/s ec)

Figure I.7:Pôle-zéros et diagramme de Bode du système linéarisé aut


ourpoi
ntd’
équ
ili
bre()
21
Chapitre I Description et modélisation du pendule inversé
-3
x 10

V it e s s e d u c h a rio t (m / s )
P o s it io n d u c h a rio t (m )
2 0.01

1
0
0

-1 -0.01
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)

V it e s s e d u p e n d u le (ra d / s )
-3
P o s it io n d u p e n d u le (ra d )

x 10
3.1418 5

3.1416
0
3.1414

3.1412 -5
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)

Figure I.8 : Résultats de simulation en boucle ouverte d’un er épo ns eimpulsionnelle d’


une
durée 0.01 sec, amplitude 0.1 (N) et conditions initiales [x, x 
,,] [0,0,,0]

I
.10Re
pré
sent
ati
ond’
état
I.10.1 Avec la force F c
ommes
ignald’
ent
rée[BUG 03]
Onr a
ppe
ll
equel
are
pré
sent
at
iond’
éta
tpourl
ess
yst
ème
sli
néa
ire
ses
tdel
afor
me
suivante :
.
x Ax BF
 (I .38)

y Cx
T
 . 
t x ; x  x3 x4 
.
x x  
T
Onpos
eleve
cte
urd
’ét
a x1 x2 (I .39)
 
1 x2 et x3 x4
Tel que x 
0 x
1   0 
1 0 0
x1   (Lm) 2 gv2 
  0 bv Lmdv2   v 
d x2   2
I L2 m I L2 m 
x2   2 
 0 x  0
 F ( I .40)
dt x3  0 0 1 
 3  Lmv1 
x  0 Lmbv 1
dv1 x  
 
4  Lmgv1 4  M m 
 M m 

1 0 0 0
y 
0 0 1 0
x ( I .41)
 

 M m
v1 

 I ( M m) L mM
2

Avec  ( I .42)
 I L2 m
v2 

 I ( M m) L mM
2

22
Chapitre I Description et modélisation du pendule inversé

I.10.2 Modélisation en tenant compte du moteur électrique [LAM 04]


Le c
har
iots
edé
pla
ceàl
’ai
ded
’unmot
euràc
our
antc
ont
inu
ecommel
apr
ése
ntel
afi
gur
e
(I.9) :

Figure I.9 : La relation entre la force mécanique F et la tension V

L’
équa
ti
oné
lec
tri
qued
eces
ché
mae
st:

K K
V IR K m IR  m t X (I .43)
r

Ou :

V : La tension exercée sur le moteur (volt).

I : Intensité du circuit (Ampère).

R : Résistance équivalente du circuit (Ohm).

K m : Constante de couple du moteur (N.m/A).

Kt : Ra
ppor
tdet
rans
mis
siond’
eng
rena
ge(
sansdi
mens
ion).

r : Ra
yond
’eng
rena
gedes
ort
ie(
mèt
re)
.

: vitesse angulaire del


’ar
bredumoteur.

Le couple produit à l'arbre du moteur est donné par cette équation mécanique :

Cm K m I (I .44)

Qui devient a la sortie de la boite de transmission :

C Cm 
K t K m K t I (I .45)

Cec
oup
lec
réeu
nef
orc
eàl
aso
rti
ed’
eng
rena
gequie
st:

23
Chapitre I Description et modélisation du pendule inversé

C
F (t )  ( I .46)
r

Ut
il
is
antl
esé
qua
ti
ons(
I.
43)e
t(I
.45)da
nsl
’éq
uat
ion(
I.
46)
,ona
ura:
2
K K K K  1
F (t )  m t V  m t  X ( I .47)
Rr  r R

En négligeant les termes b et d ,on pe


utr
ééc
rir
ele
séq
uat
ions(
I.
22)àl
’ai
ded
’unes
eul
e

riva
ti
one
tobt
eni
ral
orsl
’équa
ti
ond
’ét
ats
uivante :

. .
x1 x2

m lg cosx3 
sin x3 

.
1
 ml cos 2 ( x3 )  K m K g
x
2 
 m  M 
 2

  V 
K m2 K g2
2
x2 
 2
mlx 42 sin 
x3 
  I ml   Rr Rr I ml ( I .48)
x x

3 4

ml cos 2  x3  cosx3  mlx 42 cosx3 


sin 
x3 

. KmK g 
1
  K m2 K g2 
x 4 
 I ml 2
 
 


x  V 

 g sin x  
m M  m M  Rr m M
2 2 3

  Rr  

I.10.2.1 Linéarisation des équations du pendule inversé

La linéarisation du s
yst
èmed’
équa
ti
on(
I.
48)a
uvoi
si
nag
ede0 0 , tel que sin()  et

cos() 1 , et 
2
 est négligeable devant , donne :

.
x Ax BV
 (I .49)

y Cx

Où :

0 1 0 0 
 1 Km2 K g2 gml 
0
ml Rr 2 ml
0 
 (M m)  L((M m)  ) 
A 0 L L  (I .50)
 0 0 1 
 1 Km2 K g2 g 
0 0 
 (M m) ml Rr 2 L  ml 
L ) )

 (M m) (M m) 

24
Chapitre I Description et modélisation du pendule inversé

 0 
 1 KmK g 
 ml Rr 
 ( M m)  
B  L  ( I .51)
 0 
 1 KmKg 
 
( M m) 
ml Rr
 L ) 
 ( M m) 


1 0 0 0
C 
0 0 1 0
( I .52)
 
I ml 2
Avec L  ( I .53)
ml
I.10.2.1.1 Simulation du système excité
Nousa
ppl
iquo
nsun
eimpul
si
ond’
unea
mpl
it
ude0
.1Ve
td’
unedur
ée0
.1Se
c,a
vecl
es
conditions initiales [x, x 
,,] [0,0,0,0]
Les
yst
èmeos
cil
lej
usqu’
àat
te
indr
esap
osi
ti
ond
’équi
li
bres
tabl
e.Le
sré
sul
tat
sde
simulation sont les suivants :

0.8 1
V ites s e du c hariot (m /s )
P os ition du c hariot (m )

0.6
0.5
0.4
0
0.2

0 -0.5
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)
V ites s e du pendule (rad/s )
P os ition du pendule (rad)

6 10

5
4
0
2
-5

0 -10
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)

Figure I.10 : Résultats de simulation en boucle ouverte d’ u ner épo ns eimpulsionnelle d


’unedu
rée
0.01 sec et amplitude 0.1 (V) conditions initiales [x, x 
,,] [0,0,0,0]

Les résultats de simulations montrent que la position [x, x 


,,] [0,0,0,0] est un point
d’
équ
ili
brei
nst
abl
e.
Nousa
ppl
iquon
sunei
mpul
si
ond
’unea
mpl
it
ude0.
1Vol
tetd’
unedur
ée0
.1Se
c,a
vecl
es
conditions initiales [x, x 
,,] [0,0,,0] (
lapos
it
iond’
équi
li
brestable).

25
Chapitre I Description et modélisation du pendule inversé

Les résultats de simulation sont les suivants :


0.8 1
P osition du c hariot (m )

V ites s e du c hariot (m )
0.6
0.5
0.4
0
0.2

0 -0.5
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)

V ites s e pendule (rad/s )


3.3 1
P osition pendule (rad)

3.2 0

3.1 -1

3 -2
0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 100
Temps (s) Temps (s)

Figure I.11: Résultats de simulation en boucle ouverte d’ uner épon seimpulsionnelle d’


unedur
ée

,,] [0,0,,0]
0.01 sec et amplitude 0.1 (V) conditions initiales [x, x

I.11 Redressement du pendule avec une commande non linéaire [BUG 03] [AST 00]

Cette commande est basée sur le théorème de stabilité de Lyapunov et va permettre de


faire converger l'énergie du système vers la valeur de l'énergie en position haute.
On prend une définition simplifiée de l'énergie du pendule :
1 .
E  J 2 mgl 
cos
 1 ( I .54)
2

Nous pouvons librement considérer que le pendule stabilisé en position haute possède une
énergie nulle. Cette situation correspond aux grandeurs :
0
 ( I .55)
0

D'après cette définition de l'énergie, dans la position basse E vaut E0 2 mgl et dans la
position haute E vaut E * 0 .

Onvama
int
ena
nts’intér
es s e rlaf
oncti ons
uiv
ante:
.
G ( E E * ) 2 ( J 2 mgl 
cos
 1
1
)2 ( I .56)
2

G ( 0 ) 0 et pour tout X 0, G ( X ) 0 donc G est Définie positive.


1 .2
J  mgl 
cos
 1
.
G 2 ( J
) (mgl sin  

) ( I .57)
2

26
Chapitre I Description et modélisation du pendule inversé

L’
expr
ess
ions
impl
if
iéedel
adéri
véeseco ndedel ’
ang l
eest:

 ( M m ) mgl sin() Fml cos()
  ( I .58)
( M m ) J Mml 2

On obtient donc
.
 J ( M m) Mml 2 Fml cos()
G 2( E E * )()( mgl sin()( 1  ) ) ( I .59)
( M m) J Mml 2
( M m) J Mml 2
.
 Fml cos()
Soit G 2( E E * )( )( mgl sin() ( I .60)
( M m ) J Mml 2
En prenant comme commande :


F Ksign(() cos()(E E * ) , K 0 ( I .61)
On obtient le résultat suivant :
. 1

G 2 ml ( E E * ) 2 () cos() 0 ( I .62 )
( M m ) J Mml 2
Donc avec cette commande, G e
stunef
onc
tiondeLy a pun ovetd’ a
prèsl
ethé
orèmede
stabilité, le point 0 e
stunpointd’ é
quil
ibr
eas
ymptot
iqueme nts t
abl
e.Don cce
tt
ecomma nde
pe rmetdef ai
rec onver
gerl
’én
erg
ieE vers la valeur E * synonyme de converger le pendule vers
la position inversée.

Cette commande ne sera utilisée que pour balancer le pendule à une position supérieure
avec lemi nimum d’ énergi
e.Onac ho i
sic ommek =20,mais elle ne permet pas de le stabiliser
d’oup lusieurscomma ndesc l
assiqu ee th euri
stiques e rontsy nthé t
iséespou rma in
teni rl
epe
ndule.
On utilise une loi de commutation appropriée entre les deux commandes, dans notre cas on
applique la commutation quand la valeur absolue de l'angle est au voisinage de 20° .

Pour que la commande fonctionne en tension, il faut rajouter un gain  car la commande
calculée fourni directement la commande F . Donc le gain va convertir la force F en tension Vm
D’
apr
èsl
esdon
née
sduc
ons
tr
uct
eurFe
edb
ackLt
d,l
ema
ximum det
ens
iondumo
teure
st2.5Volt
qui corresponds au maximum de force à 20 Newton . La dynamique entre la tension et la force est

gli
géee
tsup
pos
equ’
ell
eso
ntu
ner
ela
tio
nli
néa
ireF Vm .

Nous avons procédé à la vérification des simulations et le test de la commande


développée en expérimentation au système pendule inversé. La loi de commande est implémentée
àl
’ai
ded’unPCpenti
umIVà1GHze tl
elog
ici
elMa tl
ab7.2etpl
usente
mpsr
éele
nut
il
is
antl
a
mét
hoded’El
uerLa
grang
e.Lapé
rio
ded’é
chant
il
lonna
geestfi
xéeà0.
001s.

27
Chapitre I Description et modélisation du pendule inversé

I.11.1 Résultats de simulation et expérimentaux :


a b
0.5
0.5
P os ition(m )

P os ition(m )
0 0

-0.5 -0.5
0 5 10 0 2 4 6 8
Temps(s) Temps(s)

5
A ngle(rad)

A ngle(rad)
0 0
0 5 10 0 2 4 6 8
Temps(s) Temps(s)
5
Com m ande(V )

Com m ande(V )
5

0 0

-5
-5
0 5 10 0 2 4 6 8
Temps(s) Temps(s)


Figure I.12: Résultat de simulation redressement avec conditions initiales [x, x,, ] [0,0,0,0]
et un gain Vm 0 3 puis Vm 0 4 pour les figures (a et b) respectivement

0.2
Position (m)
Position (m)

0
0
-0.1

-0.2
-0.2
0 2 4 6 8 10 12 0 2 4 6 8
Temps (s) Temps (s)
6
6
Angle(rad)
Angle(rad)

4
4
2
2
0
0
0 2 4 6 8 10 12 0 2 4 6 8
Temps (s) Temps (s)
Commande (V)

Commande (V)

2 2

0 0

-2 -2

0 2 4 6 8 10 12 0 2 4 6 8
Temps (s) Temps (s)

Figure I.13: Redressement expérimental avec conditions initiales [x, x ,,] [0,0,0,0]
et un gain Vm 0 0.15 puis Vm 0 0.2 pour les figures (a et b) respectivement

I.12 Conclusion

Dans ce chapitre, nous avons présenté le procédé sur lequel nous avons travaillé, c
’es
t-à
dire le pendule inversé.I
lappa
rai
tda
nsc
ett
ede
scr
ipt
ione
xha
ust
ived
el’
ins
tal
la
tio
nqu
ele
sloi
s
quir
égi
sse
nts
onf
onc
tionne
ments
ontpa
rfa
it
eme
ntc
onn
ues
.Ce
pen
dant
,l’
obj
etdeno
tret
rav
ail
étant de commander le pendule inversé à l
’ai
dede
s différentes méthodes heuristiques et
classiques. Ainsi, nous avons pensé à comparer les résultats obtenus par les différentes
approches.

Nous allons maintenant introduire les mé


thode
sdec
omma
nde
scl
ass
ique
squ
ifon
tl’
obj
et
du chapitre suivant.

28
Chapitre II: Commandes classiques du pendule inversé

II.1 Introduction

Dans ce chapitre, nous allons introduire des rappels théoriques sur les différents outils
de commandes classiques appliqués au pendule inversé, dont nous aurons besoin lors de la
synthèse de notre schéma de commande pour le redressement et la stabilisation du pendule
inversé. La première stratégie appelée commande linéaire quadratique est proposée pour la
phase de stabilisation du pendule. Quant à la deuxième stratégie appelée commande par mode
de glissant, elle est basée sur des considérations de stabilité de Lyapunov du système à
commander. Cette loi de commande permet de faire tendre la surface de glissement vers zéro
est aussi décomposée en deux objectifs : Le premier consiste à redresser le pendule inversé et
le second de le stabiliser.

II.2 Commande linéaire quadratique


L’
obj
ect
ifdel
acomma
ndel
iné
air
equa
dra
tique(LQ) est de formuler le problème de
c
omma
ndepa
rre
tourd’
éta
ten termes d’
opt
imi
sat
iond’
unc
ritère qui traduit un compromis
e
ntr
el’
eff
ortde
mandéàl
acomma
nde(
act
ionne
urs
)etl
esc
ont
rai
nte
squ’
onve
uti
mpos
erà
l
’ét
at.Ene
ffe
tce
scont
rai
nte
setl
’ef
for
tde
mandéa
uxa
cti
onne
ursnes
ontpa
svr
aime
ntpr
is
ee
en compt xpl
ici
teme
ntda
nsl
eca
sdel
acomma
ndemoda
le.Toutc
equ’
onpe
utdi
rec
’es
t
que plus le système doit être rapide plus de grande amplitudes de commandes sont
nécessaires. Or ces amplitudes sont limitées par les actionneurs.
Ons
’as
sig
neda
nsc
ette partie les deux objectifs suivants :
 St
abi
li
sat
iondus
yst
èmepe
ndu
lei
nve
rsépa
rre
tourd’
éta
tdet
ypeLQ.
 Estimation des états du modèle.

II.2. Rappels sur la stabilité, détectabilité


Définition (II.1)
Une paire (A, B) e
sts
tabi
li
sabl
es’
ile
xis
teunec
omma
ndepa
rre
tourd’
éta
tdel
afor
me
u F x(t ) telle que la matrice (A+BF) est stable.
Le théorème ci-dessous permet de vérifier cette propriété pour un système :
Théorème (II.1)
Les propriétés suivantes sont équivalentes
 (A,B) est stabilisable.
 Il existe une matrice L telle que (A+BF) est stable.
 La matrice [ A I B ] est à colonnes de rang plein pour Re 0

 Pour tout et x tel que x T A x , x T B 0

29
Chapitre II: Commandes classiques du pendule inversé

Définition (II.2)
Une paire (C,A) est détectable si les modes non observables sont stables.
Le théorème ci-dessous permet de vérifier cette propriété pour un système :

Théorème (II.2)
Les propriétés suivantes sont équivalentes
 (C,A) est détectable.
 Il existe une matrice L telle que (A+LC) est stable.
 La matrice 
A I C  est à colonnes rang plein pour Re 0 .
T

 Pour tout et x tel que Ax x Cx 0 .

II.2.3 Formulation du problème LQ et sa solution


II.2.3.1 Commande LQ à horizon fini [LAR 93]
On considère le système linéaire donné par :
xAx Bu

y Cx Du (II.1)
x(t ) x
 0 0

Où x (t) e
stl
eve
cte
urd’
éta
tdedi
men
sion((n 1), u (t) vecteur de commande de dimension (m
1), y(t) vecteur de sortie de dimension (q 1), x 0 l
’ét
ati
nit
ialà l
’i
nst
anti
nit
ialt 0 ,
A ma
tri
ced’
évol
uti
onoud’
éta
t,B ma
tri
cedec
omma
ndeoud’
ent
rée
,C matrice de sortie ou
de mesure, D matrice de couplage entrée-sortie ou matrice de transmission direct.
On définit la commande optimale à horizon fini u opt (t ) comme la commande qui

minimise le critère quadratique :

1 
t
1 T 
J   [ x (t )Qx(t ) u T (t ) Ru (t )]dt x T (t1 ) Sx(t1 ) (II.2)
2
t0 

Avec Q(t ) 0 , est une matrice de pondération qui donne un poids différent à chaque
c
ompos
ant
eduve
cte
urd’
éta
tda
nsl
ecr
it
èr, R 0 est une matrice de pondération de la
e
commande qui affecte un poids différent à chaque composante du vecteur de commande
S 0

30
Chapitre II: Commandes classiques du pendule inversé

II.2.3.1.1 Ré
sol
uti
ond’
unpr
obl
èmedec
ommandeLQ
L’
Hami
lt
oni
ens
’éc
rit:
1
H ( x(t ), u (t ), (t ), t )  ( x T Qx u T Ru) T ( Ax(t ) Bu (t )) (II.3)
2
Remarque (II.1)
λreprésente le vecteur adjoint composé des dérivées partielles du critère par rapport à
l
ava
ria
bled’
éta
t.
Le Hamiltonien est minimal pour :
u (t ) H ( x(t ), u (t ), (t ), t ) Ru (t ) B T (t ) 0 (II.4)

La commande optimale est alors donnée par :


uopt R 1 B T (t )(t ) (II.5)

Les équations de Hamilton-Pont


ri
agui
nes
’éc
rive
nta
lor
s:
 (t ) Ax (t ) BR 1 B T (t )
x
 (II.6)

(t ) AT (t ) Qx (t )
La solution du problème est fournie par le théorème ci-dessous.

Théorème (II.3)
La solution optimale du problème (2.2) est donnée par :
u opt (t ) F (t ) x (t ) (II.7)

R 1 (t ) B T (t ) P(t ) x (t ) (II.8)

Où P(t ) e
stl
’uni
que solution symétrique semi-dé
fini
e pos
it
ive de l
’équa
tion
différentielle de Riccati.

P(t ) P (t ) A(t ) AT (t ) P (t ) P (t ) B (t ) R 1 (t ) B T (t ) P (t ) Q (t ) (II.9)

Avec la condition finale P(t1 ) S . La valeur correspondante du critère est donnée par
1
J opt  x T (t 0 ) P(t 0 ) x(t 0 ) (II.10)
2

Remarques (II.2)
Las
olut
iondel
’équa
tiondi
ff
ére
nti
ell
edeRi
cca
tis
’obt
ientpa
rint
égr
ati
onàr
ebour
s
de t1 à t 0 .

31
Chapitre II: Commandes classiques du pendule inversé

x(t ) i
nte
rvi
entda
nsl
’expr
ess
iondeu opt , ce qui permet de construire un système à

contre réaction (feedback). Nous pouvons remarquer que P(t ) ne dé


pendpa
sdel
’ét
atde
système, alors la loi de commande trouvée est optimale quelque soient les conditions initiales.

II.2.3.2 Commande LQ à horizon infini [MAM 06]


Suppos
onsma
int
ena
ntquel
’onf
ass
ete
ndr
et1 ve
rsl
’i
nfi
ni.Lec
rit
èret
ermi
naln’
est
alors plus nécessaire. Nous pouvons alors écrire le critère sous la forme :

1 t
1 T 

J  lim  [ x (t )Q(t ) x(t ) u T (t ) R(t )u (t )]dt  (II.11)
2 t1 
t0 

Théorème (II.4)
Supposons le système complètement commandable pour tout t t
[ 0 ,[ ou
exponentiellement stable. La solution optimale du problème (2.11) est donnée par ;
u opt (t ) F (t ) x (t ) (II.12)

R 1 (t ) B T (t ) P(t ) x (t ) (II.13)

Où P(t ) e
stl
’uni
que s
olut
ions
ymé
tri
que s
emi
-dé
fini
e pos
it
ive de l
’équa
tion

différentielle de Riccati :

P(t ) P (t ) A(t ) AT (t ) P (t ) P (t ) B (t ) R 1 (t ) B T (t ) P (t ) Q (t ) (II.14)


Avec la condition finale
lim P(t1 ) 0 (II.15)
t1  

La valeur correspondante du critère est donnée par :


1
J opt  x T (t 0 ) P(t 0 ) x(t 0 ) (II.16)
2
II.2.4 Commande LQ pour système invariant avec un horizon infini [MAM
06],[LAR 93]
Si les matrices A, B, Q et R sont constantes et T (horizon) infini, la loi de commande
e
sti
nva
ria
nte
,pui
squec
haquei
nst
ante
sti
dent
iqueàl
’i
nst
ants
uiva
nt.I
lenr
ésul
tequel
a
matrice P(t ) est constante et que P(t ) 0 . L’
équa
tion de Ri
cca
tide
vie
ntun s
yst
ème
d’
équa
tiona
lgé
bri
quedontl
aré
sol
uti
onf
our
nitl
esc
oef
fi
cie
ntsder
etourd’
éta
tcons
tan
ts
(la contre-réaction).
On considère le système linéaire invariant donné par :

32
Chapitre II: Commandes classiques du pendule inversé

xAx(t ) Bu (t ) (II.17)


Avec x(t 0 ) x0
On considère alors le critère quadratique

1 t
1 T 

J  lim  [ x (t )Qx(t ) u T (t ) Ru (t )]dt  (II.18)
21 
t  
t0 

Avec Q 0 et R 0 sont des matrices constantes.
On obtient les résultats suivants, donnés par les théorèmes ci-dessous
Théorème (II.5)
Quand t1 t
endve
rsl
’i
nfi
ni,l
asol
uti
ondel
’équa
tiondi
ff
ére
nti
ell
edeRiccati tend vers
une matrice constante
lim P (t , t1 ) P0 (II.19)
t1  

P0 est la s
olut
iondel
’équa
tiondeRi
cca
tia
lgé
bri
que

P0 AA T P0 P0 BR 1 B T P0 Q 0 (II.20)


La commande optimale est donnée par :
u opt (t ) Fx (t ) (II.21)

R 1 B T P0 x (t ) (II.22)
Et le coût optimal vaut :
1
J opt  x T (t 0 ) P0 x(t 0 ) (II.23)
2
Théorème (II.6)
Si le système (2.17) est stabilisable et le couple (Q 1 / 2 , A) est détectable, ou Q1 / 2 est
T
n’
impor
teque
llema
tri
cet
ell
eque( Q1 / 2 ) Q1 / 2 = Q alors :
 P0 e
stl
’uni
ques
olut
ions
emi
-dé
fini
epos
it
ivedel
’équa
tiona
lgé
bri
quedeRi
cca
ti.
 Le système bouclé est asymptotiquement stable.
 Si de plus (Q 1 / 2 , A) observable, alors P0 est définie positive..

II.2.4.1 Ré
sol
uti
ondel
’équat
iondeRi
ccat
i
L’
équa
tionma
tri
cie
lledeRi
cca
tipe
utê
trer
ésol
ue,s
oita
nal
yti
que
mentda
nsl
esc
as
les plus simples, soit par intégration numérique (Runge-Kutta).

33
Chapitre II: Commandes classiques du pendule inversé

II.2.5 Choix des matrices de pondération


Les matrices de pondération sont, généralement, choisies diagonales où [LAR 93]:
q1 0   0
0 q20 . 0
 
Q diag ( q1 , q 2 ,..., q q )  0   0 (II.24)
 
    0
0   0 qq 
 

r1 0   0
0 r2 0  0
 
R diag (r1 , r2 ,..., rm ) 0 0 0 0 (II.25)
 
  0  0

0    rm 

Pour faire une évaluation initiale de Q et R, on se basera sur le calibrage physique des
entrées-sorties correspondantes, en prenant :
2
 1 
ri   , i
=1,2,
…,m (
II
.26
)

sup( u i ) 
2
 1 
q i   , i
=1,
2,…,
q (
II
.27)

sup( y i ) 

e
C’stl
arè
gledeBryson.
On pourra ensuite raffiner le choix des pondérations par essais et erreurs en simulation.
Remarque (II.3)
Si on augmente Q par rapport à R, on aura globalement des réponses rapides au prix
d’
unec
omma
ndepl
usé
ner
gique.

II.2.6 Commande linéaire quadratique gaussienne (LQG) [MAM 06], [LAR 93]
La synthèse de la commande linéaire quadratique (LQ), étudiée précédemment,

ces
sit
elac
onna
iss
anc
eduve
cte
urd’
éta
t.Ce
penda
nt,da
nsl
ama
jor
it
éde
spr
obl
ème
sde
c
omma
nde
,onnedi
spos
equed’
unec
onna
iss
anc
epa
rti
ell
eduve
cte
urd’
éta
tcommeda
nsl
e
c
asdumo
dèl
ed’
unpe
ndul
einve
rsé
.Da
nsc
eca
slà
,onfait appel à la commande (LQG).
Ce
ttede
rni
èree
stbi
ena
dapt
éel
ors
quel
’ét
atdus
yst
èmen’
estpa
sdi
rec
teme
ntme
sur
abl
eou
que les mesures sont affectées par le bruit. Dans ce paragraphe, nous allons définir quelques
notions sur la commande (LQG), puis appliquer cette dernière au modèle du pendule inversé
afin de le stabiliser.

34
Chapitre II: Commandes classiques du pendule inversé

II.2.6.1 Systèmes à état non complètement accessible


Da
nsl
eca
soùl
esy
stè
men’
estpa
sàl
’état complètement accessible et si le système
e
stdé
tec
tabl
e,c
’es
t-à-dire lorsque les pôles non observables sont à partie réelle strictement

gat
ive
,ile
stpos
sibl
e,pouri
mpl
ant
erune r
égul
ati
on pa
rre
tourd’
éta
t,d’
uti
li
serun
e
sti
mat
eur(
obs
erva
teur
,fi
lt
re)
.L’
obs
erva
teure
stuns
yst
èmedy
nami
que
,dontl
ese
ntr
éess
ont

constit e
sdel
’ent
réee
tdel
asor
ti
edus
yst
èmeàc
omma
nde
retquiapourf
onc
tionde
r
econs
trui
re,t
outa
umoi
nsa
sympt
oti
que
mentl
’ét
atdus
yst
ème
.

y
Estimateur
Filtre

Observateur

Figure II.1 : Schéma synoptique du filtre de Kalman.

Où u(t) e
stl
’ent
réedus
yst
è ,y(t) est la sortie du système et xˆ
me (t ) e
stl
’ét
ate
sti
mé.

II.2.6.2 Filtrage de Kalman, commande LQG [MAM 06], [LAR 93]


II.2.6.2.1 Position du problème
Le f
il
tr
age de Ka
lma
n pr
opos
e une r
econs
truc
tion d’
éta
tda
nsune approche
stochastique. Ons
uppos
equel
’ét
atet la mesure sont bruités.
x(t ) A(t ) x(t ) B(t )u (t ) (t )
 (II.28)
y (t ) C (t ) x(t ) D(t )u w(t )
(t ) est l
eve
cte
urdebr
uitd’
éta
t,w(t ) est le vecteur de bruit de mesure,, y(t) est le
vecteur de sorties mesurées.
(t ) et w(t) s
ontde
sbr
uit
sbl
ancg
aus
sie
nse
tnonc
orr
élé
s.Le
ursf
onc
tionsd’
inter-
corrélation s
ontnul
les
,ta
ndi
squel
eur
sfonc
tionsd’
aut
o-corrélation se réduisent à des
impulsions de Dirac, c'est-à-dire :
E  
(t )E w(t ) 0 (II.29)

E
() (t V (t )()
T
(II.30)

E
w(t ) w (t )W (t )()
T
(II.31)

II.2.6.2.2 Filtre de Kalman [WEL 04]


On désire alors synthétiser le filtre de Kalman estimateur de la forme :


A(t ) xˆB (t )u L(t )(C (t ) xˆD(t )u y ) (II.32)

35
Chapitre II: Commandes classiques du pendule inversé

Te
lquel
ega
induf
il
tr
eLmi ni
mi s el ava rianc
edel
’er
reurd’
est
ima
tiondonné
epa
r:
(t ) E[ ~
x (t ).~
x T (t )] (II.33)

E[( x(t ) xˆ


(t )).( x(t ) xˆ
(t )) T ] (II.34)
On démontre alors le théorème suivant :
Théorème (II.7)
L’
obs
erva
teurr
eche
rchée
stdonnépa
r:

A(t ) xˆB (t )u L (t )(C (t ) xˆD (t )u y ) (II.35)
Avec
L(t ) (t )C T (t )W 1 (t ) (II.36)
Où (t ) e
sts
olut
iondel
’équa
tiondi
ff
ére
nti
ell
edeRi
cca
tis
uiva
nte:


(t ) A(t ) (t )(t ) AT (t ) (t )C T (t )W 1 (t )C (t ) (t )V (t ) (II.37)
Le filtre doit être initialisé avec
(t 0 ) E[ x(t 0 )]
xˆ (II.38)

(t 0 ) E [( x (t 0 ) xˆ
(t 0 )).( x (t 0 ) xˆ
(t 0 )) T ] (II.39)

Remarques (II.4)
(t ) e
stl
asol
uti
ondel
’équa
tiondeRiccati, associée au filtre de Kalman. La matrice
( ) 0) del
(t ) est la solution permanente ( t ’équa
tiondeRi
cca
tia
ssoc
iéea
upr
obl
èmede
commande, dit problème dual, suivant :

x (t ) AT x (t ) C T u (t )
 (II.40)

y (t ) B x(t )
T

1
 


J   x(t )
T
Wx (t ) 
u (t )Vu (t ) dt 
T
(II.41)
2 0 
On pourra remarquer l
’ana
log
iee
ntr
el’
équa
tion(2.37) e
tl’
équa
tion(2.14) pour la
synthèse de la commande LQ

Lor
squ’
unfiltre de Kalman est associé à une commande par retour LQ, on parle alors
de commande LQG (Linear Quadratic Gaussian).
Da
nsl
eca
sd’
uns
yst
èmei
nva
ria
nt,l
ors
quett
endve
rsl
’i
nfi
ni,(t ) tend vers une
matrice constante semi-dé
fini
epos
it
ivequivé
rif
iel
’équa
tiondeRi
cca
tia
lgé
bri
quesuivante :
AAT C T W 1CV 0 (II.42)
Le gain du filtre stationnaire est alors donné par :

36
Chapitre II: Commandes classiques du pendule inversé

L C T W 1 (II.43)
L’
exi
st
enc
edec
ett
esol
uti
one
sta
ssur
éepa
rle
scondi
ti
onss
uiva
nte
s:
 W>0.
 (AT,CT) stabilisable.
 (V1/2,AT) détectable.
Si de plus (V1/2,AT) est observable alors est définie positive.
II.2.6.2.3 Commande LQG
Le problème de commande LQG est de déterminer la loi de commande optimale u opt (t ) qui

minimise le critère suivant :



x(t )Qx(t ) u (t )Ru (t )dt 

T
1
J E  
T T
lim (II.44)
T  T 0 
II.2.6.3 Synt
hès
ed’
unec
ommandeLQG [FAU 84], [WEL 04], [MAM 06], [LAR
93]
La solution du problème LQG est connue sous le nom du théorème de séparation. Il consiste
 En l
are
che
rche d’
un e
sti
mat
eur pour l
’ét
atxx soit xˆ de telle sorte que :

E (t ) 
x (t ) xˆ
T

(t ) e
x (t ) xˆ stmi
nima
le.L’
est
ima
teurd’
éta
topt
ima
les
tdonnépa
rle
filtre de Kalman (il est indépendant de Q et R).
 Puis déterminer la commande optimale pour le système déterministe avec critère
quadratique (LQ), en considérant c
ett
ees
ti
méec
ommes
’ilé
tai
tlame
sur
eexa
ctedu
ve
cte
urd’
éta
t.
Ainsi, le problème de la commande LQG et sa solution peuvent être séparés en deux
étapes distinctes, comme le montre la figure (II.2).

w v

y
Système

xˆ u
-F Filtre de Kalman y

Figure II.2 : Théorème de séparation.

37
Chapitre II: Commandes classiques du pendule inversé

La structure de la commande LQG est illustrée par la figure (II.3):

w 

u y
Système

+
+ x̂ 1 xˆ C ^y
+
B
S
+
A Filtre de Kalman

K

Régulateur LQR

Figure II.3 : Structure de la commande LQG.

II.2.7 Synthèse de la commande LQR :

Enl
iné
ari
santl
esy
stè
med’
équa
tiond’
éta
t(I
.48)
,ent
ena
ntc
ompt
ede
ssuppositions
d’
appr
oxi
mat
ions (
I.
26)ont
rouvel
esy
stè
medé
cri
tpa
rl’
équa
tion(
I.
49)
.L’
application de la
commande LQR a pour but de trouver la matrice de gain K de telle sorte à ce que le système
minimise une fonction de coût quadratique suivante :

 
tf

J x (t ) T Q x (t ) u (t ) T Ru (t ) .dt
t0

Avec Q 0 et R 0 sont des matrices constantes.

La commande qui minimise le critère quadratique J est un retour d'état qui s'exprime
sous la forme:

u (t ) Kx(t ) avec K R 1 B T P

38
Chapitre II: Commandes classiques du pendule inversé

Où P est l'unique solution symétrique définie positive de l'équation de Riccati


suivante :
PA A T P PBR 1 B T P Q 0

II.2.7.1 Recherche des matrices de poids Q et R

Nous avons dimensionné l


esma
tri
cesdepoi
dsQe
tRd’
une commande optimale LQR
manuellement sur les diagonales de ces matrices afin de simplifier le problème. Ces poids
s
ontc
hoi
si
senf
onc
tiondec
omme
nto
nai
mer
ait«pé
nal
is
er»l
esva
ria
ble
sd’
éta
tspa
rra
ppor
t
aux entrées l
ors
qu’
ell
ess
’éc
art
entdel
acons
igne
,oui
nve
rse
ment
.

R 0.05 , Q diag (2 0.5 12 2.5


)

Une fois les coefficients de pondération sont fixés, on obtient la matrice de gain de
contre-réaction calculée avec la fonction 'lqr' de Matlab:

K - 6.3246 - 20.0764 - 61.3646 - 10.4424


,

Les valeurs propres obtenues pour le modèle du système en boucle fermée ( A BK )
sont :
p 
- 32.2457 - 6.9657 - 0.3380 + 0.3257i - 0.3380 - 0.3257i

Ces valeurs sont à comparer avec les pôles du modèle du système en boucle ouverte
(figure II.4).
Les résultats de simulation sont présentés ci-après. Ils ont été obtenus avec un
correcteur LQ calculé avec les pondérations ci-dessus.

Les variables et les paramètres du système chariot pendule sont:

M =2.4 kg, m =0.23 kg, g =9.81 m/s2, l =0.36 m, I =0.099 kg.m2 , b =0.05 Ns/m, d =0.005
Nms/rad.

39
Chapitre II: Commandes classiques du pendule inversé

II.2.7.2 Résultats de simulation


0.8
Originals
Controlés
0.6

0.4

0.2
Axe imaginaire

-0.2

-0.4

-0.6

-0.8
-35 -30 -25 -20 -15 -10 -5 0 5
Axe réel

Figure (II.4) : Résultat de placement de pôle du système en boucle ouverte et fermée


Deplacemment X (m)

0.1

-0.1
0.1
Vitesse (m/s)

-0.1
0.2
Angle Teta (rad)

-0.2
Vitesse dTeta (rad/s)

-1
10
Commande (N)

-10
0 2 4 6 8 10 12 14
Temps (s)
(sec)

Figure (II.5) : Résultats de simulation LQR pour condition initiale (0, 0, 0.2, 0)

II.2.7.3 Interprétation des résultats de simulation

D’
apr
èsl
esr
ésul
tat
sdes figures (II.4) et (II.5), on constate que:
 Le système se stabilise au bout de 4 secs tout en respectant les contraintes
d’
opt
imi
sat
ion
 Le déplacement du chariot sur les rails est dans les limites physiques.
 Les dynamiques des sous systèmes pendule et chariot sont tolérables.
 Le signal de commande u(t) est admissible et réalisable.
II.2.7.4 Estimation des états non mesurables

La méthode de régulation mise en œuvr


ejus
qu’
àpr
ése
nts
uppos
eque toutes les
c
ompos
ant
esduve
cte
urd’
éta
tdus
yst
èmes
ontc
onnue
sàc
haquei
nst
ant
.Enr
éal
it
é,nousne

40
Chapitre II: Commandes classiques du pendule inversé

disposons pas de capteurs de mesure en ce qui concerne la vitesse du chariot et la vitesse


angulaire du pendule. Doncondoi
tfa
ireunes
ynt
hès
ed’
unobs
erva
teurquinouspe
rme
tt
ra
d’
avoi
raccès à toutes les composantes du ve
cte
urd’
éta
t.

II.2.7.5 Synt
hès
edel
’obs
ervat
eur

La dynamique de l'observateur doit être 2 à 6 fois plus rapide que la dynamique du


régulateur.

On choisi l
espôl
ess
uiva
ntsàl
’obs
erva
teur:

pobs 5 * p reg 
1.0e + 002 * (-1.6123 - 0.3483 - 0.0169 + 0.0163i - 0.0169 - 0.0163i 

D’
oùonobt
ientl
ega
indel
’obs
erva
teu
rL suivant :

193.893 9.383 
184.668 52.105 
L  
 4.180 45.137 
 
- 880.548 105.531

Notre observateur sera donc:

- 193.893 1.000 - 9.383 0 


- 184.668 - 0.0198 - 52.536 0.0048 
Aobs ( A LC )  
 - 4.180 0 - 45.1378 1.000 
 
 880.548 0.0478 - 80.866 - 0.2733

On implémente notre observateur dans un bloc « state space ».

Cet observateur nous renseigne sur tous les états du vecteur et leurs évolution comme
le montrent les figures (II.6.a) et (II.6.b)

41
Chapitre II: Commandes classiques du pendule inversé

0.2
x2
x4
0 x2obs
x4obs
variables d'état du système et de l'observateur

-0.2

-0.4

-0.6

-0.8

-1

-1.2

-1.4

-1.6
0 2 4 6 8 10 12 14 16 18 20
Temps(s)

Figure II.6.a: Evolution des var


iabl
esd’
état
sdumodè
lee
tdel
’obs
erv
ate
ur
0.2
x1
Position (m)

-0.2
0 2 4 6 8 10 12 14 16 18 20
0.2
x2
Vitesse (m/s)

x2ob
0

-0.2
0 2 4 6 8 10 12 14 16 18 20
0.5
x3
Angle (rad)

-0.5
0 2 4 6 8 10 12 14 16 18 20
Vitesse Ang(rad/s)

1
x4
0 x4ob

-1

-2
0 2 4 6 8 10 12 14 16 18 20
Temps (s)

Figure II.6.b: Evolution de


svar
iabl
esd’
état
sdumodè
lee
tdel
’obs
erv
ate
ur

II.2.8 Implémentation de la commande LQR

Lor
sdel
’i
mpl
éme
nta
tion,onadua
dapt
erl
’al
gor
it
hmedec
omma
ndepourde
sra
iso
ns
et des limitations pratiques a
find’
obt
eni
rle
sré
sul
tat
sdé
sir
és,e
nl’
occ
urr
enc
ele
sga
insdu
vecteur K.
Après plusieurs essais sur la maquette du pendule inversé on a fixé comme suit :

K - 6.32 - 19.93 - 80.36 - 10.44

Aj
out
antàç
aonai
ntr
odui
tund
éri
vat
eurs
uivid’
unf
il
tr
epa
ssebas pour chaque
variable non mesurable à l
apl
acedel
’obs
erva
teurquin’
este
ffe
cti
fque dans le domaine
e
linéaire c’st
-à-dire a
utourdel
apos
it
iond’
équi
li
brei
nst
abl
e.

42
Chapitre II: Commandes classiques du pendule inversé

Lef
il
tr
epa
sseba
sint
rodui
tpourc
ett
emé
thoded’
est
ima
tionpourc
hac
unede
s
variables non mesurables, donné par le constructeur est :

10 4
G (s) 
S 2 70 . 7 S 10 4
Les résultats expérimentaux sont présentés ci-après :

0.2
Position (m)

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)

0.3
Angle (rad)

0.2
0.1
0
-0.1
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.7: Résultat de stabilisation LQR expérimental pour condition initiale (0, 0, 0.2, 0)

0.2
Position (m)

-0.2

-0.4
0 10 20 30 40 50 60 70
Temps (s)
0.4
Angle (rad)

0.2

0 10 20 30 40 50 60 70
Temps (s)
5
Commande (V)

-5
0 10 20 30 40 50 60 70
Temps (s)

Figure II.8: Résultat de poursuite rectangulaire LQR expérimental pour condition initiale
(0,0, 0.3, 0)

43
Chapitre II: Commandes classiques du pendule inversé

0.2

0.1

Position (m)
0

-0.1

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)

0.3
Angle (rad)

0.2

0.1
0

-0.1
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.9: Résultat LQR expérimental pour une référence nulle et une variation
paramé t
ri
quemde40% àpar ti
rdel ’instantt=18 s

0.05
Position (m)

0
-0.05
-0.1
-0.15
5 10 15 20 25 30 35 40
Temps (s)
0.3
Angle (rad)

0.2
0.1
0
-0.1
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.10: Résultat LQR expérimental pour une référence nulle et une variation
paramétrique M de 40% àpar ti
rdel ’i
nstantt=1 8s .

0.1
Position (m)

-0.1

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)
0.3
Angle (rad)

0.2
0.1
0
-0.1
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.11: Résultat expérimental pour une référence nulle et deux perturbations externes à
part
irdel ’inst
antt =18se tt=38s .

44
Chapitre II: Commandes classiques du pendule inversé

0.2

P osition (m )
0

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)
6
Angle (rad)

0
0 5 10 15 20 25 30 35 40
Temps (s)
5
Com m ande (V )

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.12: Résultat expérimental pour redressement et stabilisation


P os ition (m )

0.2
0
-0.2
-0.4
0 10 20 30 40 50 60 70 80
Temps (s)
6
A ngle (rad)

0
0 10 20 30 40 50 60 70 80
Temps (s)
5
Com m ande (V )

-5
0 10 20 30 40 50 60 70 80
Temps (s)

Figure II.13: Résultat expérimental pour redressement et stabilisation avec une poursuite
rectangulaire de fréquence 0.025.

0.2
Position (m)

-0.2
0 5 10 15 20 25 30 35 40 45 50
Temps (s)

6
Angle (rad)

0
0 5 10 15 20 25 30 35 40 45 50
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40 45 50
Temps (s)

Figure II.14: Résultat expérimental pour redressement et stabilisation avec deux


perturbations externes àpar t
irdel ’inst
antt=25se tt =36s .

45
Chapitre II: Commandes classiques du pendule inversé

II.2.8.1 Interprétation des résultats expérimentaux

On constate sur le résultat présenté ci-dessus à la figure (II.12) que la commande basée
sur le principe de minimum d’
éne
rgi
eas
sur
eleba
lanc
eme
ntdupe
ndul
eets
aconve
rge
nce
vers la zone linéaire. Dans cette zone, la commande linéaire quadratique prend le relais figure
(II.7) et(II.12).Ce
ttepha
ses
’ef
fec
tuee
ndouc
eur
,ave
cjus
teunléger pic en tension qui
respecte le cahier des charge
s.Let
empsder
épons
ees
td’
ordre de 8 secs.

Les figures (II.8) et (II.13) présentent la performance de commande linéaire


quadratique en termes de poursuite de trajectoire linéaire carrée. On constate une très bonne
poursuite e
tl’
ang
ledupe
ndul
ere
stequa
sime
nti
ncha
ngé
.

Les figures (II.11) et (II.14) montrent la robustesse de cette commande en termes de


rejet de perturbation. En effet, en soumettant le pendule à plusieurs perturbations, sous forme
de forces appliquées sur la masse du pendule, celui-ci se redresse rapidement et le chariot
rejoint sa position initiale en rejetant ainsi la perturbation.

Les figures (II.9) et (II.10), montrent l


esr
ésul
tat
sobt
enusl
ors
qu’
onas
oumi
sle
t
système à des perturbations avec introduciond’
uneva
ria
tionpa
ramé
tri
quee
nl’
occ
urr
enc
ela
variation de la masse du pendule (m) et du chariot (M) de +40% respectivement. Le système
manifeste une très bonne robustesse par rapport aux variations paramétriques et reste robuste
en termes de rejet de perturbation.

46
Chapitre II: Commandes classiques du pendule inversé

II.3.1 Commande par mode glissant:


Dans cette deuxième partie nous allons donner quelques notions fondamentales de la
commande à structure variable, et quelques concepts de base de la théorie des modes
glissants.
Les lois de commandes dites à structure variable constituent une bonne approche de
commande des systèmes non linéaires possédants des dynamiques incertaines et des entrées
bornées de bruit. Elles sont basées essentiellement sur la résolution des équations différentielles a
second membre discontinu, initiée par Filippov en 1960 [FIL.60], qui est utilisée par la suite dès
onde
la paruti slivr
esd’ Eme lyanov[ EME. 67],d’I
tki s[ITK. 76]e td’Ut kin[UTK. 78].

Da nsc ec as,l as t
ructured’ unc ont
rôleurcompor
tede
uxparties: une partie continue
représentant la dynamique du système durant le mode glissant et une autre discontinue
représentant la dynamique du système durant le mode de convergence. Cette dernière est
importante dans la commande non linéaire car elle a un r ôle d’ él
iminer les effets
d’impr écis
ionse tles perturbations sur le modèle.

II.3.1.1 Définitions :

Considérons le système non linéaire suivant [BUH 86] :

xf ( x, t , u )
 (II.45)
y h( x)

Et l
’hy
per
sur
fae: s ( x) 0
c

f est un champ de vecteur suffisamment différentiable.


U si S ( x ) 0

U ( x, t )   (II.46)

U si S ( x ) 0

U ( x, t ) 
1 1 si S ( x) 0
U : est la commande du système. x e
stl
’ét
atdus
yst
èmededi
mens
ionn

Le système (II.45) avec la loi de commande (II.46) est intrinsèquement à structure


variable [UTK.78]. En revanche, le système rendu discontinu par le choix d'une commande
discontinue, u caractérisée par une discontinuité artificielle.

Le système variable (II.45) avec la loi de commande (II.46) peut se réécrire comme suit :
f ( x, t ) si S ( x, t ) 0
x f ( x, t , u ) 

f ( x, t )
(II.47)
 si S ( x, t ) 0

47
Chapitre II: Commandes classiques du pendule inversé

f ( x, t ) et f ( x, t ) Sont des champs de vecteurs complets et s(x) : est une surface qui divise
l'espace en deux parties disjointes S(x) > 0 et S(x) < 0

Remarque (2.5) :

D'autres systèmes sont de conception naturellement discontinus, à titre d'exemples les


circuits électroniques contenant des commutateurs et les systèmes mécaniques contenant un
frottement sec [UTK.78, UTK.92].

II.3.2 Différentes Structures du Contrôle par Mode de Glissement

Dans les systèmes à structure variable utilisant la commande par les modes de
glissement, on peut trouver deux configurations de base, appropriée à la synthèse des
différentes commandes [BUH.86].

II.3.2.1 Structure par Commutation au Niveau de l'Organe de Commande

Elle correspond à la structure la plus simple ou la commutation est effectuée au niveau


de l'organe de commande. Le schéma de cette structure est donné par la figure (II.15):

Figure II.15 Configuration par changement de la structure par commutation

Dans ce cas la logique de commande est donnée par :

 
U max si S ( x ) 0

U  
 si S ( x ) 0

U min
(II.48)

Elle correspond au fonctionnement tout ou rien des interrupteurs de puissance, associées dans
une grande majorité d'applications aux variateurs de vitesse.

48
Chapitre II: Commandes classiques du pendule inversé

II.3.2.2 Structure par Commutation au Niveau d'une Contre Réaction d'Etat

La deuxième structure (figure II.16) fait intervenir la commutation au niveau d'une


contre-réaction d'état.

Il faut alors que dans ce cas, la classe de systèmes non linéaires décrite par le modèle suivant :

xf ( x) g ( x) u (II.49)

La surface de commutation S (x) est donnée par :

S ( x) Kx kw (II.50)


Avec :

K :Ve
cte
urdel
acont
rer
éac
tiond’
éta
t.
k :Coe
ffi
cie
ntdel
’i
nte
rve
nti
ondi
rec
tedel
acons
igne
.
w : Grandeur de consigne.

Figure II.16 Configuration par changement der


etourd’
état

Pour notre travail nous avons choisi cette dernière structure.

II.3.3 Thé
ori
edel
aCommanded’
unsystème à structure variable
Un système a structure variable est un système dont la structure change pendant son
f
onc
tionne
ment
.Ile
stc
ara
cté
ris
é pa
rlec
hoi
x d’
une f
onc
tion e
td’
une l
ogi
que de
c
ommut
ati
on.Cec
hoi
xpe
rme
taus
yst
èmedec
ommut
erd’
unes
truc
tur
eàunea
utr
eàt
out
instant.

49
Chapitre II: Commandes classiques du pendule inversé

Dans l
acomma
ndeàs
truc
tur
eva
ria
ble
,lat
raj
ect
oir
ed’
éta
tes
tame
néeve
rsune
s
urf
ace
.Pui
sel
lee
stf
orc
éeàr
est
era
uvoi
si
nag
edec
ell
eciàl
’ai
dedel
aloidec
ommut
ati
on.
Cette surface est appelée surface de glissement et le mouvement le long de laquelle se
produit est appelé mouvement de glissement.
La trajectoire dans le plan de phase illustrée pour un système de second ordre par la figure
II.17 est constituée de trois parties distinctes :
Le mode de convergence (MC) :c
’es
tlemodedur
antl
eque
l la variable à régler se

pla
ceàpa
rti
rden’
impor
teque
lpoi
nti
nit
ialda
nsl
epl
andepha
see
tte
ndve
rsl
asur
fac
ede
glissement S ( x, y ) 0 .

Le mode de glissement (MG) :c


’es
tlemodedur
antl
eque
llava
ria
bled’
éta
taa
tte
int
la surfacedeg
lis
seme
nte
tte
ndve
rsl
’or
igi
nedupl
andepha
se.Lady
nami
quedec
emodee
st
caractérisée par le choix de la surface de glissement S ( x, y ) 0 .

Le mode du régime permanent (MRP) : Ce mode interprète la réponse du système


a
utourdes
onpoi
ntd’
équi
li
bre(
ori
ginedu plan de phase), il est caractérisé par la qualité et les
performances de la commande.

S ( x, y ) 0

MC
MRP
x
MG

Figure II.17: Différents modes pour la trajectoire dans le plan de phase

II.3.4 Conception de la commande par mode de glissement


La conception de la commande peut être effectuée en trois étapes principales très

penda
nte
sl’
unedel
’aut
re:
- Choix de la surface ;
- L’
éta
bli
sse
mentde
scondi
ti
onsd’
exi
st
enc
e;
- Détermination de la loi de commande.

50
Chapitre II: Commandes classiques du pendule inversé

II.3.4.1 Choix de la surface de glissement


Le choix de la surface de glissement concerne le nombre et la forme des fonctions

ces
sai
res
.Ce
sde
uxf
act
eur
sdé
pende
ntdel
’appl
ica
tione
tdel
’obj
ect
ifvi
sé.
è
Pour un systmedé
finipa
rl’
équa
tion(
II
.51), le vecteur de surface  a la même dimension
que le vecteur de commande u .
xA
x, t 
x B
x, t 
u (II.51)
La surface de glissement est une fonction scalaire telle que la variable à régler glisse
sur cette surface et tend vers l
’or
igi
neduplan de phase [ZAH.00].
Laf
ormenonl
iné
air
ees
tunef
onc
tiondel
’er
reurs
url
ava
ria
bleàr
égul
erx , elle est
donnée par :
r
 
1

S 
x   e
x (II.52)

t 
Avec :
e
t :L’
éca
rte
ntr
elava
ria
bleàr
égl
ere
tsar
éfé
renc
e.
: Une constante positive.
r :Lede
grér
ela
tif
,ilr
epr
ése
ntel
enombr
edef
oisqu’
ilf
autdé
rive
rlas
urf
acepour
faire apparaître la commande.
L’
expr
ess
iondel
asur
fac
ees
tuneé
qua
tiondi
ff
ére
nti
ell
edontl
’uni
ques
olut
ione
st
e
x 0 .L’
obj
ect
ifdel
acomma
ndee
stdema
int
eni
rlas
urf
aceàz
éro.

2Condi
II.3.4. ti
ondec
onve
rge
ncee
td’
exi
ste
nce
Les deux conditions (convergence et existence) sont les deux critères qui permettent
a
uxdi
ff
ére
nte
sdy
nami
que
sdus
yst
èmedec
onve
rge
rve
rsl
asur
fac
edeg
lis
seme
nte
td’
y
rester indépendamment de la perturbation. Il existe deux considérations pour assurer le mode
de convergence :
II.3.4.2.1 Fonction discrète de commutation

Emilyanov et Utkin ont proposé et étudié la première condition de convergence. Elle


consiste à donner une dynamique à la surface convergente vers zéro. Elle est donnée par :

S S 
.
x  x 0 (II.53)

51
Chapitre II: Commandes classiques du pendule inversé

II.3.4.2.2 La fonction de Lyapunov


La fonction de Lyapunov est une fonction scalaire définie positive 
v
x 0 
. La loi de

c
omma
ndedoi
tfa
iredé
croî
tr
ece
ttef
onc
tion.L’
idé
ees
tdec
hoi
si
runef
onc
tions
cal
aie
r x
pourg
ara
nti
rl’
att
rac
tiondel
ava
ria
bleàc
ont
rôl
erve
rss
ava
leurder
éfé
renc
eetdec
onc
evo
ir
une commande u tel que le carré de la surface correspond à une fonction de Lyapunov.
On peut définir la fonction de Lyapunov comme suit :

v
x  S T 
1
x .S x (II.54)
2
La dérivée de cette fonction peut être donnée comme suit :


x S 
.
v x S x (II.55)

Il est clair que pour vérifier la décroissance de v


x ,i
lsuf
fi
tdevé
rif
ierl
’i
néga
lit
é


vx 0 [BUH.86]
.D’
oùl
avérification de la relation (II.53).

II.3.4.3 Calcul de la commande


Lorsque le régime glissant est atteint, la dynamique du système est indépendante de la
loi de commande quiapourbutdema
int
eni
rle
scondi
ti
onsdeg
lis
seme
nt(
l’
att
rac
tivi
tédel
a
s
urf
ace
),c
’es
tpourc
ett
era
ison que l
asur
fac
ees
tdé
ter
miné
eindé
penda
mme
ntde l
a
commande [ZAH.00].
Maintenant, il reste à déterminer la commande nécessaire pour attirer la trajectoire
d’
éta
tve
rsl
asur
fac
e,e
tens
uit
eve
rss
ontpoi
ntd’
équi
li
bre
,enma
int
ena
ntl
esc
ondi
ti
ons
d’
exi
st
enc
edumodedeg
lis
seme
nt.L’
obt
ent
iond’
unr
égi
medeg
lis
seme
ntné
ces
sit
eune
attractivité de la surface de glissement des deux cotés. De ce fait, une commande discontinue
e
sti
ndi
spe
nsa
ble
,iln’
empê
chenul
leme
ntqu’
unepa
rti
econt
inuel
uis
oita
jout
ée.

Enpr
ése
nced’
unepe
rtur
bat
ion,l
apa
rti
edi
scont
inueae
sse
nti
ell
eme
ntpourbutde

rif
ierl
esc
ondi
ti
onsd’
att
rac
tivi
té.Da
nsc
eca
s,l
ast
ruc
tur
ed’
unc
ont
rôl
eurpa
rmodede
glissant est constituée de deux parties [ZAH.00], [RIC.06]
,l’
unee
stl
acomma
ndeé
qui
val
ent
e
u equ e
tl’
aut
rea
ttr
act
iveu n :

u u equ u n (II.56)

- u equ est proposée par Fillipov et Utkin, elle sert à maintenir la variable à contrôler

sur la surface de glissement S 


x 0 [NIC.96], [ZAH.00]. Elle est introduite en considérant

que S 
x 0  S 
.
x 0 [RIC.06].

52
Chapitre II: Commandes classiques du pendule inversé

- u n est introduite pour vérifier la condition de convergence S S 


.
x  x 0 .

Considérons le système suivant :



xt A
x, t 
b
x, t 
.u (II.57)
Lepr
obl
èmec
ons
ist
eàt
rouve
rl’
expr
ess
iona
nal
ogi
quedel
acomma
ndeu .
On a :

S S 
S 
. x
x    (II.58)
t 
x t
En remplaçant (II.51) dans (II.52) on obtient :


S

S 
x   A

S
t 
x
x, t 
b 
x, t 
uequ un   (II.59)


S

S 
x   A

S
t 
x
x, t 
b 
x, t 


uequ  b
S
x
x, t 
un (II.60)

Durant le mode de glissement et le régime permanent, la surface est nulle, et par


conséquent sa dérivée et la partie discontinue sont aussi nulles [ZAH.00]. D’
oùondé
dui
t
l
’expr
ess
iondel
acomma
ndeé
qui
val
ent
eéc
rit
ecommesuit :
1
 
 bx, t  Ax, t 
S S
u equ   (II.61)
x  
x

bx, t 0 .
S
Pour que la commande équivalente puisse prendre une valeur finie, il faut que 
x
Durant le mode de convergence, on remplace la commande équivalente par son
,onobt
expression dans la relation (II.60) ientl
’expr
ess
iondel
adé
rivé
edel
asur
fac
ecomme
suit :

Sx, t  b
x, t 
. S
  un (II.62)
x
La condition d’
att
rac
tivi
tée
xpr
imé
eda
ns(
II
.53) devient :

S
x, t  b
x, t 
S
  u n 0 (II.63)
x
Pourquec
ett
econdi
ti
ond’
att
rac
tivi
tés
oitvé
rif
iée
,ilf
autquel
esi
gnedeu n soit


opposé à celui de S 
x, t 
 bx, t [RIC.06].
S
x

53
Chapitre II: Commandes classiques du pendule inversé

II.3.5 Solutions pour la suppression du phénomène de réticence

Le phénomène de réticence constitue un inconvénient majeur non négligeable, car



mes
’ile
stpos
sibl
edel
efi
lt
reràl
asor
ti
edupr
oce
ssus
, il est s
usc
ept
ibl
ed’
exc
ite
rles
mode
sdeha
ute
sfr
éque
nce
squin’
ontpa
sét
épr
ise
ncompt
elor
sdel
amodé
lis
ati
ondu
s
yst
ème
.Ce
cipe
utdé
gra
derl
espe
rfor
manc
ese
tmê
mec
ondui
rea
upr
obl
èmed’
ins
tabi
li

[
Utk92]
.Lar
éti
cenc
eimpl
iqueé
gal
eme
ntd’
impor
tant
esoscillations mécaniques au niveau
des actionneurs, pouvant provoquer leurs usures rapide, ainsi que des pertes énergétiques non
négligeables au niveau des circuits de puissance électrique. Dans le but de réduire ou
d’
éli
mine
rcephé
nomè
ne,denombr
eus
ess
olutions ont été proposées [SLO.84], [BUH.86].

On décrit ici une des solutions à savoir celle de couche limite connue aussi par le nom
"boundary layer solution", a été proposée par Slotine1984 [SLO.84], elle consiste à effectuer
une approximation continue des discontinuités présentent dans la loi de commande au
voisinage de la surface de glissement.
Suppos
onsq
uel
acomma
ndedi
scont
inuequipr
ovoquel
ephé
nomè
neder
éti
cenc
es’
écr
it
e
sous la forme :
u (t ) k sign( s (t )) (II.64)
La fonction signe ( s (t )) est remplacée par une fonction plus lisse dans la couche limite
de s(t) . Parmi ces fonctions utilisées nous citerons la fonction de saturation:

s s
 si 1
 
sat ( s )  (II.65)
sign( s ) s
si 1

 

Figure II.18 : Fonction SAT avec un seuil

54
Chapitre II: Commandes classiques du pendule inversé

Le système ne converge plus vers la valeur désirée, mais vers un voisinage de cette
de
rni
ère
.Ai
nsi
,lami
see
npl
aced’
unec
omma
ndec
ont
inueda
nsuneba
ndedel
asur
fac
e

ces
sit
e un c
ompr
omi
sent
rel
arobus
tes
see
tle
s pe
rfor
manc
es.D’
aut
resf
onc
tions
d’
adoucissement existent telles que les fonctions sigmoïdes:
2 s s s
arctan , , tanh( )... etc
  s  

II.3.6 Avantages et inconvénients de la commande par mode glissant

Il est reconnu que la robustesse vis-à-vis des perturbations et des incertitudes du


modè
lepr
ése
ntel
epoi
ntf
ortd’
unec
omma
ndepa
rmodeg
lis
sant. Contrairement à une loi de
commande classique, les performances dynamiques sont maintenues [SLO.91].

Depl
us,l
aré
duc
tiondel
’or
dredus
yst
èmec
ons
titue un autre point fort de ce type de
commande, car elle permet de simplifier la complexité du système.

Cependant, ces performances sont obtenues au prix de certains inconvénients :

Un phénomène de Chattering ou broutement provoqué par la partie discontinue de


cette commande et qui peut avoir un effet néfaste sur les actionneurs.

Les
yst
èmee
sts
oumi
sàc
haquei
nst
antàunec
omma
ndeé
levé
eaf
ind’
ass
ure
rsa
c
onve
rge
nceve
rsl
’ét
atdé
sir
éetc
ecin’
estpa
ssouha
ita
ble
.

Parmi les solutions proposées à ces problèmes on peut citer la commande par mode
glissant à bande limite qui consiste à remplacer la fonction de commutation dans la
commande par une fonction de saturation (hystérésis, arc tangente, etc.).

55
Chapitre II: Commandes classiques du pendule inversé

II. 3.7 Synthèse de la Commande par modegl


is
santd’
unpe
ndul
einve
rsé[MEL.10]

II. 3.7.1 Formulation mathématique

La modélisation du processus est une étape primordiale dans la mi


see
nœuvr
ed’
un
contrôleur. En général, un système non linéaire ayant pour entrée de commande u et comme
sortie y, peut être décrit par :[SAI.06]


x F ( x, x
(n)
,  x ( n1) , u )
 (II.66)
 ,  x ( n1) )
 y H ( x, x

,  x ( n1) ) sont deux fonctions non linéaires continues,


,  x ( n1) , u) et H ( x, x
Où F ( x, x
r
epr
ése
ntel
esé
tat
sdu s
yst
ème
.Ce
tt
ede
scr
ipt
ion nepe
rme
tpa
slami
see
n œuvr
ede
contrôleurs pour assurer la poursuite de trajectoires. Pour pallier à ce problème, la
linéarisation entrée-sortie a été largement utilisée, afin de trouver une relation explicite entre
l
’ent
réedus
yst
èmee
tsas
ort
ie,e
nut
il
is
antde
ste
chni
que
sdel
agé
omé
tri
edi
ff
ére
nti
ell
e.
[
Slo.
91]e
t[I
so.
99]
.Ai
nsi
,uns
yst
èmenonl
iné
air
ed’
ordr
ena
ffi
neda
nsl
acomma
ndepe
ut
être décrit par la relation suivante:

x ( n ) f ( x, x
,  x ( n1) ) g ( x, x
,  x ( n1) ) u
 (II.67)
 y h( x)

, x ( n1) ) et g ( x, x
Où f ( x, x , x ( n1) ) sont des fonctions non linéaires continues. Cette
nouvelle description permet d’
uti
li
serf
aci
leme
ntl
esdi
ff
ére
nte
sappr
oche
sba
sée
ssurl
a
rétroaction pour résoudre les problèmes de poursuites de trajectoires et de régulations.
Conf
ormé
mentàl
’équa
tionpr
écé
dent
e,l
afor
mec
anoni
qued’
uns
yst
èmenonl
iné
aire de
s
econdd’
ordr
epe
utêtre écrite comme suit :

.
x1 x2
.
x 2 f 
x g xu (II.68)
y x
 1


Ainsi, le problème de poursuite de trajectoire consiste à déterminer la loi de commande
u 
x quipe
rme
td’
ass
urr la convergence du vecteur d'état x
e t [ x1 , x2 ] vers le vecteur
d'état désiré x d 
t [ x1d , x 2d ] avec une erreur de suivi :

e x 
t x d 
t . (II.69)

56
Chapitre II: Commandes classiques du pendule inversé

En général, la surface de glissement est définie par:[Dot 03]


s  e x 2 x 2 d 
x1 x1d 
.
x e 
(II.70)

Où est une constante de glissement strictement positive. En dérivant l'équation (II.70),


nous obtenons :

ef 
x b
.
s 
e e 2 x 2 d 
ex  x u x
2d (II.71)

Dans le but de synthétiser la loi de commande, définissons la fonction de Lyapunov


comme suit :
V  s 
1 2
x (II.72)
2

Ainsi le problème de contrôle équivaut à faire tendre vers zéro la surface de glissement
s
x, t en satisfaisant à la condition suivante [DOT.03]

1 d 2
2 dt
s   
x K s ; K 0 (II.73)

Cette condition peut être réécrite comme suit :


sgn 
. .
s . s K s ou s s K

Par conséquent, le problème de contrôle est d'obtenir la loi de commande u 


appropriée, qui garantit la condition de glissement :
. 
e  f 
x, t g 
x, t 
. ..
s . s s  u  x 1d K s (II.74)
 
Où :
. 
sgn e  f 
x, t g 
x, t 
..
s u  x 1d K (II.75)
 

Si f 
x, t est connue, la loi de commande appropriée peut être obtenue facilement
comme suit :[BYU.98]

 . 
u  g 1 e  f 
x, t x 1d  K sgn 
..
s  (II.76)
 

Cette loi de commande garantit la condition de glissement. Néanmoins, pour garantir la


contrôlabilité du système, on considère que le gain de commande g ( x, t ) nes
’annul
epa
ssur

le domaine de fonctionnement ( g ( x, t ) 0) . Pour résoudre ce problème, nous avons supposé

57
Chapitre II: Commandes classiques du pendule inversé

que g ( x, t ) g g ( x, t ) où g est une constante positive connue et g ( x, t ) est une fonction

positive inconnue. Ainsi la loi de commande résultante est donnée par cette
expression:[BYU.98]
1  1
u1 g e f 
x, t 
x1d K .sgn 
s g sgn 
. ..

s F1 (II.77)
 
Avec :
F1 e  f 
x, t x 1d  K . sgn 
. ..
s (II.78)

Cependant, la présence de la fonction signe, dans la commande par mode glissant,


provoque un phénomène de broutement généré par des variations brusques et rapides du
signal de commande, ce qui peut exciter les hautes fréquences du pr
oce
ssuse
tl’
endomma
ger
[SAI.06]. Pour pallier à ce problème, nous avons retenue la solution de Slotine et Lie
[SLO.91] qui consiste à introduire une bande de transition autour de la surface de glissement
permettant de transformer la fonction signe en saturationdé
cri
tepa
rl’
équa
tion(
II
.79), et ainsi
éliminer le broutement.
 s s
 si 1
s   
sat ( )  (II.79)
  s s
sign ( ) si 1
  

Où représente la bande de transition de la surface de glissement.

II.3.7.2 Redressement et stabilisation du pendule inversé par mode glissant

Ladynami
quec
ompl
èted’
unpendule inversé, peut être représentée par deux sous
s
yst
ème
sno
nli
néa
ire
sd’
ordr
ede
ux.Lepr
emi
erdé
cri
tlady
nami
queduc
har
iotc
ommes
uit:
.
x 1  x 2
. (II.80)
x 2  f 1 
x g 1 ( x ) u 1
y  x
1 1

Où u1 et y1 s
ontr
espe
cti
veme
ntl
’ent
réedec
omma
ndee
tlas
ort
ie,a
ppr
opr
iée
sauc
har
iot
.

Quant au second représente la dynamique de la tige est donnée par :


.

3 x 4
x

4 f 2 
x x g 2 ( x )u 2 (II.81)
y x
2 3

Où u2 et y2 s
ontr es
pe ct
ive
me ntl ’e nt
réedec
omma
ndee
tlas
ort
ie,a
ppr
opr
iée
sàl
atige .

58
Chapitre II: Commandes classiques du pendule inversé

II.3.7.2.1 La première étape

Sert à asservir la position du chariot tout en suivant une référence, dont la trajectoire
sinusoïdale est choisie de telle sorte à donner une énergie nécessaire au pendule pour atteindre
les voisinages de la position verticale haute.
La surface de glissement dans cette étape est donnée par :
s1 ( x) 1 ( x1 x1d ) ( x2 ) (II.82)
Avec
x1d 0.2 * sin (4 * t ) et 1 30 (II.83)

5
Position du pendule

0
0 1 2 3 4 5 6
Temps (s)

Figure II.19 : Résultat de simulation de redressement par la commande de glissement avec


des conditions initiales (0, 0, 0, 0)

II.3.7.2.2 La deuxième étape

Sert à asservir la position du chariot et du pendule vers les états désirés. Cependant, les
surfaces de glissement sont définies comme suit :

s1 ( x) 1 ( x1 x1d ) ( x2 x2 d ) (II.84)

s2 ( x) 2 ( x3 x3d ) ( x4 x4 d ) (II.85)

Conformément à la loi de commande par mode glissant synthétisée au paragraphe


précédent (II.76), dans le cas où la dynamique complète du pendule inversé est parfaitement
connue et ce dernier ne subit aucune perturbation externe, le contrôle de la position du chariot
et la stabilisation de la tige, peuvent être assurés par les lois de commandes (II.86) et (II.87)
respectivement :

59
Chapitre II: Commandes classiques du pendule inversé

 s1 ( x)  s ( x) s ( x)
u1 g 1 (u1 K1sat ( )) g 1 K1sat ( 1 ) u 1 K1 sat ( 1 )
1 1
(II.86)
x x x

 s2 ( x)  s ( x) s ( x)
u 2 g 2 (u 2 K 2 sat ( )) g 2 K 2 sat ( 2 ) u 2 K 2 sat ( 2 )
1 1
(II.87)
  
Avec

u 1 f1 ( x) 1d 
x 1 ( x2 x2 d ) (II.88)

u 2 f 2 ( x) 3d 
x 2 ( x4 x4 d ) (II.89)

Néanmoins, dans la réalité, le pendule inversé est soumis à une seule entrée de
c
omma
ndeq
uic
ont
rôl
esi
mul
tané
men
tlapos
it
ionduc
har
iote
tl’
ang
ledel
ati
ge.Ce
tteentrée
de commande est déduite à partir de la soustraction pondérée des signaux u1 et u2 comme suit :

u 2 u 2 1u1 (II.90)

Où 1 et 2 sont des constantes positive de pondération.

II.3.7.3 Résultats de simulation

0.4 0.3
0.2
P os ition (m )

0.2 0.1
A ngle(rad)

0
0 -0.1
-0.2
-0.2
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

1
V ites se A ngulaire (rad/s)
V itess e du c hariot (m /s)

0
0.5

-0.5
0

-0.5 -1
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

5
20
S urface de gliss em ent
Com m ande (N)

10 0

0 -5

-10 -10
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

Figure II.20: Résultats de simulation pour la commande de glissement sans perturbation

60
Chapitre II: Commandes classiques du pendule inversé

0.6 0.3

0.4 0.2

Position (m)

Angle(rad)
0.2 0.1

0 0

-0.2 -0.1
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

1 0.5
Vitesse du chariot (m/s)

Vitesse Angulaire(rad/s)
0.5 0

0 -0.5

-0.5 -1
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

20 10

Surface de glissement
Commande (N)

10 5

0 0

-10 -5

-20 -10
0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Temps (s) Temps (s)

Figure II.21: Résultats de simulation pour la commande de glissement avec une perturbation
alé
atoi red’ unedur ée1Se c,appliqué eàl ’instant10Se c
,sur le pendule avec conditions
initiales (0, 0, 0.2, 0)

0.4
0.2
P o s it io n (m )

A n g le (ra d )

0.2
0 0
-0.2
-0.4 -0.2
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)
V ite s s e A n g u la ire (ra d /s )
V ite s s e d u c h a rio t (m /s )

1 0.5

0.5 0

0 -0.5

-0.5 -1
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)
S u rf a c e d e g lis s e m e n t

20 10
C o m m a n d e (N )

10
0
0
-10
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)

Figure II.22: Résultats de simulations d’ unepoursuite rectangulaire avec des


conditions initiales (0, 0, 0.2, 0)

61
Chapitre II: Commandes classiques du pendule inversé

0.5

P o s itio n (m )
0

-0.5
0 5 10 15 20 25 30
Temps (s)

6
A n g le (ra d )

4
2
0
-2
0 5 10 15 20 25 30
Temps (s)
20
C o m m a n d e (N )

-20
0 5 10 15 20 25 30
Temps (s)

Figure II.23: Résultats de simulation de redressement et de stabilisation par la commande


de glissement avec des conditions initiales (0, 0, 0, 0)

8
6 +ou- 0% (M)
A ngle(rad)

4 +ou- 40% (M)


2
0
-2
0 5 10 15 20 25 30 35 40
Temps(s)
P os ition (m )

0.2
0
-0.2
-0.4
0 5 10 15 20 25 30 35 40
Temps(s)
40
C om m ande (N )

20
0
-20
0 5 10 15 20 25 30 35 40
Temps(s)

Figure II.24: Résultats de simulation de redressement et de stabilisation par la commande


de glissement avec une variation paramétrique M de 40%
6 +0%(m)
A ngle (rad)

4
+40%(m)
2
0
-2
0 5 10 15 20 25 30 35 40
Temps(s)
0.5
P os ition (m )

-0.5
0 5 10 15 20 25 30 35 40
Temps(s)
Com m ande (N )

20
0
-20
-40
0 5 10 15 20 25 30 35 40
Temps(s)

Figure II.25: Résultats de simulation de redressement et de stabilisation par la commande


de glissement avec une variation paramétrique m de 40%

62
Chapitre II: Commandes classiques du pendule inversé

II.3.7.3.1 Interprétation des résultats de simulation

A partir des graphes montrés sur les figures (II.19), (II.21) et (II.23), on peut constater
que notre commande de glissement arrive à stabiliser le pendule inversé. En effet elle a pu le
rame ne rdes apos i
tiond’ équi
li
br es tableàs apos itiond’ é qui l
ibrei ns tablee tl ’
yma i
nten i
r.
Elle a en outre permis de stabiliser le déplacement du chariot en le ramenant à sa positon
initiale avec un déplacement maximal de 0.3 m.

D’
apr
èsc
esmê
mesf
igur
es(II.19) et (II.23), on constate que:

 Le système se stabilise au bout de 5 à 6 sec.


 Le chariot est dans les limites physiques de déplacement [-0.5m, +0.5m].
 Les dynamiques des sous systèmes pendule et chariot sont tolérables.
 Le signal de commande u(t) est admissible et réalisable.

Dans la figure (II.21) le casd’ appli


ca t
iond’ unepe rt
urba ti
ons url ependule,àl’i
nstant
t= 10 sec, le système répond avec des oscillations très faible et négligeable du pendule et le
déplacement du chariot ne dépasse pas 0.1 mètres par rapport à la référence. Le régulateur
réagit et corrige cette perturbation avec une énergie tolérable et stabilise le système après 2
sec à la disparition de la perturbation. La surface de glissement reste stable.

La figure (II.22) reflète la performance de commande de glissement en terme de


poursuite de trajectoire linéaire carrée. On constate une très bonne poursuite avec un écart nul
etl’
ang led upe ndul ere stequa sime nti nchangé.

Dans nos deux dernières simulations, nous avons affecté avec une erreur paramétrique
quivaj usqu’à( 40%)s urlama sseduc ha r
iot(M)e tc el
ledupe ndul e( m)présentés par les
figures (II.24), (II.25)r especti
ve me nta f
in de t esterl ar obus tes
s e de l ’ al
g orithme de
commande.
Nous notons que j usqu'à( 40%)d’ erreurpa r
a mé t
riques url ama ss educ ha riot(M),
voire la figure (II.24), nous enregistrons un temps de réponse de 6 sec, le chariot est dans ses
limites physique [-0.5 m, +0.5 m], la stabilité du système et de la surface de glissement
ajoutant a ça, la commande est tolérable et réalisable pratiquement (amplitude maximale : 20
(N) et sans présence du broutement).

Da nsl ec asd’ erreurpa r


amé triques
url ama sse( m)dupe ndul edonné epa rl afigure
(II.25), nous notons un bon résultat, néanmoins, la commande de glissement ne répond pas à
toutes les restrictions du système, notamment celle de la tension. En effet, on constate un pic
important de tension de 45(N) lors de la commutation entre les deux commandes. En plus un
léger dépassement de limites désirées pour le chariot.
63
Chapitre II: Commandes classiques du pendule inversé

Pour les surfaces de glissement, on voit que les surfaces convergent dans un temps
fini. Dans le régime établi, ces surfaces oscillent autour de zéro ce qui explique le bon choix
de ces dernières.

Da n scettepa rti
e ,nousa vonspr ésentél e sr és ult
a tsdes imul ati
onqu’adonné la
commande de glissement. Nous avons vu que celle-ci manifeste de très bonnes performances
et une très bonne robustesse, tout en respectant toutes les restrictions pratiques.

Ilde me ure,né anmoi ns,trèsinté res


santd’
impléme
nte
rlac
omma ndedeg l
is
seme nt.En
effet, celle-cipr és ented’ exc e
llentesp e rf
ormancescommenousavonspuleconst
ate
r lors de
la section traitant la simulation de cette commande.

II.3.7.4 Résultats expérimentaux

Afin de tester les performances de la stratégie de commande développée


précédemment, plusieurs expériences ont été effectuées au sein de notre Laboratoire. Les
performances à atteindre dans chaque expérience, sont le redressement de la tige à partir de sa
position initiale, pour la stabiliser par la suite à sa position inverse, toute en assurant de petites
oscillations du chariot autour de sa position de référence. Les valeurs numériques utilisées
sont:
1 16 ; 2 8; x 0.04 ;0.1;1 0.175 ;2 0.1

0.05
Position (m)

-0.05
0 5 10 15 20 25 30
Temps (s)
6.4
Angle (rad)

6.2

0 5 10 15 20 25 30
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30
Temps (s)

Figure II.26:Résultat de stabilisation glissant expérimental pour condition initiale (0,0,0.3,0)

64
Chapitre II: Commandes classiques du pendule inversé

0.5

Position (m)
0

-0.5
0 10 20 30 40 50 60 70
Temps (s)
6.4
Angle (rad)

6.2

0 10 20 30 40 50 60 70
Temps (s)
5
Commande (V)

-5
0 10 20 30 40 50 60 70
Temps (s)

Figure II.27: Résultat de poursuite rectangulaire glissant expérimental pour condition


initiale (0, 0, 0.3, 0)
0.1
Position (m)

-0.1

0 5 10 15 20 25 30
Temps (s)
6.4
Angle (rad)

6.2

0 5 10 15 20 25 30
Temps (s)
Commande (V)

-2
0 5 10 15 20 25 30
Temps (s)

Figure II.28: Résultat glissant expérimental pour une référence échelon et une variation
paramétrique m de 40% àpar ti
rdel ’i
nstantt=18 s

0.1
Position (m)

-0.1
0 5 10 15 20 25 30
Temps (s)

6.3
Angle (rad)

6.2
6.1
6

5.9
0 5 10 15 20 25 30
Temps (s)
Commande (V)

-2
0 5 10 15 20 25 30
Temps (s)

Figure II.29: Résultat expérimental glissant pour une référence échelon et une variation
par amé t
riqueM de40% àpar tirdel ’inst
antt =18s

65
Chapitre II: Commandes classiques du pendule inversé

0.1

Position (m)
0.05

-0.05
0 5 10 15 20 25 30
Temps (s)

6.3
Angle (rad)

6.2
6.1
6
5.9
0 5 10 15 20 25 30
Temps (s)
3
Commande (rad)

2
1
0
-1
-2
0 5 10 15 20 25 30
Temps (s)

Figure II.30: Résultat expérimental pour une référence échelon et deux perturbations externe
àpartirdel ’ins
tantt =17 se tt=29s.

0.2
Position (m)

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)
8

6
Angle (rad)

0
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.31: Résultat expérimental pour redressement et stabilisation

0.2
Position (m)

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)
8

6
Angle (rad)

0
0 5 10 15 20 25 30 35 40
Temps (s)
Commande (V)

-2
0 5 10 15 20 25 30 35 40
Temps (s)

Figure II.32: Résultat expérimental pour redressement et stabilisation avec deux


pe rt
urbat i
onse xte
rneàpar ti
rdel ’i
nstantt=25se tt=36s .

66
Chapitre II: Commandes classiques du pendule inversé

0.5

Position (m)
0

-0.5
0 10 20 30 40 50 60 70 80
Temps (s)
10
Angle (rad)

0
0 10 20 30 40 50 60 70 80
Temps (s)
5
Commande (V)

-5
0 10 20 30 40 50 60 70 80
Temps (s)

Figure II.33: Résultat expérimental pour redressement et stabilisation avec une poursuite
rectangulaire de fréquence 0.025.

II.3.7.4.1 Interprétation des résultats expérimentaux

On constate sur les résultats présentés dans les figures (II.31), (II.32) et (II.33) que la
c
omma
ndeba
sées
url
epr
inc
ipedemi
nimum d’
éne
rgi
eas
sur
eleba
lanc
eme
ntdupe
ndul
eet
sa convergence vers la zone linéaire. Dans cette zone, la commande par mode glissant prend
l
ere
lai
s.Ce
ttepha
ses
’ef
fec
tuee
ndouc
eur
,ave
cjus
teunl
ége
rpi
c en tension qui ne nuit en
r
iena
uca
hie
rde
scha
rge
s.Let
empsder
épons
ees
td’
ordr
ede8s
ec.

Les figures (II.27) et (II.33) reflètent les performances de la commande en termes de


poursuite de trajectoire linéaire carrée retar
déde20s ,d’amplitude0.2 V et de période 20 sec.
Onc ons tateunet rèsbonnepour suitee tl’ang ledupe ndul
er est
equa si
menti nchang é.

D’
apr
èsl
es figures (II.28), (II.29), (II.30) et (II.32),ons
’ape
rçoi
tquel
’ef
fetde
s
i
variations paramétrque
setdel
ape
rtur
bat
ionn’
ontpas empêchés le système de réglage de
réaliser sa tâche de contrôle, ce qui nous donne une idée générale sur le comportement robuste
de la loi de commande par mode glissant.

Les figures (II.28) et (II.29), montrent lesr


ésul
tat
sobt
enusl
ors
qu’
onas
oumi
sle
s
yst
èmeàde
spe
rtur
bat
ionsa
veci
ntr
oduc
tiond’
uneva
ria
tionpa
ramé
tri
quee
nl’
occ
urr
enc
ela
variation de la masse du pendule (m) et du chariot (M) de +40% respectivement, au de-là de
cette variation le chariot reste immobile. L’
ang
ler
est
einc
hangée
tauc
unpi
cauni
vea
udel
a
commande.

Les figures (II.30) et (II.32) montrent la robustesse de cette commande en terme de


rejet de perturbations. En effet, en soumettant le pendule à plusieurs perturbations, sous forme

67
Chapitre II: Commandes classiques du pendule inversé

de forces appliquées sur la masse du pendule, celui-ci se redresse rapidement et le chariot qui
fait un déplacement maximum de 0.1 m rejoint sa position initiale au bout de 3 sec en rejetant
ainsi la perturbation.

L’
ava
nta
gequepr
ocur
elac
omma
ndepar mode glissant est sa robustesse vis-à-vis des
perturbations et des incertitudes du modèle. Cependant ces performances sont obtenues au
prix de certains inconvénients :

 Le phénomène de chattering provoqué par la partie discontinue.


 La commande élevée au quelle le système est soumis a chaque instant.

La solution proposée à ces problèmes consiste à remplacer la fonction de commutation


dans la commande par une fonction de saturation, les quatre derniers résultats expérimentaux
présentés ci-dessus montrent l
’ef
fi
cac
it
édec
ett
ede
rni
ère:

Dans la première expérience, nous avons considéré les deux régulateurs par mode
glissant synthétisés sans fonctions de saturation ni perturbations externes. La figure (II.34),
montre respectivement les profils de la position du chariot, la position angulaire de la tige et
l
acomma
ndec
orr
esponda
nte
,oùonp
eutc
onc
lur
ed’
unepa
rtl
ast
abi
li
sat
iondel
ati
geàsa
pos
it
ioni
nve
rse
,ai
nsiq
u’unphé
nomè
nedebr
out
eme
ntquis
’expl
iquephy
sique
mentpa
rla
présence de la fonction signe dans la commande par mode glissant, générant ainsi les
variations brusques du signal de commande.

Da
nsl
’expérience suivante, nous avons utilisé les mêmes contrôleurs que la première
expérience, mais avec la fonction de saturation. Les résultats obtenus sont illustrés par la
figure (II.35), où nous constatons que le phénomène de broutement est presque éliminé.

Pourt
est
erl
aca
pac
itéd’
ada
pta
tiondus
ché
madec
omma
ndedé
vel
oppél
orsde
s
mouvements du pendule inversé face aux variations paramétriques, nous avons effectué deux
autres expériences qui sont similaires respectivement aux expériences précédentes où on a
juste introduit une variation sur le capteur mesurant la position du chariot en lui rajoutant
signal carré, retardé de 20 s, d’
ampl
it
ude-0.
2V e
tdepé
riode20s
.Le
sré
pons
esd’
unet
ell
e
situation sont données par les figures (II.36) et (II.37).

68
Chapitre II: Commandes classiques du pendule inversé

0.1

Postion(m)
-0.1

-0.2

-0.3
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Angle(rad)

-2
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Commande(V)

-2

-4
0 5 10 15 20 25 30 35 40 45
Temps (s)

Figure II.34: Résultats obtenus, sans fonction de saturation et perturbations externes

0.1

0
Positon(m)

-0.1

-0.2

-0.3
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Angle(rad)

-2
0 5 10 15 20 25 30 35 40 45
Temps (s)

2
Commande(V)

-2

-4
0 5 10 15 20 25 30 35 40 45
Temps (s)

Figure II.35: Résultats obtenus, avec fonction de saturation et sans perturbations externes

0.1

0
Position(m)

-0.1

-0.2

-0.3
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Angle(rad)

-2
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Commande(V)

-2

-4
0 5 10 15 20 25 30 35 40 45
Temps (s)

Figure II.36: Résultats obtenus d’


unepour
sui
ter
ect
angul
air
e, sans fonction de saturation

69
Chapitre II: Commandes classiques du pendule inversé

0.1

Position(m)
-0.1

-0.2

-0.3
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Angle(rad)

-2
0 5 10 15 20 25 30 35 40 45
Temps (s)

4
Commande(V)

-2

-4
0 5 10 15 20 25 30 35 40 45
Temps (s)

Figure II.37: Résultats obtenus d’


unepour
sui
ter
ect
angul
air
e, avec fonction de saturation

Ces résultats montrent les qualités de poursuite satisfaisantes. En effet, nous


constatons que cette stratégie de commande rejette rapidement ces perturbations ce qui permet
de conclure que les performances de poursuite sont très peu affectés par ces perturbations.

II.4 Conclusion :

Dans ce chapitre nous avons vu les notions de base concernant la commande linéaire
quadratique, la commande par mode glissant. L’intérê
tmajeur de ces approches réside dans la
simplicité de la mi
seenœuvr edec eslois de commande.

Ensuite, nous avons présenté les résultats de simulations et e xpérime ntaux qu’ a
données chaque commandes. Nous avons vu que ces schémas de commande présentent de très
bonnes performances et une robustesse remarquable, tout en respectant toutes les restrictions
pratiques.

Les résultats de simulations et expérimentaux montrent que ceux obtenus par la


commande de mode de glissement sont plus performant que ceux de la commande LQR, ceci
est due au bon choix de la surface de glissement, plus loin un réglage au niveau de P et Q
pour obtenir plus de performance.

Ces contrôleurs convenables ont dé jàé t


émi se n œuvr e, mais des améliorations
peuvent être apportées pour optimiser encore plus le comportement du système et faire en
sort
equ’ i
lc onsommemoi nsd’ énergie électrique quelque soit les objectifs visés et les
contraintes existantes.

Le chapitre suivant a donc pour but de synthétiser deux contrôleurs à base de


techniques nouvelles dites intelligentes qui seront plus performants, robustes et moins
gourmand en énergie, en vue de réaliser des avancées significatives.

70
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.1 Introduction
Dans ce chapitre, nous allons présenter et analyser quelques structures intelligentes
basées sur les concepts tels que la logique floue, les réseaux de neurones et les réseaux neuro-
flous. Cette démarche est menée afin de lever une contrainte en contrôle relative à la nécessité
de disposer d'un modèle le plus fidèle possible, sachant que les erreurs de modélisation et les
imperfections des modèles, contribuent à dégrader notablement les performances des lois de
commandes conventionnelles[MEL 98].

Dans la première partie, nous étudierons en détail les principes de la logique floue et ses
applications dans le domaine du réglage puis nous décrirons les différentes solutions pour un
organe de commande basé sur les principes flous.

Dans la deuxième partie de ce chapitre, nous discuterons des algorithmes dits "réseaux
de neurones". Nous présenterons les propriétés des réseaux de neurones, en tenant compte de
leurs caractéristiques dans le traitement du problème posé.

Ensuite, dans la troisième partie de ce chapitre nous nous concentrerons en particulier


sur la projection des systèmes flous dans un réseau de neurones afin de former un système
neuro-flou en tirant les profits de la logique floue et des réseaux de neurones. L'esprit de ces
réseaux et d'intégrer à priori, une connaissance même imparfaite, mais permettant un
apprentissage plus rapide qu'avec des poids initiaux aléatoires.

A la fin de la synthèse de chaque type de commandes, nous présenterons les résultats de


simulations suivies des résultats expérimentaux du système commandé mis àl ’épreuvede
perturbations et de variations paramétriques.

III.2 Logique floue et la commande floue


III.2.1Introduction
La logique floue est une théorie qui a connu un grand engouement depuis que Zadeh a
introduit le concept de sous-ensembles flous en 1965. Par la suite, en 1974, Mamdani
introduisait la commande floue pour la régulation de processus industriel. Dans les années 80,
la commande floue connaît un essor considérable au Japon, notamment grâce aux travaux de
Sugeno. La logique floue permet de faire le lien entre modélisation numérique et
modélisation symbolique, ce qui a permis des développements industriels spectaculaires à
pa
rti
rd’
alg
ori
thme
str
èss
impl
esdet
raduc
tion dec
onna
iss
anc
es symboliques en entité
s
numérique et inversement. Elle préent
eene
ffe
tl’
ava
nta
ged’
uti
li
serde
srè
gle
sli
ngui
st
ique
s
s
impl
espe
rme
tta
ntdet
radui
ref
aci
leme
ntl
esa
voi
rfa
ired’
une
xpe
rtpourr
épondr
eàune
problématique spécifique [FAU.06].

71
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.2 La logique floue [FAU.06].


La notion de logique floue permet d’
éte
ndr
elanot
iondel
ogi
quec
las
sique
,as
soc
iée
a
uxva
ria
ble
sbool
éenne
snepr
ena
ntquede
uxva
leur
s0e
t1.I
les
tal
orspos
sibl
ed’
ass
oci
erà
de
sva
ria
ble
sde
scoe
ffi
cie
ntsd’
appa
rte
nanc
eàde
ssous
-ensembles flous prenant des valeurs
da
nsl
’i
nte
rva
lle[
0,1]e
tqua
nti
fi
antl
’i
nce
rti
tudes
url
ava
ria
ble
.Uné
véne
mentc
ert
ainpour
l
ava
ria
bles
etr
adui
rapa
runc
oef
fi
cie
ntd’
appa
rte
nanc
eaus
ous
-ens
embl
efl
ou,c
’es
t-à-dire à
l
apr
opr
iét
é,é
galà1a
lor
squel
ava
leurs
erai
nfé
rie
ureà1e
npr
ése
nced’
incertitudes. Il vient
a
lor
squ’
uneva
leurnul
lepourun c
oef
fi
cie
ntd’
appa
rte
nanc
eindi
quequel
apos
sibi
li

d’
appa
rte
nanc
eaus
ous
-ensemble sélectionné de la variable représentant la grandeur
concernée est complètement rejetée.
III.2.3 Notion de sous-ensemble flou [LAU.03]
Dans la théorie classique des ensembles, un sous-ensemble A de B est défini par une
foncti
ond’ appa rtena nceA  x qui caractérise tout élément x appartenant à B. Cette fonction
prend la valeur 1 si x appartient à A et la valeur 0 dans le cas contraire :

1 Si x A

A 
x  ( III .1)
0 Si x A

En logique floue, un sous-ensemble flou A de B est défini par une fonction


d’
appar
tena
nceA x pouvant prendre différentes valeurs comprises entre 0 et 1, selon le
de
gréd’app
artenancedel ’él
émentx au sous-ensemble A.

x 
A  0 1

III.2.4 Univers de discours [MAD.08]

L’ uni
versdedi s cour sr eprésent el ’ensembl eder é fére
nc eouledomaine de variation
de la variable linguistique, ou domaine de fonctionnement du processus dans le cas de
réglage, comme illustré sur la figure (III.1) dont plusieurs sous-ensembles sont décrits par des
fonctionsd ’a
ppa rtenanc e(FA)t riang ulairese ttrapézoïdales.

Figure III.1 : Univers de discours normalisé uniforme de 3 ensembles.


72
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.5 Variable et valeur de variable linguistique [MAD.08]

La variable linguistique représente un phénomène ou une grandeur, par des termes


linguistiques : « quelque, beaucoup, souvent », «négative, environ zéro et positive» ce sont les
valeurs linguistiques.

I
II.
2.
6Rè
gle
sd’
inf
ére
nce[GER.08].

Ona
ppe
ller
ègl
esd’
inf
ére
ncel
’ens
embl
ede
sdi
ff
ére
nte
srè
gle
sre
lia
ntl
esva
ria
ble
s
f
loue
sd’
ent
réed’
uns
yst
èmea
uxva
ria
ble
sfl
oue
sdes
ort
iedec
esy
stè
meàl
’ai
dede
s
différents operateurs. Ces règles se présentent sous la forme :
Si condition 1 ET/OU condition 2 (ET/OU...) alors action sur les sorties OU
Si condition 3 ET/OU condition 4 (ET/OU...) alors action sur les sorties OU

Si condition n ET/OU condition n+1 (ET/OU...) alors action sur les sorties.

Oupa
runema
tri
ced’
inf
ére
nces
ousf
ormed’
unt
abl
eaudonnéc
i-dessous

θ
U N EZ P

N N N EZ
dθ/dt
EZ N EZ P

P EZ P P

Tableau III.1 : Règles d’


inf
ére
ncepourRLFT

I
II.
2.
7Re
pré
sent
ati
onde
sfonc
tionsd’
appar
tenanc
e[GAC.97]

Onr
epr
ése
ntel
esva
ria
ble
sli
ngui
st
ique
spa
rle
ursf
onc
tionsd’
appa
rte
nanc
es.Doncà
chaque sous-ensemble flou Ai est associé unef
onc
tiond’
appa
rte
na e A i 
nc x où x est la

variable linguistique. Tel que, à chaque point x est associé une valeur précise de A i 
x , qui


sig
ne,l
ede
gréd’
appa
rte
nanc
edexàAi .

Laf
onc
tiond’
appa
rte
nanc
epe
utê
trer
epr
ése
nté
e par plusieurs formes : Triangulaire,
trapézoïdale, sigmoïdale et gaussienne. On pe
utdé
fini
rd’
aut
resf
orme
s de f
onc
tions
d’
appa
rte
nanc
e,ma
isda
nsl
eré
gla
gepa
rlog
iquef
loue
,le
sfor
mesdé
jà citées et illustrées sur
la figure (III.2) sont largement suffisantes pour délimiter les ensembles flous.

73
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.7.1 Fonction triangulaire [GAC.97]

Elle est définie par trois paramètres a, b, c, qui déterminent les coordonnées des
trois sommets.
x a c x
( x) max ( min ( , ),0) (III.2)
b a c b

III.2.7.2 Fonction trapézoïdale

Elle est définie par quatre paramètres a, b, c, qui déterminent les coordonnées des
quatre sommets.
x a d x
( x) max ( min ( ,1 , ),0) (III.3)
b a d c

III.2.7.3 Fonction sigmoïde :

Elle est définie par deux paramètres 


a, b,

1
( x)  (III.4)
1 exp( a ( x c))

III.2.7.4 Fonction gaussienne :

Elle est définie par deux paramètres 


, m,

( x m) 2
( x) exp ( ) (III.5)
22

Figure III.2 : For


mesde
sfonc
tionsd’
appar
tenanc
eus
uel
les

74
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.8 Opérations sur les ensembles flous [LAU.03]


Le
sopé
rat
ionsd’
uni
on,d’
int
ers
ect
ione
tdec
ompl
éme
nta
tionda
nsl
ese
nse
mbl
esf
lous
s
ontdé
fini
esàl
’ai
dedel
eur
s fonctions d’
appa
rte
nanc
e.
III.2.8.1 Egalité :
A = B  x U , f A ( x ) f B ( x ) .
(III.6)
III.2.8.2 Inclusion:
A B  x U , f A ( x ) f B ( x ) .
(III.7)

III.2.8.3 Ladi
sj
onc
tionf
loue
,‘OU’ouUnion :
Laf
onc
tiond’
appa
rte
nanc
e(Figure III.5)  A  B est définie, pour tout u U ,
par :
Mamdani : AB (u ) max
A (u ), B (u ) (III.8)

Sugeno : AB (u ) A (u ) B (u ) A (u ) 


B (u ) (III.9)

III.2.8.4 Lac
onj
onc
tionf
loue
,‘ET’oui
nte
rse
cti
on:
Laf
onc
tiond’
appa
rte
na eFigure (III.6) AB est définie, pour tout u U , par :
nc

Mamdani : AB (u ) min


A (u ), B (u ) (III.10)

Sugeno : AB (u ) A (u ) 


B (u ) (III.11)

III.2.8.5 La complémentation, négation ou inverse :


Laf
onc
tiond’
appa
rte
na eFigure (III.7) A duc
nc ompl
éme
ntd’
une
nse
mbl
e A est

définie, pour tout u U , dans les deux cas par :


A 1 A (u ) (III.12)

75
Figure III.3: Fonc
tiond’
appar
tenan
ceA Figure III.4: Fonc
tiond’
appar
tenan
ceB
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Figure III.5 : Fonc


tiond’
appa
rte
nan
ced
el’
uni
on

Figure III.6 : Fonc


tiond’
appar
tenan
ced’
int
ers
ect
ion

Figure III.7 : Operateur de complémentation de la


foncti
o nd’appar t
enanceA

76
CHAPITRE III:: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

I
II.
2.
9St
ruc
tur
ed’
unr
égl
ageparl
ogi
quef
loue[BÜH.94].
Le contrôleur par logique flou est chargé de calculer à chaque instant la commande
réelle u (non flou) à appliquer au système afin de réaliser l
’obj
ect
ifdecontrôle
contrôle qui est
l
’annul
ati
ondel
’er
reurder
égl
agee y r (la sortie mesurée –la référence)
Les entrées de réglage sont en général :
v
 Lava
leurr
éel
ledel
’er
reure
 Ladé
rivé
edel
’er
reure
r
RLF OCM S
Um u ym

Figure III.8 :St


ruc
tur
ed’
un réglage par logique floue

OCM : c
’es
tl’
orga
nedec
omma
nde
,S:
S c
’es
tles
yst
èmeàr
égl
er.c : la grandeur de
consigne, Um : le signal de commande fournit par le RLF, U : la grandeur de commande
f
our
niepa
rl’
OCM.V : une perturbation, Y : la grandeur à régler (ou sortie). Ym : le vecteur qui
contient les grandeurs mesurées.

III.9.10 Configuration interne d'un système d'inférence flou (SIF)

Un système flou est un système à base de connaissances particulière


particulières, dont
l
’ar
chi
tec
tur
edeba
see
stillustrée par la figure (III.9),, se compose essentiellement de quatre
modules.[LAB.98]

Figure III.9 : Ar
chi
te
ctur
ed’
unc
ont
rôl
eurparl
ogi
quef
loue

77
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.10.1 Fuzzification
C'est le mécanisme réalisant l'interface " Numérique - Linguistique" qui permet de
transformer une grandeur générée par un capteur à l'entrée en partie floue définie sur un
espace de représentation lié à l'entrée. Du choix de cet espace de représentation (numérique
ou linguistique) dépend la nature de la partie floue E résultante de la partie fuzzification. Cette
dernière peut être un sous ensemble numérique (élément de F(X)) ou un sous ensemble flou
symbolique (élément F(L(X))). On distingue alors deux types de fuzzification respectivement
appelées fuzzification numérique et fuzzification symbolique [NAK.97].

III.2.10.1.1 Fuzzification numérique


Une fuzzification numérique transforme toute valeur numérique x de l'entrée en valeur
floue numérique, c'est-à-dire un élément de F(X), en utilisant la fuzzification singleton ou non
singleton.
La fuzzification Singleton de la valeur x = x0 est la partie floue numérique N 
x 0 dont
la fonction d'appartenance est définie par [BYU.98]
1 Si x x0

N x0 
x  (III.13)
0 Si x x0

Dans la fuzzification non Singleton de la valeur x = x0, la fonction d'appartenance de la


partie floue numérique N 
x 0 peut être définie par une fonction gaussienne.

 1 x x 2

N x0  
x exp   0
  (III.14)
 2  
  

Où  est paramètre qui caractérise la largeur de la fonction d'appartenance.

III.2.10.1.2 Fuzzification Symbolique [MEL.98]


Elle transforme toute valeur numérique x en une partie floue linguistique, c'est-à-dire un
élément de F(L(X)). Cette partie floue permis de caractériser à quel point la valeur numérique
peut être décrite par le symbole L(X), en utilisant la description supérieure ou inférieur de
l'entrée x, comme suit :

Supposons que l'ensemble des symboles relatifs à l'entrée x soit défini par
L
x 
N , Z , P, où N= Négative, Z= Zéro, P= Positive et que l'univers de discours associé

78
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

X, soit défini par X 


0.4 , 0.4
. La signification floue des différents symboles est donnée
par MX. Ainsi, la figure suivante montre la description floue d'une entrée x = 0.3.

D L X 
0.30 / N 0.25 / Z 0.75 / P
M X 
N M X 
Z M X 
P

L(X)
X
-0.4 0 .3 .4 N Z P
(a) Signification floue des symboles (b) Description floue de x=0.3

Figure III.10: Lien entre signification floue et description floue

III.2.10.2 Base de règles floues


C'est une base de connaissances qui contient les règles floues décrivant le
comportement du système. L'ensemble des règles se présente sous la forme d'une énumération
de type:
t
- Si condition 1 et/ou condition 2 (e/ou…)a
lor
sac
tions
url
ess
ort
ies
t
- Si condition 3 et/ou condition 4 (e/ou…)a
lor
sac
tions
url
ess
ort
ies
t
- Si condition 5 et/ou condition 6 (e/ou…)a
lor
sac
tions
url
ess
ort
ies

III.2.10.3 Le moteur d'inférence flou


Il transforme à l'aide des techniques de raisonnement flou, la partie floue issue de la
fuzzification en une nouvelle partie floue, afin d'évaluer le degré de vérité d'une règle i à
partir des fonctions d'appartenance liées à la prémisse et à la conclusion. L'agrégation des n
règles s'effectue en combinant les différentes règles floues à l'aide de l'opérateur Ou. En effet,
une telle énumération est comprise dans ce sens:

 Sic
ondi
ti
on1e
t/o
ucondi
ti
on2(e
t/ou…)a
lor
sac
tions
url
ess
ort
ies
ou
 Sic
ondi
ti
on3e
t/o
ucondi
ti
on4(e
t/ou…)a
lor
sac
tions
url
ess
ort
ies
ou
 Sic
ondi
ti
on5e
t/o
ucondi
ti
on6(e
t/ou…)a
lor
sac
tions
url
ess
ort
ies

79
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.10.4 Défuzzification [MEL 98]


C'est une interface " Linguistique - Numérique" qui transforme la partie floue de
l'inférence en valeurs numériques directement exploitables par le processus. Le résultat de
l'inférence peut être soit une partie floue numérique, soit une partie floue symbolique. Afin
de les transformer en une valeur numérique, on aura besoin de deux types de défuzzification:
une défuzzification numérique 1 , et une défuzzification symbolique 2 [MEL.98]. La figure
(III.3) montre ces deux types de défuzzification dans le cadre de la topologie SIF [NAK.97].

Fuzzification Inférence Défuzzification


F(X) F(Y)
SIF1
Fuzzification
numérique 1

SIF2
X Y

SIF3
Fuzzification 2
symbolique
F(L(X)) SIF4 F(L(Y))

Figure III.11 : Défuzzification numérique et symbolique

Le choix de t-norme min et t-conorme T max permet de retrouver les quatre


familles SIF suivantes:

 Famille SIF1, 
U X , V Y ,  x X ,  y Y ,
F 
y x  X X 
x T R 
x, y 
. (III.15)

 Famille SIF2, 
U X , V L
Y 
,  x X ,  L' L
Y ,
F 
L' x X  x T R 
X  x, L' 
. (III.16)

 Famille SIF3, 
U LX, V Y  , L LX ,  y Y ,
F 
y L  L X 
X 
L T R 
L, y 
. (III.17)

 Famille SIF4, 
U L
X, V L
Y 
,  L L
X, L' L
Y ,
F 
L' L LX  L T uR 
X  L, L' 
 (III.18)

80
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.10.4.1 Défuzzification numérique


Ce type de défuzzification 1 dans la figure (III.11) est utilisé pour les familles SIF1 et
SIF3 par la méthode la plus couramment utilisée dite défuzzification par calcul centre de
gravité dont l'énoncé est le suivant:

Soit F F 
Y , la partie floue numérique issue de l'inférence. La valeur numérique y 
produite par l'application de la méthode de centre de gravité est donnée par:

 
 y . y . dy
F

y 1 
 y Y
F  si Y est continue (III.19)
F 
 y . dy
y Y

La valeur y produite par défuzzification 1 est définie comme étant la coordonnée y du

centre de gravité (G) de la surface située sous F voir la figure (III.12). Cependant, son
calcul est relativement complexe puisqu'il nécessite le calcul d'une intégrale, ou d'une somme
pondérée dans le cas discret.

Degré de vérité de la variable floue

F

Grandeur de sortie Y

y

Figure III.12: Défuzzification par calcul du centre de gravité

III.2.10.4.2 Défuzzification symbolique


La défuzzification symbolique 2 dans la figure( III.3) transforme un sous ensemble
flou symbolique en une valeur numérique, en considérant la défuzzification symbolique
comme étant la composition de deux opérations 3 et 1 , c'est-à-dire 2 
F 1 
3 
F où

81
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

1 est la fonction de la défuzzification numérique et 3 est une fonction qui transforme un


sous ensemble flou symbolique de F 
L
Y en un sous ensemble flou numérique de F 
Y ,
par application de la règle compositionnelle d'inférence

 y Y 3 F 
y L' L
Y
   
T F L' , R L' , y (III.20)

III.2.11 Les différents systèmes d'inférence floue [GER.04] [JAN.92]

Le système d'inférence flou est composé essentiellement de la base de règles, de la base


de données (les paramètres des fonctions d'appartenance) et du raisonnement flou. Les types
les plus courants sont représentés sur les deux figures suivantes:

Prémisse de la règle Inférence floue Conclusion de la règle


(min - prod)
μ(
x) μ(
y) μ(z)Min - Max μ(z ) Prod - Max

1 1 1 1
min C'1 C'1

x y prod z z

μ(x) μ(y
) μ(z
) μ(z
)
1 1 min 1 1

prod C '2 C'2


x y z z

Agrégation des règles max

C' C'
C'2 C'2
C'1 C'1
x y
Variables d'observation
z z

Centre de gravité Milieu des maximums

Figure III.13: Système d'inférence flou de Mamdani

82
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Prémisse de la règle Inférence floue Conclusion de la règle


(min-prod) Tsukamoto Takagi-Sugeno
μ(
x) μ(
y) μ(z)

z1=f1(x,y)

w1

x y z

1 μ(
x) 1 μ(
y) μ(
z)

w2
z2=f2(x,y)

x y z

z 
w1 z1 w2 z2 
/w1 w2 
x y
Variables d'observation z z
moyenne pondérée
Figure III.14: Système d'inférence flou de Tsukamoto et Takagi-Sugeno

Dans la méthode de Mamdani, les prémisses et les conclusions des règles sont floues.
L'inférence floue est réalisée à l'aide de l'opérateur min (minimum) ou prod (produit) et
l'agrégation des règles à l'aide de l'opérateur max (maximum). La défuzzification est
généralement effectuée par la méthode du centre de gravité.

Pour TSUKAMOTO, la fonction d'appartenance de chaque conclusion est une fonction


monotone croissante. L'inférence floue est réalisée par l'opérateur min ou prod. La sortie
numérique est une moyenne pondérée des valeurs issues des fonctions monotones.

La méthode de TAKAGI-SUGENO, est très efficace du point de vue de calcul car elle
privilégie l'analyse mathématique, elle fonctionne bien avec les techniques linéaires,
l'optimisation et les techniques dites adaptatives. L'inférence floue est réalisée avec l'opérateur
min ou prod. Les conclusions des règles sont des valeurs numériques calculées à partir des
entrées et la valeur finale est obtenue en effectuant une moyenne pondérée des conclusions.

83
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.12 Synthèse du correcteur PID classique [JAN.98] [BOU.05]

Las
ort
iea
gis
santduc
orr
ect
eurpr
opor
ti
onne
lint
égr
aldé
rivéi
déa
les
tli
éeàl
’er
reure
n
entrée par :
t
1 de
u K c [ e   e dTd ] (III.21)
Ti 0 dt

Avec : e w y

Puisque le correcteur flou est un correcteur numérique, alors il faut déterminer


l
’équi
val
entdi
scr
etduc
orr
ect
eurPI
Dcl
ass
iquec
ont
inu.Pourde
spe
tit
esva
leur
sdel
apé
riode
d’
écha
nti
ll
onna
geTs , la relation (III.21) devient :

1 k
e k e k 1
u k K c [ e k 
Ti
e
i 1
j Ts Td
Ts
] (III.22)

Où uk r
epr
ése
ntel
esi
gna
ldec
omma
ndeàl
’i
nst
ant
k.

III.2.12.a Dé
ter
minat
ionde
spar
amè
tre
sd’
adapt
ati
ond’
unc
orr
ect
eurf
loue
nfonction
des paramètres classique [JAN.98]

En premier lieu, il faut choisir le type de correcteur, puis en discrétisant le correcteur


c
las
siqueobt
enuondé
ter
minel
esr
ela
tionsdonna
ntl
espa
ramè
tre
sd’
ada
pta
tionduc
orr
ect
eur
flou équivalent. Dans le cas d’
unPI
Dnousa
vons:

GE f 1 ( K c , Ti , Td )
GCE f 2 ( K c , Ti , Td )
GU f 3 ( K c , Ti , Td )

Avec K c , Ti , et Td s
ontl
espa
ramè
tre
sd’
unc
orr
ect
eurc
las
sique
,etGCE,GEe
tGU
s
ontl
espa
ramè
tre
sd’
ada
pta
tionduc
orr
ect
eurf
lou.Da
nsc
ett
ese
cti
on,nousa
llonspr
ése
nte
r
ces relations de passage pour les différents types de correcteur.

84
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.12.1 Correcteur proportionnel flou (FP)


Ce type de correcteur est donné par la figure (III.15):

E f u PLANT
GE GU
+
_

Figure III.15:St
ruc
tur
ed’
unr
égul
ate
urf
lout
ypeP

L’
ent
réedu c
orr
ect
eure
stl
’er
reur
, la sortie est le signal de commande u. Ce
c
orr
ect
eurpos
sèdede
uxpa
ramè
tre
sd’
ada
pta
tions(
gai
ns)GEe
tGU.Ons
ymbol
is
eles
igna
l
avant le gain par une lettre minuscule et après le gain par une lettre majuscule, par exemple
E = GE e.

Le signal de commande u k , est une fonction non linéaire en fonction de ek :

uk f ( GE . ek ) . GU (III.23)

Par des choix judicieux au niveau de la structure interne du correcteur flou, on peut
e
mpl
oye
rl’
appr
oxi
mat
ionl
iné
air
edef comme suit [JAN.98] :

f ( GE . ek ) GE . ek (III.24)

La relation (III.23) devient :

uk GE . ek . GU GE . GU . ek (III.25)

Da
ns l
eca
s d’
un c
orr
ect
eur pr
opor
ti
onne
lcl
ass
ique l
asor
ti
eagi
ssa
ntee
st
pr
opor
ti
onn
ell
eàl
’er
reure
nent
rée:

uk K c . ek (III.26)
Ces deux dernières relations donnent :

GE . GU K c (III.27)

85
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.12.2 Correcteur proportionnel dérivée flou (FPD)

Le correcteur proportionnel dérivé a comme entrée :l


’er
reur«e » et sa dérivée « de »
illustré par la figure (III.16):

E
GE f PLANT
u
GU
du /dt DE
+ GCE
_

Figure III.16:St
ruc
tur
ed’
unr
égul
ate
urf
lout
ypePD

Dans ce cas le signal de commande uk est une fonction non linéaire en fonction de

l
’er
reur«e »e
tladé
rivé
edel
’er
reur«de », u k est donné comme suit :

uk f (GE . ek , GCE . dek ) . GU (III.28)

Demê
meunc
hoi
xdes
truc
tur
eint
ernepe
utc
ondui
reàe
mpl
oye
rl’
appr
oxi
mat
ion
linéaire de f comme suit :

uk (GE . ek GCE . dek ) . GU (III.29)

e e
Avec dek  k k 1 .
Ts

Ce qui donne :

GCE ek ek 1
uk GE . GU . (ek  . ) (III.30)
GE Ts

Da
nsl
eca
sd’
uncorrecteur proportionnel dérivé classique la relation (III.22) donne :

 e e 
uk K c . 
ek Td . k k 1 
 (III.31)
 Ts  

86
CHAPITRE III:: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Par identification les deux dernières relations donnent :

GE . GU K c (III.32)

GCE
Td (III.33)
GE
III.2.12.3 Correcteur flou proportionnel
roportionnel intégral (FPI)

Le correcteur proportionnel intégral a comme entrées :l


’er
reur«e », sa dérivée « de »
e
tl’
int
égr
aldel
asor
tie comme commande, voire la figure (III.17):

GE E
f PLANT
GCU
+ du /dt GCE
_ DE Δ

:St
Figure III.17: ruc
tur
ed’
unr
égul
ate
urf
lout
ypePI

Pour ce type de correcteur le signal de commande u k est déterminé en incrémentant la

va
leurdel
acomma
ndeàl
’i
nst
antk 1 par la variation uk , comme suit :

uk uk 1 uk (
III
.3’
)

Avec la relation (III.22)) pour Td 0 on a :

 1 
uk uk uk 1 K c . 
e
k ek 1  . ek . Ts

 (III.35)
 Ti 

Dans ce cas le signal de commande u k est la somme des incréments précédents :

k
uk ui . GCU . Ts (III.36)
i 1

87
CHAPITRE III:: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Unc
hoi
xjud
ici
euxpourl
ast
ruc
tur
eint
ernepe
rme
td’
écr
ir
el’
appr
oxi
mat
ionl
iné
air
e
suivante :
k
uk ( Ei DEi ) . GCU . Ts
i 1
k
 e e 
GCU .  GE . ei GCE . i i 1 . Ts
i 1  Ts 
(III.37)
 k k

GCU  GE . ei . Ts GCE . (ei ei 1 )
 i 1 i 1 
GE k 
GCE . GCU .  . ei . Ts ek 
 GCE i 1 
Da
nsl
eca
sd’
unc
orr
ect
eurpr
opor
ti
onne
lint
égr
alc
las
siquel
are
lat
ion(
III.22
22) donne :

 1 k 
ek  . ei . Ts 
uk K c .  (III.38)
 Ti i 1 

Par identification les deux dernières relations donnent :

GCE . GCU K c (III.39)

GE 1
 (III.40)
GCE Ti

III.2.12.4 Correcteur flou proportionnel intégral dérivée (FPID)

Le correcteur proportionnel intégral dérivé flou a trois entrées :l


’er
reur, sa dérivée et
son intégrale, donné par la figure (III.1
III.18).

E
GE f + PLANT
GU
+ du /dt GCE DE
_ +
IE
1/s GIE

Figure III.18:: S
truc
tur
ed’
unr
égul
ate
urf
lout
ypePI
D

L’
ava
nta
gedec
ette structure de commande basée sur le moteur flou proportionnel
dérivée, e
stqu’
ile
stpos
sibl
edec
ons
trui
reunc
orr
ect
eurdet
ypePI
Dsa
nsa
voi
ràc
alc
ule
rla

88
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé


rivé
ese
condedel
’er
reur
,quir
isq
uer
aitd’
ampl
if
ierdef
açont
ropi
mpor
tant
elebr
uitde
mesure.
La sortie du correcteur est ainsi une fonction non linéaire des trois entrées, u k est donnée
comme suit :
 k

uk f (GE . ek , GCE . dek ) GIE . ei . Ts . GU (III.41)
 i 1 
L’
appr
oxi
mat
ionl
iné
air
edef est:

 (e ek 1 ) k

u k GE . ek GCE . k GIE . ei . Ts . GU
 Ts i 1 
(III.42)
 GIE k
GCE ek ek 1 
GE . GU  ek  . ei . Ts  . 
 GE i 1 GE Ts 

Par identification de la relation (III.42) avec la relation (III.22), on trouve :


GE . GU K c (III.43)

GCE
Td
GE
(III.44)
GIE 1
 (III.45)
GE Ti

III.2.12.5 Relation de passage


Le tableau (III.2) r
ésumel
esr
ela
tionsdonna
ntl
espa
ramè
tre
sd’
ada
pta
tion d’
un
c
orr
ect
eurf
loue
nfonc
tionde
spa
ramè
tre
sd’
unc
orr
ect
eurPI
Dcl
ass
ique:

Correcteur PID classique


Kc 1 Td
Ti
FP GE.GU _ _
Correcteur flou

FPI GCE.GCU GE/GCE _

FPD GE.GU _ GCE/GU

FPID GE.GU GIE/GE GCE/GE

Tableau III.2 : Relation entre les gains flous et classiques.

89
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.13 Ré
gla
ged’
unc
ont
rôl
eurflou [BÜH.94][NAK.97]
Un contrôleur flou possède de nombreux paramètres de réglage, ce qui peut, à priori,
effrayer ses utilisateurs potentiels. En effet, contrairement aux contrôleurs classiques, le
contrôleur flou possède un nombre plus conséquent de paramètres, qui lui offre, davantage de
degrés de liberté.
On peut distinguer parmi les choix et les réglages à faire :
 L’ expr ess i
onde srègles,
 La définition des variables et des valeurs linguistiques,
 Lamé thoded’ impl i
catione tlamé t
hoded’ infér
e nce,
 La méthode de défuzzification,
 Le sf acteur sd’échel
les url ese nt
réese tle ss or
ti
e sduc ont r
ôle
ur.

Cependant, on constate une certaine insensibilité du résultat au choix des méthodes


d’implication,d’ infére nc
eetdedé f
u zzificati
on.Pourl esa ut
re spa r
amè tres
,un r églage
séquentiel est possible.

III.2.14 Avantages et désavantages du réglage par la logique floue :


Evidemme nt
,l eréglagepa rl og iquef loueréunitunc
ert
ainnombr
ed’
ava
nta
ges et de
désavantages. Les avantages essentiels sont [HAN 94] :

 La nonné ces s
it
éd’
unemodé
lis
ati
on(
cepe
nda
nt,i
lpe
utê
treut
il
ededi
spos
erd’
un
modèle convenable).
 La maîtrise du système à régler avec un comportement complexe (fortement non
linéaire et difficile à modéliser).
 L’
obt
ent
ionf
réque
ntedeme
ill
eur
espr
est
ations dynamiques (régulateur non linéaire).
 La disponibilité de système de développement efficace, soit pour microprocesseur ou
PC (solution logicielle), soit pour circuit intégrés (processeurs dédicacés, fuzzy processors).

Par contre les désavantages sont :

 Lema
nquededi
rec
tive
spr
éci
ses pourl
aconc
ept
ion d’
un r
égl
age(
choi
x de
s
grandeurs à mesurer, détermination de la fuzzification, des inférences et de la défuzzification).
 L’
appr
ochea
rti
sana
lee
tnon s
yst
éma
tique(
impl
éme
nta
tion de
sconna
iss
anc
esde
l
’opé
rat
eur
, est souvent difficile).
 L’
impos
sibi
li
tédel
adé
mons
tra
tiondel
ast
abi
li
téduc
irc
uitder
égl
agee
ntout
e
g
éné
ral
it
é(e
nl’
abs
enc
ed’
unmodè
leva
labl
e).
 La précision de réglage souvent peut élever.
 La cohérence des inférences non garantie à pr
ior
i(a
ppa
rit
ionder
ègl
esd’
inf
ére
nce
contradictoires possible).

90
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15 Application de la commande floue sur le pendule inversé

III.2.15.1. Analyse du problème

L’
obj
etdenot
ret
rava
ilc
ons
ist
eàa
ssur
erl
ast
abi
li
téve
rti
cal
edupe
ndul
einve
rseda
ns
uns
yst
èmer
éel
.Pourc
ela
,ile
stné
ces
sai
redeg
ére
rl’
équi
li
breve
rti
caldubr
asdupe
ndul
een
tenant compte de la position du chariot sur son rail de guidage dont les dimensions

cani
que
ssontf
ixé
es.En e
ffe
t,s
ilapos
it
ion n’
estpa
sma
îtr
isé
e,s
esva
ria
tionsqui
c
ont
ri
bue
ntàl
’équi
li
bredubr
asvonte
ntr
aîne
rl’
act
iva
tionde
sbut
éesdef
indec
our
se,
limitant ainsi le déplacement du chariot. Cette dé
tec
tiond’
unede
sbut
ées
,soi
tàdr
oit
esoi

g
auc
he,pr
ovoquea
lor
slac
oupur
edel
’al
ime
nta
tiondumo
teurd’
ent
raî
neme
ntduc
har
iot
,
doncc
hut
edupe
ndul
e,i
nte
rrompa
ntdec
efa
itl
’expé
rie
nce
.

Enc
ons
éque
nce
,ili
mpor
ted’
eff
ect
uerunec
ommande du moteur à la fois en fonction
del
’ang
ledubr
asdupe
ndul
ema
isa
uss
idel
apos
it
ionduc
har
iot
,doncd’
ass
ure
rl’
équi
li
bre
du pendule pour une consigne de position de donnée.

III.2.15.2. Structure de la commande floue

III.2.15.2.1. Enoncé de la méthode

Lac
omma
ndef
louer
epos
esurl
’él
abor
ati
onder
ègl
esdé
cri
vantl
efonc
tionne
mentdu
pe
ndul
e.Unr
ais
onne
mentphy
siquea
ppl
iquéàl
’équi
li
bredubr
asdupe
ndul
e,a
nal
ogueàl
a
stabilité ve
rti
cal
ed’
unbâ
tonda
nsl
apa
umedel
ama
in,né
ces
sit
el’
uti
li
sat
ioni
mpl
ici
tede
deux informations, à savoir :

 Ladé
via
tiondel
’ang
le.

 La vitesse de la déviation del


’ang
le.

Da
nsc
era
isonne
ment
,lapos
it
ionduc
har
iotn’
estpa
spr
isee
ncompt
eal
orsques
on
contrôle est impératif pour les raisons rappelées précédemment. Aussi, pour assurer sa gestion
t
oute
ncont
rôl
ante
ffi
cac
eme
ntl
’équi
li
bredubr
asàunepos
it
iondonné
educhariot, nous
ut
il
is
eronsc
ommeda
nsl
eca
sdel
’ang
lede
uxi
nfor
mat
ionsdumê
met
ype
.

91
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15.2.2. Choix des éléments des régulateurs flous

III.2.15.2.2.1. Choix de la forme des classes

Pour permettre une commande progressive et non pas par paliers, la forme triangulaire
s
embl
epr
éfé
rabl
epourt
out
esl
esc
las
sesde
sva
ria
ble
sd’
ent
réee
tdes
ort
ie,c
equipe
rme
t
également de simplifier les calculs.

III.2.15.2.
2.2.Dé
fini
ti
onde
sré
fér
ent
iel
spourl
esquat
revar
iabl
esd’
ent
rée
s ( x, x )
,,

Da
nsl
ebutd’
eff
ect
uerl
atr
ans
for
mat
ionnumé
riques
ymbol
ique
,ile
stné
ces
sai
rede
c
onna
îtr
elapl
agedeva
ria
tionr
éel
ledec
haquegr
ande
urd’
ent
réea
find’
yfa
irec
orr
espondr
e
son ensemble flou, ce dernier étant lui-même divisé en sous-ensembles flous. Nous avons
donc défini 5 sous-ensembles flous (ou classes) respectivement nommés : Grand Négatif
(GN), Petit Négatif (PN), Zéro (ZR), Petit Positif (PP), Grand Positif (GP).

Ecart de position

Il est calculé par différence entre la consigne de position et la mesure de position réelle
duc
har
iotpa
rra
ppor
tauc
ent
redel
’axedeg
uida
ge.Le
sli
mit
esphy
sique
sdel
a pos
it
iondu
chariot sont comprises entre –50c
met50c
m.Lec
ons
truc
teurdupe
ndul
enes
ti
pul
equ’
un
écart de position de 40 cm qui ne doit pas être dépassé car la commande correspondante
entraîne une inclinaison du bras du pendule, ce qui provoque un arrêt du programme de
commande du pendule.

Ma
lgr
éce
ttes
péc
ifi
cat
ionduc
ons
truc
teur
,lapl
aged’
éca
rt de position a été élargie à
100 cm en valeur absolue voire la figure (III.19).

Vitesse linéaire

Il est très difficile, voire impossible sans expérimentation, de déterminer les examens
de la vitesse linéaire. Néanmoins des mesures ont été effectuées pour un échelon de tension
maximale de la commande du moteur. La variation maximale de tension, correspondant à la
variation maximale de vitesse du chariot entre deux intervalles de temps consécutifs, est de
l
’or
drede1m/
s.

92
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

PN ZR PP GN GP PN ZR PP GN GP
1 1

0.9 0.9

0.8 0.8

Fonction d'eappartenance X

Fonction d'eappartenance V
0.7 0.7

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
Deplacement X (m) Vitesse dX (m/s)

Figure III.19: Définition des classes de position et de vitesse du chariot

Ecart angulaire

Il est calculé par différence entre la consigne angulaire et l


’i
ncl
ina
isonpr
ise pa
rle
br
asdupe
ndul
e.Le
sli
mit
esphy
siqu
esdel
ame
sur
edel
’ang
lesont fixées entre -20 et +20
degrés; limite de commutation entre les deux contrôleurs une f
oisl
edoma
ined’
att
rac
tione
st
atteint.

Vitesse angulaire

Comme pour la vitesse linéaire, nous avons fixé les limites de la vitesse angulaire. Soit
une vitesse angulaire entre -1 et +1 rad/s.

PN ZR PP GN GP PN ZR PP GN GP
1 1

0.9 0.9
Fonction d'eappartenance dTheta

0.8 0.8
Fonction d'eappartenance Theta

0.7 0.7

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
Angle Theta (rad) Vitesse Anglaire dTheta (rad/s)

Figure III.20: Définition des classes de position et de vitesse angulaire du pendule

III.2.15.2.3. Définition des référentiels pour les variables de sortie des deux régulateurs

Les deux grandeurs de sortie, exprimées sous forme symbolique à convertir en valeur
numérique sont les deux tensions de commande moteur fournies par les deux régulateurs. La
forme des classes sera triangulaire et trapézoïdale, même le nombre de sous-ensembles flous
reste à cinq.

93
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Tension de commande du moteur

L’
ens
embl
efl
oudec
ett
egr
ande
urdoi
ts’
ada
pte
ràl
aca
rac
tér
ist
iquede
mandé
epa
rle
constructeur, soit une tension évoluant entre 0 et +5 V nécessaire pour attaquer l
’ét
agede
puissance du moteur.

1
PN
0.9 ZR
F o n c t io n d 'a p p a rt e n a n c e d e s d e u x s o rt ie

PP
0.8
GN
0.7 GP

0.6

0.5

0.4

0.3

0.2

0.1

0
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
Commmande (V)

Figure III.21: Définition des classes de la consigne de commande (V)

III.2.15.2.4.Tableaux de règles

L’
uti
li
sat
ion dede
ux r
égul
ate
urss
truc
tur
ell
eme
nti
dent
ique
s,é
labor
antc
hac
un une
c
omma
ndee
nsor
ti
e,i
mpos
eladé
fini
ti
ond’
unj
euder
ègl
esdé
cri
vantr
espe
cti
veme
ntl
e
fonctionnement de chacun.

La base de connaissance dec


haq
uec
ont
rôl
eurf
loupe
utê
tres
ynt
hét
is
ées
ousf
ormed’
un
tableau de règles où chaque règle associe sous forme conditionnelle les états des variables
d’
ent
rée
s à une caractéristique de la variable de sortie. Comme chacune des deux entrées est
fuzzifiée en cinq classes, on obtient un jeu de 25 règles.

Les règles du premier contrôleur se déduisent des observations faites précédemment


c
’es
t-à-di
re,l
ors
quel
echa
riote
sts
it
uéàga
uchedel
acons
igne
,l’
éca
rtde position est positif
e
ts’
ils
edé
pla
ceda
nsl
amê
medi
rec
tion,a
lor
silf
auti
ncl
ine
rlepe
ndule vers la droite. Le
tableau(III.3) présente les règles du premier régulateur.

94
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

x GN PN ZR PP GP
x
GN ZR PP GP GP GP

PN PN ZR PP GP GP

ZR GN PN ZR PP GP

PP GN GN PN ZR PP

GP GN GN GN PN ZR

Tableau III.3 : Règles d’


inf
ére
ncepourRLFX

 GN
 PN ZR PP GP

GN GN GN GN PN ZR

PN GN GN PN ZR PP

ZR GN PN ZR PP GP

PP PN ZR PP GP GP

GP ZR PP GP GP GP

Tableau III.4 : Règles d’


inf
ére
ncepourRLFT

Les règles du second régulateur gérant la stabilisation du bras sont simples à élaborer.
Par exemple, si le bras tombe vers la gauche très rapidement alors le chariot doit se déplacer
t
rèsvi
teve
rsl
aga
uchepourr
éta
bli
rl’
équi
li
bre
.Ce
cipe
uts
e traduire par une règle exprimée
sous la forme conditionnelle suivante :

Sil
’ang
let
étae
stt
rèsné
gat
if
,ent
raî
nantuné
car
tang
ula
iret
rèspos
it
ife
tquel
ava
ria
tion
angulaire est aussi très négative alors la force appliquée au chariot doit être très grande et
dirigée vers la gauche donc très négative.

III.2.15.2.
5.Lemot
eurd’
inf
ére
nce

Lal
oidec
ompos
it
ionMAX MI
Nes
tut
il
is
éed’
unepa
rtpouré
lir
ele
srè
gle
saumoy
en
dut
abl
eauc
orr
esponda
nte
td’
aut
repa
rtpourf
air
el’
agr
éga
tion des résultats flous de la
variable de sortie associée à ce tableau.

95
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15.2.6. La transformation symbolique numérique

La méthode du centre de gravité simplifiée a été choisie pour sa rapidité de calcul sans
compromettre la précision du résultat.

Pour satisfaire une mise au point plus conviviale de cette commande floue, un facteur
d’
éche
llee
sta
ffe
ctéàc
haqueva
ria
bled’
ent
réee
tdes
ort
ie.Ce
sdi
ff
ére
ntsf
act
eur
sd’
éche
lle
sont entrés au clavier lors d’
unepha
sed’
ini
ti
ali
sat
ionqu’
ils sont synthétisés à partir des
pa
ramè
tre
sd’
uncorrecteur PID classique donné par le constructeur pour affecter les sous-
ensembles flous de chaque variable.


Gains de normalisation :

GE1 0.08 ; GCE1 0.25 ; GIE1 0.001




GE2 1
 ; GCE2 0.2 ; GIE2 0.01



Gains des commandes :

GU 1 30.6


GU 2 47.6

A partir de cette étape du travail, nous pouvons présenter les résultats de simulation
de la méthode de commande floue du pendule à notre disposition.

III.2.15.6 Résultats de simulation

0.5 0.5
Position(m)

Angle(rad)

0 0

-0.5 -0.5
0 5 10 15 20 25 30 0 5 10 15 20 25 30
Temps (s) Temps (s)
Vitesse angulaire (rad/s)
Vitesse du chariot (m/s)

1 0.5

0 0

-1 -0.5

-2 -1
0 5 10 15 20 25 30 0 5 10 15 20 25 30
Temps (s) Temps (s)

Figure III.22:Résultats de simulation de stabilisation du pendule par la commande floue

La figure ci-dessus r
epr
ése
ntel
’évol
uti
onr
espe
cti
vedel
apos
it
ione
tvi
tes
seduc
har
iot
pa
rra
ppor
tàl
acons
ignea
ins
iquec
ell
edel
’ang
lee
tde vitesse angulaire du pendule par
rapport à la verticale par un régulateur Mamdani à 25 règles.

96
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5 0.5

Position (m)

Angle (rad)
0 0

-0.5 -0.5
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)

Vitesse du Pendule (rad/s)


Vitesse du Chariot (m/s)

1 0.5

0 0

-1 -0.5

-2 -1
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)

1
Commande (V)

-1

-2

-3
0 5 10 15 20 25 30 35 40
Temps(s)

ond’
Figure III.23.a: visualisati unepour
sui
teé
che
lon

1
0.2
P o s itio n (m )

A n g le (ra d )

0 0

-0.2
-1
0 10 20 30 40 50 60 70 80 90 0 10 20 30 40 50 60 70 80 90
V it e s s e d u p e n d u le (ra d / s )

Temps(s) Temps(s)
V it e s s e d u C h a rio t (m / s )

5 2

0 0

-5 -2
0 10 20 30 40 50 60 70 80 90 0 10 20 30 40 50 60 70 80 90
Temps(s) Temps(s)
5
Commande (v)

-5
0 10 20 30 40 50 60 70 80 90
Temps (s)

ond’
Figure III.23.b: visualisati unepour
sui
ter
ect
angul
air
e

Les deux figures ci-dessusr


epr
ése
nte
ntl
’évol
uti
ondel
apour
sui
tedepos
it
iondu
chariot par rapport à la consigne échelon et rectangulaire respectivement par un régulateur
Mamdani à 25 règles.

Perturbations appliquées

Une des manières possibles de vérifier la stabilité verticale du pendule consiste à


evi
appliquer une force latérale sur la mass ssé
eàl
’ext
rémi
tédubras afin de visualiser si
l
’équi
li
bree
str
éta
bli
. Les mesures concernant cette expérimentation sont représentées sur la
figure ci-dessous :

97
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5

Position (m)

Angle (rad)
0.2
0 0.1
0
-0.5 -0.1
0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35

Vitesse du pendule (rad/s)


Vitesse du chariot (m/s) Temps(s) Temps(s)
1 0.5

0 0

-1 -0.5

-2 -1
0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35
Temps(s) Temps(s)

2
Commande (V)

-2

-4
0 5 10 15 20 25 30 35
Temps (s)

Figure III.24 : visualisation des perturbations

III.2.15.4 Interprétation des résultats de simulation

1. D’
apr
èsl
esr
ésul
tat
sde la figure (III.22), on constate :
 Le temps de réponse est de 4 Sec.
 Lac
omma
nden’
estpa
séne
rgé
tiquee
tré
ali
sabl
epr
ati
que
ment
.
 Le déplacement du chariot ne dépasse pas les limites physiques.
 Les dynamiques des sous systèmes pendule et chariot sont tolérables.

2. Dans les figures (III.23)l


eca
sd’
une poursuite référence échelon ou rectangulaire
imposée au chariot, nous notons :

 La stabilisation du pendule avec des petites oscillations dues à la trajectoire du chariot.


 La bonne poursuite des deux références sans dépassement des limites.
 Commande acceptable et réalisable pratiquement.
 La tolérance des dynamiques des sous systèmes pendule et chariot.

ots
3. Quand une perturbation a été appliquée sur le pendule, le chari ’es
tdé
pla
céde20
cm avec une déviation angulaire de 0,075 rad (environ 4 degré), et un temps supérieur à 2
secondes pour retrouver le régime stable voir figure (III.24). Ce qui confirme la robustesse et
la performance de cette commande.

Nous somme donc en mesure maintenant de transposer cette commande floue sur
notre dispositif afin de réaliser un système de commande autonome tout en améliorant le
fonctionnement du point de vue rapidité et résistance de la commande aux perturbations
d’
ori
gines diverses.

98
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15.5 Implémentation de la commande floue

Lor
sdel
’i
mpl
éme
nta
tion,onadua
dapt
erl
’al
gor
it
hmedec
omma
ndepourde
sra
isons
et des limitations pratiques a
find’
obt
eni
rle
sré
sul
tat
sdé
sir
és,e
nl’
occ
urr
enc
eles facteurs
d’
éche
lles
ur les entrées et les sorties des contrôleurs, le nombre de classes et de règles.

Fuzzification
Le régulateur flou utilisé est de type Mamdani. Les formes des fonctions
d’
appa
rte
nance sont triangulaires et trapézoïdales voir figure (III.25).

1 1
ZR
Fonction d'appartenance X

Fonction d'appartenance V
0.8 NP 0.8
PP
0.6 0.6

0.4 0.4

0.2 0.2

0 0
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 -1.5 -1 -0.5 0 0.5 1 1.5
Deplacement X(m) Vitesse dX (m/s)
NP ZR PP GN GP
Fonction d'appartenance dTheta

1 1
Fonction d'appartenance Theta

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0 0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
Angle Theta (rad) Vitesse Anglulaire dTheta (rad/s)

Figure III.25: Fonc


tionsd’
app
art
enanc
ede
sent
rée
spourl
acommandef
loue

Tableaux de règles

Les désignations restent les mêmes que les précédentes données à la section (III.2.15.2).
Lamé
thod
ed’
inf
ére
nceut
il
is
éea
findet
ir
erl
es conclusions est la méthode max-min, du fait
qu’
ell
ees
tfa
cil
eài
mpl
ant
ere
tdonnedebonsr
ésul
tat
s. Les bases de règles sont données par
l
est
abl
eaux(
III
.5)e
t(I
II
.6)del
apos
it
ionduc
har
iote
tl’
ang
ledupe
ndul
ere
spe
cti
veme
nt.

x PN ZR PP
x
PN ZR PP GP
ZR PN ZR PP
PP GN PN ZR

Tableau III.5 : Règles d’


inf
ére
ncepourRLFX

99
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

 GN
 PN ZR PP GP

GN GN GN GN PN ZR

PN GN GN PN ZR PP

ZR GN PN ZR PP GP

PP PN ZR PP GP GP

GP ZR PP GP GP GP

Tableau III.6 : Règles d’


inf
ére
ncepourRLFT

Défuzzification
La méthode utilisée pour la défuzzification reste inchangée, i
ls’
agi
tde l
a

fuz
zif
ica
ti
onpa
rce
ntr
edeg
ravi
té.Le
sfonc
tionsd’
appa
rte
nanc
edel
asor
ti
eU sont des
formes triangulaires et trapézoïdales voir figure (III.26)

1
PN
0.9 ZR
F o n c t io n d 'a p p a rt e n a n c e d e s d e u x s o rt ie

PP
0.8
GN
0.7 GP

0.6

0.5

0.4

0.3

0.2

0.1

0
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
Commmande (V)

Figure III.26: Fonctions d’


appar
tenanc
epourl
acommandes
tabi
li
sant
e


Gains de normalisation :

GE1 0.5
 ; GCE1 0.5

GE2 1
 ; GCE2 1



Gains des commandes :

GU1 23


GU 2 25

100
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15.6 Résultats expérimentaux

0.4
Position (m)

0.2

-0.2
0 5 10 15 20 25 30
Temps (s)

0.3
Angle (rad)

0.2
0.1

-0.1
0 5 10 15 20 25 30
Temps (s)

2
Commande (V)

-2

0 5 10 15 20 25 30
Temps (s)

Figure III.27 : Résultat de stabilisation flou expérimental pour condition initiale (0, 0, 0.3, 0)
0.5
Position (m)

-0.5
0 10 20 30 40 50 60 70
Temps (s)
0.3
Angle (rad)

0.2
0.1
0
-0.1
0 10 20 30 40 50 60 70
Temps (s)
4
Commande (V)

-2

-4
0 10 20 30 40 50 60 70
Temps (s)

Figure III.28: Résultat de poursuite rectangulaire flou expérimental pour condition initiale
(0,0, 0.3, 0)

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)
0.3
Angle (rad)

0.2
0.1
0
-0.1
0 5 10 15 20 25 30 35 40
Temps (s)
4
Commande (V)

-2

-4
0 5 10 15 20 25 30 35 40
Temps (s)

Figure III.29 Résultat de poursuite échelon expérimental pour condition initiale (0.3, 0, 0, 0)

101
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5

Position (m)
0

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)
6
Angle (rad)

0 5 10 15 20 25 30 35 40
Temps (s)
4
Commande (V)

-2

-4
0 5 10 15 20 25 30 35 40
Temps (s)

Figure III.30 Résultat expérimental pour redressement et stabilisation

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)
6
Angle (rad)

0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure III.31 Résultat expérimental pour redressement et stabilisation avec perturbation


externeàl ’
instantt=28s .

0.5
Position (m)

-0.5
0 10 20 30 40 50 60 70 80
Temps (s)
6
Angle (rad)

0 10 20 30 40 50 60 70 80
Temps (s)
4
Commande (V)

-2

-4
0 10 20 30 40 50 60 70 80
Temps (s)

Figure III.32 Résultat expérimental pour redressement et stabilisation avec une poursuite
rectangulaire de fréquence 0.025.

102
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.2.15.7 Analyse des résultats expérimentaux

On constate à partir des résultats expérimentaux présentés par les figures (III.27) et
(III30), que cette commande assure bi enl ’objectifdes t
a bil
isati
on,e ll
ee stcons i
dé ra
bleme nt
rapide par rapport aux autres commandes, le temps de réponse est plus rapide avec des
dépassements et oscillations moins importants, les performances sont altérées et se dégradent
quand on augmente la taille de la base de règles, cela est due aux insuffisances que présente
l’environne me ntdedé ve loppe
me nts url equelonat rava i
llé.

Les figures (III.28), (III.29), (III.30) et (III.31) obtenues montrent bien que cette
commande est robuste vis-à-vis des perturbations extérieures. Mais elle réagit moins
correctement à une variation de consigne. Néanmoins, son défaut majeur réside dans le
dépassement que présente la tension présentant plus de chahutement, ce qui est plus éprouvant
pour le moteur et la courroie.

On constate aussi dans toutes les figures données, des oscillations d’


ampl
it
ude
importante autour de la consigne en régime établi, contrairement aux autres commandes vues
dans le chapitre précédent, d’
ail
leur
s pour un échelon d’
ampl
it
udes
upé
rie
urà 0.3 m, il
entraine la chute du pendule provoqué par une détection des contacts de sécurité alors une
c
oupur
edumot
eurd’
ent
rai
neme
ntduc
har
iot
.

i
L’mpl
éme
nta
tionde la commande par logique floue demande une bonne expertise
pour trouver les bons paramètres du régulateur surtout lorsque le nombre de variables entrant
e
nje
ude
vie
ntt
ropi
mpor
tant
,d’
oùde
spr
obl
ème
sli
ésàs
aré
ali
sat
ionpr
ati
quee
ndé
coul
ent
.Il
e
stdonci
nté
res
santd’
uti
li
serde
ste
chni
que
sd’
appr
ent
is
sag
esa
find’
aut
oma
tis
erl
ami
sea
u
point du contrôleur flou.

La suite de ce t
rava
ils
’ins
cri
tda
nsl
amouva
ncede
str
ava
uxa
ctue
lss
ur la commande
opt
floue liés au problème d’ imi
sat
ionde
spa
ramè
tre
sde
ssy
stè
mesd’
inf
ére
ncef
lou.

103
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.3 Les Réseaux de neurones


III.3.1 Introduction
Les réseaux de neurones artificiels (RNA) sont des réseaux fortement connectés de
processeurs élémentaires fonctionnant en parallèle. Chaque processeur élémentaire calcule
unes
ort
ieuni
ques
url
aba
sede
sinf
orma
tionsqu’
ilr
eçoi
t. Ils infèrent des propriétés
émergentes permettant de solutionner les problèmes jadis qualifiés de complexe.

Dans un réseau, chaque sous-groupe fait un traitement indépendant des autres et


transmet le résultat de son analyse au sous-groupe suivant. L'information donnée au réseau va
donc se propager de la couche d'entrée à la couche de sortie, en passant soit par aucune, une
ou plusieurs couches intermédiaires. Il est à noter qu'en fonction de l'algorithme
d'apprentissage, il est aussi possible d'avoir une propagation de l'information à reculons.

Dans cette partie, nous donnons un bref aperçu de ces nouveaux outils, leurs
apprentissage et architectures que nous retenons pour la suite de notre travail.

III.3.2 Neurone biologique


Le neurone biologique est le composant cellulaire de base du cerveau, voire la figure
(III.33), il comprend [BOR.07] :

Le corps cellulaire, qui fait la somme des influx qui lui parviennent ; si cette somme
dépasse un certain seuil, il envoie lui-mê meuni nfluxpa rintermé dia i
redel ’ axone;

L’ a
xonequipe
rme
tdet
rans
met
tr
ele
ssi
gna
uxé
mispa
rlec
orpsc
ell
ula
irea
uxa
utr
es
neurones;

Les dendrites, qui sont les récepteurs principaux du neurone, captant les signaux qui
lui parviennent ;

Les synapses, qui permettent aux neurones de communiquer avec les autres via les
axones et les dendrites.

Figure III.33 Neurone biologique


104
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.3.3 Neurone artificiel [BOR.07]


Une analogie directe faite par Mac Culloches et Pitts, avec le neurone biologique a
donnéunne
uronef
orme
lqu’
este
nef
fetl
’él
éme
ntdeba
sed’
unr
ése
audene
urone
s.I
lré
ali
se
une fonction f (z ) d’
une s
omma
tion pondé
rée z des n 1 signaux x0 , x1 ,..., x n qui lui
parviennent, voire la figure (III.34) :
x0
w0
x1
w1 y

wi  f

xi
wn

xn

Figure III.34 Neurone artificiel


n
z Wi xi et y  f 
z (III.46)
i 0

Les coefficients de pondération wi , i 0,1..., n s


’appellentl espoi dss yna pti que
s. Si wi
e
stpos
iti
f,l’entréexi est excitatrice alors que si wi est négatif, elle est inhibitrice.

Le
sfonc
tionsd’
act
iva
tionl
espl
usut
il
is
éessont les suivantes, voire la figure (III.35) :

a) tout ou rien ; e) saturation ;


b) fonction signe ; f) sigmoïde ;
c) plus ou moins à seuil ; g) fonction arc tangente ;
d) fonction affine ; h) fonction gaussienne.

a) b) c) d)

e) f) g) h)

Figure III.35 Fonc


tionsd’act
ivat
ionl
espl
usut
il
is
ées
105
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.3.4 Les architectures neuronales


Les connexions entre les neurones qui composent le réseau, décrivent la topologie du
modèle. Elle peut être quelconque, mais le plus souvent il est possible de distinguer une certaine
régularité (réseau à connexion complète) [BOR.07].

III.3.4.1 Les réseaux de neurones non bouclés


Un réseau de neurone non bouclé ou réseau unidirectionnel (feed forward networks)
e
str
epr
ése
ntépa
rune
nse
mbl
edene
urone
sconne
cté
sent
ree
uxt
ell
equel
’i
nfor
mat
ion
circulant des couches entrées vers les couches sorties au travers d'éventuelles couches
intermédiaires sans retour en arrière.

Ce type de réseau comprend deux groupes d'architectures: les réseaux Mono-Couche


et les réseaux Multi-Couche. La figure (III.35) illustre un RNA Multi-Couche non bouclé.

E X1 S
N O
T Y1 R
R X2 T
E I
X3 E
E
S S

Couc
hed’
ent
rée Couche cachée Couche de sortie

Figure III.35: Réseau de neurone non bouclé

III.3.4.1.1 Réseaux non boucles Mono-Couche

Ce type de réseau possède une couche d'entrée recevant les stimuli à traiter par
l
'
int
ermé
dia
irede
snœudss
our
ces
.Ce
ttec
ouc
hes
epr
oje
ttee
nunec
ouc
hedes
ort
iec
ompos
ée
dene
urone
s(nœudsdec
alc
ul)t
rans
met
tantl
esr
ésul
tat
sdut
rai
teme
nt au milieu extérieur.
La figure (III.36) présente un réseau proactif Mono-Couc
hea4nœudsd'
ent
réee
t3nœudsde
sortie. La désignation Mono-Couche est attribuée à la couche de sortie.

106
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

X1
Y1

X2
Y2
X3
Y3
X4
Couche Couche
d’
entré
e de sortie
Figure III.36: Réseau non bouclé mono couche

III.3.4.1.2 Les réseaux non boucles Multi-Couches


Ce type de réseaux proactifs se caractérise par la présence d'une ou de plusieurs
c
ouc
hesc
aché
es,dontl
esnœudsdec
alc
ulc
orr
esponda
nts s'appellent neurones cachés. Les
couches cachées s'interposent entre l'entrée du réseau et sa sortie. Leurs rôle est d'effectuer un
prétraitement des signaux d'entrée, reçus par la couche d'entrée en provenance du milieu
extérieur, et de transmettre les résultats correspondants à la couche de sortie ou seront
déterminées les réponses finales du réseau.

Ce rôle de prétraitement fait que, en ajoutant une ou plusieurs couches cachées, le


réseau est capable d'extraire plus de propriétés statistiques que celles extraites d'un réseau
similaire ayant moins de couches cachées. Ceci est utile pour réaliser des fonctions plus
complexes que de simples séparations linéaires.

La figure (III.37) illustre un réseau à une seule couche cachée comportant 4 unités
d'entrées, 3 unités cachées et 2 unités de sortie (réseau 4-3-2).

X1

Y1
X2
Y2
X3

X4
Couche
d’
entré
e Couche Couche
cachée de sortie

Figure III.37: Réseau non bouclé multi couches

107
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Ce réseau est dit complètement connecté dans le sens que chaquenœudd'


unec
ouc
he
est connecté à t
ousl
esnœudsdel
acouc
hea
dja
cent
esui
vant
e.Sié
vent
uel
leme
nt,de
s
connexions manquaient entre des neurones de deux couches voisines, le réseau serait dit
partiellement connecté.

III.3.4.2 Les réseaux de neurones bouclés


Les réseaux récurrents (recurrent networks) possèdent une structure similaire à celle des
réseaux unidirectionnels mais complétée par des connexions entre éléments de la même couche ou
vers des couches amont. Ces réseaux sont assez puissants, car leur fonctionnement est séquentiel et
adopte un comportement dynamique.

E X1 S
N O
T Y1 R
R X2 T
E I
E X3 E
S S

Couc
hed’
ent
rée Couche cachée Couche de sortie

Figure III.38: Réseaux de neurones bouclés

III.3.4.3 Les réseaux de neurones à connexions complexes [OUL.05].

Dans la catégorie des réseaux à connexions complexes se trouve tous les réseaux qui ne
trouvent pas leur place dans les deux catégories précédemment citées. Nous pouvons mentionner les
SOM (Self Organizing Map), LVQ (Learning Vector Quantization), ART (Adaptative
Resonnance Theorie), RCE (Restric-ted Coulomb Energy), les réseaux probabilistes, etc.

I
II.
3.5Pr
oce
ssusd’
appr
ent
iss
age
On appelle apprentissage des réseaux de neurones artificiels la procédure itérative qui
consiste à estimer les paramètres des neurones du réseau afin que celui-ci remplisse au mieux
la tache qui lui est affectée [FAB.03].

L’
appr
ent
is
sagee
stl
aca
rac
tér
ist
ique principale des réseaux de neurones et il peut se
faire de différentes règles et manières.

108
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.3.5.1 Apprentissage supervisé [BRE.99]


L’
appr
ent
is
sag
esupe
rvi
séc
ons
ist
eàpr
ése
nte
raur
ése
auunes
éri
ed’
exe
mpl
ess
urs
es
entrées, ainsi l
eré
sea
uca
lcul
esurs
ess
ort
iesunve
cte
urd’
éta
tquie
stc
ompa
réau vecteur des
états désirés. Une erreur est calculée entre le vecteur des sorties désirées et le vecteur des
s
ort
iesc
alc
ulé
espa
rler
ése
au.L’
alg
ori
thmed’
appr
ent
is
sag
eada
ptel
espoi
dsdur
ése
aude
façon à corriger son comportement comme le montre la figure (III.39):

Environnement Stimuli RN Réponse du réseau

-
Si
gna
uxd’
err
eur

+
Système Réponses désirées

Figure III.39 : Apprentissage supervisé

III.3.5.1.1La rétro-pr
opag
ati
ondugr
adi
entdel
’er
reur

L’
alg
ori
thmeder
étr
o-pr
opa
gat
iondug
radi
entdel
’er
reuraé
téc
réee
ngé
nér
ali
santl
es
r
ègl
esd’
appr
ent
is
sag
esdeWi
drow-Hoff, aux réseaux multicouches à fonction de transfert
non linéaire.
La rétro-pr
opa
gat
iondug
radi
entdel
’er
reure
stut
il
is
éepoura
juster les poids et les
bi
aisdur
ése
aua
findemi
nimi
serl
’er
reurqua
dra
tiquee
ntr
elas
ort
iedur
ése
aue
tlas
ort
ie
r
éel
le.Ac
haquec
oupl
eent
rée
/sor
ti
e,unee
rre
ure
stc
alc
ulé
e,l
egr
adi
ent
,oupe
nte
,del
’er
reur
est déterminé. Ensuite les poids et les biais sont modifiés en ligne sur le réseau. On réitère ces
c
alc
ulsj
usqu’
àl’
obt
ent
ionduc
rit
èred’
arr
êt.

Soit une réponse spécifique désirée DP à chaque vecteur d'entrée XP. La mise à jours des
coefficients synaptiques W s'effectuent progressivement jusqu'à ce que l'erreur entre les
sorties du réseau et les résultats désirés soit minimisée. Pour ce faire, considérons le problème
de minimisation de la fonction coût défini pour n exemples ( XP; DP) et YP la sortie du réseau,
par l'erreur qui peut être quadratique de la forme [MEL.98]:

E
W 
YP DP 
2
(III.47)
P

L'apprentissage revient à déterminer W = Arg Min(E)


En général, on utilise des méthodes de gradient partiel, total ou stochastique :

109
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

W
t 1W 
t grad W 
E (III.48)

Gradient partiel : W 
t 1W 
t 
DP  f 
WX P 
f ' 
WX P 
XP (III.49)

Gradient total : W 
t 1W 
t grad W 
Et
 (III.50)

Gradient stochastique : W 
t 1W 
t grad W 
EP 
t
 (III.51)

Où E P  YP DP , erreur calculée sur un seul exemple que l'on tire au hasard à
2

chaque t.
f : fonction d'activation.

t: pas de gradient (fixe, décroissant, ou adaptatif)


dE
Pour calculer P , on exploite la rétro propagation du gradient, qui est une méthode
dWij

astucieuse de calcul du gradient de la fonction coût en utilisant la dérivation composée pour


rétro- propager l'erreur, comme le montre la figure suivante [FAB.03]:

yi yj

ii
ff j j f
 k f
Wij Wjk

y0=1

Figure III.40 : Rétro-propagation du gradient

dE P dE dj  dE 
 P  P y (III.52)
dWij 
dj dWij dj i

dE
On pose j  P , d'où
dj

Wij 
t 1Wij 
t yi j (III.53)

dE P dk
    dy 
dE
Mais j  P  
 k dk k W jk  j  (III.54)
dj d 
d  k d  k d 
k  k 
 j   j   j 
 
D'où j  kW jk f ' 
j si neurone j est caché (III.55)
k 

110
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

dE  dE P 
dy j 
Et j  P  
  (III.56)
d  dy 
d 
 j   j 
 j 

  
D'où j 2 y j D j f ' j si neurone j en sortie (III.57)

Cependant j se calcule de proche en proche par rétro-propagation de l'erreur.

III.3.5.2 Apprentissage non supervisé

L’
appr
ent
is
sag
ees
tqua
lif
iédenons
upe
rvi
sél
ors
que
,se
ule
sle
sva
leur
sd’
ent
rées
ont
disponibles. Il repose sur un critère interne de conformité du comportement du réseau par
rapport à des spécifications générales et non sur des observations externes. Dans ce cas,
l'apprentissage est basé sur des probabilités. Le réseau va se modifier en fonction des
régularités statistiques de l'entrée. L'algorithme d'apprentissage exploite pour se faire une
mesure prédéterminée de la qualité de représentation de la connaissance afin d'ajuster les
paramètres du réseau [BRE.99]. Ce type d'apprentissage est représenté schématiquement en
figure (III.41):

Environnemen Stimul RN Réponse du réseau


t i

Figure III.41 Apprentissage non supervisé

III. 4 Systèmes Neuro-Flous

Les réseaux de neurones (RN) multicouches constituent des approximateurs universels


grâce à leur capacité d'apprentissage, mais leurs structures et leurs paramètres n'ont pas
t
ouj
our
sd’
int
erpr
éta
tion phy
sique
.De pl
us,l
aconna
iss
anc
ehuma
ine nepe
utpa
sêt
re
exploitée pour les construire.

En revanche les systèmes d'inférence flous possèdent deux points forts par rapport aux
réseaux de neurones. D'une part, ils sont généralement construits à partir de la connaissance
humaine, d'autre part, ils ont une capacité descriptive élevée due à l'utilisation de variables
linguistiques. L'approche traditionnelle pour la conception des systèmes d'inférence flous est
basée sur les connaissances acquises par des opérateurs experts. Cette approche a prouvé son
efficacité dans plusieurs applications. Il se peut cependant que les opérateurs ne puissent pas

111
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

traduire leurs connaissances et expérience sous forme de contrôleur à logique floue. Il arrive
parfois que le domaine d'expertise ne soit pas disponible. Il est donc naturel de construire des
systèmes hybrides qui combinent les concepts des systèmes d'inférence flous et des réseaux
de neurones, ce sont des réseaux neuro - flous, dont l'apprentissage permet d'ajuster les
paramètres et de s'adapter aux changements de conditions. Les inférences sont ensuite
extraites après convergence. Le schéma général d'une structure neuro-floue est illustré par la
figure suivante:

Entrées Unités Entrées Sortis réseau


d'association

Logique floue Réseau neuronal


Portion fixe Portion d'apprentissage

Figure III.42: Structure générale d'un réseau neuro-flou

III.4.1 Définition
George Lee (Lee et al. 2001) définit un système neuro-flou comme étant un réseau
neuronal multicouche avec des paramètres flous, ou comme un système flou mis en
application sous une forme distribuée parallèle [OUL.05].

Un système neuro-flou ne devrait par contre pas être vu comme un système expert
mais ils peuvent être utilisés comme des approximateurs universels.

112
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Données linguistiques Expression linguistiques

Opération parallèle

Données symboliques Apprentissage

Figure III.43: Principe du système neuro-flou

La figure(III.43) résume le principe du système neuro-flou qui représente l'intersection


entre la logique floue et les réseaux de neurones.

III.4.2 Méthodes des combinaisons Neuro-Floues


Il existe quatre grandes catégories de combinaisons des réseaux de neurones avec la
logique floue [MOR. 04]:

III.4.2.1 Réseau flou neuronal

Dans ces réseaux, les techniques floues sont employées pour augmenter les possibilités
du processus d'apprentissage et d'exécution des réseaux de neurones.

III.4.2.2 Système neuronal/flou simultanément

Le réseau de neurone et le système flou fonctionnent ensemble sur la même tâche,


ma
iss
anss
'i
nfl
uenc
er,c
’es
t-à-dire ni l'un ni l'autre n'est employé pour déterminer les
paramètres de l'autre. Habituellement le réseau neuronal traite les entrées, ou post-traite les
sorties du système flou.

III.4.2.3 Modèles neuro-flous coopératifs

Le réseau de neurone est employé pour déterminer les paramètres (les règles et les
e
nse
mbl
esf
lous
)d'
un s
yst
ème f
lou.Apr
èsl
a pha
se d’
appr
ent
is
sag
e,l
esy
stè
me f
lou
f
onc
tionnes
ansl
eré
sea
udene
urone
.C’
estunef
ormes
impl
ede
ssy
stè
mesne
uro-flous.

III.4.2.4 Modèles neuro-flous hybrides

Les approches neuro-floues modernes sont de cette forme. Un réseau neuronal et un


système flou sont combinés dans une architecture homogène. Le système peut être interprété
comme un réseau neuronal spécial avec des paramètres flous ou comme un système flou mis
en application sous une forme distribuée parallèle.

113
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.4.3 Le
stype
sd’
impl
éme
ntat
ionde
sré
seauxne
uro-flous [OUL.05]

Dans la littérature il y a une panoplie de systèmes neuro-flou comme : les systèmes


neuro-flou coopératives, concurrents, les systèmes dit hybrides ou neuro-flou adaptatif, le
modèle NEFCLASS, ANFIS, FALCON et GARIC .etc.

Selon l'interaction entre la logique floue et les réseaux de neurones, et compte tenu de
nos objectifs, nous avons retenu deux types de systèmes neuro-flous à savoir : systèmes
d’
inf
érence neuro-flou adaptatifs (ANFIS) et inférence neuro-flou (INF).

1Sys
III.4.3. tème
sd’
inf
ére
ncene
uro-flou adaptatifs(ANFIS)

Le
ssy
stè
mesd’
inf
ére
ncene
uro-flou adaptatifs (ANFIS), sont des systèmes hybrides
ut
il
is
antl
’i
nfé
renc
efl
ouedeTa
kag
iSug
eno.Las
truc
tur
eANFI
Ses
tcons
ti
tué
edecinq
couches comme le montre la figure (III.44). La première couche cachée fuzzifie les variables
d’
ent
rée
setl
esopé
rat
eur
sty
peT-norme calculent la partie prémisse des règles dans la
deuxième couche cachée. La troisième couche cachée normalise les poids des règles suivit par
la quatrième couche cachée où les paramètres des parties conclusions des règles sont
déterminés. La couche de sortie calcule la somme de tous les signaux venant de la quatrième
couche [JAN.93].

Son e
ntr
aîne
ment e
sta
ccompl
it pa
rl’
alg
ori
thme du g
radi
ent de
sce
nte(
rét
ro
pr
opa
gat
ion)pourl
’opt
imi
sat
ionde
spa
ramè
tre
sde
spa
rti
espr
émi
sse
s,e
tl’
alg
ori
thmede
s
moindres carré pour la résolution des paramètres des parties conclusion. Afin de réduire
l
’er
reure [JAN.93].

Pour simplifier la compréhension, nous considérons un système à deux entrées x1 et x2


et une sortie y, modélisé par un système flou de type TSK, composé des deux règles
suivantes:

Si x1 est A1 et x2 est B1 alors y1  f1 


x1 , x2  a1 x1 b1 x2 c1
(III.58)
Si x1 est A2 et x2 est B2 alors y 2  f1 
x1 , x2  a2 x1 b2 x2 c2

Jang [JAN.95] a proposé la représentation de cette base de règles par le réseau adaptatif
de la figure (III.44) :

114
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

couche 4
couche 1
couche 2 couche 3
x1 x2 couche 5
A1
x1 w1 v1 v1.f1
Π N
A2
Σ y

B1 v2.f2
Π w2 N
x2 v2
B2 x1 x2

Figure III.44 : Architecture ANFIS

Le réseau adaptatif ANFIS est un réseau multi couches dont les connexions ne sont pas
pondérées.Le
snœudss
ontdede
uxt
ype
sdi
ff
ére
ntss
elonl
eur
s fonctionnalités:l
esnœuds
c
arr
és(
ada
pta
tif
s)c
ont
ienne
ntde
spa
ramè
tre
s,e
tle
snœudsc
irc
ula
ire
s(f
ixe
s)n'
ontpa
sde
paramètres. Toutefois, chaquenœud (
car
réou c
irc
ula
ire
)appl
iqueunef
onc
tion s
urs
es
signaux d'entrées. La sortie Oik dunœudidel
acouc
hek(
appe
lénœud(
i,k)
)dé
pendde
s
signaux provenant de la couche (k-1)e
tde
spa
ramè
tre
sdunœud(
i,k)
,c'
est
-à-dire [NAK.97]:

 
Oik f O1k 1 ,..., Onkk11 , a, b, c,... (III.59)

Où nk 1 est le nombre de nœud


sda
nsl
acouc
hek-1,e
ta,b,c
…sontl
espa
ramè
tre
sdu
nœud(
i,k)
.Pourunnœudc
irc
ula
irec
espa
ramè
tre
sn'
exi
st
entpa
s.

Dans le réseau de la figure (III.44),l


esnœudsd'
unemê
mec
ouc
heontde
sfonctions
issues d'une même famille que nous explicitons ci-dessous.

Couche 1 Gé
nér
ati
ondude
gréd’
appa
rte
nanc
e:

Cha
quenœuddec
ett
ecouc
hepos
sèdede
spa
ramè
tre
saj
ust
abl
es.Laf
onc
tiondunœud
est identique à la fonction d'appartenance à un sous-ensemble flou de l'univers de discours des
entrées. Da
nsl
emodè
ledeJ
ang[
JAN.
95]
,le
sfonc
tionsd’
appa
rte
nanc
esontde
sga
uss
ienne
s.

Oi1=fi1(x) = μAi (x) (III.60)

115
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Où x e
stl
'
ent
réedunœudi
,etAi le terme linguistique associé à sa fonction μAi. En
d'autres termes, Oil est le degré d'appartenance de x à Ai, définie par une fonction

d'appartenance Ai 
x .

Couche 2 Génération du poids de la règle i:

Cha
quenœudcirculaire appelé П dans cette couche correspond à une règle floue
Sug
eno.I
lre
çoi
tle
ssor
ti
esde
snœudsde f
uzz
ifi
cat
ion e
tca
lcul
eson a
cti
vat
ion.La
c
onj
onc
tionde
sant
écé
dent
ses
tré
ali
séea
vecl
’opé
rat
eurpr
odui
t.

wi Ai 
x1 
.Bi 2 
x2 
, i 1..2 (III.61)

Couche 3 Normalisation des poids de la règle i:

Cha
quenœudde c
ett
ecouc
hee
stunnœudc
irc
ula
irea
ppe
léN. Il calcule le degré
d'activation nor
mal
is
éd’
uner
ègl
efl
ouedonné
e.Lava
leurobt
enuer
epr
ése
ntel
acont
ri
but
ion
de la règle floue au résultat final.
wi
vi 
w1 w 2
(III.62)

Couche 4 Calcul de la sortie des règles :

Cha quenœuddec
ett
ecouc
hee
stunnœudc
arr
éave
cunef
onc
tionr
éal
is
antl
eca
lcul
suivant :

Oi4 vi . f i vi 


ai x1 bi x2 ci 
, i 1..2 (III.63)

Où vi est la sortie de la couche 3, et 


ai , bi , ci est l'ensemble des paramètres ajustables
de sortie de la règle i.

Couche 5 Faire la somme de toutes les entrées à partir de la couche 4:

Compr
enduns
eulnœud quif
our
nitl
asor
ti
edeANFI
Senc
alculant la somme des
s
ort
iesdet
ousl
esnœudsdedé
fuz
zif
ica
tion, c'est-à-dire,
O15 y vi . f i (III.64)
i

116
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III. 4.3.1.1 Algorithme d'apprentissage


L'apprentissage à partir d'un ensemble de données concerne l'identification des
paramètres des prémisses et des conséquences, la structure du réseau étant fixée. L'algorithme
d'apprentissage commence par construire un réseau initial, ensuite on applique une méthode
d'apprentissage par rétro-propagation de l'erreur, en utilisant une règle hybride d'apprentissage
qui combine un algorithme de descente de gradient avec une estimation par moindres carrées
[NAK.97].
Pour ce faire, considérons les paramètres de prémisses (couche 1) sont ceux proposés
par l'expert, par contre les paramètres de conséquence sont ajustés via la minimisation à la
sortie de l'erreur quadratique instantanée suivante:

e(k )  hd (k ) h(k ) , k 1..2


1 2
(III.65)
2

Avec h(k) est sortie réelle et hd(k) est la cosigne désirée.

En outre, soit 
i le vecteur des paramètres à ajuster pour chaque coordonnée

cartésienne. Notre objectif est de trouver les composantes du vecteur i , en utilisant


l'approche du filtre de Kalman étendu qui consiste à linéariser à tout instant la sortie h autour

du vecteur estimé i. Cela revient à écrire:[MEL.10]

 

hd 
k h
k i i i 1 
T
k
 
(III.66)
 h
i 
k
k 
T

 i

Par conséquent, les paramètres sont ajustés selon la relation suivante:

i i 1 Pi i ei
T
(III.67)


ei hd h

 T  .

Avec i  O3,i O3,i ei O3,i e i  (III.68)
  
 1
Pi 
 2 i i
T

Où 1 et 2 sont des gains d'adaptation pour modifier la vitesse de convergence.

117
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.4.3.2 Inférence Neuro-flou (INF)


L'objectif principal du système d'inférence neuro-flou est de réaliser un processus de
raisonnement flou en utilisant, une architecture d'un réseau de neurones de telle manière que
les paramètres du raisonnement flou représentent les poids du réseau de neurones[ LIM.02].

Ainsi, le système d'inférence neuro-flou peut identifier automatiquement en ajustant les


fonctions d'appartenance, par modification des poids de connexion du réseau de neurones via
un algorithme d'ajustement paramétrique approprié. Par conséquent les fonctions
d'appartenance peuvent être finalement optimisées par une architecture neuronale.

Comme, la configuration de base d'un système flou possède trois parties à savoir
Fuzzification des entrées, engin d'inférence à base des règles floues et Défuzzification des
sorties floues, dont chacune peut être réalisée par plusieurs méthodes. Si nous choisissons
respectivement Singleton fuzzification pour les entrées de chaque règle floue, le produit
d'inférence et la défuzzification par centre de gravité, on peut obtenir le modèle mathématique
du système flou comme suit :

Supposons, que le système flou est décrit par L règles floues, dont chacune possède N
r
vaia
ble
sd’
ent
résx1 , x 2 , .............. x N . Ainsi, la lere règle R l est donnée sous cette forme:
e

R 
l
: Si x1 est F1l et x2 est F2l et ....................et x N est FNl
(III.69)
alos y1l est H 1l , y 2l est H 2l , ........................... y Ml est H Ml

Par l
’utilisation Singleton fuzzification et le produit d'inférence, la jéme sortie floue de la
léme règle floue, y lj j 1, 2,.........M peut être exprimée sous cette forme :[LIM.02]

y lj y j 
   
xi 
l N
(III.70)

 i 1 F l
i 

l
Avec y j est le point qui a la fonction d'appartenance maximale des ensembles flous H lj

j

, de telle manière que F l y j 1 , et  l 
l

F
x i est la valeur de la fonction d'appartenance
i

appropriée à la iéme entrée de la iéme règle.

Considérons la défuzzification par centre de gravité, la valeur numérique de la jéme sortie


y j est donnée par cette relation [LIM.02]:

118
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

yj   
xi 
lL N
 
yj  L  
l
1 i 
1 Fl
i
(III.71)
   
xi 

N

l
1

 i1 Fl
i 

 F l 
xi 
N

Posant Gl 
i
1
x  i
(III.72)
l 1 
   
xi 
L N


 i
1 Fl
i 

Par conséquent la relation (III.71) peut être réécrite comme suit :
L
y j y j Gl 
l
x (III.73)
l
1

Avec Gl 
l
x représente la structure non linéaire du réseau de neurone et y j les poids à
ajuster du réseau de neurone.

III.4.4 Application de la commande Neuro-floue

Dans ce cas nous avons appliqué la commande neuro-floue, et nous avons exploité la
capacité d'apprentissage du réseau de neurones, afin de produire la base de connaissances
d'une manière automatique. Pour cela on a utilisé, deux régulateurs neuro-flou de type
Sugeno, qui présentent deux avantages majeurs par rapport à celui de type Mamdani :

 Temps de calcul de la commande réduit (le temps consommé par la procédure de


défuzzification est évité), moins de règles nécessaires pour réaliser une tache donnée
 Facilité de mettre sous forme de réseau adaptatif non linéaire [JAN.92].

III.4.4.1 Architecture du système de contrôle


Le schéma bloc du système de contrôle à deux régulateurs séparés avec le modèle de
simulation est illustré par la figure suivante :

Xd d/dt RNFX

+ S
X
θ
RNFT
θ=0 d/dt

Figure III.45: Contrôle neuro-flou avec deux régulateurs

119
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

III.4.4.2 Méthodologie de conception


Da
nsl
’évol
uti
on du c
ont
rôl
efl
ou,de
ux t
ype de s
yst
ème onté
té dé
vel
oppé
s,
notamment, le système de Mamdani ou standard, basé sur les règles purement floues et le
système flou de Takagi Sugeno dont les règles sont semis flous.

La règle Takagi Sugeno présente à la différence de celle de Mamdani une conséquence


quin’
estpa
sune
nse
mbl
efl
ouma
isunef
onc
tion

Dans notre cas on a quatre entrées, deux entrées pour chaque régulateur: x ( t ), x(t )

position et vitesse du chariot, (t ), (t ) : angle et vitesse angulaire du pendule , une sortie
copulée F (t ) pi , qi , et ri représentent les coefficients de (TS)

III.4.4.3 Régulateur Neuro-flou (2×2)

La structure du régulateur sous forme d'un réseau adaptatif est présentée dans la figure
suivante [KAY.99]:
Δe
Π N 1
A1

e
Π N 2
A2

Π N 3
B1
Δe

B2 Π N 4
e
Figure(III.46) : Le régulateur de type Sugeno (2×2) sous forme de RNA.

III.4.4.3.1 Algorithme de commande


Couche 1
Las or
ti
edec
ha quenœudda nsc et
tec oucheest exprimée par:
O1, i A ( e ) ,i
pour i = 1,2. (III.74)
O1, i Bi 2 (e) , pour i = 3,4. (III.75)

Tel que Ai et Bi sont les fonctions d'appartenances de forme triangulaire.

120
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Couche 2
Le
ssor
ti
esde
snœudsdec
ett
ecouc
hes
onte
xpr
imé
espa
r:

O2,1 O1,1.O1, 3 w1


O O .O w
 2, 2 1,1 1, 4 2

O2, 3 O1, 2 .O1,3 w3
(III.76)

O2, 4 O1, 2 .O1, 4 w4
Couche 3
Las
ort
iedunœude
ste
xpr
imé
epa
r:

O3, i wi  4 wi (III.77)


wK
K 1

Couche 4
Les nœudsde cette couche sont à paramètres ajustables, leurs fonctions sont de la
forme :
O4, i wi .( pi .e qi .e ri ) i=1,4. (III.78)

Tel que p, q, r sons les paramètres ajuster.

Couche 5
Ce
tt
ecouc
hec
ont
ientuns
eulnœudquir
éal
is
elas
ommede
ssor
ti
esde
snœudsdel
a
couche précédente :
4
O5 O4, i (III.79)
i 1

Les paramètres des prémisses sont supposés fixes, donc O5 peut être écrite sous la
forme :
4
O5 ( wi .e). pi ( wi .e).qi ( wi ).ri (III.80)
i 1

III.4.4.3.2 Algorithme d'apprentissage

Pour estimer les paramètres du réseau de neurones, nous avons utilisé le filtre de
KALMAN étendu comme un algorithme d'apprentissage. Le régulateur est caractérisé par un
vecteur de paramètres . Notre objectif est de trouver les valeurs du vecteur en minimisant
l'erreur suivante:

e(k )  hd (k ) h(k ) , k 1..2


1 2
(III.81)
2

121
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

L'approche du filtre de KALMAN étendu consiste à linéariser à tout instant la sortie y


autour du vecteur estimé ̂. Ceci revient à écrire :

 

hd 
k h
k i i i 1 
T
k
 
(III.82)
 h
i 
k
k 
T

 i

Par conséquent, les paramètres sont ajustés selon la relation suivante:

i i 1 Pi i ei
T
(III.83)
Avec

ei hd h

 T  .


i  O O e O e
3 ,i i  (III.84)
 
3,i 3,i i

 1
Pi 
 2 i i
T

p(k) est le gain de l'algorithme d'estimation, 1 et 2 fixés a 1 sont des gains


d'adaptation pour modifier la vitesse de convergence.

Nous remarquons que cette méthode nécessite le calcul du gradient qui n'est rien
d'autre que la méthode de rétro propagation utilisée dans les réseaux de neuronaux [ZHA.01].
h
 (III.85)


pour le cas étudié, le vecteur des paramètres est:

i [ ri p i q i ]T (III.86)

Par conséquent nous avons :

h h h h T
i  [ ] (III.87)
i 
 ri 
pi 
qi

III.4.4.4 Structure du réseau contrôleur


La figure (III.46) présente un contrôleur neuronal flou à deux entrées, chaque entrée a
deux sous ensembles (négatif, positif), ce qui forme quatre (4) règles. Dans notre cas la sortie

pendsde
sent
rée
s,donci
lfa
uta
voi
runer
ela
tion e
ntr
el’
ent
éee
tlas
ort
iedoncl
e

122
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

r
ais
onne
menta
ppr
oxi
mat
ifdeSug
enonedoi
tpa
sêt
red’
ordr
ezé
ro. Le réseau contrôleur
c
alc
ulel
ede
gréd’
act
iva
tiondec
haq
uer
ègl
equie
stmul
ti
pli
épa
rlaf
onction de Takagi
Sug
eno.Ors
onr
ôlee
std’
ampl
if
ieroudedi
minue
rlaf
orc
e.

Pour la création des règles on s


’es
tba
sésur le fonctionnement mécanique du système,
pour illustrer cette idée, nous donnons un exemple :
Quand le pendule penche vers la droite, le chariot doit le rattraper en effectuant un
mouvement vers la droite et inversement.
Si ( est positive) ET ( 
est positive) ALORS ( F est positive)

La synthèse du régulateur de Sugeno revient à la détermination des coefficients des


c
ons
éque
nce
sde
srè
gle
sfl
oue
s,l
’obt
ent
iondec
esc
oef
fi
cie
ntsàpa
rti
rde
sconna
iss
anc
es
vagues et imprécises est très difficile. Dans notre cas, nous exploitons les données entrées,
sorties correspondant au régulateurs de Mamdani (tableau III.5 et III.6). Pour expliquer cette
idée, nous donnons deux exemples :

Si l
af orcesuitl
’a ngl
e ,al
ors( p1) reçoit une valeur numérique proche de (1) et (q1)
reçoit une valeur numérique proche de (0)

Et Si la force s
uitl
’angle et valeur angulaire, alors (p1) et (q1) reçoivent une valeur
numé
riquepr ochede( 1)
…e tc
.


Base de règles :

n 
2 nombr
edef
onc
tionsd’
appa
rte
nanc
espourc
haquee
ntr
éedur
égul
ate
ur.
m 
4 nombre de règles floues.

Les valeurs initiales des paramètres des conclusions des règles sont prises comme suit:

N° e e p1 q1 r1 p2 q2 r2
règle
1 N N 0.209 0.3 0.01 0.56 0.325 0
2 N P 0.209 0.3 0.01 0.56 0.325 0
3 P N 0.209 0.3 0.01 0.56 0.325 0
4 P P 0.209 0.3 0.01 0.56 0.325 0

Tableau (III.7): Paramètres TKS initiaux du régulateur (2x2)

La commande est donné par :


u GU 2 uteta GU 1 u x

123
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé


Gains de normalisation :

GE1 2 ; GCE1 0.7




GE2 2.5 ; GCE2 0.3
 


Gains des commandes :

GU 1 0.175


GU 2 0.39

Les simulations et les expérimentations suivantes sont obtenues pour les gains
d’
ada
ptaton1 et 2 qui sont fixés à 1.
i

III.6.5 Résultats de simulation

1 0.2
Position (m)

Angle (rad)

0.5
0
0

-0.5 -0.2
0 5 10 15 20 25 30 0 5 10 15 20 25 30
Temps (s) Temps (s)
2 1
Vitesse (rad/s)
Vitesse (m/s)

1 0.5

0 0

-1 -0.5
0 5 10 15 20 25 30 0 5 10 15 20 25 30
Temps (s) Temps (s)

2
Commande (V)

-1

-2
5 10 15 20 25 30 35 40
Temps (s)

Figure(III.47):Résultats de simulation de stabilisation du pendule par la commande neuro


floue

0.5
Position (m)

-0.5

-1
0 5 10 15 20 25 30 35 40 45 50
Temps (s)
0.2
Angle (rad)

-0.2
0 5 10 15 20 25 30 35 40 45 50
Temps (s)
2
Commande (N)

-2

-4
0 5 10 15 20 25 30 35 40 45 50
Temps (s)

Figure(III.48):Ré
sul
tatsdes imul ati
ond’ unepoursui
teé chelonpourl
edé
plac
eme
nt
du chariot par la commande neuro floue.

124
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.4 0.3

0.2 0.2

Position (m)

Angle (rad)
0
0.1
-0.2
0
-0.4
-0.1
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)

2 1

Vitesse Angiulaire(rad/s)
1
Vitesse (m/s)

0
0
-1
-1

-2 -2
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Temps (s) Temps (s)

2
Commande (V)

-2

0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.49) : Résultats de simulation d’ unepour


suitesinusoïdale pour le déplacement du
chariot par la commande neuro floue
1
P os ition(m )

-1
0 5 10 15 20 25 30 35 40
Temps(s)
0.2
A ngle(rad)

-0.2
0 5 10 15 20 25 30 35 40
Temps(s)
Com m andant(V )

-5
0 5 10 15 20 25 30 35 40
Temps(s)

Figure(III.50): Résultats de simulation de stabilisation du pendule par la commande neuro


floue avec rejet de perturbation

III.4.4.5.1 Interprétation des résultats de simulation


D’
apr
èsl
esrésultats de simulation présentés sur les figures (III.47), (III.48), (III.49) et
(III.50), on constate bi
enqu’
onaa
bou
tià des résultats satisfaisants avec:

 Un temps de réponse de 3 sec.


 Une bonne poursuite de trajectoire et une erreur statique nulle.
 Une commande n’
onténergétique et réalisable pratiquement.
 Un déplacement du chariot dans les limites de rail.
 Un rejet de perturbations.
 Les dynamiques des sous systèmes pendule et chariot tolérables.

125
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Nous notons une très bonne poursuite, sans dépassement des limites dans les deux cas
de poursuite de référence rectangulaire et sinusoïdale, illustrés par les figures (III.48) et
(III.49), ainsi lors de la perturbation externe montré par la figure (III.50), le système répond
avec oscillation très faible ou très négligeable du pendule et un déplacement du chariot de 0.1
mètres par rapport à la référence. Le régulateur réagit et corrige ces perturbations avec une
énergie tolérable et stabilise le système après 2 sec.

D’
apr
èsl
esr
ésul
tat
sde s
imul
ati
on obt
enus
,nousc
onc
luonsl
arobus
tes
see
tla
performance de la commande neuro floue.Ma
int
ena
nti
lner
est
epl
usqu’
àva
lide
rsurl
e
dispositif réel les résultats obtenus en simulation.

III.4.4.5.2 Implémentation de la commande neuro-floue

Lor
sdel
’i
mpl
éme
nta
tion,nousa
vonsg
ardél
amê
mes
truc
tur
edur
ése
auc
ont
rôl
eure
t
les mêmes coefficients Takagi Sugeno initiaux donnés au tableau (III.7). On a juste adapté les
sd’
facteur éche
lles
url
ese
ntr
éeset les sorties des contrôleurs. Le nombre de classes et de
règles restent inchangé à ceux de résultats de simulation.


Gains de normalisation :
GE1 1; GCE1 1


GE2 1; GCE 2 1

   


Gains des commandes :
GU 1 0.85


GU 2 0.55

III. .4.4.5.3 Résultats expérimentaux

0.2
Position (m)

-0.2
0 5 10 15 20 25 30
Temps (s)
6.4
Angle (rad)

6.2

5.8
0 5 10 15 20 25 30
Temps (s)
Commande (V)

-2

0 5 10 15 20 25 30
Temps (s)

Figure(III.51) : Résultat de stabilisation neuro flou expérimental pour condition initiale


(0 ,0, 0.3, 0)

126
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5

Position (m)
0

-0.5
0 10 20 30 40 50 60 70
Temps (s)
6.4
Angle (rad)

6.2

0 10 20 30 40 50 60 70
Temps (s)
5
Commande (V)

-5
0 10 20 30 40 50 60 70
Temps (s)

Figure(III.52) : Résultat de poursuite rectangulaire neuro flou expérimental pour condition


initiale (0, 0, 0.3, 0)

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps(s)
6.4
Angle (rad)

6.2

0 5 10 15 20 25 30 35 40
Temps(s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps(s)

Figure(III.53) : Résultat de poursuite échelon neuro flou expérimental pour condition initiale
(0,0,0.3, 0)

0.2
Position (m)

-0.2

-0.4
0 5 10 15 20 25 30 35 40
Temps (s)
6.4
Angle (rad)

6.2

0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.54) : Résultat expérimental pour une référence échelon et une variation


par amé triquemde40% àpar t
irdel ’
instantt=24s

127
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.2

Position (m)
0

-0.2

0 5 10 15 20 25 30 35 40
Temps (s)
6.4
Angle (rad)

6.2

0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.55) : Résultat expérimental pour une référence échelon et une variation


par amé triqueM de40% àpar tirdel ’i
nstantt=20s

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)

6.3
Angle (rad)

6.2
6.1
6
5.9
0 5 10 15 20 25 30 35 40
Temps (s)
4
Commande (V)

-2

-4
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.56) : Résultat expérimental pour une référence échelon et deux perturbations


e xterneàpar tirdel ’
instant t=17s et t=27s.

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)
8
6
Angle (rad)

4
2

0
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.57) : Résultat expérimental pour redressement et stabilisation

128
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5

Position (m)
0

-0.5
0 10 20 30 40 50 60 70 80
Temps (s)

6
Angle (rad)

0
0 10 20 30 40 50 60 70 80
Temps (s)
5
Commande (V)

-5
0 10 20 30 40 50 60 70 80
Temps (s)

Figure(III.58) : Résultat expérimental pour redressement et stabilisation avec une poursuite


rectangulaire de fréquence 0.025.

0.5
Position (m)

-0.5
0 5 10 15 20 25 30 35 40
Temps (s)
8
6
Angle (rad)

4
2
0
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.59) : Résultat expérimental pour redressement et stabilisation avec une variation


paramétrique m de 40% àpar tirdel’ins tantt =28 s

0.2
Position (m)

-0.2
0 5 10 15 20 25 30 35 40
Temps (s)
10
Angle (rad)

0
0 5 10 15 20 25 30 35 40
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40
Temps (s)

Figure(III.60) : Résultat expérimental pour redressement et stabilisation avec une variation


paramétrique M de 40 % à partir del ’ins tantt =2 8s

129
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

0.5

Position (m)
0

-0.5
0 5 10 15 20 25 30 35 40 45 50
Temps (s

6
Angle (rad)

0
0 5 10 15 20 25 30 35 40 45
Temps (s)
5
Commande (V)

-5
0 5 10 15 20 25 30 35 40 45
Temps (s)

Figure(III.61) : Résultat expérimental pour redressement et stabilisation avec deux


pe rturbationse x
terneàpar ti
rdel ’
instantt
=25se tt=36s .

III. .4.4.5.4 Interprétation des résultats expérimentaux


Nous avons procédé à la vérification et le test de la commande développé en
expérimentation au système pendule inversé. Les résultats d’
expé
rime
nta
tion sont présentés
sur les figures (III.51) à (III.61).Nouspouvonsr
ema
rque
rbi
enqu’
onaa
bout
iàde
sré
sultats
concluants et satisfaisants en terme de poursuite avec de très faibles erreurs en régime
permanent, un dépassement admissible de 0.07 à 0.1 m et un temps de réponse environ de 2
s
ecpourl
ast
abi
li
sat
ionduc
har
iot
.L’
ang
ledupe
ndul
ere
stequa
sime
nt inchangé avec une
variation allant de 0.005 à 0.01 rad. Le signale de commande u(t) est moins énergétique et
plus doux par rapport aux commandes évoquées précédemment.

Cette commande manifeste une robustesse remarquable à la fois vis-à-vis de variations


paramétriques jusqu'à 40% de la masse du chariot et du pendule respectivement montrés par
les figures (III.54) (III.59) (III.55) et (III.60), ainsi que par rapport au rejet de perturbations
extérieures appliquées sur la masse du pendule aux instants 25 et 36 sec illustré par les
figures (III.56) et (III.61). En effet le système réagit avec un déplacement de 0.05 à 0.1 m et
rejoint sa position au bout 2 sec après avoir dissipé la perturbation.

III.5 Comparaison des résultats obtenus avec les commandes appliquées


A pa
rti
rd’
un nombr
e d’
ess
aise
xpé
rime
nta
ux s
tat
is
ti
que
mentr
epr
ése
nta
tif
,nous
présentons les tableaux qui résument les résultats obtenus en régime établi relevés sur les
figures (II.7) à (II.14), (II.26) à (II.37), (III.27) à (III.32) et (III.51) à (III.61):

130
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Le tableau (III.8) présente la comparaison des commandes développées pour une


consigne de 0 m.
Correcteur LQR MG FLOU NEURO
FLOU
Position du Mini -0.1733 -0.1653 -0.1904 -0.0477
Chariot (m) Maxi 0.0140 0.0594 0.3003 0.0486
Angle du Mini -0.007 -0.077 -0.0797 -0.054
pendule (rad) Maxi 0.007 0.049 0.0828 0.024

Tableau (III.8): Compar


ais
onde
sme
sur
esdepos
it
ione
td’
angl
e

Le tableau (III.9) présente la comparaison des dépassements du chariot et des


déviations angulaire du pendule lors des changements de consigne de 0.25m.

Correcteur LQR MG FLOU NEURO


FLOU
Position du Mini -0.0498 -0.0566 -0.0955 -0.1616
Chariot (m) Maxi 0.2621 0.3096 0.3925 0.3377
Angle du Mini -0.0368 -0.065 -0.0920 -0.063
pendule (rad) Maxi 0.0736 0.058 0.0828 0.054

Tableau (III.9): Dépassement de la consigne de position et la déviation angulaire lors de


changement de consigne de position de 0.25 m

Le tableau (III.10) présente la comparaison des réactions du système par les


différentes commandes développées pour des variations paramétriques et les perturbations
e
xté
rie
ure
saf
ind’
éva
lue
rle
ursr
obus
tes
se.

Amplitude des Type de NEURO


Correcteur LQR MG FLOU
oscillations perturbation FLOU
Position du Variation de mini -0.0367 -0.0110 + -0.0277
Chariot (m) 40% de M maxi 0.0253 0.0349 + 0.0196
Position du Variation de mini -0.0408 -0.047 + -0.0153
Chariot (m) 40% de m maxi 0.0026 0.018 + 0.0471
Position du maxi -0.0598 0.0485 -0.2406 0.0450
Extérieure
Chariot (m)
Angle du maxi 0.0307 -0.058 0.0797 -0.0463
Extérieure
pendule (rad)

Tableau (III.10): Synthèse comparative de la robustesse

131
CHAPITRE III: Commandes floue et neuro f
loued’
unpe
ndul
einve
rsé

Le tableau (III.11) présente la synthèse sur les aspects qualitatifs des commandes
développées.
NEURO
Correcteur LQR MG FLOU
FLOU
Dynamique Bonne Bonne Bonne Bonne
Précision Bonne Excellente Moins Bonne Très Bonne
Complexité à régler Facile Facile Difficile Difficile
Complexité à synthétiser Facile Moins Facile Difficile Difficile
Commande Eprouvante Acceptable Plus Eprouvante Douce

Tableau (III.11): Aspects qualitatifs des commandes développées

III.6 Conclusion
Dans ce chapitre, nous avons présenté les concepts fondamentaux de la logique floue,
des réseaux de neurones ainsi que les systèmes neuro-flous issus de la combinaison de la
logique floue et les réseaux de neurones.

Nous avons d'abord introduit la structure interne d'un système d'inférence flou,
nécessaire à la compréhension d'un système flou. Nous avons ensuite présenté une
méthodologie complète de la construction de la relation entrée-sortie à partir des règles floues.
Par la suite les modèles dynamiques des réseaux de neurones ont été décrits d'une manière
détaillée avec l'algorithme d'apprentissage par rétro propagation.

Dans la troisième partie nous avons présenté la stratégie de commande neuro-floue


a
ins
iquel
’al
gor
it
hmed’
appr
ent
is
sage utilisé dans notre application.

Enfin, nous avons présenté les résultats expérimentaux obtenus par application la
commande floue et la commande neuro floue respectivement. Nous avons vu que celles-ci
manifeste de très bonnes performances et une très bonne robustesse.

Le contrôleur neuro flou proposé dans cette partie peut être appliqué à une large classe
de systèmes non linéaire, il combine les avantages de deux techniques; par la rapidité du
temps de réponse, la commande moins énergétique, la meilleur limitation du déplacement du
chariot et la très bonne robustesse vis-à-vis des erreurs paramétriques et perturbations
extérieures.
ss
Le i
mul
ati
onse
ffe
ctué
ess
url
emodè
led’
éta
tdus
ystème pendule inversé ainsi les
r
ele
vése
xpé
rime
nta
uxmont
rel
’ef
fi
cac
itédec
ett
ecomma
ndea
uss
ibi
ene
nsi
mul
ati
onqu’
en
expérimentation.

132
Conclusion générale

Conclusion générale

L’
étude pr
ése
nté
e da
nsc
e mé
moi