vine J. Le Centre Automatique et Syst` emes ecole des Mines de Paris 35 rue SaintHonor e 77305 Fontainebleau Cedex E-mail : Jean.Levine@ensmp.fr Mars 2004
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
3 Introduction aux syst` emes dynamiques 3.1 Brefs rappels sur les ots, les orbites et leur stabilit e . . . . . . 3.1.1 Flot, portrait de phases . . . . . . . . . . . . . . . . . . 3.1.2 Point d equilibre . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Orbite p eriodique, application de Poincar e. . . . . . . . 3.2 Stabilit e des points d equilibre et des orbites . . . . . . . . . . . 3.2.1 Attracteur . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Stabilit e au sens de Lyapounov . . . . . . . . . . . . . . 3.2.3 Remarques sur la stabilit e des syst` emes instationnaires . 3.2.4 Fonctions de Lyapounov et de Chetaev . . . . . . . . . . 3.2.5 Th eor` eme de Hartman-Grobman, vari et e centre . . . . . 4 Syst` emes command es, commandabilit e 4.1 Commandabilit e des syst` emes lin eaires . . . 4.1.1 Le crit` ere de Kalman . . . . . . . . . 4.1.2 Forme canonique de commandabilit e 4.2 Commandabilit e des syst` emes non lin eaires 4.2.1 Commandabilit e au premier ordre . 3
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
4 4.2.2
5 Analyse asymptotique, echelles de temps 5.1 Persistance de la vari et e invariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Robustesse de la stabilit e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Application ` a la mod elisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6 Commande hi erarchis ee 79 6.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.2 Ajout dint egrateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 6.3 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 7 Jets innis, equivalence de Lie-B acklund 7.1 Exemple introductif de grue . . . . . . . . . . . . . . . 7.2 Description des trajectoires . . . . . . . . . . . . . . . 7.3 Jets innis, changements de coordonn ees, equivalence . 7.3.1 Jets innis, coordonn ees . . . . . . . . . . . . . 7.3.2 Vari et es produits, topologie de Fr echet . . . . . 7.3.3 Champs de vecteurs, ot, syst` eme command e . 7.3.4 Equivalence de Lie-B acklund . . . . . . . . . . 85 85 87 90 90 91 92 96 105 105 106 106 107 108 110 111 114 115 116 117 117 118 118 118 123 125 125
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
8 Syst` emes plats 8.1 Syst` emes plats, sortie plate . . . . . . . . . . . . . . . . . 8.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Syst` eme masses-ressort . . . . . . . . . . . . . . . 8.2.2 Commande de robot . . . . . . . . . . . . . . . . . 8.2.3 Pendule . . . . . . . . . . . . . . . . . . . . . . . . 8.2.4 V ehicule non holonome . . . . . . . . . . . . . . . 8.2.5 V ehicule ` a remorques . . . . . . . . . . . . . . . . 8.3 Platitude et commandabilit e. . . . . . . . . . . . . . . . . 8.4 Platitude et lin earisation . . . . . . . . . . . . . . . . . . . 8.4.1 Syst` eme masses-ressort (suite) . . . . . . . . . . . 8.4.2 Commande de robot (suite) . . . . . . . . . . . . . 8.4.3 Pendule (suite) . . . . . . . . . . . . . . . . . . . . 8.4.4 V ehicule non holonome (suite) . . . . . . . . . . . 8.5 Caract erisation des sorties plates . . . . . . . . . . . . . . 8.5.1 Lapproche par matrices polyn omiales . . . . . . . 8.5.2 Sorties plates des syst` emes lin eaires commandables 8.5.3 Le calcul pratique de la d ecomposition de Smith . 8.5.4 Exemples . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
9 Platitude et planication de trajectoires 129 9.1 Planication sans contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9.1.1 Cas g en eral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 9.1.2 Trajectoires arr et-arr et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
` TABLE DES MATIERES 9.2 Planication sous contraintes . . . . . 9.2.1 Contraintes g eom etriques . . . 9.2.2 Contraintes quantitatives . . . Application ` a la commande pr edictive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3
10 Platitude et suivi de trajectoires 10.1 Position du probl` eme . . . . . . . . . 10.1.1 Pendule (suite et n) . . . . . 10.1.2 V ehicule non holonome (suite 10.2 Commande de lhorloge . . . . . . .
. . . . . . . . et n) . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Chapitre 1
Introduction, exemple
1.1 Quest-ce quun syst` eme non lin eaire command e?
Un syst` eme non lin eaire command e est un ensemble d equations (di erentielles par exemple) non lin eaires, d ecrivant l evolution temporelle des variables constitutives du syst` eme sous laction dun nombre ni de variables ind ependantes appel ees entr ees ou variables de commande, ou simplement commandes, que lon peut choisir librement pour r ealiser certains objectifs. On en conna t de nombreux exemples parmi les syst` emes m ecaniques ou chimiques : satellites, avions, automobiles, grues, machines-outils, r egulateurs thermiques, r eacteurs chimiques, proc ed es biotechnologiques ou agro-alimentaires, etc. Les entr ees peuvent etre choisies en boucle ouverte, cest-` a-dire ne d ependant que du temps, ou en boucle ferm ee, cest-` a-dire comme des fonctions des variables mesur ees, appel ees observations, qui rendent compte de l etat du syst` eme ` a chaque instant. Dans tout ce cours, on se restreint ` a l etude des syst` emes repr esent es par un ensemble ni d equations di erentielles non lin eaires command ees. Un tel syst` eme est non lin eaire sil nest pas equivalent ` a un syst` eme lin eaire dans un sens a pr ` eciser. Plusieurs relations d equivalence peuvent etre introduites, donnant des classications tr` es di erentes si le syst` eme est command e ou non. Dans le cas non command e on classe les comportements par rapport ` a la stabilit e et linstabilit e lin eaires et on fait appara tre les dynamiques centres (ni lin eairement stable ni lin eairement instable) au voisinage dun point d equilibre ou dune orbite p eriodique. Dans le cas command e, beaucoup plus compliqu e, l equivalence ` a un syst` eme lin eaire d ecrit une propri et e de lensemble des trajectoires du syst` eme que lon appellera platitude. Au-del` a de lanalyse des types de comportement des syst` emes, se pose le probl` eme de leur utilisation. Un objectif de commande se traduit par la donn ee dune ou plusieurs trajectoires de r ef erence ` a suivre (boucle ouverte) et, en boucle ferm ee, par certaines exigences sur la vitesse de poursuite, latt enuation des perturbations, linsensibilit e aux erreurs et variations param etriques, la pr ecision du suivi. Bien s ur, les r eglages de la boucle ouverte et de la boucle ferm ee interagissent de fa con complexe, surtout dans le contexte non lin eaire, mais on peut, dans certains cas, arriver ` a rendre ces deux aspects aussi ind ependants que possible pour en faciliter la mise au point. Dans de nombreux cas, en outre, le nombre, la technologie et lemplacement des capteurs devant permettre de fermer la boucle ne sont pas donn es a priori et entrent dans la conception de la boucle ferm ee. 7
Le succ` es dans la r ealisation des objectifs d epend beaucoup de ce qui est pris en compte dans le mod` ele dynamique. Pr ecisons que pour les commander, des mod` eles souvent beaucoup plus na fs que ce que les Physiciens ont lhabitude de construire susent : il ne sagit pas dexpliquer ou de reproduire avec pr ecision les ph enom` enes les plus ns, mais de pr evoir, avec peu de variables, l evolution du syst` eme dans un futur relativement proche pour l echelle de temps o` u est cens ee agir la commande ; il faut garder ` a lesprit, en eet, que les erreurs et les dynamiques n eglig ees ou les perturbations non mod elis ees doivent etre compens ees ou att enu ees gr ace ` a la commande en boucle ferm ee, qui utilise les observations sur les ecarts successifs ` a la trajectoire ` a suivre pour les compenser. Il est donc important de savoir ma triser les interactions entre la complexit e du mod` ele choisi pour repr esenter les ph enom` enes et la conception et les performances de lois de commande. Dans le m eme ordre did ees, le statut du mod` ele des actionneurs doit etre pos e. Quil sagisse de piston, d electroaimant, de convertisseur electrique, d echangeur, d electrovanne, de volet motoris e, etc., capables de produire un d eplacement, une vitesse, une force, un d ebit, une temp erature, une pression, une intensit e electrique, une tension, etc. , les actionneurs constituent en eux-m emes des syst` emes command es que lon appelle souvent des syst` emes de bas-niveau. Dans la conception de syst` emes, on est souvent amen es ` a utiliser implicitement ou explicitement un principe de d ecomposition o` u la sortie dun sous-syst` eme de bas-niveau est consid er ee comme lentr ee dun syst` eme de plus haut-niveau : pour commander un ascenseur, lactionneur est un moteur electrique qui est suppos e produire une vitesse verticale instantan ee, consid er ee comme lentr ee du syst` eme d ecrivant le d eplacement vertical de lascenseur, le syst` eme de haut-niveau. Les deux syst` emes sont naturellement coupl es : lentr ee dune personne dans lascenseur, ou sa sortie, cr ee une variation de force que le moteur doit compenser et, suivant la fa con dont ce moteur est pilot e, cette compensation peut entra ner certains eets ind esirables (oscillations, erreur de positionnement, . . .). Ainsi, lorsquon n eglige le mod` ele du moteur dans la commande de haut-niveau, et surtout dans le contexte non lin eaire, on doit sassurer que lascenseur fonctionne dans une plage compatible avec les r eglages pr ealables du moteur. Nous reviendrons sur les fondements de ce principe de d ecomposition ` a loccasion de l etude des syst` emes hi erarchis es. Nous proposons donc dans ce cours deux visions indissociables des syst` emes : leur complexit e par rapport au lin eaire dune part et les possibilit es quils orent pour lanalyse et la conception de lois de commande. Un autre aspect important que lon va retrouver tout au long de ces pages consiste ` a mettre en evidence les aspects g eom etriques qui sous-tendent les notions que nous venons dintroduire. Cette approche nous permettra notamment dapporter des simplications importantes dans les calculs et les raisonnements par des choix judicieux de coordonn ees curvilignes.
1.2
Un exemple introductif
Consid erons le ressort non amorti de pulsation dont la position x v erie : x + 2 x = 0. (1.1)
Si lon pose x = v , lexpression v 2 + 2 x2 , qui est proportionnelle ` a l energie m ecanique du ressort, reste constante au cours du temps le long de nimporte quelle trajectoire de (1.1). Autrement dit, les trajectoires sont des ellipses, donc des courbes ferm ees, dans le plan (x, v ) de centre lorigine
et dont les foyers sont d etermin es par les conditions initiales (x0 , v0 ). On retrouve bien entendu linterpr etation classique : si on lache le ressort depuis la position x0 avec la vitesse initiale v0 , il oscille ind eniment ` a la pulsation . Le mouvement ne sarr ete pas mais ne samplie pas non plus. Cependant, si le ressort est l eg` erement non lin eaire et quon a n eglig e cet aspect, son comportement peut etre tr` es di erent. Pour cela, supposons en fait que la raideur du ressort d ecroisse lin eairement par rapport ` a 2 l elongation mais avec une pente faible : k (x) = x, avec > 0 petit, et donc la force de rappel du ressort est k (x)x = 2 x x2 . L equation du ressort devient alors x + 2 x x2 = 0. (1.2)
Posons comme ci-dessus v = x . On v erie que lexpression ( energie m ecanique ` a un facteur pr` es) E (x, v ) = v 2 + x2 ( 2 2 x) 3 (1.3)
reste constante au cours du temps. Les trajectoires du ressort perturb e sont donc d ecrites par les courbes d equation E (x, v ) = E (x0 , v0 ) repr esent ees sur la gure 1.1. On voit que pour une elongation initiale faible, le comportement du ressort est peu modi e. Par contre, ` a partir dun certain seuil, le ressort, trop mou, est instable.
30
25
20
15
10
-5 -15 -10 -5 0 5 10 15 20 25
Fig. 1.1 Destabilisation du ressort caus ee par la nonlin earit e de sa raideur Ce ph enom` ene est bien connu sur les remorques de camions ou les attaches des wagons de train o` u il faut ajouter un amortisseur pour absorber le surcro t d energie d elivr ee par le ressort lorsquon le lache. En fait, on peut interpr eter lajout dun amortisseur comme un bouclage : dans l equation (1.2) une force de frottement de la forme Kv , proportionnelle ` a la vitesse, est ajout ee, ce qui revient
10
a consid ` erer que le syst` eme est command e par la force u = Kv : x + 2 x x2 + u = x + 2 x x2 + Kv = 0. (1.4)
Si lon refait le calcul pr ec edent dE dt le long dune trajectoire quelconque de (1.4), on trouve que dE 2 ecroit le long des trajectoires de (1.4). dt = 2Kv < 0, ce qui montre que la fonction E d 2 Or on peut v erier que, pour |x| < , la fonction E est strictement convexe et admet lorigine x = 0, v = 0 comme unique minimum. Par cons equent, la d ecroissance de E le long des trajectoires 2 telles que |x| < montre que les trajectoires ne peuvent que converger vers lorigine, et donc le syst` eme est devenu stable gr ace ` a lamortisseur. On peut m eme faire mieux ` a condition de remplacer lamortisseur par un v erin actif. En eet, si lon peut modier comme on le d esire la force u produite par le v erin, il sut de poser
u = 2 x + x2 + K1 x + K2 v avec K1 > 0 et K2 > 0, de sorte que l equation (1.4) devient x = K1 x K2 x qui est lin eaire et stable. La progression que nous avons suivie sur cet exemple tr` es simple est en quelque sorte lun des ls directeurs du cours : on etudie dabord les nonlin earit es qui peuvent avoir une inuence importante sur le comportement du syst` eme non command e, puis linuence de divers types de bouclages pour compenser une partie ou tous les eets ind esirables.
1.3
Orientations
Le premier volet de ce cours aborde l etude du comportement naturel (non command e) du syst` eme, dans la perspective de le d ecomposer en sous-syst` emes correspondant aux ph enom` enes stables, instables et centre au voisinage dun point d equilibre ou dune orbite p eriodique. Cest la connaissance de cette g eom etrie qui doit nous guider pour modier les comportements non voulus et, par cons equent, il est souhaitable de d evelopper des m ethodes permettant de faire de la chirurgie g eom etrique pour ne modier que ce qui est n ecessaire en evitant de casser la structure naturelle du syst` eme. Le second volet du travail a trait ` a l elaboration ` a proprement parler de lois de commandes. En premier lieu, on sattache ` a g en erer des trajectoires que le syst` eme est, au moins id ealement, capable de suivre. Un point important est de savoir si les commandes ` a notre disposition sont susamment riches pour amener l etat du syst` eme o` u on le d esire (commandabilit e) et ` a trouver ces commandes de fa con explicite (planication de trajectoires). En second lieu, on utilise le concept de r etroaction, qui consiste ` a utiliser les mesures faites ` a chaque instant sur l etat du syst` eme, pour ramener ce dernier sur la trajectoire d esir ee en d epit des erreurs et perturbations. On peut distinguer plusieurs sortes de lois de commande en boucle ferm ee, ou r etroactions : les bouclages d etat qui supposent que l etat complet est mesur e ou estim e, et les bouclages de sortie qui nutilisent que les informations venant de certaines sorties (fonctions de l etat non n ecessairement bijectives). Dans tous les cas, ces bouclages peuvent etre statiques, cest-` a-dire que la commande est calcul ee en
1.3. ORIENTATIONS
11
utilisant directement les informations sur l etat, ou ` a linverse, dynamiques, cest-` a-dire o` u des calculs dint egrales de fonctions des variables d etat est n ecessaire pour calculer la commande. Toutes ces questions, utilisent de fa con importante le formalisme et les r esultats de la g eom etrie di erentielle qui sont r esum ees au Chapitre 2. Les principaux r esultats sur les syst` emes dynamiques nous seront aussi tr` es utiles et sont pr esent es au Chapitre 3.
12
Chapitre 2
2.1
Vari et e, di eomorphisme
Commen cons par rappeler le r esultat classique suivant : Th eor` eme 1 (des fonctions implicites) Soit une application k fois contin ument n n p di erentiable, avec k 1, dun ouvert U R dans R avec 0 p < n, et supposons quil existe au moins un x0 U tel que (x0 ) = 0. Si en chaque point x de U lapplication lin eaire tangente D(x) est de rang plein egal ` a n p, il existe un voisinage V = V1 V2 U de Rn = Rp Rnp et une application k fois contin ument di erentiable de V1 dans V2 tels que les deux ensembles {x V1 V2 |(x) = 0} et {(x1 , x2 ) V1 V2 |x2 = (x1 )} sont egaux. 13
14
Autrement dit, la fonction v erie localement (x1 , (x1 )) = 0 et la variable d ependante x2 = (x1 ) est d ecrite ` a laide des p variables (localement) ind ependantes x1 .
2 2 u R Exemple 1 Consid erons la fonction de R2 dans R d enie par (x1 , x2 ) = x2 1 + x2 R o` est un r eel positif. Il est clair que la solution de l equation = 0 est donn ee par x1 = R2 x2 2 pour |x2 | R. Le th eor` eme des fonctions implicites conrme lexistence dun solution locale autour 2 2 dun point (x1,0 , x2,0 ) tel que x2 1,0 + x2,0 = R (par ex. x1,0 = R, x2,0 = 0), puisque lapplication lin eaire tangente de en ce point : D(x1,0 , x2,0 ) = (2x1,0 , 2x2,0 ) = (0, 0), est de rang 1. Notons quil y a deux solutions locales suivant que lon consid` ere le point (x1,0 , x2,0 ) egal ` a
R2 x2 2,0 , x2,0
ou ` a R2 x2 2,0 , x2,0 .
La notion de vari et e di erentiable en d ecoule directement : D enition 1 etant donn ee une application di erentiable de Rn dans Rnp (0 p < n), on suppose quil existe au moins un x0 solution de l equation implicite (x) = 0 et que lapplication lin eaire tangente D(x) est de rang plein (n p) dans un voisinage V de x0 . On appelle vari et e di erentiable de dimension p lensemble X d eni par l equation implicite (x) = 0, autrement dit : X = {x V |(x) = 0} (2.1)
Le fait que cet ensemble nest pas vide est une cons equence directe du Th eor` eme 1. Si en outre est k fois di erentiable (resp. analytique), on dit que X est une vari et e de classe C k , k = 1, . . . , (resp. analytique ou C ). Lorsquaucune ambigu t e nest possible, on parle simplement de vari et e.
Fig. 2.1 Sph` ere de R3 Exemple 2 La vari et e ane (analytique) : {x Rn |Ax b = 0} est de dimension p si rang (A) = n p et b ImA.
15
Exemple 3 La sph` ere de R3 de centre C , de coordonn ees (xC , yC , zC ), et de rayon R : {(x, y, z ) 3 2 2 2 2 R |(x xC ) + (y yC ) + (z zC ) R = 0} est une vari et e analytique de dimension 2 (voir Fig. 2.1). Le concept de di eomorphisme local est essentiel pour pouvoir d ecrire les vari et es de mani` ere intrins` eque (cest-` a-dire ind ependamment du choix des coordonn ees dans lesquelles l equation implicite (x) = 0 est ecrite). Nous allons aussi introduire la notion dhom eomorphisme local, l eg` erement plus faible. D enition 2 etant donn ee une application dun ouvert U Rn dans un ouvert V Rn de classe C k , k 1 (resp. analytique), on dit que est un di eomorphisme local de classe C k (resp. analytique) dans un voisinage U (x0 ) dun point x0 de U si est inversible de U (x0 ) dans un voisinage V ((x0 )) du point (x0 ) de V et si 1 est aussi de classe C k (resp. analytique). On dit que est un hom eomorphisme local de classe C k (resp. analytique) si est de classe k C (resp. analytique), localement inversible et si son inverse est continue. Les di eomorphismes locaux sont caract eris es par le r esultat classique suivant : Th eor` eme 2 (dinversion locale) Une condition n ecessaire et susante pour que soit un k di eomorphisme local de classe C (k 1) au voisinage de x0 est que son application lin eaire tangente D(x0 ) soit bijective. Rappelons aussi le Th eor` eme 3 (du rang constant) Soit une application de classe C k (k 1) dune vari et eX de dimension n de classe C k dans une vari et e Y de dimension p de classe C k . Si rang (D(x)) = q min(n, p) pour tout x dans un voisinage U dun point x0 X , alors : (i) pour tout y (U ) Y , 1 ({y }) est une sous-vari et e de X de dimension n q et de classe k C ; (ii) (U ) est une sous-vari et e de Y de dimension q et de classe C k . En particulier, (i) si n p, est injective de U sur Y si et seulement si rang (D(x)) = n pour tout x U (par cons equent est un hom eomorphisme de U sur (U )). (ii) si n p, est surjective de U sur V ouvert de Y si et seulement si rang (D(x)) = p. Les coordonn ees curvilignes fournissent une interpr etation g eom etrique remarquable des di eomorphismes. En particulier, il est possible de trouver (localement) des coordonn ees curvilignes adapt ees dans lesquelles la vari et e X donn ee par (2.1) sexprime comme un sous-espace vectoriel de Rp . Il sut en eet dintroduire les coordonn ees curvilignes : y1 = 1 (x), . . . , ynp = np (x), ynp+1 = 1 (x), . . . , yn = p (x), les fonctions ind ependantes 1 , . . . , p etant choisies de sorte que lapplication x (1 (x), . . . , np (x), 1 (x), . . . , p (x)) soit un di eomorphisme local. On dit alors alors quon a redress e les coordonn ees de X puisque X = {y |y1 = = ynp = 0} .
16
2.2
Fig. 2.2 Espaces tangent et normal en un point dune vari et e. Rappelons que lapplication lin eaire tangente D(x), exprim ee dans le syst` eme de coordonn ees locales (x1 , . . . , xn ), aussi appel ee matrice jacobienne de , est la matrice dont l el ement de la ligne j i et de la colonne j est xi (x). On v erie facilement que la normale au point x ` a la vari et e X est port ee par D(x), ou plus pr ecis ement, est une combinaison lin eaire des colonnes de D(x). En eet, soit y (t) une courbe di erentiable contenue dans X pour tout t 0 susamment petit, telle que y (0) = x (une telle courbe existe bien gr ace au th eor` eme des fonctions implicites). On a donc (y (t))(x) (y (t)) = 0 pour tout t [0, [ et donc = 0. Si lon fait tendre t vers 0, on obtient que t def dy D(x).y (0) = 0, o` uy (0) = dt |t=0 (voir Fig.2.2), ce qui prouve que le vecteur y (0) tangent ` aX au point x appartient au noyau de D(x). On d eduit alors imm ediatement que tout el ement de limage de D(x) est orthogonal ` a nimporte quel vecteur tangent ` a X au point x, C.Q.F.D. Ceci motive la d enition de lespace tangent ` a une vari et e: D enition 3 Lespace tangent ` a X au point x X est lespace vectoriel Tx X = ker D(x) . Le br e tangent TX est lensemble TX =
x X
Tx X .
Notons que compte-tenu du fait que D(x) est de rang n p dans louvert V , dim Tx X = dim ker D(x) = p , x V . D enition 4 Un champ de vecteurs f (de classe C k , analytique) sur X est une application (de classe C k , analytique) qui ` a tout x X fait correspondre le vecteur f (x) Tx X . D enition 5 Une courbe int egrale du champ de vecteurs f est une solution locale de l equation di erentielle x = f (x).
17
Lexistence locale et lunicit e des courbes int egrales de f d ecoule du fait que f est de classe C k , k 1, et donc localement lipschitzienne1 . Consid erons un syst` eme de coordonn ees locales (x1 , . . . , xn ). Les composantes du champ de vecteurs f dans ces coordonn ees sont not ees (f1 , . . . , fn )T . On va montrer quon peut associer ` a f une op eration de d erivation appel ee d eriv ee de Lie dans la direction f . Notons t Xt (x) la courbe int egrale de f passant par x ` a t = 0. D enition 6 Soit h une fonction de classe C 1 de Rn dans R. On appelle d eriv ee de Lie de h dans la direction f , not ee Lf h, la d eriv ee de h le long de la courbe int egrale de f en t = 0, autrement dit : n d h Lf h(x) = h(Xt (x))|t=0 = (x) . fi (x) dt xi
i=1
Par cette formule, un champ de vecteurs f quelconque est identi e` a lop erateur di erentiel lin eaire du premier ordre n . Lf = fi (x) xi
i=1
Exemple 4 Dans un ouvert U de R2 de coordonn ees (x, t), consid erons le champ f (t, x) =
v 1 o` u v est une constante arbitraire, et la fonction h(t, x) = x vt de U dans R. La d eriv ee de Lie de h h la fonction h le long du champ f est donn ee par : Lf h(x, t) = dh dt = x v + t 1 = v v = 0.
Comme pr ec edemment, il existe des coordonn ees qui permettent de redresser le champ. Pour cela, nous avons besoin des notions dimage dun champ de vecteurs par un di eomorphisme et dint egrale premi` ere. Pour introduire la notion dimage dun champ de vecteurs par un di eomorphisme, faisons le calcul simple suivant : soit un di eomorphisme local et posons y = (x). Notons aussi y (t) = (Xt (x)), o` u Xt (x) est la courbe int egrale de f issue du point x ` a t = 0, limage par de la courbe int egrale Xt (x). Elle v erie alors d d yi (t) = i (Xt (x)) = Lf i (1 (y (t))) i = 1, . . . , n . dt dt La courbe t y (t) v erie donc le syst` eme d equations di erentielles y i = Lf i (1 (y (t))) pour i = 1, . . . , n, dont le second membre d enit bien le champ de vecteurs image cherch e. On a donc : D enition 7 Limage par le di eomorphisme du champ f , not e f est le champ de vecteurs donn e par f = (Lf 1 (1 (y )), . . . , Lf n (1 (y )))T . On dit en outre que f est redress e par di eomorphisme (voir Fig.2.3) si Lf 1 (1 (y )) = 1 et Lf i (1 (y )) = 0
1
i = 2, . . . , n .
On rappelle quune fonction f de Rn dans Rn est localement lipschitzienne si et seulement si pour tout ouvert U de Rn et pour tout x1 , x2 dans U , il existe une constante K telle que f (x1 ) f (x2 ) K x1 x2 . L equation di erentielle x = f (x) avec f localement lipschitzienne admet au voisinage de tout point x0 une courbe int egrale passant par x0 pour t = 0, i.e. une application t x(t) v eriant x (t) = f (x(t)) et x(0) = x0 pour tout t I, I etant un intervalle ouvert de R contenant 0.
18
x x(t)
y y(t)
Fig. 2.3 Limage par du champ est redress e et les courbes int egrales sont transform ees en droites horizontales. Il r esulte de cette d enition (exercice) que la formule de la d eriv ee de Lie nest pas aect ee par 1 changement de coordonn ees : Lf h(x) = L f (h )(y ). D enition 8 Une int egrale premi` ere de f est une fonction v eriant Lf = 0. Autrement dit, est une fonction constante le long des courbes int egrales de f . On dit que x0 X est un point transient ou r egulier pour le champ de vecteurs f si f (x0 ) = 0. Clairement, pour un tel point, on a x = f (x0 ) = 0, autrement dit, la courbe int egrale passant par x0 ny reste pas, ce qui justie le qualicatif de transient. Proposition 1 Soit x0 un point de X transient pour le champ f de classe C k (k entier quelconque). Il existe un syst` eme de coordonn ees locales (1 , . . . , n ) de classe C k en x0 dans lequel f est redress e, cest-` a-dire tel que Lf i = 0 pour i = 1, . . . , n 1 et Lf n = 1. Autrement dit, f admet un syst` eme de n 1 int egrales premi` eres ind ependantes dans un voisinage de x0 , d enies par Lf i = 0 pour i = 1, . . . , n 1. Exemple 5 Consid erons l equation di erentielle sur R : x = cos2 x. (2.2)
x Comme cos erie imm ediatement que la courbe int egrale de (2.2) 2 x a pour primitive tan x + C , on v passant par x0 ` a linstant t0 avec x0 = + 2 k , est donn e e par tan x ( t ) = t t + tan x0 . Donc 0 2 y (t) = tan x(t) v erie y = 1. Le di eomorphisme local y : x tan x redresse donc le champ cos2 x x . Par ailleurs z (t) = tan x(t) t est une int egrale premi` ere de (2.2) puisque tan x(t) t = t0 + tan x0 est constante pour tout t.
Le champ x1 x2 cos2 x2 x + cos2 x2 x correspondant ` a (2.3) est redress e par le di eomorphisme 1 2 1 2 y1 log x1 2 x2 local = . y2 tan x2
2.3. CROCHET DE LIE Exemple 7 Soit U une application de classe C 1 de Rn dans R. On dit que le syst` eme mx i = U , xi i = 1, . . . , n
19
(2.4)
x 2 i + U (x)
i=1 n i=1 x i x i 1 U m xi x i
(souvent appel ee energie m ecanique) est une int egrale premi` ere du champ
Exemple 8 Soit H une application de classe C 1 de Rn Rn dans R. Consid erons le syst` eme Hamiltonien H H , p i = , i = 1, . . . , n. (2.5) q i = pi qi On v erie ais ement que la fonction H est une int egrale premi` ere du champ
n i=1 H pi qi H = 21 m H qi pi n 2 i=1 pi
+ Par ailleurs, on v erie sans peine quen posant qi = xi , pi = mq i = mx i et U (q ), on retrouve le r esultat de lexemple pr ec edent. En m ecanique, q sinterpr` ete comme la position et p comme limpulsion.
2.3
Crochet de Lie
Consid erons, comme dans la section pr ec edente, un champ de vecteurs f et une fonction r eguli` ere h. Lop eration Lf , d eriv ee de Lie dans la direction f , peut etre it er ee. On peut en eet d enir Lk fh pour tout k 0 comme suit :
k 1 k L0 f h = h et Lf h = Lf (Lf h) k 1 . n j h h Par exemple, L2 eration de d eriv ee de Lie it er ee dordre k i,j =1 (fi xi xj + fi fj xi xj ). Lop fh = d enit donc un op erateur di erentiel lin eaire dordre k . De m eme, si g1 , . . . , gk sont k champs de vecteurs sur X , on peut d enir comme ci-dessus la d eriv ee de Lie it er ee dordre r1 + . . . + rk : rk r1 r2 rk 1 Lr g1 Lgk h = Lg1 (Lg2 Lgk h) . f
2
Consid erons maintenant deux champs de vecteurs f et g et calculons, dans un syst` eme de coordonn ees locales, lexpression suivante : n n gi fi h fj Lf Lg h Lg Lf h = gj . xj xj xi
i=1 j =1
Cette expression antisym etrique par rapport ` a f et g , d enit un op erateur di erentiel dordre 1, les termes du second ordre de Lf Lg h et Lg Lf h, sym etriques, ayant et e elimin es. Elle constitue donc un nouveau champ de vecteurs, not e [f, g ], appel e crochet de Lie de f et g .
20
D enition 9 Le crochet de Lie des champs de vecteurs f et g est le champ de vecteurs d eni par : L[f,g] = Lf Lg Lg Lf . En coordonn ees locales :
n
n j =1
[f, g ] =
i=1
fi gi gj . fj xj xj xi
(2.6)
Le crochet de Lie jouit en particulier des propri et es suivantes : antisym etrie : [f, g ] = [g, f ] ; [f, g ] = [f, g ] + (Lf )g (Lg )f , pour toute paire (, ) de fonctions C ; identit e de Jacobi : [f1 , [f2 , f3 ]] + [f2 , [f3 , f1 ]] + [f3 , [f1 , f2 ]] = 0. Il v erie aussi : Proposition 2 Soit un di eomorphisme de la vari et e X dans la vari et e Y . Soient f1 et f2 des champs de vecteurs arbitraires de X et f1 et f2 leurs images dans Y . On a [ f1 , f2 ] = [f1 , f2 ]. (2.7)
Preuve. Par d enition, on a L fi h((x)) = Lfi (h )(x), i = 1, 2, pour toute fonction di erentiable h sur Y . On a donc L f2 L f1 h((x)) = Lf2 ((L f1 h) (x)) = Lf2 Lf1 (h )(x). On en d eduit imm ediatement que L[ f1 , f2 ] h((x)) = L[f1 ,f2 ] h (x), do` u le r esultat.
exp-f(expg(expf(x)))
exp-g(exp-f(expg(expf(x))))
expg(expf(x))
g 2[f,g](x) x
expf(x)
Fig. 2.4 Interpr etation g eom etrique du crochet [f, g ]. Le champ [f, g ] nappartient pas n ecessairement au plan engendr e par f et g . Le crochet [f, g ] peut sinterpr eter g eom etriquement comme suit : notons, par analogie avec les syst` emes lin eaires, Xt (x) = exp tf (x) le point de la courbe int egrale de f ` a linstant t passant par le point x ` a linstant 0. Cette notation a lavantage, lorsquon utilise plusieurs champs de vecteurs, de pr eciser lequel est int egr e. Ainsi, le point de la courbe int egrale du champ g ` a linstant t passant par le point x ` a linstant 0 est not e exp tg (x). Pour susamment petit, consid erons lexpression : exp(g ) exp(f ) exp g exp f (x)
def
21
dont la repr esentation graphique est donn ee Fig.2.4. Nous allons etablir le r esultat classique suivant (cas particulier de la formule de Baker-Campbell-Hausdorf) : Proposition 3 exp(g ) exp(f ) exp g exp f (x) = x + 2 [f, g ](x) + 0(3 ) . Preuve. Consid erons lequation di erentielle x = f (x). Une courbe int egrale passant par x0 ` a t t linstant t = 0 v erie x(t) = x0 + 0 f (x(s))ds. Posons F (t) = 0 f (x(s))ds. Son d eveloppement de Taylor pour t susamment petit est donn e par F (t) = F (0) + tF (0) + t2 F (0) + 0(t3 ) 2
avec F (t) = f (x(t)) et F (t) = f x (x(t))f (x(t)), et donc F (0) = 0, F (0) = f (x0 ) et F (0) = f eveloppement de la courbe int egrale x(t) pour t = susamment petit est donc x (x0 )f (x0 ). Un d donn e, ` a lordre 2 en , par x() = exp f (x0 ) = x0 + f (x0 ) + On v erie alors, par la m eme m ethode, que x(2) = exp g exp f (x0 ) = x0 + (f (x0 ) + g (x0 )) g g 2 f (x0 )f (x0 ) + (x0 )g (x0 ) + 2 (x0 )f (x0 ) + 0(3 ), + 2 x x x ensuite que 2 g x(3) = exp(f ) exp g exp f (x0 ) = x0 + g (x0 ) + (x0 )g (x0 ) 2 x g f +2 (x0 )f (x0 ) (x0 )g (x0 ) + 0(3 ), x x et enn que x(4) = exp(g ) exp(f ) exp g exp f (x) g f (x0 )f (x0 ) (x0 )g (x0 ) + 0(3 ) = x0 + 2 x x do` u le r esultat en remarquant que le vecteur que le vecteur [f, g ](x0 ).
g f x (x0 )f (x0 ) x (x0 )g (x0 )
(2.8)
(2.9)
(2.10)
(2.11)
La cons equence de cette proposition est que si pour tout x dans un voisinage donn e on consid` ere le sous-espace vectoriel E (x) de Tx X engendr e par f (x) et g (x), le crochet [f, g ] indique si les courbes int egrales de f et g ont tendance ` a rester tangentes ` a E pour t susamment petit (ce qui est le cas si [f, g ] E ) ou non ([f, g ] E ). En particulier, on peut esp erer trouver une sous-vari et e de X qui admette E (x) pour espace tangent en tout point x du voisinage consid er e si [f, g ] E , alors que si [f, g ] E , une telle sous-vari et e ne semble pas pouvoir exister puisque les courbes int egrales la quittent n ecessairement. Avant daborder le probl` eme de lexistence de sous-vari et es int egrales, nous avons besoin dintroduire la notion de distribution de champs de vecteurs.
22
2.4
D enition 10 Une distribution de champs de vecteurs D est une application qui ` a tout point x X fait correspondre le sous-espace vectoriel D(x) de Tx X . Soit V un ouvert de X . La distribution D est r eguli` ere et de rang constant k dans V sil existe des champs de vecteurs r eguliers g1 , . . . , gk tels que : rang (g1 (x), . . . , gk (x)) = k pour tout x V . D(x) = e.v.{g1 (x), . . . , gk (x)} pour tout x V . Le champ des vitesses et vitesses angulaires de deux corps rigides mobiles en contact sans glisser, constitue un exemple classique de distribution de champs de vecteurs. En eet, la vitesse v du point de contact dune pi` ece de monnaie roulant sans glisser sur le plan xe de coordonn ees {x1 , x2 } doit etre parall` ele ` a ce plan : v e.v.{ x , } . 1 x2 Notons, compte-tenu de ce qui pr ec` ede, que la notion de distribution de champs de vecteurs ne d epend pas des coordonn ees choisies. D enition 11 La distribution D est dite involutive si et seulement si pour tout couple de champs de vecteurs f et g de D on a [f, g ] D. Une distribution involutive est donc caract eris ee par [D, D] D. Si D nest pas involutive, on peut d enir sa cl oture involutive : D enition 12 La cl oture involutive D dune distribution D est la plus petite distribution involutive contenant D. etre construite ` a partir des crochets it er es des champs g1 , . . . , gk (voir [31]). Notons que D peut Exemple 9 (Distribution non involutive) Consid erons la distribution D dans TR3 engendr ee par g1 = x1 et g2 = x2 + x1 x3 . Clairement, [g1 , g2 ] = x3 . Les trois vecteurs g1 , g2 et [g1 , g2 ] egale sont lin eairement ind ependants. D nest donc pas involutive et sa fermeture involutive D est a TR 3 . `
2.5
Int egrabilit e
On se pose maintenant le probl` eme suivant : ` quelle condition existe-t-il un di Soit D une distribution r eguli` ere de rang constant k . A eomorphisme = (x) tel que, dans les nouvelles coordonn ees, la distribution image D soit donn ee par D = e.v.{ 1 , . . . , k } ? Ce probl` eme porte aussi le nom de redressement dune distribution par di eomorphisme. La r eponse est donn ee par : Th eor` eme 4 (Frobenius) : Soit D une distribution r eguli` ere de rang constant k . Une condition n ecessaire et susante pour que D puisse etre redress ee par di eomorphisme est que D soit involutive. Dans ce cas, en tout point x U ouvert dense de X , il passe une sous-vari et e de dimension k tangente en tout point ` a D.
23
Une telle sous-vari et e de X en tout point tangente ` a D est appel ee vari et e int egrale de D. Preuve. Si D est redress ee par di eomorphisme, son involutivit e est claire : soit le di eomorphisme correspondant. Si v1 et v2 sont des champs de vecteurs de D, vi = k j =1 ai,j j , i = 1, 2 et on on a, dapr` es la proposition 2, [v1 , v2 ] = [ v1 , v2 ] et, utilisant le fait que k [ , ] = 0 pour tout i, j , on v erie facilement que [ v1 , v2 ] = i,j =1 [a1,i i , a2,j j ] = i j
k i=1 i , a2,j k j =1 a1,j i
a2,j
a1,j i
i .
i = 1, . . . , k , ce qui prouve que [v1 , v2 ] D, do` u linvolutivit e. La r eciproque est beaucoup plus compliqu ee et utilise la propri et e du crochet de Lie repr esent ee sur la Fig. 2.4. Le lecteur int eress e peut se r ef erer ` a [14]. La seconde partie est une cons equence directe du th eor` eme des fonctions implicites. En eet, 0 , . . . , = 0 , avec si lon note i = i (x) pour tout i = 1, . . . , n, lensemble d eni par k+1 = k n n +1 0 , . . . , 0 ) dans un ouvert dense (U ) o` 0 = (1 u lapplication tangente D(x) est de rang plein egal n 0 , . . . , 0 ) a n, est une sous-vari ` et e de X de dimension k , tangente ` a D en tout point (1 , . . . , k , k n +1 (U ), et donc, par d enition, une vari et e int egrale de D, pour tout 0 , C.Q.F.D.
2.6
On se pose maintenant le probl` eme de r esoudre k equations aux d eriv ees partielles lin eaires du 1er ordre dans un ouvert donn e V de la vari et eX : Lg1 y = 0 . . (2.12) . Lgk y = 0 o` u y est la fonction inconnue et o` u g1 , . . . , gk sont des champs de vecteurs r eguliers tels que rang (g1 (x), . . . , gk (x)) = k pour tout x V . On introduit alors la distribution D donn ee par D(x) = e.v.{g1 (x), . . . , gk (x)} pour tout x V . Clairement, si y est solution du syst` eme (2.12), comme L[gi ,gj ] y = Lgi (Lgj y ) Lgj (Lgi y ) = 0 0 = 0, eairement ind ependants, on on a Lg y = 0 pour tout g D. Inversement, comme g1 , . . . , gk sont lin peut trouver des champs de vecteurs r eguliers gk+1 , . . . , gr tels que g1 , . . . , gr forment une base de D(x) en tout point de V et Lg y = 0 pour tout g D implique en particulier que Lgi y = 0 pour i = 1, . . . , k et donc que y est solution du syst` eme (2.12). Par le th eor` eme de Frobenius, une condition n ecessaire et susante pour que D puisse etre redress ee dans V est que D soit involutive. Notons que D peut toujours etre redress ee si elle est de rang constant dans V . Supposons dans un premier temps que D est involutive. Il existe alors un di eomorphisme tel que si lon note = (x), on a D( ) = e.v.{ g1 ( ), . . . , gk ( )} = e.v.{ ,..., } 1 k
24
dans (V ). Posons alors z = y 1 . On v erie imm ediatement que Lg y = 0 pour tout g D equivaut ` a z z = 0, . . . , = 0. 1 k On en conclut que z ne d epend pas de (1 , . . . , k ), autrement dit que z ( ) = z ( ) pour tout = (k+1 , . . . , n ) tel que (V ). La solution y se d eduit imm ediatement de z par y = z . Dans le cas o` u D nest pas involutive et si D est suppos ee de rang constant r, le m eme raisonnement peut etre conduit avec D ` a la place de D. Il faut cependant remarquer dans ce cas que la fonction y nest pas compl` etement d etermin ee par les equations (2.12). Les equations suppl ementaires engendr ees par les champs de vecteurs de D qui ne sont pas dans D sont souvent appel ees equations de compatibilit e. On ne peut donc pas redresser D sans redresser du m eme coup D, ce qui entra ne que z ( ) = z ( ) pour tout = (r+1 , . . . , n ) tel que (V ). Notons aussi que bien souvent la cloture involutive de D est lespace tangent de Rn tout entier, ce qui implique que la seule solution y possible est la fonction nulle dans V . On a donc montr e que la r esolution dun syst` eme d equations aux d eriv ees partielles du 1er ordre equivaut ` a redresser la distribution de champs de vecteurs correspondante (ou sa cloture involutive). Cependant, le di eomorphisme qui permet de redresser cette distribution est lui-m eme obtenu par la r esolution du syst` eme Li j = i,j pour i = 1, . . . , k , j = 1, . . . , n, avec {1 , . . . , k } ethode nest donc applicable en pratique que une base de D et i,j le symbole de Kronecker. Cette m si lon conna t une base particuli` ere de D pour laquelle les equations du di eomorphisme sont plus simples. Il existe sinon dautres m ethodes comme la m ethode des bicaract eristiques. On trouvera un aper cu approfondi sur cette question dans [4, 5] par exemple. Exemple 10 (Distribution non involutive, suite) Consid erons la distribution D de lexemple 9, engendr ee par g1 = x1 et g2 = x2 + x1 x3 . Cette distribution n etant pas involutive, le syst` eme d equations aux d eriv ees partielles du premier ordre y = 0, x1 equivaut ` a y = 0, x1 y = 0, x2 y = 0, x3 y y + x1 =0 x2 x3
2.7
Consid` erons la distribution TX qui ` a tout point de la vari et e X fait correspondre lespace tangent Tx X . On v erie imm ediatement que TX est involutive (par d enition de lespace tangent) et dapr` es le th eor` eme de Frobenius, on peut trouver une base locale de TX sous la forme { x , . . . , x }. Introduisons le dual de Tx X , not e T e espace cotangent ` a la vari et eX x X et appel n 1 au point x, en d enissant la base duale {dx1 , . . . , dxn } par le produit scalaire < , dxj >= i,j xi , i, j = 1, . . . , n . (2.13)
25
Le br e cotangent, not e T X , est alors donn e par T X = xX T xX . Si maintenant est une fonction de classe C de X dans R, on d enit sa di erentielle par la dx . Notons que par cette formule, la di e rentielle dune fonction peut etre formule d = n i i=1 xi identi ee ` a son application lin eaire tangente. Ainsi, d(x) en tout point x X est un el ement de T X et si f est un champ de vecteurs ( f ( x ) T X pour tout x ), le produit scalaire < d, f > se x x d eduit de la d enition pr ec edente par
n
< d, f >=
i,j =1
fi
fi
i=1
= Lf . xi
(2.14)
Exemple 11 Reprenons la fonction h(t, x) = x vt avec v R constante donn ee. On a dh = vdt + dx et, si f = t + v x , on a < dh, f >= v + v = 0. On retrouve donc bien le r esultat de lexemple 4. En fait, la di erentielle d de peut etre d enie comme un objet plus global, i.e. sans r ef erence ` a sa valeur d(x) en chaque point x X . D enissons en eet la projection de T X dans X par la formule (d(x)) = x pour tout 1 etant des x X . On a alors d(x) = n i=1 xi (x)dxi (x) pour tout x, les coecients xi (x) fonctions C sur X . On dit alors que d est une section C du br e cotangent T X relativement a la projection canonique . ` On v erie ais ement que cette d enition est ind ependante du choix de coordonn ees de X . Plus g en eralement : D enition 13 On appelle forme di erentielle de degr e 1, ou 1-forme, une section C du br e cotangent T X , cest-` a-dire une application qui ` a tout point x X fait correspondre un el ement X ` (x) T X , ( x ) e tant une combinaison lin e aire des covecteurs de la base locale de T a x x 1 coecients C sur X . Lensemble des sections C de T X est un espace vectoriel not e (X ). n Le produit scalaire dune 1-forme = n i=1 fi xi i=1 i dxi avec un champ de vecteurs f = est donn e par
n
< , f >=
i=1
fi i .
(2.15)
Nous allons voir quune 1-forme nest pas en g en eral la di erentielle dune fonction et que, par cons equent, 1 (X ) contient beaucoup plus que les di erentielles de fonctions. D enition 14 Une 1-forme est dite exacte s il existe une fonction telle que = d. Une condition susante est donn ee par la proposition : Proposition 4 Pour quune 1-forme soit exacte, il faut que v erie j i = xj xi i, j. (2.16)
26
on a i =
xi
j 2 2 i = = = xj xj xi xi xj xi do` u le r esultat.
x x et y = x2 + . On v erie facilement que y = y2 d = . Cependant la fonction et la 1-forme ne sont pas d enies ` a lorigine et on peut montrer que nadmet aucune primitive dans un voisinage de (0, 0) (voir le th eor` eme 5 ci-dessous, aussi appel e Lemme de Poincar e).
On peut aussi d enir des formes de degr e 2 (et plus g en eralement de degr e sup erieur ` a 1) en introduisant le produit tensoriel antisym etrique despaces cotangents Tx X Tx X dont une base (en coordonn ees locales) est form ee des produits dxi dxj pour i < j , avec dxi dxj = dxj dxi , Une 2-forme i, j.
dxj
avec i,j C (X ) pour tout i, j . Comme pr ec edemment, une 2-forme est une section C de T X T X , i.e. une application qui ` a tout x X fait correspondre (x) T x X Tx X , combinaison a coecients C . Lespace vectoriel des 2-formes lin eaire des covecteurs de base de Tx X Tx X ` sur X est not e 2 (X ). Par une construction analogue, on d enit lespace vectoriel k (X ) des k -formes sur X comme lensemble des sections C du produit tensoriel antisym etrique T X . . . T X de k r epliques de T X , pour k N. Une k -forme est alors une application qui ` a tout x X fait correspondre le k -covecteur (x) = i1 ,i2 ,...,ik (x)dxi1 dxi2 . . . dxik
i1 <i2 <<ik
avec i1 ,i2 ,...,ik pour tout i1 , i2 , , ik . Lantisym etrie a pour cons equence evidente que toute forme de degr e sup erieur ` a n sur une vari et e de dimension n est identiquement nulle. On peut aussi cr eer une 2-forme ` a partir dune 1-forme par lop erateur d dit de d erivation ext erieure, de 1 (X ) dans 2 (X ), par la formule d =
i,j
i dxj dxi = xj
i<j
j i xi xj
dxi dxj
(2.17)
27
o` u est une 1-forme d enie, comme pr ec edemment, par = ec edente i i dxi . La formule pr 1 montre que si est une fonction C sur X et si (X ), le produit est un el ement de 1 (X ) et la d eriv ee ext erieure du produit v eri e d( ) = d + d . Lop erateur d de d erivation ext erieure peut etre etendu ` a un op erateur de 2 (X ) dans 3 (X ) par la formule danti-d erivation : d( ) = d d pour tout , 1 (X ), puisqualors d et d sont des 3-formes. En eet, on a =
j
(2.18)
j dxj (
k k dxk ) = j i,j,k xi k +
dxj (
j,k j k dxj dxk . Appliquant j xj dxi dxj dxk . i j k k dxk ) = i,j,k xi k dxi dxj dxk .
la formule
j dxj
k i,k xi dxi
dxk
i,j,k
k i,j,k j etrie. On en d eduit donc imm ediatement (2.18) en ajoutant xi dxi dxj dxk par antisym ces deux derni` eres expressions. Plus g en eralement, d peut etre vu comme un op erateur de p+q (X ) dans p+q+1 (X ) pour tous entiers naturels p et q par
d( ) = d + (1)p d pour tous p (X ) et q (X ). Revenons maintenant ` a la condition (2.16). Clairement, cette derni` ere est equivalente ` a: d = 0. (2.19)
Notons que cette derni` ere expression est ind ependante des coordonn ees. On peut aussi d eduire de ce qui pr ec` ede que pour toute 1-forme , on a d2 = d(d ) = 0. D enition 15 Une 1-forme v eriant la propri et e (2.19) est appel ee forme ferm e e. La r eciproque de la Proposition 4 nest vraie que sous des restrictions topologiques : Th eor` eme 5 (Lemme de Poincar e) Une forme ferm ee sur un ouvert contractile2 est exacte.
ydx de lexemple 12 est d enie sur R2 \ {(0, 0)} qui nest pas Exemple 13 La 1-forme = xdy x2 + y 2 contractile. Elle nest pas exacte dans un voisinage de lorigine, bien quelle soit exacte au voisinage de nimporte quel autre point de R2 ne contenant pas lorigine.
2 Un ouvert U est contractile sil existe un point xU U et une application continue de U [0, 1] dans U qui d eforme U en le point xU , i.e. telle que (, 0) = IdU ( (x, 0) = x x U ) et (x, 1) = xU pour tout x U .
28
2.8
Nous allons maintenant donner le crit` ere dint egrabilit e pour une famille de 1-formes, version duale du Th eor` eme 4 de Frobenius, enonc e en 2.5 pour une famille de champs de vecteurs. Dans cette perspective, nous avons besoin dintroduire notamment les notions dimage r eciproque dune forme, ou forme induite, par un di eomorphisme, et de d eriv ee de Lie dune forme. D enition 16 Etant donn ee une 1-forme sur la vari et e X de dimension n et un di eomorphisme local dune vari et e Y de dimension m dans X , on appelle image r eciproque de par , ou forme induite, not ee , la 1-forme sur Y d enie par , v = , v pour tout champ de vecteurs v TY . Dans un syst` eme de coordonn ees (x1 , . . . , xn ) de X et (y1 , . . . , yn ) de Y , avec = v erie que la d enition pr ec edente donne
n n i=1 i dxi ,
(2.20)
on
=
i,j =1
(i )
i dyj . yj
(2.21)
Notons quon peut etendre cette formule ` a une application di erentiable quelconque (pas n ecessairement un di eomorphisme) et pour une vari et e Y de dimension p quelconque :
p n
=
j =1 i=1
(i )
i dyj yj
et cette derni` ere d enition est en accord avec la formule (2.20) si lon etend aussi la d enition de sur Y par limage dun champ de vecteurs v = p v ( y ) j j =1 yj
n
v|(Y ) =
i=1
(Lv i )|(Y )
. xi
Cette d enition s etend aussi facilement aux formes de degr e quelconque par la formule ( ) = pour toutes 1-formes et . On v erie alors facilement que Proposition 5 pour toute forme sur X et toute application di erentiable de Y dans X , on a d = d.
29
D enition 17 Etant donn ee une famille de r 1-formes {1 , . . . , r } ind ependantes, une vari et eY est appel ee vari et e int egrale du syst` eme di erentiel ext erieur 1 = 0 . . (2.22) . r = 0 sil existe une application di erentiable de Y dans X telle que 1 , . . ., r soient identiquement nulles sur Y . Deux syst` emes di erentiels ext erieurs sont dits alg ebriquement equivalents si toute forme de lun sexprime comme une combinaison des formes de lautre et r eciproquement. Plus pr ecis ement, soient deux syst` emes ext erieurs d enis par les formes (1 , . . . , r ) et (1 , . . . , r ) o` u les formes i et i sont de degr es quelconques. i est une combinaison lin eaire des j sil existe r formes 1 , . . . , r telles que i = r j =1 j j . Lorsque le syst` eme (2.22) nest compos e que de 1-formes, on dit que cest un syst` eme de Pfa. D enition 18 On appelle fermeture du syst` eme (2.22) le syst` eme 1 = 0 d1 = 0 . . . r = 0 dr = 0 On dit que le syst` eme (2.22) est ferm e sil est alg ebriquement equivalent ` a sa fermeture. La proposition suivante est evidente : Proposition 6 Toute vari et e int egrale du syst` eme de Pfa (2.22) est aussi une vari et e int egrale de sa fermeture (2.23). D enition 19 On dit que le syst` eme (2.22) de rang r est compl` etement int egrable sil existe un ouvert U de X et r fonctions di erentiables ind ependantes y1 , . . . , yr telles que (2.22) soit alg ebriquement equivalent dans U ` a dy1 = 0, . . . , dyr = 0 autrement dit, sil admet r int egrales premi` eres locales ind ependantes. On a alors la version duale du Th eor` eme de Frobenius : Th eor` eme 6 Une condition n ecessaire et susante pour que le syst` eme de Pfa (2.22) de rang r soit compl` etement int egrable dans un ouvert U X est quil soit ferm e dans U . Dans ce cas, il existe un ouvert dense U1 U tel que par tout point de U1 il passe une vari et e int egrale locale de (2.22) de dimension n r qui est une sous-vari et e de X .
(2.23)
30
Preuve. Donnons les preuves les plus simples, ` a savoir de la condition n ecessaire et de la seconde partie du Th eor` eme. Pour la condition susante, le lecteur int eress e peut se r ef erer ` a [15]. Si le syst` eme de Pfa (2.22) est compl` etement int egrable, il existe r int egrales premi` eres locales r ind ependantes y1 , . . . , yr telles que i = r a dy et inversement dy = b . j j j =1 i,j i=1 j,i i On a alors
r r
di =
j =1
dai,j dyj
r
=
j =1
dai,j
k=1
bj,k k
=
k=1
i,k k
avec i,k = r eme de Pfa (2.22) est alg ebriquement equivalent j =1 bj,k dai,j , ce qui prouve que le syst` a sa fermeture, et donc ferm ` e. En ce qui concerne la seconde partie, si le syst` eme est compl` etement int egrable, il admet r int egrales premi` eres ind ependantes y1 , . . . , yr . Soit U1 louvert dense de U dans lequel la matrice yi est de rang plein egal ` a r. Pour tout x0 U1 , le syst` eme dy1 = = dyr = 0 est Jacobienne x j equivalent au syst` eme implicite form e des r equations ind ependantes y1 (x) = y1 (x0 ), . . . , yr (x) = yr (x0 ) et qui admet une solution locale dans U . Cette derni` ere d enit une sous-vari et e de X de dimension n r, do` u le r esultat. La cons equence de ce r esultat est que pour tout champ de vecteurs v tangent ` a TY , o` u Y est une vari et e int egrale du syst` eme de Pfa (2.22), et si est lapplication di erentiable de Y dans X associ ee, on a i , v = 0 = i , v de sorte que lensemble des champs de vecteurs v pour v TY d enit une distribution D telle que dyi , w = 0 pour tout i = 1, . . . , r et tout w D. Cette distribution admet donc une base en tout point, not ee , suppl ementaire de y , involutive par construction, , . . . , n , . . . , y r r 1 1 et telle que la vari et e Y , partout tangente ` a D, est bien une vari et e int egrale au sens du Th eor` eme 4.
2.9
Terminons cette introduction ` a la g eom etrie di erentielle en g en eralisant la notion de d eriv ee de Lie aux formes di erentielles et en etudiant certaines de ses propri et es. On va d enir sur T X une op eration, duale du crochet de Lie, appel ee d eriv ee de Lie de 1forme. On va proc eder par etape en d enissant dabord cette notion pour la d eriv ee ext erieure dune fonction :
n
dLf =
i=1
Lf dxi = xi
Lf
i=1
xi
+ < d,
f > dxi . xi
(2.24)
Cette formule d enit une nouvelle 1-forme que lon note Lf d, appel ee d eriv ee de Lie de d le long de f . Si g est un second champ de vecteurs, on v erie facilement que :
n
< Lf d, g >=
i=1
(Lf (
(2.25)
DE LIE DES 1-FORMES 2.9. DERIV EE Pour d enir la d eriv ee de Lie dune 1-forme g en erale, on etend cette relation : D enition 20 La d eriv ee de Lie de la 1-forme est d enie par < Lf , g >= Lf < , g > < , [f, g ] > . pour toute paire de champs de vecteurs f et g . Un calcul facile montre que
n
31
(2.26)
Lf =
i=1
(Lf (i )+ < ,
f >)dxi . xi
def
(2.27)
Si lon appelle aussi le crochet de Lie de f et g d eriv ee de Lie de g le long de f , Lf g = [f, g ] et si lon r e ecrit (2.26) : Lf < , g >=< Lf , g > + < , Lf g > cette formule appara t bien comme une formule de d erivation usuelle dun produit scalaire. La dualit e entre 1-formes et champs de vecteurs s etend aux d eriv ees ext erieures de 1-formes, qui sont des 2-formes, donc des formes bilin eaires, en les faisant agir sur les paires de champs de vecteurs. En coordonn ees locales, on a : d, (f, g ) =
i<j
j i xi xj
fi gj =
1 2
i,j
j i xi xj
fi gj
On a le r esultat suivant : Proposition 7 Pour toute paire de champs de vecteurs f, g et toute 1-forme , on a d, (f, g ) = Lg , f Lf , g + , [f, g ] . Preuve. On a d, (f, g ) = 1 2 j i xi xj (2.28)
fi gj ,
i,j
Lg , f =
i,j
j fi fj gi + i gj xi xj i gi fj gi + i fj xj xj i fj gi fi gj xj xj
Lf , g =
i,j
, [f, g ] =
i,j
do` u le r esultat en faisant la somme de ces expressions. On en d eduit une autre version du Th eor` eme de Frobenius :
32
Corollaire 1 Si le syst` eme de Pfa (2.22) est compl` etement int egrable, et si f et g sont deux vecteurs tangents ` a une vari et e int egrale, alors [f, g ] est tangent ` a la m eme vari et e int egrale. Inversement, si D est une distribution involutive de champs de vecteurs et une 1-forme qui sannule sur D, alors est ferm ee. Preuve. Application directe de la formule (2.28) : si (2.22) est compl` etement int egrable alors toute 1-forme du syst` eme annule les champs de vecteurs f et g tangents ` a un vari et e int egrale ainsi que d puisque le syst` eme est ferm e. On en d eduit que , [f, g ] = 0 pour toute 1-forme de (2.22) et donc que [f, g ] est tangent ` a la m eme vari et e int egrale. Inversement, si sannule sur f et sur g , pour f et g quelconques dans D, par linvolutivit e de D, sannule aussi sur [f, g ], et donc d, (f, g ) = 0 pour toute paire f, g D. La 2-forme d sannule donc aussi sur D, ce qui prouve que est ferm ee.
Chapitre 3
sur une vari et e X de classe C et de dimension n, f etant un champ de vecteurs C . On verra plus loin que lon peut se ramener ` a cette situation dans le cas de syst` emes command es, par exemple au voisinage de points d equilibre ou dorbites p eriodiques, la loi de commande en boucle ouverte ou ferm ee ayant et e x ee au pr ealable. L equation (3.1) est dite stationnaire pour exprimer que la vitesse f (x) en tout point x ne d epend pas de linstant t de passage. Le cas des equations di erentielles dites instationnaires, cest-` a-dire o` u f d epend du temps, x = f (t, x) (3.2) sera aussi abord e plus loin. On va dabord etudier le ot associ e` a (3.1), ses orbites et le portrait de phases associ e. La notion la plus simple, ensuite, est le point singulier ou point d equilibre. Dans le cas o` u certaines trajectoires sont ferm ees (orbites p eriodiques) on d enira lapplication de Poincar e ou application de premier retour qui permet de traiter une orbite p eriodique comme un point xe de cette application. On rapellera aussi les notions de fonctions de Lyapounov et de Chetaev, tr` es populaires mais souvent tr` es diciles ` a construire directement, et notamment dans les coordonn ees de d epart. On va sint eresser ensuite au comportement qualitatif des solutions de (3.1) autour dun point singulier. Apr` es avoir rappel e la classication des comportements des syst` emes lin eaires autour dun point d equilibre, qui correspond ` a une classication de ses valeurs propres, on se propose de r epondre ` a la question suivante : comment comparer la complexit e du comportement asymptotique dun syst` eme non lin eaire avec celle de son lin earis e tangent ? Pour pr eciser le mot comparer, il est important de remarquer que la stabilit e nest pas aect ee si lon tord les trajectoires de mani` ere r eguli` ere, cest-` a-dire par changement de coordonn ees susamment di erentiable. On peut donc 33
34
reformuler la question pr ec edente en disant que notre but consiste ` a d eterminer ` a quelle condition il existe un changement de coordonn ees qui transforme localement les trajectoires du syst` eme non lin eaire en les trajectoires de son lin earis e tangent. On retrouve donc ici la m eme pr eoccupation quau chapitre pr ec edent sur la mise en evidence de coordonn ees qui simplient particuli` erement lanalyse, ici de la stabilit e ou de linstabilit e. Si lon prend les hom eomorphismes comme changements de coordonn ees, le th eor` eme dHartman et Grobman conduit ` a une classication utilisant la notion dhyperbolicit e. On introduit ensuite les sous-vari et es invariantes stable, instable et centre et on montre comment l etude de la stabilit e locale est ramen ee ` a celle dune equation di erentielle ou r ecurrente tr` es simple en dimension r eduite. Les d emonstrations des principaux r esultats, diciles, ne sont pas donn ees. Pour plus de pr ecisions, on pourra se reporter ` a [3, 4, 5, 9, 17, 19, 25, 28, 27, 37, 40, 43, 16, 51, 57, 58]. On trouvera notamment de nombreux exemples dapplications ` a la m ecanique dans [3, 4, 5, 40].
3.1.1
` partir de chaque condition initiale o` A u la solution de (3.1) existe, comme on a suppos e que le champ de vecteurs f de (3.1) est C , il existe une unique courbe int egrale maximale solution de (3.1) dans un voisinage de chaque point. Notons comme auparavant Xt (x) la solution ` a linstant t partant de l etat initial x ` a linstant 0. En vertu de lexistence et de lunicit e des courbes int egrales, lapplication x Xt (x), not ee Xt , est un di eomorphisme local pour tout t o` u elle est d enie. Lorsque les courbes int egrales du champ f sont d enies sur R tout entier, on dit que le champ f est complet. Dans ce cas, Xt existe pour tout t R, et d enit un groupe ` a un param` etre de di eomorphismes locaux : 1. lapplication t Xt est C , 2. Xt Xs = Xt+s pour tous t, s R et X0 = IdX . Notons que les points 1 et 2 impliquent que Xt est un di eomorphisme local pour tout t. On appelle ot associ e` a (3.1) lapplication t Xt . On v erie ais ement que le ot v erie l equation di erentielle suivante : d Xt (x) = f (Xt (x)) (3.3) dt pour tout t et toute condition initiale x tels que Xt (x) est d eni. = 1, Dans le cas instationnaire ( equation (3.2)), le ot se d eduit de ce qui pr ec` ede en posant t x = (x, t) et en prenant pour champ de vecteurs f ( x) = (f (t, x), 1), qui devient stationnaire dans la vari et e augment ee X R. On prendra donc garde dans la suite, pour les r esultats qui s etendent au cas instationnaire (malheureusement pas tous !), ` a remplacer la dimension n de la vari et e X par n + 1. On appelle orbite de l equation di erentielle (3.1) une classe d equivalence de la relation d equivalence x1 x2 sil existe t tel que Xt (x1 ) = x2 ou Xt (x2 ) = x1 . Autrement dit, x1 x2 si x1 et x2 appartiennent ` a la m eme courbe int egrale maximale. On appelle orbite dun point la courbe int egrale maximale passant par ce point. Le portrait de phases de (3.1) est alors la partition de la vari et e X form ee par les orbites de (3.1) munies de leur sens de parcours.
3.1. BREFS RAPPELS SUR LES FLOTS, LES ORBITES ET LEUR STABILITE
35
x<0 O
x>0
Fig. 3.1 Les 3 orbites du syst` eme (3.4). Exemple 14 L equation di erentielle sur R x = x (3.4)
a pour ot Xt (x0 ) = et x0 . Compte-tenu de la positivit e stricte de et pour tout t, il vient que deux points de R appartiennent ` a la m eme courbe int egrale si et seulement sils appartiennent ` a la m eme demi-droite ou sont nuls, i.e. x1 x2 equivaut ` a signe (x1 ) = signe (x2 ) ou x1 = x2 = 0. Le syst` eme (3.4) admet donc 3 orbites : R+ , R et {0}, comme indiqu e sur la Fig. 3.1. La m eme conclusion vaut pour le syst` eme x = +x, la seule di erence etant que le sens de parcours des orbites est loppos e de celui de (3.4). Bien entendu, le ot et le portrait de phases ne d ependent pas du choix des coordonn ees. En eet, si est un di eomorphisme et si lon note z = (x) f (1 (z )) . (3.5) x Ainsi, si lon note Zt le ot associ e` a cette equation transform ee, on v erie facilement quil se d eduit du ot Xt par la formule Zt ((x)) = (Xt (x)), ou encore : z = Zt = Xt . (3.6) on a :
On d eduit des formules analogues pour les orbites et le portrait de phases. Notons que dans le cas instationnaire, les di eomorphismes consid er es vont de X R dans luim eme. Ils incluent donc des changements de temps qui ne sont pas n ecessairement croissants. Ainsi, apr` es transformation, il pourrait exister des points de X au voisinage desquels on remonte le temps ou m eme o` u le temps doit etre consid er e comme une variable complexe (solution dune equation polyn omiale). Cette remarque est ` a la source des di erences importantes qui subsistent entre les syst` emes stationnaires et instationnaires, notamment au plan de la stabilit e o` u le d eroulement du temps, sens de parcours des orbites, joue un r ole crucial. Rappelons (Proposition 1) quau voisinage dun point r egulier ou transient x0 , cest-` a-dire tel que f (x0 ) = 0, il existe un di eomorphisme local qui redresse le champ. La solution transform ee 0, . . . , z 0 , z (t) = t + z 0 avec z 0 = (x ), i = 1, . . . , n et est donc donn ee par z1 (t) = z1 ( t ) = z n1 i 0 n n1 n i donc x(t) = 1 (1 (x0 ), . . . , n1 (x0 ), t + n (x0 )). Dans le cas instationnaire, on peut montrer que le redressement respecte le sens du temps.
36
Ce r esultat montre quau voisinage dun point r egulier, les transitoires dune equation di erentielle g en erale sont qualitativement tr` es simples puisquon peut les d ecrire par n 1 constantes et une fonction ane par rapport au temps, ce qui revient ` a dire que les orbites sont des droites parall` eles. Toute la complexit e est donc localement rel egu ee dans les non lin earit es statiques redress ees par le di eomorphisme. On verra plus loin que le comportement qualitatif au voisinage dun point singulier (aussi appel e r egime permanent ou point d equilibre), dune orbite p eriodique (ou cycle limite) ou plus g en eralement dune vari et e invariante, peut etre beaucoup plus complexe.
3.1.2
Point d equilibre
On sint eresse maintenant aux ph enom` enes dits asymptotiques cest-` a-dire faisant intervenir des ensembles de temps non born es et o` u les trajectoires sont attir ees ou repouss ees par des points, des orbites ou des ensembles particuliers. Un point singulier (ou point d equilibre ou r egime permanent) du champ f ou, par extension, du syst` eme (3.1), est un point x tel que f ( x) = 0, ou, ce qui revient au m eme, tel que Xt ( x) = x (point xe du ot). Un champ de vecteurs nadmet pas n ecessairement de point singulier : cest le cas des champs constants, par ex. x = 1, ou instationnaires puisque le champ (f (t, x), 1) ne sannule pas et na donc jamais de point singulier, m eme si sa projection x f (t, x) en a, au sens o` u il existe un point x v eriant f (t, x ) = 0 pour tout t. La notion de point d equilibre est donc le premier exemple de dicult e sp ecique aux syst` emes instationnaires. On peut obtenir une approximation au premier ordre de Xt (x) au voisinage dun point singulier x en calculant la solution de l equation di erentielle lin eaire appel ee equation aux variations ou lin earis ee tangente : dXt ( x) d Xt ( x) f Xt ( x) = = ( x) x dt dt x x x ou encore, avec les notations A =
def f x) x (
et z =
def Xt ( x) x
z = Az . Les valeurs propres de la matrice A sont souvent appel ees les exposants caract eristiques du point singulier x . Elles ne d ependent pas du choix des coordonn ees : la matrice du lin earis e tangent dans dautres coordonn ees est semblable ` a celle du lin earis e tangent dans les coordonn ees initiales et les valeurs propres sont donc les m emes. Exemple 15 Consid erons la classique equation du pendule simple = g sin l , ou encore, avec les notations x1 = et x2 = x 1 = x2 x 2 = g l sin x1 . (3.8) (3.7)
On v erie imm ediatement que ce syst` eme admet deux points singuliers dans le cylindre S1 R : (x1 , x2 ) = (0, 0) et (x1 , x2 ) = (, 0) (un point x1 S1 etant par d enition le repr esentant dans
3.1. BREFS RAPPELS SUR LES FLOTS, LES ORBITES ET LEUR STABILITE
37
lintervalle [0, 2 ] de lensemble des r eels de la forme x1 + 2k , avec k Z). Le lin earis e tangent 0 1 du syst` eme en (0, 0) est z = z dont les exposants caract eristiques sont i g l. g 0 l Remarque 1 On peut toujours se ramener au cas o` u le point singulier est lorigine 0 puisque si x v erie f ( x) = 0, il sut de consid erer le changement de coordonn ees z = x x et le champ f transform e g (z ) = f (z + x ). On a alors g (0) = 0 et g (0) = ( x ) . z x Remarque 2 Pour mettre en evidence les propri et es des exposants caract eristiques, il est souvent utile de mettre la matrice A du lin earis e tangent sous forme de Jordan (voir par ex. [23]). Soit P la matrice de passage associ ee ` a la forme de Jordan J de A, i.e. telle que P AP 1 = J (dans le cas o` u A na que des valeurs propres distinctes non nulles, P est la matrice des vecteurs propres ( associ es aux valeurs propres de A). Posons x = P x et f x) = P f (P 1 x ). Le syst` eme (3.1) est en 0 est alors transform e en x = f ( x). On v erie imm ediatement que le lin earis e tangent de f egal = Jz a z ` avec z = P z . On se placera dembl ee dans ces coordonn ees pour lesquelles les enonc es seront souvent simpli es. Lorsque A est une matrice non d eg en er ee, ou ce qui revient au m eme lorsque A na pas de valeurs propres nulles, on dit que le point singulier x est non d eg en er e. Cette notion correspond au cas o` u l equation aux variations admet lorigine comme unique point singulier. On parle aussi de point singulier hyperbolique si A na pas de valeurs propres purement imaginaires. Notons quune matrice g en erique1 na pas de valeur propre sur laxe imaginaire. Le lin earis e tangent dun point singulier hyperbolique correspond donc au cas g en erique. On verra que le comportement asymptotique dune equation di erentielle de la forme (3.1) au voisinage dun point singulier hyperbolique, m eme plus pr ecis ement son portrait de phases local au voisinage du point singulier, peut etre compl` etement d ecrit (dans un sens qui sera sp eci e plus loin) ` a laide de ses exposants caract eristiques. On donnera aussi un exemple qui montre que ce r esultat ne sapplique pas (au moins directement) dans le cas instationnaire. Dans le plan R2 , on peut classer les points singuliers non d eg en er es en quatre cat egories suivant le signe de la partie r eelle de leurs exposants caract eristiques : les points-selles (2 valeurs propres dont les parties r eelles sont de signes oppos es), les nuds (2 valeurs propres r eelles de m eme signe), les foyers (2 valeurs propres complexes dont les parties r eelles sont non nulles et de m eme signe) et les centres (2 valeurs propres ` a parties r eelles nulles) (voir Fig. 3.2).
3.1.3
On appelle cycle ou orbite p eriodique une trajectoire isol ee de (3.1) non r eduite ` a un point et ferm ee (di eomorphe ` a un cercle) cest-` a-dire telle quil existe T > 0 v eriant XT (x) = x. On montre facilement que les courbes int egrales de (3.1) sont soit des points, soit des courbes di eomorphes ` a des cercles ou des droites. On peut aussi dire de fa con equivalente que si une orbite nest ni constante ni injective, elle est p eriodique.
au sens de presque toutes les matrices, ou encore en dehors dun ensemble maigre de matrices. On peut donner une d enition rigoureuse de la notion de g en ericit e qui d epasse le cadre de cet expos e. Le lecteur int eress e peut se r ef erer par exemple ` a [5, 17].
1
38
1.5
0.8
0.2
-0.5
-0.2
-2 -40
0.01 0.008 0.006 0.004 0.002 0 -0.002 -0.004 -0.006 -0.008 -0.01 -0.01 -0.005 0 0.005 0.01
0.5
-0.5
-1
-1.5
-1
-0.5
0.5
1.5
Fig. 3.2 Lorigine est un point-selle (en haut, ` a gauche), point d equilibre du syst` eme x 1 = x1 , x 2 = 2x2 ; un nud stable (en haut, ` a droite), point d equilibre du syst` eme x 1 = x1 , x 2 = 2x2 ; un foyer stable (en bas ` a gauche), point d equilibre du syst` eme x 1 = x2 , x 2 = 2x1 2x2 ; un centre (en bas, ` a droite), point d equilibre du syst` eme x 1 = x2 , x 2 = x1 . Dans les quatre cas, le point singulier est non d eg en er e, mais il nest pas hyperbolique dans le cas du centre. Certaines classes remarquables de syst` emes ne poss` edent pas dorbites p eriodiques. Cest le cas des syst` emes dont le champ d erive dun potentiel, aussi appel es syst` emes de gradient. On dit quun champ de vecteurs f sur la vari et e X d erive dun potentiel sil existe une fonction V de classe C 2 de X dans R telle que V f (x) = (x) , x X . x On d eduit imm ediatement une condition n ecessaire pour que f d erive dun potentiel : fj fi = , xj xi On a la proposition suivante : Proposition 8 Un champ qui d erive dun potentiel nadmet aucune orbite p eriodique. Preuve. Par d enition, on a d V V V (x(t)) = (x(t)) (x(t)) dt x x = V (x(t)) x
2
i, j .
0,
t .
(3.9)
3.1. BREFS RAPPELS SUR LES FLOTS, LES ORBITES ET LEUR STABILITE
39
Supposons alors que la trajectoire x(t) corresponde ` a une orbite p eriodique, cest-` a-dire quil existe V T > 0 tel que x(t + T ) = x(t) pour tout t. Si x (x(t)) = 0 pour au moins un t, on a V (x(t + s)) < V (x(t)) pour tout s 0 dapr` es lin egalit e (3.9) et donc en particulier V (x(t + T )) < V (x(t)), ce qui contredit le fait que x(t + T ) = x(t) (puisqualors on devrait avoir V (x(t + T )) = V (x(t))). On a donc V e de la solution de x = V x (x(t)) = 0 pour tout t et par lunicit x (x), il vient x(t + s) = x(t) pour tout s, ce qui veut dire que lorbite correspondante est r eduite ` a un point et ne peut donc pas etre p eriodique.
Remarque 3 Lapellation syst` eme de gradient est trompeuse car ces syst` emes ne recouvrent quune tr` es faible partie des syst` emes physiques dont le champ de forces d erive dun potentiel : au lieu de x = V erivant dun potentiel U , mx = U x , on a, dans le cas dun champ de forces d x , autrement dit, en posant x1 = x et x2 = x , V x1 1 U V x 2 = = . m x1 x2 x 1 = x2 =
1 U m erive du potentiel V , au sens de Dans R2 , le champ de vecteurs correspondant, x2 x x1 x2 , d 1 1 V 1 U , soit U (x1 , x2 ) = 2 mx2 la Proposition 8, si et seulement si x = 1 = m 1 , ce qui implique x2 1 x2 1 que V (x1 , x2 ) = x1 x2 et que la seule dynamique gradient en dimension 2 est donn ee par
2 2
x 1 = x2 ,
x 2 = x1
i.e. x1 (t) = aet + bet , x2 (t) = aet bet , dont on v erie directement quelle na pas dorbite p eriodique : supposons au contraire quil existe T > 0 tel que x1 (t + T ) = x1 (t) et et a b et+T a b , = x2 (t + T ) = x2 (t) pour tout t. On a alors t T et a b e a b et est un vecteur propre de la matrice ce qui implique imm ediatement que le vecteur et a(eT 1) b(eT 1) , dont le d eterminant doit donc etre nul, i.e. 2ab(eT 1)2 = 0 ; or si a(eT 1) b(eT 1) a et b ne sont pas tous nuls, les propri et es de lexponentielle contredisent lhypoth` ese T > 0, et si a = b = 0, la trajectoire correspondante est un point d equilibre. Il reste donc eT = 1, ou T = 0, ce qui est contraire ` a lhypoth` ese. On peut donner une version plus physique du r esultat pr ec edent : Proposition 9 Soient U une fonction di erentiable de Rn dans R et une fonction (x) de Rn n dans R . Notons , le produit scalaire de Rn et soit m un r eel positif. La dynamique mx = U (x) (x), x (x) x (3.10)
nadmet aucune orbite p eriodique. Si en outre U admet un unique minimum x sur Rn et si ne n sannule pas sur R , alors les trajectoires de (3.10) convergent vers x.
40
Clairement, le membre de droite repr esente la somme des forces qui d erivent dun potentiel U ( x (x)) et dissipatives ( (x), x (x)). 1 Preuve. Posons V (x, x ) = 2 m x, x + U (x) ( energie m ecanique). On a d U V (x(t), x (t)) = mx , x + (x), x dt x U (x), x (x), x (x), x + = x = (x), x 2 0.
U (x), x x
(3.11)
Le raisonnement de la preuve de la Proposition 8 sadapte alors ais ement. Si maintenant x est tel que U (x) = minxRn U (x), et si ne sannule pas, comme la fonction V est strictement d ecroissante le long des trajectoires de (3.10), ces derni` eres convergent toutes vers le minimum de V qui nest autre que x, puisquon v erie ais ement que le point d eni par (x = x, x = 0) est un point d equilibre et que, si ce n etait pas le cas, on aurait U (x) = V (x, 0) > min(x,x ) U (x), ce qui est absurde. ) V (x, x
Remarque 4 Pour revenir au sujet de la remarque 3, le syst` eme (3.10) est un syst` eme Hamiltonien 1 2 o` u lon a ajout e un terme dissipatif. En eet, posons H = 2m x2 +U (x1 ) avec x1 = x, x2 = mx 1 et H H U H 1 H 1 x do` u x = ( x ) , x ( x1 ). x2 2 = x2 , x2 . On a x = et = et x = 1 1 2 2 x1 x2 2m 2 x2 x1 m 1 Notons que si le terme de dissipation est nul ( 0), le syst` eme est Hamiltonien et rien nemp eche quil ait des orbites p eriodiques. Etant donn ee une orbite p eriodique de (3.1), de p eriode T , un point x et une sous-vari et e W de dimension n 1 transverse ` a au point x (cest-` a-dire telle que lespace tangent Tx W ` a W au point x et la droite R.f (x) tangente en x ` a lorbite soient suppl ementaires), on appelle application de Poincar e ou application premier retour associ ee ` a W et x, lapplication P qui ` a tout point z W voisin de x fait correspondre le point P (z ) obtenu en prenant la premi` ere intersection de lorbite de z et de W (voir Fig. 3.3). On peut montrer que le terme de premi` ere intersection a bien un sens puisque le temps T (z ) mis sur lorbite de z pour revenir dans W est proche de la p eriode T et est donc minor e par un nombre strictement positif. Lapplication de Poincar e ne d epend ni de la sous-vari et e transverse W ni du point x en ce sens que si lon choisissait une sous-vari et e transverse W en un point x de , lapplication P correspondante serait limage de P par le di eomorphisme qui transforme W en W et x en x . La v erication de cette propri et e est laiss ee au lecteur. Notons que lapplication de Poincar e P envoie W , de dimension n 1, dans elle-m eme et est un di eomorphisme local. On peut ainsi d enir l equation r ecurrente zk+1 = P (zk ) qui admet x pour point xe. On voit alors que l etude du comportement de (3.1) au voisinage de lorbite p eriodique se r eduit ` a l etude de l equation r ecurrente ci-dessus. Notons que dans le cas d equations r ecurrentes de la forme xk+1 = f (xk )
3.1. BREFS RAPPELS SUR LES FLOTS, LES ORBITES ET LEUR STABILITE
41
P(x) x x
Fig. 3.3 Lapplication de Poincar e P autout dun point xe x . Ici le lin earis e tangent de P en x est instable. o` u f est un di eomorphisme C , les points d equilibre sont remplac es par les points xes de f , i.e. les points x tels que f ( x) = x et le syst` eme lin earis e tangent, ou equation aux variations, autour dun point x sobtient comme dans le cas continu. Les multiplicateurs caract eristiques sont egalement les valeurs propres de la matrice du lin earis e tangent. Ainsi, pour une orbite p eriodique, les (n 1) multiplicateurs caract eristiques de P (les n 1 valeurs propres du lin earis e tangent de P au point x) sont appel es ` a jouer un r ole tr` es important. Si P na pas de multiplicateur caract eristique sur le cercle unit e du plan complexe, on dit que lorbite est hyperbolique.
Exemple 16 Reprenons le pendule simple de lexemple 15. Rappelons quil admet deux points singuliers dans le cylindre S1 R : (x1 , x2 ) = (0, 0) et (x1 , x2 ) = (, 0). Le lin earis e tangent au 0 1 point d equilibre (0, 0) est z = z et ses exposants caract eristiques sont i g l . Le point g 0 l singulier (0, 0) nest donc pas hyperbolique. 0 1 Le lin earis e tangent en (, 0) est donn e par z = z . Ses exposants caract eristiques g 0 l sont r eels, donn es par g l ce qui signie que le point singulier (, 0) est un col hyperbolique (cest l equilibre instable de l equilibriste). On remarquera, conform ement ` a la proposition 8, que le champ ci-dessus, f (x1 , x2 ) = T , ne d (x2 , g sin x ) e rive pas dun potentiel puisque 1 l f1 f2 g =1= = cos x1 . x2 x1 l
42
2 Par contre, le champ f est Hamiltonien puisque, si lon pose comme pr ec edemment H = 1 2 x2 + g H H et x 2 = x . Nous avons donc ici un syst` eme Hamiltonien p eriodique. 1 = x l (1 cos x1 ), on a x 2 1 On sait en eet que le mouvement pendulaire est p eriodique lorsquil nest pas amorti par le frottement de lair, que lon n eglige ici. En eet, l energie m ecanique est egale ` a H (au facteur ml2 pr` es) et on v erie sans dicult e que sa d eriv ee le long des trajectoires du pendule est nulle, ce qui signie que lHamiltonien H est une int egrale premi` ere. Les trajectoires pendulaires sont donc caract eris ees par l equation
1 2 g g x2 + (1 cos x1 ) = (1 cos 0 ) 2 l l le membre de droite correspondant ` a l energie ` a linstant initial, le pendule etant lach e ` a vitesse initiale nulle (on peut toujours se ramener ` a ce cas par un choix judicieux de la position angulaire initiale 0 ). Les orbites correspondantes, d equation x2 = 2g (cos x1 cos 0 ) l
1 x2 dx1
sont ferm ees et la p eriode T (0 ) sur chacune delles est donn ee par la formule (int egrer dt = sur un quart de p eriode) : T (0 ) = 2 2l g
0
d . cos cos 0
On peut montrer par ailleurs (exercice dicile) que cette expression est bien egale ` a la formule
l usuelle, et ind ependante de langle initial 0 , T = 2 g . Intersectons maintenant les orbites par la demidroite { x1 0 , x2 = 0 } (tout autre choix de demidroite transversale redonnerait le m eme r esultat). On v erie que la restriction de l equation des orbites ` a cette demidroite est donn ee par cos x1 = cos 0 , ce qui revient ` a dire que chaque orbite traverse laxe x2 = 0 en x1 = 0 + 2k pour x1 0 ou encore que chaque orbite senroule ind eniment sur elle-m eme et que l ecart entre deux orbites voisines reste constant apr` es un tour. On d eduit ainsi sans calcul (le v erier en utilisant limage par le ot, apr` es un tour, dune perturbation sur 0 ) que lapplication de Poincar e est localement egale ` a lidentit e de R et admet donc 1 pour unique multiplicateur caract eristique, ce qui prouve que les orbites du pendule ne sont pas hyperboliques. On peut dailleurs v erier quelles ne persistent pas en pr esence de perturbations : par exemple, si maintenant on consid` ere que la r esistance de lair induit un frottement visqueux (force proportionnelle ` a la vitesse avec orientation oppos ee), l equation du pendule est donn ee par
= g sin l avec > 0, ou encore par x 1 = x2 x 2 = g l sin x1 x2 . Ce syst` eme est maintenant de la forme (3.10) avec (x1 ) . Les deux equilibres pr ec edents subsistent mais lorigine est maintenant hyperbolique (et, on le verra plus loin, stable puisque ses exposants caract eristiques ont pour partie r eelle ), et l equilibre
43
(, 0) demeure hyperbolique instable. Cependant, m eme pour arbitrairement petit, il ny a plus dorbite p eriodique en vertu de la proposition 9. Cette remarque illustre donc le fait que la non hyperbolicit e est reli ee ` a la non g en ericit e, cest-` a-dire ` a la non persistance sous leet de perturbations du comportement dynamique.
3.2
3.2.1
Un ensemble A est dit invariant (resp. positivement invariant) sil contient son image par le ot pour tout t (resp. pour tout t 0), autrement dit si Xt (A) A pour tout t R (resp. t 0). En temps discret, la m eme d enition est valable en changeant t R en t Z et t 0 en t N. Ainsi, si A est invariant (resp. positivement invariant), les trajectoires partant dun point de A restent dans A pour tous les temps positifs et n egatifs (resp. pour tous les temps positifs). On dit aussi que A est globalement positivement invariant sil est positivement invariant et si toutes les courbes int egrales entrent dans A au bout dun temps ni positif. On parle aussi de vari et e invariante pour d esigner un ensemble invariant qui est une sousvari et e de X . Exemple 17 Pour le syst` eme x = x sur R, tout voisinage compact de 0 est globalement positivement invariant. En revanche, pour x = +x, seul le point d equilibre {0} est positivement invariant. Exemple 18 Lorbite dune int egrale premi` ere d enie globalement est une vari et e invariante : dans 2 = R2 est une vari R2 , un cercle quelconque x2 + x e t e invariante pour le syst` e me x 2 = x1 . 1 = x2 , x 1 2 Exemple 19 En temps continu, on v erie facilement que si X = Rn , si A X est un compact dint erieur non vide dont la fronti` ere A est di erentiable et orientable, A est positivement invariant si et seulement si le champ f est rentrant sur A. Si lon note la normale ` a A point ee vers lext erieur et < ., . > un produit scalaire sur X , on dit que f est rentrant sur A si < f, >|A < 0. 2 2 Par exemple, dans R2 , lellipso de A = {(x1 , x2 ) R2 |kx2 1 + x2 r } est positivement invariante pour le champ de vecteurs f = x2 x1 (kx1 + x2 ) x2 car un vecteur normal ` a la fronti` ere A de 2 2 2 2 T A, qui v erie A = {(x1 , x2 ) R |kx1 + x2 = r }, est donn e par (kx1 , x2 ) et le produit scalaire 2 0. On v < f, > est egal ` a kx1 x2 x2 + kx x = x erie en outre que lorsque x2 = 0, 1 2 2 2 x 2 = kx1 < 0 (x1 et x2 ne peuvent pas etre tous deux nuls sur A) ce qui montre que f est strictement rentrant sur A. On v erie facilement, en calculant le ot, que les courbes int egrales de f non seulement restent dans A mais convergent toutes vers lorigine. On introduit g en eralement une notion plus pr ecise et surtout plus intrins` eque que les ensembles invariants. En eet, la connaissance de plusieurs ensembles invariants peut etre superue puisque par exemple Xt (A) est invariant si A lest. Les informations r eellement incompressibles r esident en ), ), ), o` d fait dans les ensembles limites Xt (A Xt (A Xt (A uA esigne la fermeture de A, qui lorsque correspondent aux ensembles constitu es des points limites des trajectoires restant dans A lon fait tendre t vers , + et respectivement. Notons enn que la notion dattracteur
tR t0 t0
44
correspond au fait quon se rapproche dune limite dans le sens positif du temps alors que se rapprocher en temps r etrograde revient en fait ` a etre repouss e. Do` u la d enition suivante : ) o` Xt (A u A est un ensemble invariant relativement On appelle attracteur lensemble B =
t0
est compact). compact (i.e. tel que A Lorsque A est globalement positivement invariant, lattracteur B est dit maximal. On v erie sans dicult e quun attracteur est un ensemble invariant : B = Xt (B ) pour tout t. Exemple 20 Parmi les points singuliers dun champ de vecteurs f , tous ne sont pas des attracteurs. Nous verrons plus loin que les points singuliers stables, cest-` a-dire dont les exposants caract eristiques sont ` a partie r eelle strictement n egative, sont des attracteurs. Les points singuliers instables sont des attracteurs par rapport ` a f , correspondant au temps r etrograde. Il existe des ensembles invariants qui sont attracteurs ` a la fois pour f et pour f : pour le champ f correspondant au syst` eme x 1 = x2 x 2 = x1 ,
2 2 lorigine est un centre au sens du paragraphe 3.1.2. Toutes ses orbites donn ees par x2 1 + x2 = R , o` u R est un r eel arbitraire (les cercles de centre lorigine), sont des attracteurs ` a la fois pour f et f (voir Fig 3.2).
Exemple 21 Une orbite p eriodique peut aussi etre un attracteur si ses multiplicateurs caract eristiques sont tous de module strictement inf erieur ` a 1 (rappelons que pour les orbites p eriodiques, on sousentend multiplicateur caract eristique de lapplication de Poincar e). Dans lexemple pr ec edent, toutes les trajectoires sont des orbites p eriodiques neutres, cest-` a-dire de multiplicateur dont le module est egal ` a 1. Un attracteur nest pas n ecessairement un ensemble ayant des propri et es g eom etriques et topologiques simples. Un attracteur qui nest pas constitu e dune union nie de sous-vari et es de X est appel e attracteur etrange ou fractale. Sa dimension (au sens de Hausdor) peut etre non enti` ere.
3.2.2
On va maintenant sp ecier la notion dattracteur dans le cas dun point ou dune orbite. On parle alors de stabilit e au sens de Lyapounov2 , ou Lstabilit e, et de stabilit e asymptotique au sens de Lyapounov, ou Lstabilit e asymptotique. On dit que le point x est Lyapounovstable, ou Lstable, si pour tout voisinage U1 de x il existe un voisinage U2 de x contenu dans U1 tel que toutes les trajectoires partant dun point quelconque de U2 ` a linstant t = 0 restent dans U1 pour tout t 0 (Fig. 3.4 ` a gauche). On dit que le point x est Lyapounovasymptotiquement stable, ou Lasymptotiquement stable, sil est Lstable et si toutes les trajectoires partant dun point quelconque dun voisinage de x ` a linstant t = 0 convergent vers x lorsque t + (Fig. 3.4 ` a droite).
en r ef erence au nom dAlexandre Lyapounov (18541918) qui fut lun des fondateurs avec Henri Poincar e (1854 1912), puis Ivar Bendixson (18611936), George Birkho (18841944) et de nombreux autres math ematiciens et physiciens math ematiciens, de lanalyse qualitative des equations di erentielles. Pour la plupart, leurs travaux furent motiv es par lanalyse asymptotique des trajectoires en m ecanique c eleste.
2
45
Xt(x) U1 x x U1 U2
Xt(x) x x U2
Fig. 3.4 L-stabilit e (` a gauche) et L-stabilit e asymptotique (` a droite) du point x . La di erence entre ces deux notions est quune petite perturbation sur l etat initial dun syst` eme autour dun point d equilibre Lstable peut engendrer des petites oscillations entretenues, alors quelles samortissent au cours du temps dans le cas dun point d equilibre Lasymptotiquement stable. Th eor` eme 7 (stabilit e dun point singulier, cas continu) Soit x un point singulier non d eg en er e du champ de vecteurs f . 1. Si tous les exposants caract eristiques de x sont ` a partie r eelle strictement n egative, alors x est Lasymptotiquement stable. 2. Si lun au moins des exposants caract eristiques de x est ` a partie r eelle strictement positive, alors x nest pas Lstable. Exemple 22 Reprenons le syst` eme Hamiltonien avec dissipation (3.10) de la proposition 9, en dimension n = 1 pour simplier, et supposons que le potentiel U admette un unique minimum au point x. Rappelons que les conditions n ecessaires pour que x soit un unique minimum sont donn ees par U 2U (x) = 0, (x) > 0. x x2 Pour calculer les exposants caract eristiques de x, posons, comme ` a la remarque 4, x1 = x, x2 = mx 1 . Le syst` eme s ecrit donc en dimension 2 : x 1 = 1 x2 m U 1 x 2 = (x1 ) 2 (x1 )x2 x1 m
et a pour point d equilibre (x, 0). Son lin earis e tangent autour de (x, 0) est donn e par 1 = 1 2 m 2 U 1 2 = 2 (x)1 2 (x)2 m x1
46
et les exposants caract eristiques cherch es sont les racines du polyn ome caract eristique (de la variable complexe ) : det
2U x2 1
2
1 m 1 2 (x) (x) + m
= 2 +
1 2 1 2U (x) + (x) = 0 m m x2 1
U Comme par hypoth` ese (x) > 0, le produit des racines est positif, et comme 2 (x) > 0, la somme x2 1 des racines est strictement n egative, si bien que les 2 racines sont ` a valeur r eelle strictement n egative, ce qui permet non seulement de retrouver le r esultat de convergence de la proposition 9 mais de le pr eciser par la preuve de la L-stabilit e asymptotique du point d equilibre x, conform ement au th eor` eme 7, point 1.
Ces conditions, qui portent le nom de premi` ere m ethode de Lyapounov, sont susantes et non n ecessaires puisquelles ne permettent pas de conclure, par exemple, dans le cas de valeurs propres purement imaginaires ou, a fortiori, nulles. Lexemple 23 suivant montre les dicult es d etablir un r esultat g en eral dans ce cas. Exemple 23 Consid erons les deux equations di erentielles scalaires x = x3 et x = x3 . Toutes deux admettent x = 0 comme point singulier avec 0 pour exposant caract eristique. La solution 1 2 2 2 at ) g en erale de x = ax3 etant x(t) = (x , on voit facilement que pour a = 1 (second 0 syst` eme) toutes les solutions sont bien d enies lorsque t + et convergent vers 0, ce qui prouve que 0 est attractif, alors que pour a = 1 (premier syst` eme) les solutions nexistent pas au del` a de t= 0 epulsif. Ainsi, les 2 , bien quelles partent toutes de 0 en t = , ce qui prouve que 0 est r deux syst` emes ont des comportements oppos es alors quils ont la m eme valeur propre nulle au point singulier 0. Ce probl` eme existe aussi en lin eaire en dimension sup erieure ou egale ` a 2 comme le montre lexemple suivant : Exemple 24 lorigine (0, 0) de R2 pour le syst` eme x = 0 0 0 0 x est Lstable puisque x(t) = x0
x2
pour tout t, mais pas Lasymptotiquement stable. En revanche, pour le syst` eme x =
0 1 x, 0 0 elle nest pas Lstable puisque la solution est x1 (t) = x2 (0)t + x1 (0), x2 (t) = x2 (0). Dans les deux cas, 0 est valeur propre double. Pour lanalyse de la stabilit e de lapplication de Poincar e autour dun point xe, cest-` a-dire associ ee ` a une orbite p eriodique, le Th eor` eme 7 se transpose comme suit : Th eor` eme 8 (stabilit e dun point xe, cas discret) Soit x un point xe du di eomorphisme f . 1. Si tous les multiplicateurs caract eristiques de x sont de module strictement inf erieur ` a 1, alors x est Lasymptotiquement stable. 2. Si lun au moins des multiplicateurs caract eristiques de x est de module strictement sup erieur a 1, alors x ` nest pas Lstable.
47
3.2.3
Donnons maintenant un exemple de syst` eme instationnaire instable dont les valeurs propres du lin earis e tangent au point singulier, prises ` a chaque instant, sont ` a partie r eelle strictement n egative, ce qui montrera bien limportance de lhypoth` ese de stationnarit e du champ. Consid erons le syst` eme lin eaire instationnaire : x =
3 2 1 + 3 1 2 sin t cos t 2 cos t 3 2 1 2 sin t cos t 1 + 3 2 sin t
x.
Son unique point singulier est lorigine x = 0 et, par lin earit e, le syst` eme est egal ` a son lin earis e tangent. 1 On v erie facilement que, pour tout t x e, ses valeurs propres sont egales ` a 4 i 47 (donc 1 , strictement n egative). ind ependantes du temps et ` a partie r eelle 4 Cependant, il est imm ediat de v erier que lunique solution du syst` eme partant du point (a, 0), a R, ` a linstant t = 0, est donn ee par x(t) = et donc pour tout a = 0, lim ae 2 cos t t ae 2 sin t
t
t+
En fait, pour certaines classes de syst` emes instationnaires, on peut se ramener au cas stationnaire en regroupant les instationnarit es dans une transformation statique. Plus pr ecis ement, on peut calculer la solution de x (t) = A(t)x(t) en cherchant dabord une transformation x = B (t)y telle que la solution transform ee y (t) v erie une equation stationnaire y = y . Dans le cas p eriodique, le th eor` eme de Floquet (voir par ex. [4, 5]) indique que la fonction matricielle B (.) est p eriodique de p eriode eventuellement double de celle de A(.). La stabilit e de la solution est alors equivalente a la stabilit ` e de puisquon a x(t) = B (t)et B (0)1 x(0) avec B (t) born ee (puisque p eriodique). On v erie facilement que dans notre exemple, les matrices B (t) et sont donn ees par : B (t) = cos t sin t sin t cos t , = 0 0 1
1 2
1 a donc pour valeur propre 2 ,` a partie r eelle positive, do` u la non Lstabilit e.
3.2.4
Initialement, les fonctions de Lyapounov ont et e introduites pour etudier la stabilit e dun point singulier. Nous avons pr ef er e pr esenter ici une d enition plus g en erale qui englobe le cas des vari et es invariantes. Supposons donc que le syst` eme (3.1) admette une vari et e invariante X0 born ee. Une fonction de Lyapounov associ ee ` a X0 est une appplication V de classe C 1 sur un ouvert U de X contenant X0 , ` a valeurs dans R+ et v eriant les propri et es suivantes (voir Fig. 3.5) : (i) V atteint son minimum dans U ;
48
V=Cte
x = min V
Fig. 3.5 Fonction de Lyapounov V pour le champ de vecteurs f : f est rentrant sur chaque ensemble de niveau de V de sorte que les courbes int egrales de f convergent vers le minimum de V qui est le point d equilibre x de f . (ii) V est non croissante le long des trajectoires de (3.1), cest-` a-dire Lf V 0 dans U 3 . Lorsque louvert U est egal ` a X tout entier et que X nest pas compact, on appelle fonction de Lyapounov propre une fonction de Lyapounov v eriant de plus la condition (iii)
x , xX
lim
V (x) = +.
Notons que la di erentiabilit e de la fonction de Lyapounov V nest pas n ecessaire et peut etre aaiblie en exigeant que la fonction V soit ` a variation born ee, ce qui sut pour d enir la d eriv ee de Lie Lf V comme une mesure de Radon n egative sur X , ou autrement dit, comme la somme dun fonction d erivable n egative ou nulle et dune combinaison d enombrable ` a coecients n egatifs ou nuls de masses de Dirac concentr ees sur des ensembles ferm es dint erieur vide de X . Lusage dune telle machinerie peut etre rendu n ecessaire lorsque le champ f nest pas partout d erivable ou, pire, est discontinu (voir par ex. Filippov [20]). Dans le cas instationnaire, la d enition pr ec edente doit etre adapt ee comme suit : dans (i), la fonction de Lyapounov V est d enie sur U R, admet un minimum uniforme par rapport ` a t dans V U et dans (ii), la d eriv ee de Lie de V le long de f = (f, 1) doit etre prise comme : Lf V = t + Lf V . Dans ce cas aussi, la r egularit e de V peut etre aaiblie. Th eor` eme 9 (LaSalle) Supposons pour simplier que X = Rn . Soit C un ensemble compact positivement invariant pour le champ de vecteurs f , contenu dans un ouvert U de X et soit V une fonction di erentiable v eriant Lf V 0 dans U . Soit W0 = {x U |Lf V = 0} et X0 le plus grand ensemble invariant par f contenu dans W0 . Alors pour toute condition initiale dans C , X0 est un attracteur, i.e. t0 Xt (C ) X0 .
Dans le cas dune dynamique discr` ete xk+1 = f (xk ) o` u f est un di eomorphisme, qui recouvre le cas de lapplication de Poincar e dune orbite p eriodique, cette derni` ere in egalit e doit etre remplac ee par V (f (x)) V (x) dans U.
3
49
Ce r esultat porte le nom de principe dinvariance de LaSalle et, dans le cas o` u la vari et e W0 est r eduite ` a un point (qui est alors n ecessairement un point singulier de f ), il est appel e seconde m ethode de Lyapounov4 . Si la fonction V est telle que lensemble V 1 (] , c]) = {x X |V (x) c}, appel e ensemble de niveau, est born e pour un r eel c bien choisi et si Lf V 0 dans X tout entier, on peut choisir C = V 1 (] , c]) qui est bien compact et positivement invariant puisque V d ecroit le long des courbes int egrales de f . Pour sp ecier la nature de la convergence, on introduit souvent les variantes suivantes de la condition (ii) : (ii) V sannule sur X0 et Lf V < 0 dans U \ X0 ; (ii) V sannule sur X0 et il existe > 0 tel que Lf V V dans U \ X0 . Une fonction de Lyapounov stricte (resp. forte) est une fonction de Lyapounov qui v erie (ii) (resp. (ii)) ` a la place de (ii). Proposition 10 Sous les hypoth` eses du Th eor` eme 9, on a : si (ii) a lieu alors X0 est un attracteur ; si (ii) a lieu, X0 est un attracteur et V (Xt (x)) et V (x) pour tout x dans un voisinage de X0 (resp. V (f k (x)) (1 )k V (x)). Exemple 25 Reprenons lexemple 16 du pendule avec un petit frottement : x 1 = x2 x 2 = g l sin x1 x2 .
Notons f (x1 , x2 ) = x2 x (g l sin x1 + x2 ) x2 le champ de vecteurs correspondant et rappelons la 1 fonction de Lyapounov (Hamiltonien) :
g 1 + (1 cos x1 ). V (x1 , x2 ) = x2 2 2 l
1 On a Lf V = x2 eni par W0 = {(x1 , x2 )|Lf V = 0 } est egal au 2 0 dans S R et lensemble d sous-espace {x2 = 0} = R. Comme V c, pour c r eel positif, implique que |x2 | 2c, on peut prendre C = (] , +[R) V 1 (] , c]), pour ]0, [, qui est bien compact et positivement invariant. Calculons le plus grand ensemble invariant par le champ f contenu dans W0 . Si lon restreint f ` a W0 , il vient f|W0 = ( g l sin x1 ) x2 qui admet comme plus grand ensemble invariant {(x1 , x2 )| sin x1 = 0, x2 = 0}, soit les deux points (0, 0) et (, 0). Or comme on a exclu le point (, 0) par le choix de < , on converge vers le point d equilibre (0, 0) correspondant au pendule immobile en position verticale vers le bas pour toutes conditions intiales dans C .
aussi appel ee m ethode directe parce quelle ne n ecessite pas de r esoudre l equation di erentielle (3.1). La dicult e est malheureusement remplac ee par la d etermination de la fonction V ! Pour certaines classes de syst` emes, comme les syst` emes Hamiltoniens dissipatifs, la fonction V peut etre d etermin ee par des consid erations physiques. Dans le cas de la proposition 9, la fonction V est lHamiltonien ( energie m ecanique). Rappelons que la premi` ere m ethode de Lyapounov concerne lexamen du signe des exposants caract eristiques (th eor` eme7).
50
La transcription de ces r esultats dans le cas o` u lensemble X0 est un point singulier (resp. point xe) ou une orbite p eriodique ne pose pas de dicult e. On dit quun point singulier (resp. xe) est exponentiellement stable sil est Lasymptotiquement stable et sil admet localement une fonction de Lyapounov forte equivalente ` a une norme au carr e, 2 t 2 autrement dit sil existe > 0 tel que Xt (x) e x pour tout x dans un voisinage du point singulier. Notons que lhypoth` ese (ii) (Lyapounov forte) ne sut pas pour garantir la stabilit e exponentielle, comme le montre lexemple suivant : Exemple 26 consid erons le syst` eme scalaire x = x3 . On v erie facilement que la fonction 2 2 x V (x) = e est une fonction de Lyapounov forte pour tout > 0, alors que les trajectoires 1 du syst` eme ne convergent pas vers 0 exponentiellement : x(t) = (2t + C ) 2 . Enn, V nest pas polyn omiale, alors que lexistence dune fonction de Lyapounov forte V quadratique surait ` a garantir la stabilit e exponentielle. Dans le cas dun point singulier (resp. dun point xe) hyperbolique, il est assez facile de faire le lien entre Lstabilit e asymptotique et existence dune fonction de Lyapounov. Th eor` eme 10 Consid erons un point singulier (resp. un point xe) x hyperbolique dun champ f . Les conditions suivantes sont equivalentes : 1. Le point singulier (resp. xe) x a tous ses exposants caract eristiques (resp. multiplicateurs caract eristiques) ` a partie r eelle strictement n egative (resp. ` a lint erieur du disque unit e). 2. Il existe une fonction de Lyapounov forte dans un voisinage de x . En outre, si lune des conditions 1 ou 2 est v eri ee, x est exponentiellement stable. Dans ce cas, on peut prendre comme fonction de Lyapounov la norme de l ecart au point singulier au carr e dans la base des vecteurs propres associ ee ` a la forme de Jordan de A : si P est la matrice de passage (i.e. telle que P AP 1 = avec diagonale dans le cas o` u A est diagonalisable), 1 2 alors la fonction V (x) = P (x x ) est une fonction de Lyapounov forte dans un voisinage susamment petit de x . cest une cons equence facile des th eor` emes 7 et 8. Il est souvent plus dicile de montrer linstabilit e dun syst` eme que sa stabilit e. Dans le cas du temps continu, les fonctions de Chetaev peuvent etre utiles ` a lanalyse des points singuliers instables. Soit donc x un point singulier du champ de vecteurs f . On dit que lapplication W de classe C 1 dun voisinage U de x dans R+ est une fonction de Chetaev (voir Fig. 3.6) si (i) U contient un c one dint erieur non vide de sommet x et de fronti` ere r eguli` ere par morceaux, tel que f soit rentrant dans sur ; (ii)
xx ,x
lim
Th eor` eme 11 Un point singulier x pour lequel une fonction de Chetaev existe est instable. En particulier, si x est hyperbolique et a au moins un exposant caract eristique ` a partie r eelle strictement positive, la fonction obtenue en prenant le carr e de la norme de la projection de x x sur le sous espace propre correspondant aux valeurs propres ` a partie r eelle positive, dans un voisinage c onique convenablement choisi, est une fonction de Chetaev.
51
f x W= Cste
Fig. 3.6 Fonction de Chetaev W pour le champ de vecteurs f : f est rentrant dans le c one sur le bord et W est croissante le long des courbes int egrales de f dans .
3.2.5
D enition 21 On dit que le champ de vecteurs (resp. le di eomorphisme) f ayant lorigine5 pour point singulier (resp. xe), est topologiquement equivalent ` a son lin earis e tangent Az sil existe un hom eomorphisme h dun voisinage U de 0 dans lui-m eme qui envoie chaque orbite de f dans une orbite de son lin earis e tangent en respectant le sens de parcours. Autrement dit, tel que Xt (h(z )) = h(eA (t,z ) z ) (resp. f k (h(z )) = h(A(k,z ) z )) pour tout z U avec fonction r eelle strictement croissante pour tout z (resp. enti` ere strictement croissante pour tout z ). On notera en particulier que les champs x et kx avec k > 0 sont topologiquement equivalents puisque, sur les orbites correspondantes, il sut de changer t en (t, x) = kt qui est bien une fonction croissante du temps. Par contre, les champs x et x ne sont pas topologiquement equivalents car, pour avoir les m emes orbites, il faudrait changer t en t et le sens de parcours des orbites ne serait pas respect e. On a vu pr ec edemment que si lorigine est un point singulier (resp. xe) hyperbolique, on peut d eterminer sa stabilit e ou son instabilit e en examinant le signe des parties r eelles (resp. le module) des valeurs propres de A, matrice du syst` eme lin earis e tangent. Dans le cas o` u A admet ` a la fois des valeurs propres ` a partie r eelle strictement positive et n egative (resp. de module strictement plus grand que 1 et plus petit que 1), on peut pr eciser le comportement local du syst` eme, toujours ` a partir du lin earis e tangent en d ecomposant lespace, dans un voisinage du point d equilibre (ou du point xe lorsquil sagit de lapplication de Poincar e dune orbite p eriodique), en vari et es stable et instable. Supposons donc que A est hyperbolique et admet k < n valeurs propres ` a partie r eelle strictement positive (respectivement de module strictement sup erieur ` a 1), compt ees avec leur multiplicit e, et n k ` a partie r eelle strictement n egative (resp. de module strictement inf erieur ` a 1), toujours compt ees avec leur multiplicit e. Le nombre total des valeurs propres ainsi d enies est n ecessairement egal ` a n en vertu de lhyperbolicit e.
5
on a vu pr ec edemment quon pouvait toujours, par changement de coordonn ees, se ramener ` a ce cas.
52
Introduisons les sous-espaces propres de A, E + , de dimension k , associ e aux valeurs propres ` a partie r eelle strictement positive (resp. de module strictement plus grand que 1) et E , de dimension n k , associ e aux valeurs propres ` a partie r eelle strictement n egative (resp. de module strictement inf erieur ` a 1). E + et E sont des sous-espaces vectoriels suppl ementaires invariants par A par + n + + d enition des sous-espaces propres : E E = R , AE E et AE E . Ainsi, pour la condition initiale z0 E 6 , on aura limt+ eAt z0 = 0 (resp. limk+ Ak z0 = 0) ce qui veut dire que E est le sous-espace stable de A. De m eme, si z0 E + , on aura At k limt+ e z0 = 0 (resp. limk+ A z0 = 0) ce qui veut dire que E + est le sous-espace instable de A. On va maintenant aner cette analyse en prolongeant cette d ecomposition pour f en sousvari et es stable et instable dans un voisinage de 0. D enition 22 On appelle vari et e stable locale du champ f au point singulier 0 la sous-vari et e
Wloc (0) = {x U | t+
(3.12)
(3.13)
Lensemble Wloc (0) correspond donc ` a lensemble des conditions initiales dans le voisinage U ` linverse, pour lesquelles les trajectoires restent enti` erement dans U et convergent vers lorigine. A + eloignent ind eniment de Wloc (0) correspond aux conditions intiales qui restent dans U et qui s lorigine.
Exemple 27 Le syst` eme x 1 = x1 + x1 x2 x 2 = x2 admet lorigine pour point singulier et son lin earis e tangent en 0 est z = 1 0 0 1 (3.14) z . Il admet
donc les deux valeurs propres 1 et 1. Clairement, si lon part dune condition initiale v eriant x1 (0) = 0, on a x 1 (0) = 0, si bien que x1 (t) = 0 pour tout t. Par ailleurs, comme x2 = et x2 (0), le ot (x1 (t), x2 (t)) converge vers lorigine lorsque t +, autrement dit W (0) = {(0, x2 )|x2 R}. De m eme, si lon part dune condition initiale v eriant x2 (0) = 0, on a x2 (t) = 0 pour tout t et x 1 = x1 , soit x1 = et x1 (0). On a donc W + (0) = {(x1 , 0)|x1 R}. Montrons que (3.14) est topologiquement equivalent ` a son lin earis e tangent en posant (t, z2 ) = x 1 t (et 1)z2 pour z2 > 1 et h(z1 , z2 ) = (z1 , z2 ). En eet, r e- ecrivons (3.14) : x = 1x 2 , soit 1 t ( x x (0)) t 2 2 x1 = x1 (0)e , et, en combinant cette expression avec x2 = e x2 (0) obtenue ` a partir de x 2 = x2 , il vient x1 = x1 (0)e (t,x2 (0)) et x2 = x2 (0)et . Comparant avec la solution du lin earis e t t tangent : z1 = e z1 (0), z2 = e z2 (0), il vient : x1 (t) = h1 (z1 ( (t, z2 (0))), z2 (t)) = z1 ( (t, z2 (0)) =
Il sagit dun abus de langage qui doit etre compris comme suit : comme E + E = Rn , toute condition intiale + + E + et z0 E . On dit alors que z0 E pour exprimer que z0 s ecrit de mani` ere unique z0 = z0 + z0 avec z0 + z0 = 0.
6
53
e (t,z2 (0) z1 (0) et x2 (t) = h2 (z1 ( (t, z2 (0))), z2 (t)) = z2 (t) = et z2 (0), do` u le r esultat en remarquant t que le sens de parcours est respect e si et seulement si t = 1 + e z2 > 0, autrement dit si z2 > 1. L equivalence a donc lieu dans le voisinage de lorigine R] 1, +[. Dans le cas dun di eomorphisme, cette d enition devient : D enition 23 On appelle vari et e stable locale du di eomorphisme f au point xe 0 la sous-vari et e
Wloc (0) = {x U | k+
(3.15)
(3.16)
On a alors le r esultat suivant : Th eor` eme 12 (Hartman et Grobman) Si 0 est un point singulier (resp. xe) hyperbolique de f , alors f est topologiquement equivalent ` a son lin earis e tangent et lhom eomorphisme correspondant pr eserve le sens de parcours. + (0) = dim E + En outre, il existe des vari et es stable et instable locales de f en 0 avec dim Wloc + a lorigine ` a E et E respectivement et ayant la m eme et dim Wloc (0) = dim E , tangentes ` r egularit e que f . La seconde partie du th eor` eme est souvent appel ee th eor` eme dHadamardPerron, comme dans le cas lin eaire. Notons quon peut prolonger ces vari et es par les formules suivantes dans le cas continu : W (0) =
t0 (0)) , Xt (Wloc
W + (0) =
t0
+ (0)) Xt (Wloc
(3.17)
W + (0) =
k 0
+ f k (Wloc (0)) .
(3.18)
Cette d ecomposition nest susante que pour une matrice A g en erique. En eet, elle exclut les cas o` u A a des valeurs propres purement imaginaires ou nulles (resp. de module 1). Lextension ` a ces cas se fait gr ace ` a lintroduction de la vari et e centre. Si 0 est un point singulier (resp. xe) de f non hyperbolique, on doit compl eter la d ecomposition pr ec edente de A en sous-espaces propres en introduisant E 0 le sous-espace propre associ e aux valeurs + 0 n 0 propres ` a partie r eelle nulle (resp. de module 1). On a alors E E E = R et E est lui aussi invariant par A. Th eor` eme 13 (Shoshitaishvili) Si le champ (resp. di eomorphisme) f est de classe C r et admet 0 pour point singulier (resp. xe), il admet des vari et es stable, instable et centre locales not ees + 0 r r r 1 Wloc (0), Wloc (0) et Wloc (0), de classe C , C et C respectivement, tangentes ` a lorigine ` a E , E+ + 0 0 et E . Wloc (0) et Wloc (0) sont d enies de mani` ere unique alors que Wloc (0) nest pas n ecessairement
54
unique. + En outre, contrairement au fait que le comportement des trajectoires restant dans Wloc (0) et Wloc (0) est donn e par le lin earis e tangent de f , le comportement des trajectoires restant localement dans 0 (0) est d la vari et e centre Wloc etermin e par les termes non lin eaires de f . Plus pr ecis ement, f est topologiquement equivalent au voisinage de lorigine au champ x1 x1 + x2 x2 + f0 (x3 ) x o` u x1 3 est un syst` eme de coordonn ees locales de E , x2 un syst` eme de coordonn ees locales de E + et o` u 0 f0 (x3 ) est la restriction de f ` a Wloc (0) (resp. f est topologiquement equivalent au voisinage de 1 lorigine au di eomorphisme (x1 , x2 , x3 ) ( 2 x1 , 2x2 , f0 (x3 ))). Indiquons comment se fait le calcul de la vari et e centre dans le cas du temps continu, la m eme technique pouvant etre transpos ee directement en temps discret. On commence par mettre A sous forme de Jordan. Dans ces coordonn ees, le syst` eme s ecrit : x = A x + f1 (x, y ) y = A0 y + f2 (x, y ) (3.19)
o` u A est la partie hyperbolique de A, A0 est le bloc regroupant toutes les valeurs propres ` a partie fi fi 0 r eelle nulle de A, correspondant au sous-espace E , et fi (0, 0) = 0, (0, 0) = (0, 0) = 0, x y i = 1, 2. 0 (0) donn Supposons la vari et e centre Wloc ee par x = h(y ), (3.20)
0 (0) doit etre tangente o` u h est une fonction C ` a d eterminer. On doit avoir h(0) = 0 et, comme Wloc h a E 0 en 0, ` (0) = 0. La dynamique sur la vari et e centre est donn ee par y
y = A0 y + f2 (h(y ), y )
(3.21)
def f 2 o` u la fonction f eme que h, v erie f 2 (y ) = f2 (h(y ), y ), de m 2 (0) = 0 et y (0) = 0. En dautres termes, si lon d eveloppe les fonctions f erie de Taylor au voisinage de 0, les termes de plus 2 et h en s
bas degr e des s eries correspondantes sont de degr e 2 en y . On note cette propri et e f2 (h(y ), y ) = 0 (0) est donc donn 0( y 2 ) et h(y ) = 0( y 2 ) au voisinage de 0. Le champ tangent ` a Wloc e` a lordre 3 2 par A0 y + f2 (0, y ) + 0( y ). 0 (0) par le ot, cest-` Pour identier les termes suivants, on utilise linvariance de Wloc a-dire d (x h(y )) = 0, ou encore : dt A h(y ) + f1 (h(y ), y ) h (A0 y + f2 (h(y ), y )) = 0 . y
(2)
(3.22)
Si lon pose h(y ) = h(2) y 2 + 0( y 3 ), fi (0, y ) = fi y 2 + 0( y 3 ), o` u y 2 repr esente le vecteur de tous les mon omes de degr e 2 form es ` a partir des composantes de y . On v erie facilement que h(2) doit v erier l equation h(2) y 2 (2) A h(2) y 2 + f1 y 2 = A0 y y
55
et par la m eme m ethode, on identie les coecients des puissances successives de h (voir lexemple 28 plus loin). Notons quon na par cette m ethode quune approximation polyn omiale de la vari et e centre, et que, si lon a tous les termes de la s erie de Taylor, cette derni` ere nest pas n ecessairement convergente. Cette approche sav` ere cependant susante dans plusieurs applications que nous rencontrerons plus loin. Notons que la stabilit e de la dynamique centrale conditionne la stabilit e de la dynamique hyperbolique et que dautre part, cette stabilit e ne peut pas etre exponentielle puisquelle correspond aux valeurs propres non hyperboliques. Ainsi, on peut interpr eter localement la vari et e centre comme donnant les coordonn ees dans lesquelles la dynamique se d ecompose en partie rapide (hyperbolique) et lente (centrale). On d emontre facilement que la m ethode des perturbations singuli` eres en est un cas particulier : on consid` ere un syst` eme sous la forme x = f (x, ) . (3.23)
Pour se mettre sous la forme pr ec edente, on augmente l etat en ajoutant = 0. On suppose par ailleurs que f (0, 0) = 0 et que pour = 0, le lin earis e tangent de f admet les sous-espaces propres E , E + et E 0 . On est alors ramen es ` a la construction pr ec edente en d ecomposant f au voisinage de (0, 0) en sous-vari et es invariantes hyperbolique et centre, en partant de la forme (P x, ) = (x1 , x2 , ), avec P matrice des vecteurs propres associ ee ` a la d ecomposition de Jordan de la matrice du lin earis e tangent de f et 1 = A x1 + f1 (x1 , x2 , ) x x 2 = A0 x2 + f2 (x1 , x2 , ) (3.24) = 0 et en posant x1 = h(x2 , ) . (3.25) Le reste du d eveloppement se conduit exactement comme ci-dessus. Le th eor` eme de la vari et e centre arme alors que le syst` eme (3.23) est au moins topologiquement equivalent au syst` eme x 1 = A x1 x 2 = A0 x2 + f2 (h(x2 , 0), x2 , 0) (3.26)
o` u la variable lente est x2 et la variable rapide x1 . Si cette derni` ere est stable pour tout x2 dans la vari et e centre, la stabilit e du point singulier (0, 0) d epend enti` erement de la stabilit e de sa projection sur la vari et e centre. On retrouve ainsi la version locale du th eor` eme de Tykhonov [58]. Notons que cette d ecomposition ne n ecessite pas de mettre en evidence des coordonn ees telles que (3.23) soit di eomorphe ` a: = g1 (, , ) = g2 (, , ) o` u le r ole que lon fait jouer au param` etre est un peu articiel, sauf si le probl` eme se pose directement sous cette forme. Le m eme genre de m ethode sapplique aussi au cas de la moyennisation, i.e. lorsque le syst` eme evolue sur un tore ou un cylindre et que lon peut d ecoupler sa dynamique moyenne de sa dynamique oscillatoire (voir par ex. [25]).
56
Exemple 28 Consid erons le syst` eme en dimension 2 x 1 = x1 + f1 (x1 , x2 ) x 2 = f2 (x1 , x2 ) fi (0, 0) = 0 pour i, j = 1, 2. xj Le lin earis e tangent est donc donn e par o` u f1 et f2 v erient : fi (0, 0) = 0 et z = 1 0 0 0 def z = Az . (3.28) (3.27)
Les deux valeurs propres de A sont donc 1 = 1 et 2 = 0. Dapr` es le th eor` eme de la vari et e centre, on peut trouver une vari et e invariante x1 = h(x2 ) que lon va calculer. Posons, comme 3 pr ec edemment, h(x2 ) = h2 x2 + h x 3 2 + . . . au voisinage de 0. On a : 2 x 1 = x1 + f1 (x1 , x2 ) = avec fi ((h(x2 ), x2 ) = dh f2 (x1 , x2 ). dx2 i = 1, 2.
1 2 fi 2 fi 4 (0)x3 (0)x2 2 + O ( x2 ) 2+ 2 2 x2 x1 x2
En rempla cant x1 par h(x2 ) et identiant les termes polynomiaux de degr e 2, puis 3, etc., on obtient l equation approch ee de la vari et e centre (les calculs sont simples mais p enibles et ne sont pas d etaill es ici) : x1 = h(x2 ) = 1 2 f1 1 (0)x2 2+ 2 2 x2 2 2 f1 2 f2 (0) (0) x1 x2 x2 2 2 f1 4 (0)x3 2 + O ( x2 ) x2 2
La dynamique centrale a donc pour terme de plus bas degr e un terme quadratique. Posons a = 1 2 f2 ee de la dynamique centrale est donc donn ee par 2 x2 (0) et supposons a = 0. La solution approch
2
x2 (t) = (x2 (0)1 at)1 pour x2 (0) susamment petit. Cette solution nest pas L-stable dans un voisinage de 0 car les trajectoires ne tendent vers 0 que si le signe de x2 (0) est loppos e de celui de a et explosent en 1 temps ni T = ax2 dans le cas contraire. Si par contre a = 0 , la dynamique centrale est donn ee (0) a lordre 4 par ` 2 f2 4 x 2 = (0)x3 2 + O ( x2 ) x1 x2
f2 qui est stable si x (0) < 0 et instable sinon. 1 x2 Il r esulte de cette analyse et du th eor` eme 13 que si a > 0 (resp. a < 0), le syst` eme (3.27) nest 2 f2 pas L-stable, et si a = 0 et x1 x2 (0) < 0 le syst` eme (3.27) est stable pour tout x2 susamment petit.
2
Chapitre 4
La commandabilit e fait partie des propri et es dites structurelles qui caract erisent les syst` emes, et eventuellement permettent de les classier, par leurs propri et es alg ebriques et g eom etriques. Elle est indispensable dans les applications pour quun syst` eme puisse etre convenablement command e mais ne permet cependant pas de construire des lois de commande de fa con eective, sauf eventuellement dans le cas des syst` emes lin eaires. Cependant, elle sert dintroduction ` a de nombreuses questions dune grande importance pratique, comme la planication de trajectoires. Comme dans les chapitres pr ec edents, on insiste sur lexistence de coordonn ees particuli` eres o` u la propri et e de commandabilit e est directement lisible, et dans lesquelles le syst` eme sexprime sous forme canonique. Cette approche ne s etend malheureusement pas directement au cas non lin eaire, etudi e dans la suite de ce chapitre, mais sav` ere n eanmoins int eressante, notamment pour donner des conditions n ecessaires de commandabilit e. Pour une analyse plus d etaill ee des aspects structurels des syst` emes lin eaires, et en particulier, leur commandabilit e, observabilit e et applications ` a la conception de lois de commande, on pourra se reporter ` a [34, 55, 62, 63] et pour les questions dalg` ebre lin eaire sous-jacentes, ` a [23].
4.1.1
Consid erons le syst` eme lin eaire o` u x Rn est le vecteur d etat et u Rm est le vecteur des entr ees. Clairement, la matrice A est de taille n n et B de taille n m. D enition 24 On dit que la paire (A, B ) ou encore que le syst` eme est commandable si, etant donn es un instant T > 0 et deux points quelconques x0 et xT de Rn , il existe une fonction du temps tu (t) de [0, T ] dans Rm continue par morceaux, telle que la solution x (t) de (4.1) engendr ee par u et ayant pour condition initiale x (0) = x0 , v erie x (T ) = xT . 57
58 Autrement dit :
eAT x0 +
0
eA(T t) B u (t)dt = xT .
(4.2)
Cette propri et e ne d epend en fait que des matrices A et B comme le montre le crit` ere suivant d ua ` Kalman : Th eor` eme 14 Une condition n ecessaire et susante pour que le syst` eme (4.1) soit commandable est que le rang de la matrice blocs C= soit egal ` a n. la matrice C est appel ee matrice de commandabilit e de Kalman. Elle est de taille n nm. Preuve. On peut, sans perte de g en eralit e, se ramener au cas o` u x0 = 0. En eet, il sut de changer xT en yT = xT eAT x0 puisqualors on doit trouver u tel que
T 0
. . . B. .AB . .. .An1 B
(4.3)
qui nest autre que (4.2). Consid erons la matrice C (t) = eA(T t) B o` u A et B sont les matrices transpos ees de A et B T et supposons pour un instant que la matrice G = 0 C (t)C (t)dt, de taille n n, est inversible. Il sut alors de poser u (t) = B eA (T t) G1 yT . (4.4) En eet, on v erie sans dicult e que u est continue et que
T 0
eA(T t) B u (t)dt =
0
eA(T t) BB eA (T t) G1 yT dt = GG1 yT = yT
et donc que u r ealise la trajectoire cherch ee. Il sut donc de montrer que linversibilit e de G equivaut ` a rang (C) = n. On va raisonner par labsurde et supposer que G nest pas inversible. Dans ce cas, il existe un vecteur v Rn , v = 0, tel que v G = 0. En multipliant ` a droite par v , il vient v Gv =
0 T
v C (t)C (t)vdt = 0.
Comme v C (t)C (t)v est une forme quadratique non n egative, lint egrale ne peut etre nulle sans que v C (t)C (t)v = 0 pour tout t [0, T ], ou encore sans que v C (t) = 0 pour tout t [0, T ]. Or cette derni` ere relation s ecrit v eA(T t) B = 0 et, par d enition de lexponentielle de matrice, i (T t) v I + Ai B = 0. i!
i1
59
Ce polyn ome de T t etant identiquement nul, chaque mon ome lest aussi, si bien que v B = 0 et i v A B = 0 pour tout i 1. Mais alors v C = 0 avec v = 0 et donc le rang de C ne peut etre egal ` a n. Inversement, si le rang de C est strictement inf erieur ` a n, il existe un vecteur v non nul tel que i v C = 0 et donc v A B = 0 pour tout i = 0, . . . , n 1. Or, utilisant le Th eor` eme de Cayley-Hamilton [23], toutes les puissances de A sup erieures ou egales ` a n sont des combinaisons des puissances de A entre 0 et n 1. Comme v B = v AB = . . . = v An1 B = 0, il vient que v Ai B = 0 pour tout i et donc, remontant les calculs pr ec edents, que v G = 0, ce qui implique que G nest pas inversible, do` u le r esultat.
Exemple 29 Le syst` eme ` a 1 entr ee et 2 etats x 1 = x2 x 2 = u est commandable : B = 0 1 ,A= 0 1 0 0 ,C= 0 1 1 0 et rang (C) = 2.
Exemple 30 Le syst` eme ` a 1 entr ee et 2 etats x 1 = u x 2 = u 1 0 0 0 1 et rang (C) = 1. Notons que ,C= ,A= 1 0 0 0 1 le vecteur v de la d emonstration du Th eor` eme 14 peut etre choisi ici v = (1, 1) et fournit une d combinaison des etats ind ependante de lentr ee : v x = x1 x2 est telle que dt vx=x 1 x 2 = 0, autrement dit, lexpression x1 x2 ne d epend que des conditions intiales et ne peut etre modi ee au cours du temps par lentr ee. Cest pr ecis ement ce qui caract erise un syst` eme non commandable. nest pas commandable : B =
4.1.2
La notion de forme canonique fait r ef erence ` a une classication qui elle-m eme fait r ef erence ` une relation d a equivalence : on commence par d ecrire les syst` emes qui sont equivalents entre eux, puis on d etermine les repr esentants (donn es par leur forme canonique) de toutes les classes disjointes. D enition 25 On dit que 2 syst` emes x = Ax + Bu et z = F z + Gv sont equivalents par changement de base et bouclage sil existe deux matrices M et L inversibles et une matrice K telles que si x et u satisfont x = Ax + Bu et si z = M x et v = Kx + Lu, alors z et v satisfont z = F z + Gv , et inversement. M est la matrice de changement de base, inversible de taille n n, et K et L sont les matrices du bouclage, avec L de taille m m inversible et K de taille m n.
60
De linversibilit e de M et de L, on d eduit imm ediatement que 2 syst` emes equivalents ont m emes dimensions d etat et dentr ees. Pour exprimer que cette equivalence ne d epend que des matrices des 2 syst` emes, on dit aussi que les paires (A, B ) et (F, G) sont equivalentes. La d enition 25 correspond bien ` a une relation d equivalence : elle est trivialement r eexive et transitive. Montrons la sym etrie : sil existe M , K et L tels que x = Ax + Bu soit equivalent ` a z = F z + Gv , avec z = M x et v = Kx + Lu, la transformation sym etrique existe bien puisque x = M 1 z et u = L1 KM 1 z + L1 v . Notons que M , K et L sont caract eris es par les formules F = M (A BL1 K )M 1 , G = M BL1 .
En eet, z = Mx = M (Ax + Bu) = M (Ax + BL1 (v Kx)) = M (A BL1 K )M 1 z + M BL1 v , do` u le r esultat. Les formules inverses donnent : A = M 1 (F M + GK ), B = M 1 GL. Pour simplier, dans un premier temps, etudions le cas mono-entr ee (m = 1). Nous allons montrer que tout syst` eme commandable ` a une entr ee est equivalent par changement de base et bouclage ` a un syst` eme particuli` erement simple dit canonique. Dans ce cas, B est un vecteur que lon va noter b pour eviter toute confusion. Le syst` eme s ecrit donc x = Ax + bu. . . . n1 On sait quil est commandable si et seulement si le rang de C = b. .Ab. ..... .A b est egal ` a n. Comme cette matrice comporte exactement n colonnes, celles-ci sont n ecessairement ind ependantes, ce qui veut dire que b est un vecteur cyclique de A (voir [23]), autrement dit, les vecteurs {b, Ab, . . . , An1 b} forment une base de Rn , isomorphe ` a la base canonique orthonorm ee de Rn dont le i` eme vecteur est form e de n 1 z eros et dun seul 1 dans la i` eme position. Cette base canonique est elle-m eme engendr ee par le vecteur cyclique g de la matrice F donn es par 0 0 1 0 ... 0 0 0 0 1 0 . . . . . . . g= . , F = (4.5) . . . . . 0 0 0 0 1 0 0 0 ... 0 1 Posons z = F z + gv et montrons que ce dernier est equivalent au syst` eme de d epart, autrement dit quil existe des matrices M et K et un scalaire L tels que si z = M x et v = Kx + Lu, alors z v erie z = F z + gv , ou encore z 1 = z2 . . . (4.6) z n1 = zn z n = v. Posons M1 = que 1 0 ... 0 M , la 1` ere ligne de la matrice M cherch ee, et choisissons-la de sorte (4.7)
0 0 ... 1
61
existe bien. (n1) On peut alors traduire (4.6) par z1 = M1 x, z 1 = M1 (Ax+bu) = M1 Ax = z2 , . . ., z n1 = z1 = (n) n 2 n 1 n 1 n n 1 M1 A (Ax + bu) = M1 A x = zn et z1 = z n = M1 A (Ax + bu) = M1 A x + M1 A bu = M1 An x + u, ce qui montre que pour M1 M1 A M = (4.9) . . . M1 An1 on a z i = z1 = zi+1 pour i = 1, . . . , n 1 et z n = M1 An x + u. Posons alors v = M 1 An x + u et K = M1 An , L = 1. On a bien construit les matrices M , K et L cherch ees qui transforment le syst` eme x = Ax + bu en le syst` eme, dit canonique, z = F z + gv , o` u F et g sont donn es par (4.5). Notons que cette construction est eective : on commence par former la matrice C. On calcule ensuite M1 = 0 0 . . . 1 C1 , puis chaque ligne de la matrice M , M1 Ai , en multipliant la pr ec edente ` a droite par A. Enfn, on a K = M1 An et L = 1. Dans le cas multi-variable (m > 1), la forme canonique se construit par blocs, chacun des blocs ayant la m eme structure que F et g et ayant m eme dimension que lespace cyclique engendr e par chacune des colonnes de B . Indiquons rapidement, avec d enoncer le th eor` eme ci-dessous, comment on calcule la dimension de chacun des blocs. Notons bi la i` eme colonne de B et ecrivons la matrice de commandabilit e sous la forme : C= b1 . . . bm Ab1 . . . Abm . . . An1 b1 . . . An1 bm .
(i)
Etablissons la liste de toutes les colonnes ind ependantes de C en partant de b1 et en progressant vers la droite, par elimination des colonnes lin eairement d ependantes de toutes celles d ej` a selectionn ees a gauche. Comme rang (B ) = m, les m premi` ` eres colonnes de C font n ecessairement parti de cette liste et la liste compl` ete ainsi construite, not ee C, C= b1 Ab1 . . . An1 1 b1 . . . bm Abm . . . Anm 1 bm
comprend exactement n colonnes ind ependantes si la paire (A, B ) est commandable. Les entiers n1 , . . . , nm ainsi d enis sont donc tels que 1 ni n pour tout i = 1, . . . , m et n1 + . . . + nm = n. On peut montrer quils sont invariants par changement de base et bouclage, cest-` a-dire que deux syst` emes commandables equivalents par changement de base et bouclage ont la m eme suite dentiers {n1 , . . . , nm }, ` a une permutation eventuelle pr` es. Ces entiers remarquables ni sont appel es indices de commandabilit e, ou indices de Brunovsky. Th eor` eme 15 (Brunovsky) Tout syst` eme lin eaire commandable ` a n etats et m entr ees, correspondant ` a une paire (A, B ), est equivalent ` a sa forme canonique F = diag{F1 , . . . , Fm }, G = diag{g1 , . . . , gm } o` u chacune des paires Fi , gi est de la forme (4.5), i = 1, . . . , m, avec Fi de taille ni ni et gi de taille ni 1, les entiers n1 , . . . , nm etant les indices de commandabilit e de (A, B ), et v eriant 1 ni n et m n = n . i=1 i
62
On trouvera la d emonstration de ce Th eor` eme et la construction des matrices M, L, K , comparable a celle pr ` esent ee dans le cas m = 1, dans [8, 34, 55, 62, 63]. Les cons equences de ce r esultat sont tr` es importantes puisqu` a laide de la forme canonique on peut facilement planier des trajectoires et concevoir des bouclages. Nous allons en montrer un exemple dans le cas mono-entr ee pour simplier. Planication de trajectoires Reprenons le syst` eme ` a n etats, ` a 1 entr ee, commandable, x = Ax + bu. Ce syst` eme etant equivalent ` az = F z + gv avec z = M x, v = Kx + Lu, si lon veut aller dun point x(0) = x0 ` a un point x(T ) = xT , partant ` a linstant 0 avec la commande u(0) = u0 et arrivant ` a linstant T avec la commande u(T ) = uT , il sut de traduire ces conditions sur z et v : z (0) = M x0 , v (0) = Kx0 + Lu0 , z (T ) = M xT , v (T ) = KxT + LuT , (4.10)
puis de remarquer ` a partir de (4.5) que la premi` ere composante de z , que lon rebaptise y pour plus de clart e, v erie y (i) = zi+1 , i = 0, . . . , n 1, y (n) = v
y avec la notation y (i) = d . Ainsi, les conditions (4.10) sinterpr etent comme des conditions sur les dti d eriv ees successives de y jusqu` a lordre n aux instants 0 et T . Par cons equent, si lon se donne une courbe n fois di erentiable t [0, T ] yref (t) R, v eriant les conditions initiales et nales (4.10), lensemble des autres variables du syst` eme sen d eduiront par simple d erivation, et sans int egrer les equations du syst` eme. En particulier, lentr ee v sera obtenue en d erivant n fois yref par rapport au temps et la commande uref sen d eduira par uref = L1 KM 1 zref + L1 vref , (n1) avec zref = (yref , y ref , . . . , yref ). De m eme la trajectoire de xref sobtient par xref = M 1 zref et lentr ee uref ainsi obtenue r ealise exactement x ref = Axref + buref . Reste ` a trouver une telle courbe yref . Or utilisant la th eorie de linterpolation, on peut trouver un polyn ome du temps de degr e au moins egal ` a 2n + 1 tel que les n + 1 conditions intiales et les n + 1 nales soient v eri ees, et qui, en tant que polyn ome de degr e 2n + 1, sera automatiquement n fois di erentiable : 2n+1 t i yref (t) = ai . T i=0
i
Les coecients a0 , . . . , a2n+1 se calculent en egalant les d eriv ees successives de yref prises aux instants 0 et T aux conditions initiales et nales respectivement : yref (t) = soit, en t = 0 : yref (0) = a0 , yref (0) =
(k ) (k )
1 Tk
2n+1
i(i 1) (i k + 1)ai
i=k
t T
ik
k! ak , k = 1, . . . , n 1, Tk
vref (0) =
n! an , Tn
(4.11)
63
yref (T ) =
i=0
ai ,
(k ) yref (T )
1 = k T
2n+1
1 vref (T ) = n T
i! ai , k = 1, . . . , n 1, (i k )!
(4.12)
i! ai (i n)!
ce qui fait au total 2n + 2 equations lin eaires en les 2n + 2 coecients a0 , . . . , a2n+1 , qui peuvent en fait se ramener ` a n+1 equations lin eaires en les n + 1 coecients inconnus an+1 , . . . , a2n+1 , puisque les n + 1 premi` eres equations (4.11) sont r esolues en a0 , . . . , an : a0 = yref (0) , ak = T k (k ) y (0) , k = 1, . . . , n 1, k ! ref an = Tn vref (0). n!
Notons que le syst` eme lin eaire (4.12) a toujours une solution unique car on peut l ecrire
n i=0 ai n i=k
...
(2n+1)! (n+1)!
yref (T ) . . .
i! a i (ik)!
T n vref (T ) n!an
et la matrice de gauche a toutes ses colonnes ind ependantes, ce qui ach` eve la construction de la trajectoire de r ef erence. Suivi de trajectoire, placement de p oles Montrons maintenant comment on peut aussi utiliser la forme canonique pour concevoir des bouclages : reprenons le syst` eme canonique sous la forme y (n) = v. Supposons que l etat complet x est mesur e` a tout instant. Si on d esire suivre la trajectoire yref , (n) telle que yref = vref , quon vient de construire, et que le syst` eme est soumis ` a des perturbations non mod elis ees, l ecart entre la trajectoire r eelle et sa r ef erence est donn ee par e = y yref et v erie ( n ) e = v vref . Notons que si lon mesure l etat x, on est en mesure de calculer ` a chaque instant cet ecart et de sen servir pour ramener cet ecart ` a 0. 1 (i) Posons v vref = n etant choisis arbitrairement. Le syst` eme de l ecart i=0 Ki e , les gains Ki devient
n1
e(n) =
i=0
Ki e(i)
64 ou matriciellement
e . . . e(n) =
0 0 . . .
1 0
0 1 .. .
... .. .
0 0
0 0 0 1 K0 K1 K2 . . . Kn1
e e . . . e(n1)
On v erie facilement que les gains Ki sont les coecients du polyn ome caract eristique de la matrice ainsi construite, si bien quon peut placer les valeurs propres1 o` u lon veut dans le plan complexe en choisissant convenablement les gains. Si les gains sont choisis de sorte que toutes les racines du polyn ome caract eristique sont ` a partie r eelle n egative, appliquant les r esultats du Chapitre pr ec edent, la dynamique de l ecart est exponentiellement stable. On a montr e au passage, dans la cas m = 1, limportant r esultat suivant : Th eor` eme 16 Si le syst` eme x = Ax + Bu est commandable, on peut placer les valeurs propres de la matrice A + BK du syst` eme boucl e par un bouclage d etat u = Kx ad equat, de fa con arbitraire dans le plan complexe. Preuve. La g en eralisation de la construction ci-dessus pour m quelconque se fait de la m eme mani` ere. La d emonstration pr ecise est laiss ee au lecteur. On a donc lexistence dune matrice de gains K telle que si v = Kz , la matrice du syst` eme boucl e F + GK a ses valeurs propres arbitrairement plac ees dans le plan complexe. Comme v = Kz = Kx + Lu, il vient, avec z = M x, que u = L1 (KM K )x et donc que le syst` eme boucl e dans les coordonn ees de d epart est donn e par x = (A + BL1 (KM K ))x. En utilisant de nouveau z = M x, il vient M (A + BL1 (KM K ))M 1 = F + GK et donc A + BL1 (KM K ) et F + GK sont semblables. Elles ont donc m emes valeurs propres, ce qui prouve qu etant donn ee une suite arbitraire de n 1 valeurs propres, le gain L (KM K ) assure que la matrice boucl ee A + BL1 (KM K ) admet exactement cette suite comme valeurs propres.
Corollaire 2 Un syst` eme lin eaire commandable est stabilisable et, par bouclage d etat, on peut r egler ses exposants caract eristiques de fa con arbitraire.
4.2
Consid erons maintenant un syst` eme non lin eaire x = f (x, u) (4.13)
o` u l etat x appartient ` a un ouvert de Rn et lentr ee u est de dimension m. On peut d enir plusieurs notions de commandabilit e. La notion la plus proche de ce qui pr ec` ede, mais la plus restrictive, concerne la commandabilit e locale autour dun point d equilibre ( x, u ), i.e. tel que f ( x, u ) = 0.
1
souvent appel ees en automatique les p oles en r ef erence ` a la repr esentation transfert du syst` eme
65
4.2.1
D enissons alors le syst` eme lin earis e tangent au point d equilibre x , u par x = Ax + Bu , A= f ( x, u ) , x B= f ( x, u ). u (4.14)
D enition 26 On dit que le syst` eme (4.13) est commandable au premier ordre au point d equilibre ( x, u ) si le rang de C, d eni par (4.3), est egal ` a n. Une autre d enition possible est la suivante : D enition 27 Le syst` eme (4.13) est localement commandable au point d equilibre ( x, u ) si pour tout > 0 il existe > 0 tel que pour toute paire de points (x0 , x1 ) Rn Rn v eriant x0 x < et x1 x < , il existe une commande u continue par morceaux sur [0, ] telle que u (t) < t [0, ] et X (x0 , u ) = x1 , o` u lon a not e X (x0 , u ) la solution de (4.13) ` a linstant , g en er ee ` a partir de x0 ` a linstant 0 et par la commande u . Autrement dit, le syst` eme est localement commandable au point d equilibre ( x, u ) si lon peut aller dun point ` a un autre situ es tous deux susamment pr` es du point d equilibre en une dur ee arbitrairement courte et avec une commande susamment petite. On peut d emontrer le Th eor` eme 17 Si le syst` eme (4.13) est commandable au premier ordre au point d equilibre ( x, u ), il est localement commandable en ( x, u ). Notons que le syst` eme (4.13) peut tr` es bien etre localement commandable sans etre commandable au premier ordre. En eet, le syst` eme en dimension 1 : x = u3 est localement commandable. Pour aller de x0 ` a x1 en une dur ee T = , x0 et x1 quelconques proches de 0, on peut, par la m ethode de planication de trajectoire du paragraphe 4.1.2, choisir nimporte quelle courbe di erentiable du temps x(t), passant par ces deux points aux instants respectifs t 2 t 0 et et arrivant ` a vitesse nulle, par exemple x(t) = x0 + (x1 x0 ) 3 2 , et en d eduire 1 1 x x t t 3 (t) 3 = 6 1 0 u(t) = x 1 . On v erie facilement, en outre, que si |x0 | < et |x1 | <
avec < 12 alors |u(t)| < , do` u la commandabilit e locale. Par contre, au point d equilibre (0, 0), le lin earis e tangent est donn e par x = 0, et le syst` eme nest pas commandable au premier ordre.
4
4.2.2
Supposons pour simplier que le champ f de (4.13) est ane en la commande, autrement dit que le syst` eme (4.13) est donn e par
m
x = f0 (x) +
i=1
ui fi (x)
(4.15)
avec f0 (0) = 0, de sorte que x = 0 et u = 0 est un point d equilibre. ` partir des champs de vecteurs f0 , . . . , fm , nous allons construire la suite de distributions A suivante : D0 = e.v.{f1 , . . . , fm } , Di+1 = [f0 , Di ] + Di , i 1 (4.16)
66
oture involutive de la distribution Di . o` u Di est la cl Dans toute la suite, on supposera quil existe un ouvert de X = Rn dans lequel toutes les distributions consid er ees sont de rang constant. Proposition 11 La suite des distributions Di est non d ecroissante, i.e. Di Di+1 pour tout i, et il existe un entier k et une distribution involutive D tels que Dk = Dk +r = D pour tout r 0. En outre, D jouit des deux propri et es suivantes : (i) e.v.{f1 , . . . , fm } D (ii) [f0 , D ] D . evidente. Comme par ailleurs, Di TX pour tout i, la Preuve. la non d ecroissance des Di est suite admet un plus grand el ement D , qui est involutif par construction. De plus, dim Tx X = n et, dans un ouvert U choisi de telle sorte que tous les Di sont de rang constant dans U pour i = 0, . . . , n, si lespace vectoriel Di (x) nest pas egal ` a Di+1 (x), on a dim Di+1 (x) dim Di (x) + 1 dans U . On en d eduit imm ediatement quil existe un entier k n tel que Dk +1 = Dk = D . La propri et e (i) est une cons equence imm ediate de D0 D . En ce qui concerne (ii), on a Dk +1 = [f0 , Dk ] + Dk , soit D = [f0 , D ] + D , ce qui prouve (ii) et ce qui ach` eve de prouver la proposition. La propri et e (ii) est appel ee invariance de D par f0 . On a alors la caract erisation suivante de D : Proposition 12 Soit D une distribution involutive de rang constant egal ` a k dans un ouvert U et v eriant (i) et (ii). Alors il existe un di eomorphisme tel que, si lon pose i = i (x) pour i = 1, . . . , k et j = k+j (x) pour j = 1, . . . , n k , le champ de vecteurs f0 admet la d ecomposition suivante : k nk f0 ( ) = i (, ) + (4.17) k+i ( ) i i
i=1 i=1
Preuve. Comme D est involutive et de rang egal ` a k dans U , le Th eor` eme de Frobenius garantit lexistence dun di eomorphsime tel que la distribution D soit transform ee en D = e.v.{ Dans ces coordonn ees, f0 s ecrit
k
,..., }. 1 n
f0 (, ) =
i=1
i (, ) + i
nk
k+i (, )
i=1
(4.18)
o` u les fonctions i , i = 1, . . . , n sont de classe C par rapport ` a (, ). Comme [f0 , D] D, le crochet [ f0 , ] doit e tre une combinaison lin e aire des pour j = 1, . . . , k , soit j i f0 , = i
k
i,j (, )
j =1
(4.19)
67
do` u, en utilisant (4.18) avec, comme cons equence du redressement, [ , ] = 0 pour tout i, j et i j [ , ] = 0 pour tout i, j , on a i j
f0 , = i
j
j =1 k j =1
, + j i j i j
nk j =1
nk
k+j
j =1
, j i
k j =1
j i j
nk j =1
k+j i j
k+j . i j
j
Or, si lon compare ` a (4.19), la partie du champ form ee dune combinaison lin eaire des etre nulle, soit : k+j = 0 , j = 1, . . . , n k , i = 1, . . . , k i
doit
ce qui montre que k+j ne d epend pas des variables 1 , . . . , k , do` u la formule (4.17), pour j = 1, . . . , n k . On a alors la condition n ecessaire de commandabilit e locale : Th eor` eme 18 Une condition n ecessaire pour que le syst` eme (4.15) avec f0 (0) = 0, soit localement commandable a ` lorigine est que la distribution D construite par la r ecurrence (4.16) v erie rang (D (x)) = n , o` u U est un voisinage de lorigine. Preuve. Supposons que rang (D (x)) = k < n, pour tout x U . Dapr` es la Proposition 12, il existe un di eomorphisme local tel que, si lon pose (, ) = (x), toujours comme dans la Proposition 12, avec dim = k et dim = n k , le champ f0 s ecrive comme (4.17) et tel que, ( , ) comme fi D , fi = k ecrit , i = 1 , . . . , m . Ainsi, le champ (f0 + m i,j j =1 i=1 ui fi ) s j
m k m
x U
f0 +
i=1
ui fi
=
j =1
j +
i=1
ui i,j
+ j
nk
k+j
j =1
et, par cons equent, le syst` eme (4.15), dans les coordonn ees (, ) devient :
m
i = i (, ) +
j =1
uj i,j (, ), i = 1, . . . n k.
i = 1, . . . k,
i = k+i ( ),
Il est alors clair que la dynamique de , ind ependante de et de u, nest pas modiable par la commande u, de sorte qu` a partir dun point initial (0 , 0 ), tout point nal atteignable v erie = n ecessairement T = ZT (0 ), o` u ZT (0 ) est le point de la courbe int egrale de ( ) en t = T , avec le vecteur dont les composantes sont k+1 , . . . , n . Tout point nal ne v eriant pas T = ZT (0 ) est donc inatteignable, ce qui contredit la commandabilit e.
68
Notons Lie{f0 , . . . , fm } lalg` ebre de Lie engendr ee par les combinaisons de f0 , . . . , fm et tous leurs crochets de Lie et Lie{f0 , . . . , fm }(x) lespace vectoriel engendr e par les vecteurs de Lie{f0 , . . . , fm } au point x . On a, par construction, D Lie{f0 , . . . , fm } mais on na pas l egalit e en g en eral. Par contre, dans le cas analytique, le r esultat suivant donne une expression (apparemment) plus directe du Th eor` eme 18. Th eor` eme 19 Supposons les m +1 champs de vecteurs f0 , . . . , fm analytiques. Si le syst` eme (4.15) est localement commandable en x = 0, u = 0, alors Lie{f0 , . . . , fm }(x) = Tx Rn , x X.
Preuve. Comme (4.15) est localement commandable en x = 0, u = 0, on a rang (D (0)) = n et lanalyticit e des champs f0 , . . . , fm implique que ce rang est constant sur tout X qui est di eomorphe n n a un ouvert de R . Par suite D (x) peut ` etre identi e` a Tx R et donc n ecessairement f0 (x) D (x) pour tout x. On en conclut que Lie{f0 , . . . , fm }(x) = D (x) pour tout x. Avant de passer ` a l etude de la r eciproque, beaucoup plus compliqu ee, donnons un exemple simple : Exemple 31 Le syst` eme de dimension 2 ` a 1 entr ee donn e par x 1 = x2 2, x 2 = u
admet nimporte quel point de R2 tel que x2 = 0 comme point d equilibre pour u = 0. Pla consnous au voisinage dun point d equilibre quelconque donn e par X0 = (x0 , 0) . Le syst` e me est 1 ane en la commande avec f0 (x1 , x2 ) = x2 et f ( x , x ) = . Remarquons quen X 1 1 2 0, 2 x1 x2 f0 = 0. Appliquons lalgorithme (4.16). On a D0 = e.v.{f1 } = e.v.{ x2 } et D0 = D0 ; D1 = e.v.{f1 , [f0 , f1 ]} = e.v.{ x , x2 x }, qui est de rang 2, est involutive tant que x2 = 0 mais 2 1 d eg en` ere en X0 : D1 (X0 ) = D0 , de rang 1. Par contre [f1 , [f0 , f1 ]] = 2 x D1 (X0 ) = D1 (X0 ), 1 2 et D = D1 (X0 ) = e.v.{ x2 , x1 } qui nest autre que lespace tangent de R . La condition de rang est donc v eri ee. Cependant, comme x 1 = x2 2 0, toute trajectoire est telle que x1 (t) est non d ecroissante et on ne peut pas, ` a partir de X0 , joindre un point X1 = ( x1 , x2 ) tel que x 1 < x1 quelque soit lhorizon de temps T . Le syst` eme nest donc pas localement commandable en X0 . Par contre, lensemble des points appartenant ` a un voisinage arbitraire de X0 et qui peuvent etre joints a partir de X0 par une trajectoire du syst` ` eme avec nimporte quelle entr ee continue par morceaux et en une dur ee T quelconque est dint erieur non vide (i.e. contient un ouvert de R2 ). La condition rang (D ) (X0 ) = 2 implique donc une propri et e plus faible que la commandabilit e locale. Cette propri et e est appel ee accessibilit e locale. D enition 28 Lensemble accessible ` a linstant T , not e RT (x0 ), est lensemble des points x de la vari et e X de dimension n tels que XT (x0 , u) = x pour u continue par morceaux sur [0, T ], o` u Xt (x0 , u) est solution du syst` eme (4.15). On dit que (4.15) est localement accessible si pour tout voisinage V de x0 dans X , RT (x0 ) V est dint erieur non vide.
69
Th eor` eme 20 Si pour tout voisinage V de x0 X , rang (D (x)) = n pour tout x V , alors le syst` eme (4.15) est localement accessible. Si en outre f0 0, alors (4.15) est localement commandable. Il existe des r esultats plus g en eraux, qui sappliquent notamment dans certains cas o` u f0 = 0, mais dont la complexit e d epasse largement le cadre de cet expos e. Le lecteur int eress e peut se r ef erer ` a [56]. Indiquons aussi que les r esultats de cette section, o` u lon sest restreint aux syst` emes anes en la commande de la forme (4.15), peuvent facilement setendre au cas plus g en eral des syst` emes de la forme (4.13) par lastuce suivante : Posons u i = vi , i = 1, . . . , m. Le syst` eme etendu s ecrit maintenant x = f (x, u) u 1 = v1 . . . u m = vm = F0 (X ) + m vi Fi (X ) avec X = (x, u), F0 (X ) = f (x, u) , Fi (X ) = qui est bien de la forme X i=1 x , i = 1 , . . . , m . Notons que, comme la vari e t e de d e nition est maintenant X U o` u U est un ui ouvert de Rm , la dimension n de la condition de rang doit etre remplac ee par n + m. Proposition 13 Si le syst` eme etendu (4.20) est localement accessible ou localement commandable, il en est de m eme du syst` eme de d epart. Preuve. Si lensemble accessible ` a linstant T engendr e par les trajectoires du syst` eme etendu est dint erieur non vide dans X U , sa projection sur X , qui nest autre que lespace accessible a linstant T du syst` ` eme de d epart, est aussi dint erieur non vide. De m eme, si le syst` eme etendu est localement commandable, il existe une trajectoire joignant deux points quelconques (x1 , u1 ) et (x2 , u2 ) dun voisinage convenablement choisi, avec une entr ee u continue par morceaux et de norme susamment petite. En int egrant cette derni` ere trajectoire, on obtient lentr ee u continue qui engendre une trajectoire du syst` eme de d epart entre x1 et x2 , do` u le r esultat.
(4.20)
Pour terminer cette section, montrons que, dans le cas des syst` emes lin eaires, les deux notions de commandabilit e au premier ordre et commandabilit e locale co ncident et equivalent au crit` ere de Kalman. Soit donc le syst` eme lin eaire (4.1) que nous r e- ecrivons
m
x = Ax +
i=1
u i bi
70
Clairement, le syst` eme etant lin eaire, il est egal ` a son lin earis e tangent donc le crit` ere de Kalman appliqu e au syst` eme lui-m eme ou ` a son lin earis e tangent donnent le m eme r esultat. n n A x Evaluons maintenant le rang de D . Posons Ax = n i=1 j =1 i,j j xi et bi = j =1 bi,j xj , i = 1, . . . , m. On a f0 (x) = Ax et fi (x) = bi , i = 1, . . . , m. Calculons lalgorithme (4.16). On a D0 = e.v.{b1 , . . . , bm } et comme les champs de vecteurs bi sont constants, [bi , bj ] = 0 pour tout i, j , ce qui prouve que D0 = D0 . Ensuite, on a [Ax, bi ] = [Ax, bi ] =
n j =1 (Abi )j xj n j =1 bi,j xj n k=1 n l=1 Ak,l xl xk
soit
= Abi . Donc
D1 = [Ax, D0 ] + D0 = e.v.{b1 , . . . , bm , Ab1 , . . . , Abm }. On v erie comme pr ec edemment que D1 est involutive puisque tous les champs qui la composent sont constants. Le m eme calcul it er e conduit ` a Dk = e.v.{b1 , . . . , bm , Ab1 , . . . , Abm , . . . , Ak b1 , . . . , Ak bm } pour tout k 1. Dapr` es la Proposition 11, il existe un entier k < n tel que Dk = D et la commandabilit e implique que rang (D (x)) = n pour tout x U , cest-` a-dire, en revenant aux . . notations matricielles B = b . ..... .b :
1 m
rang B, AB, . . . , Ak B = n avec k < n, ce qui nest rien dautre que le crit` ere de Kalman.
Chapitre 5
f 2 (x 1 , x 2 , u, )
( x 1 , x 2)
f 2(x 1, x 2, u, 0) ( x 1 , x 2)
f 1 (x 1 , X 2 (x 1 , u), u, 0)
0, 0
petit
= 0
Fig. 5.1 La dynamique de la variable x2 est beaucoup plus rapide que celle de x1 . Consid erons un syst` eme, dans des coordonn ees adapt ees (pas n ecessairement les coordonn ees dans lesquelles le mod` ele a et e obtenu), de la forme : x 1 = f1 (x1 , x2 , u, ) x 2 = f2 (x1 , x2 , u, ) (5.1)
o` u x1 est de dimension n1 , x2 de dimension n2 et est un petit param` etre, exprimant que le champ de vecteurs f2 , suppos e de classe C par rapport ` a tous ses arguments, est, dans un 71
72
voisinage ` a pr eciser, beaucoup plus grand que f1 , aussi suppos e de classe C . Le syst` eme (5.1) est dit sous forme standard. En termes d echelles de temps, introduisons le nouveau temps = t. est donc un temps beaucoup plus lent que t puisque pour tout t ni, lim0 (t) = 0. dx1 dt dx2 dt 1 1 1 2 On a aussi dx 1 = f1 (x1 , x2 , u, ) et dx 2 = 1 d = dt d = x d = dt d = x f2 (x1 , x2 , u, ), soit dx1 = f1 (x1 , x2 , u, ) d dx2 1 = f2 (x1 , x2 , u, ) d ce qui exprime que, dans l echelle de temps lente, la seconde dynamique est dordre 1 , donc rapide, alors que la premi` ere est dordre 0 en . Le fait que la dynamique de x2 soit rapide veut dire que x2 est attir e violemment vers un point d equilibre de f2 , dans un voisinage ` a d eterminer, si ce dernier est stable, ou violemment repouss e dans le cas contraire. La premi` ere etape de l etude concerne donc naturellement lensemble des points d equilibre. Cependant, avant daborder cette etude de fa con plus approfondie, remarquons que la forme (5.1) d epend de fa con cruciale du choix des coordonn ees. En eet, si lon pose : z1 = x1 + x2 , la dynamique obtenue est z1 + z2 z1 z2 z1 + z2 z1 z2 , , u, ) + f2 ( , , u, ) 2 2 2 2 z1 + z2 z1 z2 z1 + z2 z1 z2 z 2 = f1 ( , , u, ) f2 ( , , u, ) 2 2 2 2 z 1 = f1 ( et les 2 composantes de z contiennent ` a la fois des termes rapides et lents. Il nest donc pas possible dans ces coordonn ees de d eterminer directement si la dynamique peut etre d ecompos ee en une partie rapide et une partie lente. Les conditions dexistence de coordonn ees transformant un syst` eme sous la forme (5.1) et la mani` ere de les calculer d ebordent cependant du programme que nous nous sommes x e et ne seront pas abord ees ici. Revenons ` a lanalyse du comportement de (5.1). Lorsque = 0, lensemble des points d equilibre du syst` eme (5.1) est la vari et e d etermin ee par 0 = {(x1 , x2 , u)|f2 (x1 , x2 , u, 0) = 0} alors que, pour = 0, elle est donn ee par = {(x1 , x2 , u)|f1 (x1 , x2 , u, ) = 0, f2 (x1 , x2 , u, ) = 0} . Notons que est de dimension inf erieure ` a celle de 0 puisque, pour = 0, la condition f1 = 0 a disparu. Ceci justie le terme de perturbation singuli` ere : lorsque 0, la vari et e d eg en` ere en 0 . f2 Par le th eor` eme des fonctions implicites, si, dans un voisinage de 0 , x est de rang plein, egal 2 a n2 , la dimension de x2 , on peut ` ecrire 0 = {(x1 , x2 , u)|x2 = X2 (x1 , u)} . z2 = x1 x2 ,
73
0 La vari et e 0 a la propri et e importante suivante : si les conditions initiales (x0 1 , x2 , u0 ) appartiennent ` a 0 , et si = 0, alors les trajectoires du syst` eme restent enti` erement contenues dans 0 puisque (x 1, x 2 ) = (0, 0). 0 est donc une vari et e invariante. Nous allons etudier la persistance de cette vari et e invariante lorsque = 0, susamment petit et lorsque u varie lentement.
5.1
On va montrer quil existe pour tout = 0, susamment petit, une vari et e invariante, not ee 0, , proche de 0 , sur laquelle la dynamique du syst` eme est dordre , cest-` a-dire lente. Supposons que u varie lentement, cest-` a-dire v erie u = v avec v fonction du temps v eriant suptR v (t) < +. Posons 0, = {(x1 , x2 )|f2 (x1 , x2 , u, ) = 0}. Clairement, la r egularit e de f2 par rapport ` a entra ne que 0, reste proche de 0 pour petit. Dautre part, par le th eor` eme des fonctions implicites, comme rang C
f2 x2
= n2 , il existe une
fonction X 2 , de tous ses arguments, telle que pour tout u v eriant u = v , (x1 , x2 ) 0, a equivaut ` a x2 = X 2 (x1 , u, ) pour tout x1 et u dans un voisinage convenable, ou encore ` f2 (x1 , X 2 (x1 , u, ), u, ) = 0. Montrons que 0, est invariante par la dynamique lente x 1 = f1 (x1 , X 2 (x1 , u, ), u, ) u = v. En eet, comme
d dt x2
(5.2)
= f2 (x1 , X 2 (x1 , u, ), u, ) = 0 =
d dt
X 2 X 2 f1 (x1 , X 2 (x1 , u, ), u, ) + v = 0 x1 u
et donc X 2 est une int egrale premi` ere de f1 x , do` u linvariance par rapport ` a la dyna+ v u 1 mique lente. Ainsi la vari et e invariante x2 = X2 (x1 , u) obtenue, pour = 0, en annulant le champ f2 , continue dexister pour > 0 susamment petit et demeure invariante par la dynamique lente (5.2). Cest cette propri et e que nous appelons persistance. On peut en outre obtenir une approximation polyn omiale en de X 2 et de la dynamique lente (5.2). Indiquons la m ethode de calcul. Posons X 2 (x1 , u, ) = X2 (x1 , u) + X2 (x1 , u) + 0(2 ) Au premier ordre en , la dynamique lente est donn ee par
(5.3)
Th eor` eme 21 Pour tout susamment petit, si u v erie u = v avec suptR v (t) < +, et f2 a toutes ses valeurs propres a ` partie r e elle strictement n egative en tout point si la matrice x 2
74
(x1 , x2 , u, 0) dun voisinage ouvert V (0 ) de 0 , une approximation au premier ordre en de la vari et e invariante 0, , dans un voisinage de 0 , est donn ee par : x2 = X2 (x1 , u) + f2 x2
1
X2 X2 f2 f1 + v x1 u
(5.4)
et lapproximation au premier ordre de la dynamique lente par (5.3). Preuve. Pla cons-nous dans un voisinage ad equat de 0 et supposons que 0, est donn ee, au premier ordre en , par x2 = X2 (x1 , u) + X2 (x1 , u, v ) + 0(2 ) avec X2 une fonction susamment d erivable de tous ses arguments dans louvert consid er e. Pr ecisons quinvariance au premier ordre en par le ot veut dire que la fonction x2 X2 (x1 , u) X2 (x1 , u, v ) est dordre 0(2 ) le long du ot du syst` eme x 1 = f1 (x1 , X2 (x1 , u), u, 0) + 0(2 ) (5.5) x 2 = f2 (x1 , X2 (x1 , u) + X2 (x1 , u, v ), u, ) + 0(2 ) u = v. Utilisant donc linvariance au premier ordre et le fait que f2 (x1 , X2 (x1 , u), u, 0) = 0, on a : x 2 = X2 X2 (x1 , u)f1 (x1 , X2 (x1 , u), u, 0) + (x1 , u)v + 0(2 ) x1 u f2 f2 (x1 , X2 (x1 , u), u, 0)X2 (x1 , u, v ) + (x1 , X2 (x1 , u), u, 0) + 0(2 ) = x2 X2 X2 f2 f2 f1 + v= X2 + x1 u x2 ce qui, gr ace ` a linversibilit e de
f2 x2 ,
Revenons sur linterpr etation en termes de dynamiques lente et rapide : par rapport au temps lent = t, le syst` eme (5.5) devient : dx1 = f1 (x1 , X2 (x1 , u), u, 0) + 0() d dx2 1 = f2 (x1 , X2 (x1 , u) + X2 (x1 , u, v ), u, 0) + 0() . d La vari et e invariante, suppos ee attractive, joue donc le r ole suivant : pour toute condition initiale ede la proche de 0, , la dynamique rapide converge ` a grande vitesse (dordre 1 ) vers 0, puis c` place ` a la dynamique lente dont le ot, au moins sur un intervalle de temps petit, reste sur 0, (vari et e invariante). En outre, les ots rapide et lent, pour petit, sont localement des petites d eformations des ots lent et rapide pour = 0 (voir gure 5.1). On peut aussi reformuler cette interpr etation sous la forme dite du Lemme de lOmbre : pour toute condition initiale dans un voisinage de 0, , les trajectoires convergent vers 0, , sans appartenir n ecessairement ` a 0, , mais peuvent etre approxim ees par des trajectoires restant dans 0, (lombre) vers lesquelles elles convergent. On va maintenant sint eresser ` a la robustesse de la stabilit e par rapport ` a .
75
5.2
Robustesse de la stabilit e
Dans le cas limite o` u = 0, m eme si la dynamique rapide (en x2 ) est stable, le syst` eme nest pas hyperbolique, alors quil lest pour = 0. Si on suppose en outre que la dynamique lente est stable, on peut se poser la question de la stabilit e asymptotique de lensemble du syst` eme dune part, et de la comparaison avec la dynamique densemble lorsque = 0, qui est hyperbolique stable, dautre part. Si la stabilit e est conserv ee lorsque 0, on dit que la stabilit e est robuste. On admettra limportant r esultat suivant :
f2 Th eor` eme 22 Si, comme pr ec edemment, la matrice x a toutes ses valeurs propres ` a partie 2 r eelle strictement n egative en tout point (x1 , x2 , u, 0) dun voisinage ouvert V (0 ) de 0 et, notant 1 F1 (x1 , u) = f1 (x1 , X2 (x1 , u), u, 0), si la matrice F a partie r eelle x1 a toutes ses valeurs propres ` strictement n egative en tout point (x1 , u) dun voisinage V1 tel que V1 X2 (V1 ) contient 0 , alors le syst` eme (5.1) est asymptotiquement stable pour tout 0 susamment petit, i.e. sa stabilit e est robuste.
Ce r esultat nest pas aussi evident quil ny para t : lorsque deux sous-syst` emes sont ind ependants, la stabilit e de chacun implique la stabilit e de lensemble. Cependant, ce r esultat nest plus vrai d` es que les deux sous-syst` emes sont coupl es car le couplage peut devenir pr epond erant dans certaines zones de lespace et sopposer ` a la partie d ecoupl ee et stable de la dynamique. Ici, on est dans le cas presque d ecoupl e dans un voisinage de 0 , ce qui nous permet dutiliser le fait quun syst` eme stable faiblement perturb e est encore stable.
5.3
La persistance de la vari et e invariante et la robustesse de la stabilit e ont une cons equence importante sur la mani` ere de mod eliser un syst` eme comportant un dynamique rapide et stable. En eet, dans la dynamique lente, on ne se sert pas, au premier ordre, de toute linformation sur la dynamique rapide. Seule la connaissance approch ee de la vari et e d equilibre est utile si lon commande la dynamique lente avec des commandes susamment lentes (u = v ). Dans ce cas, on peut r eduire la dimension du syst` eme en ne gardant que la dynamique lente (5.3), la vari et e de d epart etant, localement, remplac ee par lapproximation ` a lordre 0, 0 de la vari et e lente. Cette approche comporte au moins deux avantages, ` a condition dutiliser des commandes sufsamment lentes : travailler en dimension plus faible que la dimension du syst` eme de d epart, et se passer dune connaissance pr ecise de la dynamique rapide, g en eralement plus dicile ` a identier que la dynamique lente. Exemple 1 : Nous allons retrouver un mod` ele classique approch e (mod` ele lent) de moteur electrique ` a courant continu. Consid erons donc un moteur ` a courant continu constitu e dun stator o` u sont plac es des aimants permanents et dun rotor constitu e dune bobine dinductance L et de r esistance R, dans laquelle circule un courant I , aliment ee par une tension variable U . La force electromotrice est suppos ee lin eaire par rapport au courant et sa constante de couple est not ee K . Linertie du rotor est not eJ et la r esultante des couples ext erieurs appliqu es ` a larbre du moteur est not ee Cr . On note enn Kv la constante de frottement visqueux, ce dernier etant suppos e lin eaire par rapport ` a la vitesse de
76
rotation du moteur. Le mod` ele sobtient en ecrivant la loi dOhm (combin ee avec la loi de Lenz pour lexpression de la force electromotrice) pour la bobine dune part et le principe fondamental de la dynamique dautre part pour le bilan des couples sur larbre moteur : dI = U RI K dt d J = KI Kv Cr . dt L
(5.6)
Pour la plupart des moteurs de ce type, linductance L est petite par rapport aux autres constantes. t On va donc poser L = et r e- ecrire (5.6) en temps rapide = . dI = U RI K d d J = (KI Kv Cr ) . d On d eduit imm ediatement de ce qui pr ec` ede, que x1 = , x2 = I , u = U , et, en faisant = 0, K que la vari et e 0 est donn ee par U RI K = 0, soit I = U R . La dynamique lente est alors U K d donn ee par J d = (K ( R ) Kv Cr ) soit J d = d K2 K + Kv Cr + U R R .
En temps lent, on obtient le mod` ele lent r eduit (de dimension 1 au lieu du mod` ele initial de dimension 2) et qui ne fait pas intervenir linductance L, mais qui demande, en revanche, une bonne pr ecision sur la constante de couple K et sur K R , rapport entre la constante de couple et la r esistance : d K2 K J = + Kv Cr + U . dt R R On peut aussi continuer ` a raner lapproximation de la vari et e lente et en d eduire une fa con didentier le couple r esistant ` a condition de bien conna tre linertie et la constante de couple du moteur et de mesurer lintensit e du courant dans la bobine, la tension ` a ses bornes et la vitesse de rotation du moteur. La vari et e invariante 0, ` a lordre 1 en = L est donn ee par I= U K L K + 2 R R J K U K R Kv Cr + 0(L2 ) U
Appliquons alors la tension U = K , qui correspondrait au courant nul en r egime permanent si L etait egal ` a 0. Le courant I converge vers le courant I0 dordre L donn e par : I0 = L LK (Kv + Cr ) 2 U + 0(L2 ) 2 JR R
Ainsi, pour compenser le frottement visqueux et le couple r esistant, il faut corriger la tension U en modiant sa vitesse de variation U : si lon veut assurer I0 = 0, on doit imposer la variation de d tension (lente par rapport ` a L dt ): = K (Kv + Cr ) + 0(L) . U J
77
M eme sans connaissance pr ecise de L et R, on peut utiliser cette relation ` a lenvers pour estimer la somme des forces r esistantes en modulant U de sorte que le courant I0 reste aussi petit que possible et que la vitesse de rotation soit egale ` a0: Cr = J U + 0(L). K
Cette m ethode est en particulier utile pour mesurer le frottement sec du moteur (force de frottement qui soppose au d emarrage).
78
Chapitre 6
Commande hi erarchis ee
6.1 Principe
Consid erons pour simplier un syst` eme de dimension 2 ` a 1 entr ee, de la forme : x 1 = f1 (x1 , x2 ) x 2 = f2 (x1 , x2 ) + u (6.1)
et supposons quon veuille faire suivre ` a la variable x2 une trajectoire de r ef erence x2 donn ee, en restant dans un domaine o` u f2 (x1 , x2 ) est born e. Appliquons la commande ` a grand gain u = k eel positif (x2 x2 ), pour assez petit et k un r t ni. Le syst` eme (6.1) devient, apr` es avoir introduit le temps rapide = , dx1 = f1 (x1 , x2 ) d dx2 = f2 (x1 , x2 ) k (x2 x2 ) d
ce qui a pour eet, dapr` es le th eor` eme 21, de rendre la vari et e d equation x2 = x2 + k f2 (x1 , x2 ) invariante ` a lordre 1 en . De plus, comme k > 0, cette vari et e est attractive et la dynamique lente qui en r esulte est donn ee par dx1 = f1 (x1 , x2 ) d ce qui revient ` a commander la dynamique lente par la consigne x2 , qui devient ainsi une commande ctive du sous-syst` eme lent. En outre, la vari et e invariante peut etre rendue arbitrairement proche de x2 = x2 puisque , ` a notre disposition, peut etre choisi aussi petit quon veut. On a donc transform e un probl` eme de commande dun syst` eme de dimension 2 en deux probl` emes de commande de sous-syst` emes de dimension 1 en cascade. La boucle rapide est g en eralement appel ee boucle de bas-niveau alors que la boucle r ealis ee ` a partir de la consigne x2 , que nous navons pas d etaill ee ici, sappelle boucle de haut-niveau. Notons que la boucle de hautniveau doit respecter l echelle de temps lente pour conserver le d ecouplage lent-rapide. Clairement, cette construction s etend ` a des syst` emes de dimension quelconque ` a condition quils aient une structure triangulaire comparable ` a celle de (6.1).
79
80
6.2
On va montrer comment utiliser les r esultats pr ec edents pour le suivi de trajectoire robuste dun syst` eme ayant une dynamique mal connue. La m ethode consiste ` a construire un bouclage par retour Proportionnel-Int egral nonlin eaire hi erarchis e. Consid erons le syst` eme non lin eaire mono-entr ee x 1 = f1 (x1 ) + x2 x 2 = f2 (x1 , x2 ) + g (x1 , x2 )u (6.2)
avec g (x1 , x2 ) > 0 pour tout x1 , x2 . On suppose que lon mesure x1 et x2 mais que f1 , f2 et g sont imparfaitement connus. Ces trois fonctions sont par ailleurs suppos ees globalement lipschitziennes. Notons que la condition g (x1 , x2 ) > 0 pour tout x1 , x2 pourrait etre aaiblie au prix dune complexit e plus grande, qui risquerait dobscurcir notre propos. Ajoutons un int egrateur donn e par z = x1 , soit z = x1 x 1 = f1 (x1 ) + x2 x 2 = f2 (x1 , x2 ) + g (x1 , x2 )u. (6.3)
On veut suivre une trajectoire de r ef erence (z , x erie les equations approch ees du 1 , x2 ) qui v syst` eme : z = x 1 (6.4) x = f 1 (x1 ) + x2 1 x 2 = f2 (x1 , x2 ) + g (x , x ) u 1 2
o` uf a la connaissance que lon a de f1 , l ecart f1 f etant suppos e petit et l ecart 1 correspond ` 1 entre leurs d eriv ees par rapport ` a x1 , f1 f1 , etant suppos e born e. Nous ne nous servirons pas, en fait, de la derni` ere relation donnant u , trop incertaine. On va maintenant construire une boucle de r etroaction ` a grand gain rendant la dynamique de x2 rapide, celle de x1 plus lente et celle de z encore plus lente, et qui assure le suivi avec stabilit e des trajectoires de r ef erence x1 et z donn ees, sans avoir besoin de connaissances pr ecises sur f1 , f2 et g . Posons alors k2 u = (x2 v2 ) o` u v2 est une entr ee auxiliaire qui sera r egl ee dans la suite. Il vient, en faisant le changement de t temps = , dx2 = f2 (x1 , x2 ) k2 g (x1 , x2 ) (x2 v2 ) d dz 1 avec dx a lordre 1 en , d et d dordre 1 en , ce qui montre que, pour k2 > 0, x2 converge vers v2 ` soit x2 = v2 + 0(). On peut donc consid erer v2 comme la nouvelle commande du sous-syst` eme lent z = x1 x 1 = f1 (x1 ) + v2 .
6.2. AJOUT DINTEGRATEUR Posons alors v2 = f 1 (x1 ) k1 (x1 v1 ) avec k1 positif susamment grand (mais de lordre de 1, donc inf erieur ` a nimporte quel que (v1 ) > 0, k1 f1 (v1 ) f 1 est suppos ce qui est possible puisque l ecart entre f1 et f e born e. 1 (x1 ), On obtient, en posant f1 (x1 ) = f1 (x1 ) f1 (x1 ) et f1 (x1 ) = f1 (x1 ) f 1 x 1 = k1 (x1 v1 ) + f1 (x1 ) + 0() et comme le lin earis e tangent de cette derni` ere equation en v1 est = k1 f (v1 ) 1 il vient que x1 converge localement exponentiellement vers v1 + 0(). Reportons cette derni` ere approximation dans l equation di erentielle en z : z = v1 + 0() et choisissons
v1 = x 1 k0 (z z ) k )
81
pour
avec k0 > 0. En tenant compte du fait que z = x 1 , on assure que z z = k0 (z z ) + 0() et donc, pour susamment petit et k0 susamment grand, la convergence tr` es lente de z vers O() a z + k0 z o` u a est la limite de lorsque tend vers 0. Finalement, en rempla cant v1 et v2 par leurs expressions respectives, on a construit un bouclage u= k2 x2 + f 1 (x1 ) + k1 (x1 x1 + k0 (z z )) (6.5)
82
compens ees par la boucle de bas-niveau ` a grand gain. Par contre, le voisinage V dans lequel la convergence a lieu peut etre petit, peut d ependre de et de lapproximation f etude peut 1 , et son etre complexe. Cette approche se g en eralise facilement si on remplace les sous-syst` emes de dimension 1 consid er es par des sous-syst` emes de dimension quelconque. Donnons maintenant plusieurs exemples dapplications.
6.3
Applications
Les principales applications de la commande hi erarchis ee concernent le r eglage robuste de la commande dactionneurs destin es ` a fonctionner dans des circonstances tr` es di erentes. Prenons lexemple de louverture automatique dune porte ` a laide dun moteur electrique. Ce dernier est destin e` a produire un couple qui fait tourner laxe de la porte sur lui-m eme. Or le moteur est fabriqu e ind ependamment de la connaissance de son utilisation pr ecise, et doit fonctionner correctement quelles que soient les caract eristiques m ecaniques de la porte, dans une plage donn ee de masses, dinerties, de couples r esistants, etc. Donc, si lon veut ouvrir une porte de masse, inertie, frottements donn es, en moins dune seconde et avec une pr ecision de positionnement de 1 degr e dangle par exemple, il faut que le moteur soit capable de produire nimporte quel couple de r ef erence en une dur ee beaucoup plus courte pour que la commande ait le temps dagir en compensant lerreur de positionnement. La commande de moteur est donc con cue pour produire le couple d esir e le plus rapidement possible, an de ne pas d egrader les performances du syst` eme en aval (la porte dans notre exemple). Le m eme type de conception est utilis e, par exemple, pour la commande des v erins hydrauliques qui pilotent lorientation des volets dune aile davion, sachant que lattitude de lavion est command ee par lorientation de ces volets ; pour la commande des electrovannes qui r` eglent le d ebit de uide dans un amortisseur actif de suspension ou le d ebit de produits entrants dans un r eacteur chimique ; pour la commande du courant dans les bobines dun electroaimant servant ` a mettre en l evitation laxe de rotation dune pompe ` a vide ; pour la commande de moteur electrique (` a courant continu ou alternatif, synchrone ou asynchrone) pour le positionnement de syst` emes m ecaniques ( l` eve-vitre, essuies-glaces, tables de positionnement en 2 et 3 dimensions, grues, robots, etc.) etc. Exemple 2 : Consid erons un m elangeur pour r eacteur chimique entra n e par un moteur ` a courant continu. On veut que la vitesse du m elangeur puisse varier en fonction du volume du r eacteur qui est lentement variable. Lensemble moteur-m elangeur est mod elis e par l equation electrique du moteur (voir (5.6)) et par le bilan des couples sur larbre moteur. On trouve ici les m emes equations que (5.6), ` a lexception du couple r esistant qui, ici, r esulte du d eplacement de lh elice du m elangeur dans le uide et qui est proportionnel au carr e de sa vitesse angulaire : Cr = Kf 2 o` u Kf est le coecient de frottement
6.3. APPLICATIONS
83
Cr
Cm
Fig. 6.1 M elangeur de r eacteur chimique uide.
dI = U RI K dt (6.6) d J = KI Kf 2 . dt On suppose comme auparavant que linductance L est tr` es petite par rapport aux autres coecients. Soit la vitesse de consigne, suppos ee constante ou lentement variable. On commence par la boucle de bas-niveau : L U = k1 (I vI ) L
avec k1 > 0, qui a pour eet de faire converger le courant I rapidement vers la consigne vI ` a d eterminer (au premier ordre en L). La dynamique lente r esultante est donc J d = KvI Kf 2 . dt
d = Kk2 ( ) Kf ( + )( ) = (Kk2 + Kf ( + )) ( ) dt
84
On a donc fait en sorte de commander la dynamique de la vitesse directement par le courant circulant dans le moteur, comme si celui-ci etait toujourscoll e ` a sa consigne, comportement qui est rendu possible par la boucle de bas-niveau sur la tension appliqu ee au moteur. Dun point de vue pratique, la boucle de bas-niveau peut etre directement int egr ee ` a l electronique de puissance du moteur puisquon na besoin que de la mesure du courant I et dune entr ee vI pour piloter la tension U . Ainsi, on peut r egler le gain k1 de cette boucle ind ependamment du m elangeur situ e en aval. Il sut, pour chaque utilisation du moteur, de rentrer ` a chaque instant la valeur vI de la consigne de courant, qui provient de la boucle de haut-niveau. De m eme, en pratique, l electronique de commande correspondant ` a la boucle de haut-niveau peut etre con cue de fa con s epar ee de celle du moteur, ` a condition de mettre, pour le gain k2 de cette boucle, des valeurs raisonnables, cest-` a-dire qui ninduisent pas sur la dynamique correspondante (ici la vitesse du m elangeur) un comportement trop rapide par rapport ` a celui du courant moteur. Notons, quon dispose ici dune marge importante puisque la constante de temps electrique dun moteur est en g en eral inf erieure ` a 103 secondes alors que, pour la constante de temps m ecanique, on a rarement 2 besoin de descendre en dessous de 10 secondes. Ce type de conception s etend bien evidemment ` a toutes les situations mentionn ees au d ebut de cette section.
Chapitre 7
M T x R
}contrleurs de bas-niveau
X
mg
Fig. 7.1 Grue en dimension 2. Un chariot de masse M roule sur laxe OX , suppos e repr esenter la ` eche de la grue ou le pont sil sagit dun pont roulant. Sa position est not ee x. Un moteur exerce sur lui une force horizontale dintensit e F . Le chariot porte en outre un treuil de rayon autour duquel senroule un c able assurant le levage de la charge situ ee ` a son extr emit e. La position de la charge dans le rep` ere XOZ est not ee (, ) et sa masse est egale ` a m. Le couple exerc e sur le treuil par un second moteur est not e C . La longueur du c able, sa tension et langle par rapport ` a la verticale sont not es R, T et respectivement. On se place dans la conguration o` u R < R0 pour eviter que la charge ne tra ne par terre, et on suppose que la tension du c able T est toujours positive. On adopte en outre la convention de signe pour : 0 si x et > 0 sinon. 85
86
On consid` ere egalement la force r esistante cr e ee par les frottements visqueux, comprenant la r esistance de lair sur le c able et la charge, au niveau du chariot, not ee 1 (x ), ainsi que la force ). Les fonctions 1 et 2 sont telles que i (0) = 0, de frottement visqueux sur la poulie, not ee 2 (R i = 1, 2. Un mod` ele peut etre facilement obtenu en ecrivant le principe fondamental de la dynamique sur lensemble des deux corps, chariot et charge, reli es par une liaison parfaite (le c able est suppos e rigide) dune part, = T sin m = T cos + mg m Mx = 1 (x ) + F + T sin J ) C + T R = 2 (R et les contraintes g eom etriques entre les coordonn ees des deux corps dautre part : = x + R sin = R cos .
(7.1)
(7.2)
Notons que ce mod` ele nest pas obtenu sous forme explicite. De plus, il contient des variables (T et ) dont les d eriv ees napparaissent pas explicitement, et des equations ` a la fois alg ebriques et di erentielles reliant , ` a x, R, T et . On peut donc eliminer une partie de ces inconnues mais cette op eration nest pas n ecessaire pour la suite. En particulier, il est possible de calculer une repr esentation explicite du syst` eme, de dimen). En eet, le syst` , sion 6, en prenant comme variables d etat (x, x, R, R, eme de 3 equations di erentielles : F 1 M 2 2 ) + (R + g cos ) sin 1 (x ( + sin ) sin 0 x m m m 1 C J 2 R = . R + g cos 2 (R) sin ( + 1) 0 2 m m m cos 0 R 2R g sin apr` es avoir invers e la matrice du membre de gauche, est bien une repr esentation d etat. Elle est obtenue de la fa con suivante : on commence par d eriver 2 fois les equations (7.2) = x cos + R cos R 2 sin sin + 2R +R = R sin R sin R 2 cos . cos 2R (7.3)
En recombinant les 2 premi` eres equations de (7.1) en multipliant la 1` ere par cos , la seconde par sin et en faisant la di erence, puis en multipliant la 1` ere par sin , la seconde par cos et en faisant la somme, on obtient : cos sin = g sin g ) cos = T. m sin + m( (7.4)
Il sut alors d eliminer T , et en rempla cant, dans les deux derni` eres equations de (7.1), T par son expression de (7.4) et et par leurs valeurs obtenues dans (7.3), et la premi` ere de (7.4) apr` es et par leurs valeurs, do` avoir aussi remplac e u le r esultat.
87
7.2
Nous avons vu en 4.1.2, que pour tout syst` eme lin eaire commandable de dimension n, il est (n ) possible de trouver une transformation telle que le syst` eme sexprime sous la forme zi i = vi , m i = 1, . . . , m, avec erie sans peine que le vecteur d etat x peut alors etre i=1 ni = n. On v repr esent e sous la forme x = (z1 , . . . , z1
(n1 1) (nm 1) , . . . , zm , . . . , z m )
o` u est une application lin eaire inversible. De m eme, le vecteur dentr ee u peut etre repr esent e sous la forme u = (z1 , . . . , z1
(n ) (n ) (n1 ) (nm ) , . . . , zm , . . . , z m )
eaire inversible pour tout o` u lapplication partielle (z1 1 , . . . , zm m ) (u1 , . . . , um ) est lin (n1 1) (nm 1) (z1 , . . . , z1 , . . . , zm , . . . , zm ). Nous allons voir quil est possible de g en eraliser cette propri et e dans de nombreux cas de syst` emes non lin eaires (malheureusement pas tous !), ` a condition de rel acher la condition que est un di eomorphisme dune vari et e de dimension n. On va seulement demander que soit une surjection de Rn+q dans Rn , avec q 0, inversible dans un sens qui sera pr ecis e plus loin. Montrons sur notre exemple de grue comment cette transformation est mise en evidence de fa con naturelle en etudiant la fa con de repr esenter les trajectoires du syst` eme. Un probl` eme courant pour un grutier consiste ` a amener une charge dun point ` a un autre, le c able en position verticale, au repos au d epart et ` a larriv ee. Notons que les conditions sur la verticalit e du c able se traduisent naturellement sur les variables et : si lon note xi , Ri et xf , Rf les positions du chariot et les longueurs du c able aux instants ti et tf initial et nal respectivement, on doit avoir, ` a linstant ti , (ti ) = 0 , (ti ) = 0 , (ti ) = 0 , (ti ) = 0 (ti ) = xi , (ti ) = Ri , et, ` a linstant tf , (tf ) = 0 , (tf ) = 0 , (tf ) = 0 , (tf ) = 0 . (tf ) = xf , (tf ) = Rf , = ti , tf , (t ) = 0, T (t ) = En eet, on v erie imm ediatement que ces conditions entra nent, pour t mg , x (t) = 0, R(t) = 0, F (t) = 0 et C (t) = mg, qui traduisent bien que le syst` eme est en equilibre en ti et tf . On peut donc se demander si les variables et permettent de d ecrire les trajectoires du syst` eme (7.1)-(7.2) ` a tout instant entre ti et tf au sens evoqu e ci-dessus. Montrons que la r eponse est positive. Eliminons T dans les deux premi` eres equations de (7.1) : tan = puis utilisons (7.2) : tan = x , ( x)2 + 2 = R2 . (7.6) g (7.5)
88
Eliminant enn tan de (7.5) et (7.6), on obtient le syst` eme alg ebro-di erentiel : g )( x) = ( 2 2 ( x) + = R2 do` u lon d eduit x= , g = arctan g R = + , T =m
2 2 2 2
(7.7)
2
, (7.8)
2 + ( g )2 .
+ 1
d dt
(7.9)
et de m eme J ) + T C= R 2 (R = J dt2 d2 2 + g
2
d 2 dt 2 + g
+ m 2 + ( g )2
(7.10)
ce qui montre que toutes les variables du syst` eme x, R, , , , T, F, C , entr ees incluses, peuvent sexprimer en fonction de et (les coordonn ees de la charge) et de leurs d eriv ees par rapport au temps jusqu` a lordre 4. Posons (4) = v1 (7.11) (4) = v2 On a ainsi obtenu une forme analogue ` a la forme canonique du cas lin eaire, ` a la di erence pr` es quici la dimension du syst` eme (7.11) est 8, alors que l etat du syst` eme (7.1)-(7.2) est de dimension 6. . . . , (3) , , , . . . , (3) ) fait correspondre par exemple Il en r esulte que lapplication qui ` a tout (, , , T ) nest pas un di (x, x, R, R, eomorphisme. . . . , (4) , , , . . . , (4) ) comme Cependant, si lon consid` ere lensemble des variables (, , un param etrage du couple de fonctions du temps t ( (t), (t)), lapplication . . . , (3) , v1 , , , . . . , (3) , v2 ) fait correspondre (x, x, , , T, , F, C ) , , qui ` a tout (, , R, R, par les formules pr ec edentes est inversible en un certain sens : nous venons de montrer qu` a toute trajectoire t ( (t), (t)) on fait correspondre de fa con unique une trajectoire t (x(t), R(t), (t), T (t), F (t), C (t)). Inversement, ` a toute trajectoire t (x(t), R(t), (t), T (t), F (t), C (t)) on peut faire correspondre une unique trajectoire t ( (t), (t)) par les formules (t) = x(t) + R(t) sin (t) et (t) = R(t) cos (t). De plus, ces formules sont com ) = 0 lensemble des patibles avec lop eration de d erivation par rapport au temps : notons F (X, X , , , T, F, C ). On dit que est compatible avec d , , equations (7.1)-(7.2) avec X = (x, x, R, R, dt si =0 F (, )
89
identiquement. Notons en outre que les trajectoires t ( (t), (t)) peuvent etre choisies de fa con arbitraire ` a condition d etre 4 fois d erivables, puisquil nexiste aucune equation reliant toutes ou parties des . . . , (4) , , , . . . , (4) hormis d (j ) = (j +1) et d (j ) = (j +1) . variables , , dt dt Pour conclure, nous avons mis en evidence lexistence dapplications inversibles au sens o` u elles envoient les trajectoires dun syst` eme sur les trajectoires dun second syst` eme de fa con unique, bien quelles ne pr eservent pas la dimension de lespace : les trajectoires du syst` eme (7.1)-(7.2) peuvent etre repr esent ees en dimension 6 alors que celles du syst` eme (7.11) appartiennent ` a un espace de dimension 8. Nous donnerons dans la suite le nom disomorphisme de Lie-B acklund ` a une telle application et nous allons montrer comment travailler avec. Mais auparavant, montrons lint er et de faire appara tre une telle transformation. Tout dabord, nous avons transform e un syst` eme compliqu e, (7.1)-(7.2), en le syst` eme beaucoup plus simple (7.11). De plus, nous avons montr e que les trajectoires de (7.1)-(7.2) sont param etr ees par les coordonn ees (, ) de la charge transport ee. Il en r esulte que le calcul des trajectoires de la charge permettant daller dun point ` a un autre au repos au d epart et ` a larriv ee (trajectoires arr et-arr et) devient el ementaire, de mani` ere analogue ` a ce que nous avons pr esent e dans le cas des syst` emes lin eaires a la section 4.1.2. Il reste alors ` ` a en d eduire, par les formules pr ec edentes, labscisse du chariot, la longueur du c able et son orientation par rapport ` a la verticale, ainsi que la force F et le couple C permettant dengendrer cette trajectoire. Mais ` a aucun moment, nous navons besoin dint egrer les equations du mouvement (7.1)-(7.2). Nous verrons plus loin que ces propri et es sont communes a toute une classe de syst` ` emes appel es syst` emes plats. Les variables et sont appel ees, dans ce formalisme, les composantes dune sortie plate.
Fig. 7.2 Vue stroboscopique du d eplacement de lensemble chariot-c able-charge lors du transport arr et-arr et de la charge, avec evitement dobstacle : dans la premi` ere partie de la trajectoire, le chariot tire la charge, puis cette derni` ere d epasse le chariot qui la freine ensuite jusqu` a larr et complet. Un exemple graphique du transport arr et-arr et dune charge suivant une parabole pour eviter un obstacle est donn e Fig. 7.2, o` u les mouvements de lensemble chariot-c able-charge sont d ecompos es le long de la trajectoire.
90
7.3
Lapproche que nous d eveloppons ici sinspire de [22]. On trouvera des expos es tr` es approfondis sur la g eom etrie des jets innis dans [36, 2, 30, 64]. Cette th eorie r ecente est con cue pour etudier de nombreuses questions de math ematiques et de physique math ematique comme les groupes dinvariance, de sym etries ou les lois de conservation des syst` emes d equations aux d eriv ees partielles. Nous ne lutilisons ici que dans le cas particulier des equations di erentielles ordinaires, ne comportant quun op erateur de d erivation par rapport au temps. Par ailleurs, lapproche que nous adoptons, en ce qui concerne l equivalence des syst` emes par des transformations faisant intervenir des coordonn ees de lespace des jets innis, remonte ` a Hilbert [26] puis ` a Cartan [10]. On trouvera aussi des approches l eg` erement di erentes de la n otre dans les articles [21, 32, 46, 47, 48, 52, 54, 59]. Nous avons montr e` a la section pr ec edente que lintroduction de transformations qui ne sont pas en g en eral des di eomorphismes et agissent non seulement sur les coordonn ees de la vari et e mais aussi sur un nombre ni, non connu ` a lavance, de leurs d eriv ees successives par rapport au temps, etait utile pour d ecrire les trajectoires de la grue. Ces transformations sont en fait dun type particulier : chaque composante des transformations ne fait intervenir quun nombre ni (non connu ` a lavance) des d eriv ees successives des coordonn ees, les transformations sont compatibles avec la d erivation par rapport au temps, elles sont r eversibles, i.e. on peut revenir aux coordonn ees initiales par une autre transformation du m eme type. Les transformations v eriant ces trois propri et es seront appel ees dans la suite isomorphismes de Lie-B acklund. Elles nous permettront de d enir une notion g en erale d equivalence de syst` emes conform ement ` a ce que nous avons fait pour transformer les equations de la grue (7.1)-(7.2) en le syst` eme (7.11). Indiquons comment on peut formaliser cette approche aussi bien pour des syst` emes non lin eaires implicites de la forme F (x, x ) = 0 (7.12) avec x appartenant ` a une vari et e X de dimension n et F une application C de TX dans Rnm , F dont la matrice Jacobienne x egal ` a n m, que pour des syst` emes explicites est de rang constant x = f (x, u) (7.13)
toujours avec x appartenant ` a une vari et e X de dimension n, u appartenant ` a un ouvert U de Rm , f et avec le rang de u constant egal ` a m.
7.3.1
On est donc amen es ` a introduire des coordonn ees comportant une innit e d enombrable de composantes, que lon note comme les d eriv ees successives des coordonn ees par rapport au temps pour des raisons qui seront expliqu ees ult erieurement, de la forme
k) x = x1 , . . . , xn , x 1, . . . , x n , . . . , x1 , . . . , x( n ,... . (k )
(7.14)
91
Notons quil est dusage courant chez les physiciens dadopter des coordonn ees g en eralis ees, position-impulsion, ou position-vitesse, qui susent ` a d ecrire les ph enom` enes associ es ` a la dynamique dun syst` eme. Notre d emarche, ` a linverse, consiste ici ` a utiliser aussi lacc el eration et toutes les d eriv ees temporelles sans restriction sur lordre de d erivation. En eet, notre objectif nest pas ici dint egrer les equations du mouvement pour conna tre les trajectoires possibles mais danalyser les propri et es de lensemble des trajectoires possibles qui persistent en leur appliquant une famille de transformations plus g en erales que les di eomorphismes, les isomorphismes de Lie-B acklund. On peut aussi, dans le cas explicite o` u lentr ee u est sp eci ee, introduire les coordonn ees
(k ) (x, u) = x1 , . . . , xn , u1 , . . . , um , u 1, . . . , u m , . . . , u1 , . . . , um ,... . (k )
(7.15)
Avant de d enir un syst` eme command e dans ces coordonn ees, il nous faut introduire une topologie et une structure di erentielle sur ces espaces, puis la notion de champ de vecteurs, qui nous permettra de justier les notations (7.14) et (7.15), et de ot.
7.3.2
Consid erons la vari et e de jets innis X Rn e d enombrable de , produit de X et dune innit n r epliques de R :
n n X Rn = X R R
dont les coordonn ees sont donn ees par le produit des coordonn ees de chaque terme du produit (correspondant formellement ` a (7.14)). Installons sur cette vari et e la topologie produit, appel ee o` u O est un ouvert arbitraire dun topologie de Fr echet, dont les ouverts sont de la forme O Rn produit de X et dun nombre ni, arbitraire, de r epliques de Rn . Une fonction continue de X Rn enition, est une fonction dont limage r eciproque dans R, par d . De telles fonctions peuvent cependant avoir une structure dun ouvert de R est un ouvert de X Rn tr` es complexe ` a cause de leur d ependance en un nombre inni de coordonn ees. Cest pourquoi nous allons restreindre la classe des fonctions continues et di erentiables aux fonctions qui ne d ependent que dun nombre ni de coordonn ees : D enition 29 Une fonction de X Rn dans R est continue, ce que lon note C 0 (X Rn ; R ) , si et seulement si ne d epend que dun nombre ni, arbitraire, de coor donn ees de X Rn et est continue par rapport a ` ces coordonn ees. k n Pour tout k 1, C (X R ; R) si est k fois di erentiable au sens usuel, i.e. si et seulement si elle est k fois di erentiable par rapport ` a chacune des variables dont elle d epend. On d enit de m eme une fonction continue, di erentiable, inniment di erentiable de X Rn p dans une autre vari et e Y R . Une telle fonction comporte alors une innit e d enombrable de composantes, chacune ne d ependant que dun nombre ni de coordonn ees. On proc` ede de fa con analogue pour d enir une vari et e du type X U Rm (correspondant formellement aux coordonn ees (7.15)), la topologie de Fr echet associ ee et la di erentiabilit e des fonctions d enies sur X U Rm .
92
7.3.3
Notons les coordonn ees sur la vari et e X Rn . Un champ de vecteurs C sur X Rn erateur di erentiel est, comme en dimension nie, un op du premier ordre de la forme : n v= vi,j (i) xj i0 j =1 dont chaque composante vi,j est une fonction C de X Rn epend que dun dans R, et donc ne d nombre ni de coordonn ees. On v erie que cette d enition est conforme ` a la notion de d eriv ee de Lie puisqu etant donn ee n eriv ee de Lie dans la direction v est donn ee une fonction h de classe C de X R dans R, sa d par : n h Lv h = vi,j (i) . xj i0 j =1 Notons que tous les termes de cette s erie sont nuls sauf un nombre ni, correspondant aux coordonn ees dont h d epend eectivement. De m eme, notons (0) (1) (1) (x1 , . . . , xn , u1 , . . . , u(0) m , u 1 , . . . , u m , . . .) les coordonn ees sur la vari et e X U Rm . Un champ de vecteurs C sur X U Rm e par un op erateur di erentiel du est alors donn premier ordre de la forme : n m w= w i + wi,j (i) xi u
i=1 i0 j =1 j
Exemples de champs de vecteurs remarquables Le champ de vecteurs dit trivial sur X Rn eni par : est d
n
X =
i0 j =1
xj
(i+1)
xj
(i)
(7.16)
Au champ trivial X correspond le syst` eme di erentiel trivial x (j ) = x(j +1) pour tout j , dont nimporte quelle fonction du temps t x(t) sur X est solution. Par ailleurs, h etant une fonction arbitraire, sa d eriv ee de Lie le long de X est donn ee par
n
LX h =
i0 j =1
xj
(i+1)
h
(i) xj
dh . dt
93
d on peut donc identier X ` a lop erateur de d erivation dt . Le syst` eme implicite associ e est vide, autrement dit donn e par F 0. Un champ de vecteurs lin eaire sur X U Rm e par est donn n
A,B =
i=1
+ (Ax + Bu)i xi
ui
j 0 i=1
(j +1)
ui
(j )
(7.17)
o` u (Ax + Bu)i est la i` eme composante du vecteur Ax + Bu. On v erie imm ediatement quil correspond au syst` eme lin eaire x = Ax + Bu. Le syst` eme implicite correspondant est alors donn e par C (x Ax) = 0 o` u C est une matrice de rang n m telle que CB = 0. Jets innis, formulation interne On peut maintenant donner un sens ` a la notion de vari et e de jets innis : si ` a la vari et e on associe un champ de vecteurs de la forme : X U Rm
n
f=
i=1
fi (x, u) + xi
ui
j 0 i=1
(j +1)
ui
(j )
(7.18)
on aura dh = Lf h dt pour toute fonction h de classe C sur X U Rm , soit en particulier, successivement pour h = xi (j ) et h = ui : dxi xi = Lf xi = fi (x, u) = fi (x, u) dt xi et dui (j ) (j +1) ui (j +1) = Lf ui = ui = ui (j ) dt u
i (j ) (j )
ce qui justie le fait que les coordonn ees, qui au d epart navaient aucun lien entre elles, sont
i maintenant li ees par dt = ui pour tout i = 1, . . . , m et tout j 0. Notons que le premier terme f du champ de vecteurs f peut d ependre non seulement de u mais ( ) aussi dun nombre ni de d eriv ees de u, i.e. f (x, u, u, . . . , u ). On se ram` ene facilement au cas ci-dessus en posant = (x, u, u, . . . , u(1) ) et v = u() .
du
(j )
(j +1)
Jets innis, formulation externe On peut justier de fa con analogue la notion de vari et e de jets innis sur X Rn si on lui associe (j ) (j +1) le champ trivial X d eni par (7.16) puisque, comme on vient de le remarquer, on a x i = xi (j ) pour tout j et tout i = 1, . . . , n, ce qui permet de r ecup erer la signication de xi comme d eriv ee j` eme de xi .
94 Flot
Les champs de dimension innie ont des propri et es di erentes de ceux de dimension nie. En particulier, en dimension nie tout champ de vecteurs v TX engendre un ot correspondant ` a lensemble des courbes int egrales de x = v (x), alors quun champ de vecteurs sur X Rn nengendre pas n ecessairement de ot. dv0 En eet, consid erons le champ de vecteurs v = v0 (x) x + j 1 x(j ) x (j ) sur R avec dx = 1 pour tout x. Il lui correspond le syst` eme d equations di erentielles x = v0 (x), x = x, ..., x (j ) = x(j ) , ...
0 0 qui ne peut avoir de solution puisque si x = v0 (x), x = dv =x en raison de lhypoth` ese dv dx x dx = 1. Une telle situation nappara t pas en dimension nie car les coordonn ees sont di erentiellement (k ) ind ependantes (il ny a pas de relation identiquement v eri ee entre xi et xj , x j , . . . , xj pour j = i et k 0) alors quici chaque coordonn ee est identiquement la d eriv ee de la pr ec edente. Par contre, un champ de vecteurs construit par prolongement dun champ sur X engendre toujours un ot : soit v0 TX o` u X est une vari et e de dimension n. On d enit son prolongement sur X Rn par la formule + v = v0 x(j +1) (j ) x x j 0
o` u x = (x1 , . . . , xn ), x(j ) = (x1 , . . . , xn ) et avec la notation x = v erie quon na rien chang e` a l equation di erentielle sur X :
(j )
(j )
n i=1 i xi .
Dans ce cas, on
x = v0 (x),
x =x ,
...,
x (j ) = x(j +1) ,
...
On remarquera aussi que le syst` eme de dimension m ` a m entr ees x i = ui , i = 1, . . . , m, admet pour prolongement le champ de Cartan
m i=1 ui x + i (j +1) (j ) j 0 u i u
i
que le champ trivial X pour X = Rm , dans les coordonn ees (x1 , . . . , xm , x 1 = u1 , . . . , x m = (j +1) (j ) (j +1) (j ) um , . . . , x1 = u1 , . . . , xm = um , . . .). Syst` eme command e, formulation interne On en arrive alors ` a la d enition particuli` erement simple, dans ce formalisme, de syst` eme command e: D enition 30 Un syst` eme command e est la donn ee dune paire (X, f ) o` u X est une vari et e de jets dont le champ de Cartan est f de la forme (7.18). Autrement dit, un syst` eme est donn e, dans les coordonn ees (x, u, u, . . .) par x = f (x, u) u =u u =u . . .
95
Remarquons quavec cette approche, la commande appara t dans le champ de Cartan comme une m suite innie u = (u, u, . . .) de vecteurs de R , pris ` a chaque instant t, et la fonction t u(t) est le r esultat de lint egration du ot, au m eme titre que la trajectoire t x(t). En dimension nie, par contre, la commande est donn ee a priori comme une fonction t u(t) sur un intervalle de temps donn e. Le caract` ere inni de la suite des d eriv ees de u se retrouve donc, lorsque l etat est de dimension nie, dans le fait que les commandes appartiennent ` a un espace de fonctions, de dimension innie. Syst` eme command e, formulation externe On se place donc dans la vari et e des jets dordre inni X Rn munie du champ de Cartan ( j +1) n d trivial X = dt = j 0 i=1 xi eme implicite (7.12), on peut (j ) . On va montrer quau syst`
xi
associer un ot engendr e par un champ de vecteurs de la forme (7.18). En eet, si les coordonn ees (7.14) v erient la contrainte (7.12), comme rang F = n m, x de classe C dun ouvert dapr` es le th eor` eme des fonctions implicites, il existe une application f de X Rm dans Rnm telle que x m+1 = f 1, . . . , x m) 1 (x, x . . . x n = f 1, . . . , x m) nm (x, x et, en posant u1 = x 1 , . . ., um = x m, f (x, u) = u1 . . . um f ( 1 x, u) . . . fnm (x, u)
on obtient le champ de vecteurs (7.18) en remarquant que, comme ui = x i , i = 1, . . . , m, il vient (j +1) (j ) ui = xi pour tout j 0. On retrouve alors les coordonn ees d enies par (7.15) en rempla cant d x, x , . . . par f (x, u), LX f (x, u) = dt (f (x, u)), . . .. On dit alors que le champ f est compatible avec dk le syst` eme implicite (7.12), autrement dit, dt u , . . .) et tout k F (x, f (x, u)) = 0 pour tout u = (u, u, k 0. Inversement, on peut exprimer le champ de vecteurs explicite dans les coordonn ees internes comme un syst` eme implicite sur des coordonn ees externes. Consid erons en eet le champ de vecteurs f cons par faire une permutation (7.18) dans les coordonn ees (7.15). Comme rang u = m, commen des lignes de f de sorte que la matrice jacobienne des m premi` eres lignes par rapport ` a u soit de ( rang m. Appelons x le vecteur ainsi obtenu apr` es permutation et f x, u) le champ correspondant. 1, . . . , x m ). En r Par le th eor` eme des fonctions implicites, on obtient u = U ( x, x e-injectant cette expression dans x = f ( x, u) et eliminant les m premi` eres equations qui sont alors identiquement ) = x i f 1, . . . , x m )) = 0, v eri ees, les nm equations restantes sont de la forme Fmi ( x, x x, U ( x, x i (
96
ees (7.15), si lon remplace i = m + 1, . . . , n, avec rang F x = n m. En outre, dans les coordonn u et ses d eriv ees par leur expression en fonction de x et ses d eriv ees, il est clair que ces nouvelles expressions sont exprim ees dans les coordonn ees (7.14), do` u le r esultat. Nous pouvons aussi remarquer que le recours explicite ` a un champ de vecteurs compatible avec F = 0 nest pas n ecessaire. En eet, l equation F (x, x ) = 0 permet, comme on la vu, dexprimer n m composantes de x en fonction des m autres, qui sont libres, et de x. On peut donc exprimer, de fa con analogue, les d eriv ees successives de x et x comme solutions de linnit e d equations Lk ) = X F (x, x dk (F (x, x )) = 0, dtk k 0. (7.19)
En eet, de cette derni` ere equation on peut tirer n m composantes de x(k+1) en fonction des m autres, qui sont libres, et de x, x, . . . , x(k) , variables auxquelles on substitue les valeurs trouv ees aux etapes pr ec edentes. On v erie facilement que ce processus d elimination est le m eme que celui permettant de construire un champ de vecteurs compatible pr esent e plus haut. La vari et e X0 des jets dordre inni contenue dans X Rn et v e riant F = 0 est donc donn e e par dk (F (x, x )) = 0, k 0}. (7.20) dtk Pour r esumer, la vari et e X U Rm et e de munie du champ de vecteurs (7.18) est une vari jets innis. De m eme, X Rn avec la contrainte F ( x, x ) = 0 d e nit par (7.20), une vari e t e de jets innis soumis ` a lensemble de contraintes d enies par (7.19). X0 = {x X Rn | D enition 31 Nous appelons syst` eme implicite command e, un triplet (X, X , F ), o` u X est une (j +1) n n vari et e du type X R munie du champ de Cartan trivial X = j 0 i=1 xi (j ) , et dans laquelle est donn e lensemble inni d enombrable d equations k 0. Lk ) X F (x, x =
dk F (x, x ) dtk xi
= 0 pour tout
Clairement, par construction, il existe un champ de vecteurs f du type (7.18) et compatible avec e au triplet (X, X , F ) soit identique ` a celui associ e Lk X F = 0 pour tout k 0 et tel que le ot associ m a la paire (X U R , f ) et inversement, ce qui ach` ` eve de montrer l equivalence des formulations interne et externe.
7.3.4
Image dun champ de Cartan par une application On consid ere deux vari et es de jets innis, X = X U Rm munie dun champ de Cartan f et q Y = Y V R munie du champ de Cartan g . Soit une application de classe C de Y dans X, inversible au sens o` u il existe une application de classe C de X dans Y telle que (x, u) = (y, v ) equivaut ` a (y, v ) = (x, u). On peut d enir limage g , comme en dimension nie, en posant (x, u) = (y, v ) et en calculant d (x, u, u , . . .) = dt (y, v ). On a x = Lg 0 (y, v ), u = Lg 1 (y, v ), . . ., donc g est transform e en le champ de vecteurs g = (Lg 0 ) + x (Lg j +1 )
j 0
u(j )
(7.21)
97
qui est lanalogue en dimension innie de la formule de la D enition 7. Clairement, pour que limage dun champ de Cartan sur Y soit un champ de Cartan sur X il faut que pour tout j , du(j ) = L g u(j ) = u(j +1) = j +2 dt soit, dapr` es (7.21), L g u(j ) = (Lg 0 ) Il faut donc que Lg j +1 = j +2 , j 0. Un champ de Cartan ne v eriant pas cette derni` ere identit e nest donc pas un champ de Cartan. Equivalence Nous sommes maintenant en mesure de d enir l equivalence de deux syst` emes (X, f ) et (Y, g ) q m et e de dimension p. avec X = X U R , X vari et e de dimension n, et Y = Y V R , Y vari Le point de vue externe, i.e. equivalence entre le triplet (X, X , F ) avec X = X Rn , et le triplet (Y, Y , G) avec Y = Y Rp , sera trait e dans un second temps. D enition 32 Soient (y0 , v 0 ) Y et (x0 , u0 ) X. Nous dirons que les deux syst` emes (X, f ) et equivalents en ((y0 , v 0 ), (x0 , u0 )) au sens de Lie-B acklund, ou plus rapide(Y, g ) sont localement ment, L-B equivalents, sil existe une application de Y dans X telle que (x0 , u0 ) = (y0 , v 0 ), de classe C dun voisinage de (y0 , v 0 ) Y dans un voisinage de (x0 , u0 ) X et inversible sur ces m emes voisinages, telle que g = f , et inversement, sil existe une application de classe C dun voisinage de (x0 , u0 ) X dans un voisinage de (y0 , v 0 ) Y et inversible sur ces m emes voisinages, telle que f = g . Une telle application (ou ) est appel ee isomorphisme local de Lie-B acklund. est donc un isomorphisme de Lie-B acklund si pour tout (x, u) = (x, u, u, . . .), dans un voisinage de (x0 , u0 ) dans X, il existe (y, v ) = (y, v, v, . . .) Y dans un voisinage de (y0 , v 0 ), avec (x0 , u0 ) = (y0 , v 0 ), tel que (x, u) = (y, v ), soit x = 0 (y, v ), u = 1 (y, v ), u = 2 (y, v ), . . . et inversement, si pour tout (y, v ) = (y, v, v, . . .) Y dans un voisinage de (y0 , v 0 ), il existe (x, u) = (x, u, u, . . .) dans un voisinage de (x0 , u0 ) dans X, tel que (y, v ) = (x, u), soit y = 0 (x, u), v = 1 (x, u), v = 2 (x, u), . . . De plus, et pr eservent localement la d erivation par rapport au temps ` a la fois sur X et sur Y : d g = f et f = g . Autrement dit, dt (y, v ) = Lf (x, u), soit (Lg 0 ) = f, (Lg j ) = u(j ) , j 1, u(j ) + x (Lg k+1 )
k 0
98 et
d dt (x, u)
CHAPITRE 7. JETS INFINIS, EQUIVALENCE DE LIE-BACKLUND = Lg (y, v ), soit Lf 0 = g, On doit donc avoir f (0 (y, v ), 1 (y, v )) = Lg 0 (y, v ), j +1 (y, v ) = Lg j (y, v ), j 1 j +1 (x, u) = Lf j (x, u), j 1. Lf j = v (j ) , j 1.
Exemple 32 Soit le syst` eme lin eaire scalaire x = u (i.e. x R, u R). Il lui correspond la vari et e R et le champ de Cartan trivial f = u x + j 0 u(j +1) u . Il est L-B e quivalent a ` nimporte (j ) + (g (y, y ) + v) quel syst` eme de la forme y = g (y, y ) + v d eni sur (R , g ) avec g = y y y + ( j +1) . En eet, il sut de poser y = x et v = u g (x, u), et inversement x = y et u = y , j 0 v v (j ) ou, ce qui revient au m eme, (y, v ) = (y, y, g (x, u)), . . .). y , . . .) et (x, u) = (x, u, u g (x, u), Lf (u On v erie facilement que g = f et f = g . On note en particulier que la dimension du premier syst` eme est egale ` a 1, alors que celle du second est egale ` a 2. La dimension d etat nest donc pas conserv ee par les isomorphismes de Lie-B acklund, ce qui, contrairement aux di eomorphismes, ne les emp eche pas d etre inversibles. Cet exemple illustre en fait un r esultat plus g en eral. On appelle int egrateur dordre q , avec q entier quelconque, un int egrateur de la forme z (q) = v et u = z , ou, de fa con equivalente, u(q) = v . Proposition 14 Tout syst` eme et le syst` eme obtenu en prolongeant ce dernier par un int egrateur dordre quelconque sont L-B equivalents. Preuve. Si le syst` eme est donn e par (X, f ) avec f donn e par (7.18), lintroduction dun int egrateur mq U Rm et le champ f en lui-m en X R transforme X = X U Rm e me. Le r e sultat est alors evident. Passons maintenant ` a la formulation externe : Proposition 15 Consid erons les syst` emes implicites (X, X , F ), X = X Rn , dans un voisinage eni par V de x0 X0 avec X0 d
k X 0 = {x X R n )) = 0, k 0}, |LX (F (x, x
(7.22)
F x
(7.23)
o` u G v erie rang G = p q dans W . y Les deux propri et es sont localement equivalentes : (i) Les syst` emes (7.22) et (7.23) sont tels que
99
il existe une application de classe C et inversible de W dans V telle que (y 0 ) = x0 et Y = X , et une application de classe C et inversible de V dans W telle que (x0 ) = y 0 et X = Y . (ii) Pour tout champ de Cartan f sur X Rm compatible avec (7.22) dans V et tout champ de q Cartan g sur Y Rq emes (X Rm compatible avec (7.23) dans W , les syst` , f ) et (Y R , g ) sont localement L-B equivalents en (x0 , u0 ) et (y0 , v 0 ), pour u0 et v 0 bien choisis. Preuve. (i) implique (ii) : Soient et v eriant (i). Pour tout g compatible avec (7.23) et si y W on a G(y, g (y, v )) = 0 pour tout v dans un ouvert convenable de Rq . Comme par hypoth` ese x = (y ) V X0 , avec = (0 , 1 , . . .), on a erie Lk x = 0 (y, g (y, v ), dg ), . . .) = 0 (y, v ), et x v X F (x) = 0 pour tout k 0. Soit alors v 0 dt (y, v, v d tel que x0 = (y0 , g (y0 , v0 ), dt g (y0 , v0 , v 0 ), . . .). Pour tout f compatible avec (7.22) on a x = f (x, u)
d pour u = (x, x ), soit u = ( 0 (y, v ), dt 0 (y, v )) = 1 (y, v ). Utilisant Y = X , il vient que 2 = LY 0 (y, Lg y, Lg y, . . .)
f (x, u)|(
1 (y,v )) 0 (y,v ),
= LX x|(
1 (y,v )) 0 (y,v ),
j j 0 Lg y 0 Lg y 0 j (k+1) = Lg Lg y = g (j ) + v y y (j ) y y (j ) v (k) j 0 k 0 0 0 =g + v (k+1) (k) = ( 0 ) g (y, v ). y v k 0 1 1 d d De m eme, on a u = dt u = LX (x) = dt 1 (y, v ) = g (y, v ) y + j 0 v (j +1) v 1 ) g , ce (j ) = ( qui prouve que (x, u) = (y, v ) avec = ( 0 , 1 , . . .) et f = g . D enissons u0 par (x0 , u0 ) = 0 , 1 , . . .) et x, u) avec = ( y0 , v 0 ). On montre de fa con sym etrique que lon a (y, v ) = ( ( df d 0 (x, u) = 0 (x, f (x, u), dt (x, u, u ), . . .), 1 (x, u) = (0 (x, u), dt 0 (x, u)), v = (x, x ), et donc a pour inverse avec (y0 , v 0 ) = ( x0 , u0 ), et g = f . Nous avons ainsi prouv que e que si les p syst` emes implicites (X Rn erient (i), alors les syst` emes explicites , X , F ) et (Y R , Y , G) v q m (X R , f ) et (Y R , g ), pour tous champs de Cartan f compatible avec F = 0 et g compatible avec G = 0, sont localement L-B equivalents en (x0 , u0 ), (y0 , v 0 ), pour des u0 et v 0 convenablement choisis (leur choix d epend de f et g ). (ii) implique (i) : La d emonstration est analogue ` a la pr ec edente et laiss ee au lecteur.
D enition 33 On dit que les syst` emes implicites (7.22) et (7.23) v eriant la condition (i) de la proposition 15 sont localement L-B equivalents en x0 et y 0 . Remarque 5 Si lon g en eralise aux syst` emes non lin eaires la notion d equivalence d evelopp ee dans le cadre des syst` emes lin eaires (d enition 25) on obtient : Deux syst` emes x = f (x, u), avec x X , et y = g (y, v ), avec y Y , sont equivalents par di eomorphisme et bouclage sil existe un di eomorphisme de Y vers X et un bouclage v = (y, u) o` u est inversible par rapport ` a u pour tout y , tels que le syst` eme boucl ey = g (y, (y, u)), apr` es transformation par x = (y ), v erie x = f (x, u).
100
Ainsi, si deux syst` emes sont equivalents par di eomorphisme et bouclage, les dimensions de x et y sont egales ainsi que les dimensions de u et de v , et on a (x, u) = ((y ), 1 (y, v )) et (y, v ) = ( 1 (x), (x, u)). On en d eduit imm ediatement que les deux syst` emes sont aussi L-B equivalents. L equivalence L-B est donc strictement moins ne que l equivalence par di eomorphisme et bouclage. Elle dispose cependant de propri et es susantes en pratique, comme nous le verrons dans la suite. Propri et es de l equivalence L-B Nous avons vu que l equivalence L-B ne conserve pas la dimension d etat. Par contre, la dimension du vecteur dentr ees est conserv ee. Le nombre dentr ees ind ependantes, si X = X U Rm , m est simplement la dimension de lespace R r epliqu e une innit e de fois. Dans le cas X = X Rn avec F (x, x ) = 0, cest lentier egal ` a la di erence entre la dimension de X , soit n, et le nombre d equations ind ependantes, soit n m, puisque m = n (n m). Th eor` eme 23 Si deux syst` emes sont L.B. equivalents, ils ont le m eme nombre dentr ees ind ependantes. La preuve sappuie sur le lemme suivant : Lemme 1 Notons k lapplication form ee des k + 1 premi` eres composantes de (on retire la premi` ere composante egale ` a t qui ne joue ici aucun r ole), i.e. k (y, v ) = (0 (y, v ), . . . , k (y, v )) . Si est un isomorphisme de Lie-B acklund, alors k est localement surjective pour tout k . De m eme, si est lisomorphisme inverse, k est localement surjective pour tout k . Preuve. Si 0 = 0 nest pas surjective, alors il existe au moins un x X tel que 0 (y, v ) = x pour tout (t, y, v ) Y. Clairement, = (t, 0 , 1 , . . . , k , . . .) ne peut donc pas etre surjective, ce qui contredit lhypoth` ese disomorphisme de Lie-B acklund. Le m eme raisonnement sapplique pour k et k pour tout k . Nous pouvons maintenant revenir ` a la preuve du Th eor` eme 23 : Preuve. Soit un isomorphisme de Lie-B acklund entre les deux syst` emes (X, f ) et (Y, g ). Alors, dapr` es le Lemme 1, lapplication k : (y, v ) (x, u, u, . . . , u(k) ) = k (y, v ) est surjective. Comme k ne d epend que dun nombre ni de variables, k est une surjection entre espaces de dimension nie et la dimension de limage est inf erieure ` a celle de la source. Remarquons que si 1 ne d epend d que des variables (y, v, v, . . . , v (+1) ), alors , comme u = 2 (y, v ) = dt 1 (y, v, v, . . . , v (+1) ), 2 ne d epend que de (y, v, v, . . . , v (+2) ). De m eme, k d epend au plus de (y, v, v, . . . , v (+k) ). Notons q la dimension de y , n la dimension de x, r la dimension de v et m la dimension de u. On a donc, pour tout k , les in egalit es : q + ( + k + 1)r rang k (y, v ) = n + (k + 1)m
101
(7.24)
ce qui implique que r m 0 car sinon, pour k susamment grand, lexpression de gauche de (7.24) deviendrait arbitrairement n egative et contredirait lin egalit e puisque n q r est une constante ind ependante de k . En raisonnant de mani` ere analogue sur k , o` u est linverse de , on obtient m r 0, si bien que m = r, do` u le r esultat. Dans le cas des syst` emes lin eaires, le r esultat pr ec edent devient : Proposition 16 Une condition n ecessaire et susante pour que deux syst` emes lin eaires commandables soient L-B equivalents est quils aient le m eme nombre dentr ees ind ependantes. Preuve. La condition est n ecessaire par le th eor` eme 23. Montrons quelle est susante. Comme chacun des syst` emes est equivalent ` a sa forme canonique (voir la section 4.1.2), il sut de montrer que deux formes canoniques quelconques ayant le m eme nombre dentr ees ind ependantes sont L-B equivalentes. Or, comme chacune a pour champ de Cartan le champ trivial ` a m entr ees, elles sont L-B equivalentes. C.Q.F.D. Les isomorphismes de Lie-B acklund jouissent dune autre propri et e importante en ce qui concerne les points d equilibre : Th eor` eme 24 L equivalence L-B pr eserve les points d equilibre. Preuve. Supposons que les syst` emes x = f (x, u) et y = g (y, v ) sont L-B equivalents. (j ) Soit (x0 , u0 ) un point d equilibre, i.e. f (x0 , u0 ) = 0, u0 = 0 pour tout j 1. Comme (s ) (j ) (s+j +1) y0 = 0 (x0 , u0 , u 0 , . . . , u0 ) = 0 (x0 , u0 , 0, . . . , 0) et v0 = j +1 (x0 , u0 , u 0 , . . . , u0 ) = 0 0 (s+1) 0 = 0 et 0 + u u 0 + . . . + u(s) u0 j +1 (x0 , u0 , 0, . . . , 0) pour tout j , on a donc y 0 = x x
j +1 j +1 j +1 x 0 + u u 0 + . . . + u(s+ = 0 pour tout j 1, ce qui prouve que v0 = x j +1) u0 (y0 , v0 ) est un point d equilibre de y = g (y, v ). On proc` ede de m eme pour montrer que limage dun point d equilibre de y = g (y, v ) est un point d equilibre de x = f (x, u).
(j +1)
(s+j +2)
Bouclages dynamiques endog` enes Nous allons g en eraliser la notion dint egrateur introduite pr ec edemment ` a des bouclages appel es bouclages dynamiques endog` enes. Consid erons un syst` eme (X, f ) dont la repr esentation en dimension nie est x = f (x, u). Un bouclage dynamique est la donn ee dune equation di erentielle de la forme z = (x, z, v ) et dun bouclage u = (x, z, v ). Le syst` eme boucl e est alors donn e par x = f (x, (x, z, v )) z = (x, z, v ).
102
Un tel bouclage peut avoir des propri et es inattendues comme la perte daccessibilit e ou la non inversibilit e, cest-` a-dire le fait de ne pas pouvoir revenir du syst` eme boucl e au syst` eme dorigine par un autre bouclage dynamique. Donnons-en des exemples simples : Exemple 33 consid erons le syst` eme x = u et ajoutons lui le bouclage dynamique z = v , u = v . Le syst` eme boucl e est alors x = v, z = v , ce qui implique que x z = 0 ou x(t) z (t) = x0 z0 pour tout t. Le syst` eme boucl e nest donc plus commandable. Exemple 34 Consid erons maintenant le syst` eme lin eaire de dimension 2 : x 1 = x2 , x 2 = u et appliquons lui le m eme bouclage dynamique que dans lexemple pr ec edent : z = v , u = v . Le syst` eme boucl e s ecrit x 1 = x2 , x 2 = z , soit x 1 = z + c o` u c est une constante, puisque x 2 = z implique x2 = z + c. Ainsi, la connaissance de v = z est insusante pour en d eduire z , puisquil manque la condition initiale z0 . On ne peut donc pas d eduire x1 et x2 et encore moins u, de sorte que le syst` eme boucl e contient moins dinformations que le syst` eme initial x 1 = u. La raison de cette perte dinformation r eside dans le fait que u = z , et donc z , ne peut pas sexprimer comme une fonction de (x, u) = (x, u, u, . . . , ) uniquement ` a cause de la condition initiale ene z0 manquante, qui ne peut etre d eduite de (x, u). Nous dirons quun tel bouclage est exog` puisquil d epend dune variable suppl ementaire z0 qui n etait pas dans le syst` eme dorigine et, par cons equent, le syst` eme dorigine et le syst` eme boucl e ne sont pas L-B equivalents. Par contre, si lon sen tient aux bouclages endog` enes, cest-` a-dire tels que le bouclage peut sexprimer comme une fonction des variables du syst` eme dorigine, ces pathologies disparaissent, comme nous le montrerons dans la suite. Cest ce qui motive la d enition suivante : D enition 34 Soit le syst` eme (X, f ). On appelle bouclage dynamique endog` ene un bouclage dynamique de la forme z = (x, z, v ), u = (x, z, v ) (7.25) tel que le syst` eme boucl e soit L-B equivalent au syst` eme (X, f ). En dautres termes, il existe un isomorphisme de Lie-B acklund , dinverse , tel que (x, u) = (x, z, v ) et (x, z, v ) = (x, u), ce qui implique que z , v , v , . . ., sexpriment en fonction de x, u et un nombre ni de d eriv ees de u. Il r esulte de ce qui pr ec` ede quun int egrateur dordre quelconque est un bouclage endog` ene. Le r esultat suivant pr ecise les liens entre ce type de bouclage et l equivalence L-B. Soient les syst` emes (X, f ) et (Y, g ) d enis par x = f (x, u) et y = g (x, v ) respectivement. Th eor` eme 25 Supposons que les syst` emes (X, f ) et (Y, g ) sont L-B equivalents. Alors il existe un bouclage dynamique endog` ene (7.25) tel que le syst` eme boucl e x = f (x, (x, z, v )) z = (x, z, v ) (7.26)
7.3. JETS INFINIS, CHANGEMENTS DE COORDONNEES, EQUIVALENCE soit di eomorphe au syst` eme prolong e y = g (y, w) w(r+1) = v pour un entier r assez grand.
103
(7.27)
= (y, wr ) = (y, w, w(1) , . . . , w(r) ) et v = w(r+1) . Preuve. Notons wr = (w, w(1) , . . . , w(r) ). Soit y En vertu de l equivalence L-B, on a (x, u) = (y, w) = (0 (y, w), 1 (y, w), . . .). Pour r susamment grand, 0 ne d epend que de y et 1 que de ( y , v ), i.e. lisomorphisme de Lie-B acklund est de la forme ( y , v, v (1) , . . .) = (0 ( y ), 1 ( y , v ), 2 ( y , v 1 ), . . .), toujours avec la notation v k = (v, v (1) , . . . , v (k) ) pour tout k 1, et le syst` eme x = f (x, u) devient x = f (0 ( y ), 1 ( y , v )) = g ( y) Posons + g =g y 0 + y
r 1
w(j +1)
j =0
0 0 + v (r ) . ( j ) w w
(7.28)
r 1
w(j +1)
j =0
+ v (r ) ( j ) w w
le champ de vecteurs prolong e correspondant ` a (7.27). Lidentit e (7.28) devient alors f (0 ( y ), 1 ( y , v )) = g ( y, v) 0 . y (7.29)
Dapr` es le lemme 1, 0 est surjective. Il existe donc une application surjective telle que 0 ( y) = K ( y ) est un di eomorphisme local de Y Rm(r+1) . y ( y) Posons z = ( y ). On a z = g ( y , v ) par d enition de limage du champ de vecteurs g par . Comme x = 0 ( y ), on a (x, z ) = K ( y ). Appliquons alors le bouclage dynamique u = 1 (K 1 (x, z ), v ) z = g (K 1 (x, z ), v ), pour obtenir la dynamique en boucle ferm ee x z et donc, utilisant (7.29), (K ( f y ), v ) = f (0 ( y ), 1 ( y , v )) g ( y, v) =
0 y) y ( y) y (
(x, z, v ) = =f
(7.30)
.g ( y, v) =
K ( y ).g ( y, v) y
104
Enn, utilisant lisomorphisme inverse, puisque y = 0 (x, us ) et v = 1 (x, us+1 ) pour au moins (x, us+r+1 )), o` est lapplication (0 , 1 , . . . , r+1 ), ce un s, on obtient que z = ( y ) = ( u = f (x, u) est Lie-B acklund qui prouve que (z, v ) sexprime en fonction de (x, u) et donc que x equivalent ` a sa dynamique en boucle ferm ee (7.30). Le bouclage dynamique ainsi construit est donc bien endog` ene.
Chapitre 8
t (x (t), u(t)) ))
y (r +1) = v
Fig. 8.1 Repr esentation graphique de la platitude : equivalence L-B entre les trajectoires du syst` eme trivial (en bas) et celles du syst` eme non lin eaire (en haut).
n D enition 35 On dit quun syst` eme (X U Rm a m entr ees est , f ) (resp. (X R , X , F )) ` di erentiellement plat, ou, plus bri` evement, plat, sil est localement L-B equivalent au syst` eme m , , 0)), o` m muni des coortrivial (Rm , ) (resp. ( R u est le champ de vecteurs trivial sur R m m m
105
m =
j 0 i=1
yi
(j +1)
yi
(j )
(8.1)
Le vecteur y = (y1 , . . . , ym ) est appel e sortie plate. Traduisons cette d enition dans les deux cas pr ec edemment etudi es : Cas explicite. Le syst` eme explicite x = f (x, u) ` a m entr ees est plat si et seulement sil existe une sortie plate y de dimension m, deux entiers r et s et des applications de X (Rm )s+1 dans Rm , de rang m dans un ouvert convenable, et (0 , 1 ) de R(m+2)r dans Rn Rm , de rang n + m dans un ouvert convenable, tel que y = (y1 , . . . , ym ) = (x, u, u, . . . , u(s) ) implique 0 x = 0 (y, y, . . . , y (r) ), u = 1 (y, y, . . . , y (r+1) ), l equation d etant identiquement dt = f (0 , 1 ) v eri ee. 0 On v erie facilement en eet que si x = 0 (y ) et u = 1 (y ) avec d dt = f (0 , 1 ) on a
d 1 1 (x, u) = (y ) = (0 (y ), 1 (y ), d dt (y ), dt2 (y ), . . .), et que
2
n m, est plat si et seulement Cas implicite. Le syst` eme implicite F (x, x ) = 0 avec rang s n sil existe un entier s et une application de X (R ) dans Rm , de rang m dans un ouvert convenable, tel que y = (y1 , . . . , ym ) = (x, x, . . . , x(s) ) implique x = 0 (y, y, . . . , y (r) ) pour d0 d0 un entier r, l equation F (0 , dt ) = 0 etant identiquement v eri ee, avec dt = Lm 0 . Dans tous les cas, on peut exprimer toutes les variables du syst` eme en fonction de la sortie plate et dun nombre ni de ses d eriv ees. Il ny pas unicit e de la sortie plate. En eet, si (y1 , y2 ) est une sortie plate dun syst` eme ` a2 (k ) entr ees, alors la sortie (z1 , z2 ) = (y1 + y2 , y2 ) pour k entier quelconque, est encore une sortie plate. (k ) En eet, lapplication y z ainsi d enie est inversible (y1 = z1 z2 , y2 = z2 ) et pr eserve le champ 2 de Cartan trivial sur R . La transitivit e de l equivalence L-B ach` eve de prouver notre assertion. Le r esultat suivant r esulte directement du th eor` eme 23. Proposition 17 Etant donn e un syst` eme plat, le nombre de composantes dune sortie plate est egal au nombre dentr ees ind ependantes.
dy (j ) dt F x =
dj y dtj
= y (j +1) .
8.2
8.2.1
Exemples
Syst` eme masses-ressort
Consid erons un syst` eme fait de deux solides de masses respectives m1 et m2 , accroch es ` a deux ressorts de raideurs respectives k1 et k2 , pouvant se d eplacer le long de laxe Ox (voir gure 8.2). Les abscisses respectives des centres de gravit e G1 et G2 des deux solides sont not ees l1 + x1 et l2 + x2 , o` u l1 et l2 sont les positions au repos de G1 et G2 . On suppose que les deux masses sont soumises ` a des frottements visqueux 1 (x 1 ) et 2 (x 2 ) respectivement. Les fonctions 1 et 2 sont suppos ees non n egatives, 2 fois continument d erivables et 1 (0) = 2 (0) = 0. Enn, on exerce une force u sur G2 . Les equations de la m ecanique s ecrivent imm ediatement : m1 x 1 + k1 x1 + 1 (x 1 ) = k2 (x2 x1 ) m2 x 2 + k2 (x2 x1 ) + 2 (x 2) = u . (8.2)
8.2. EXEMPLES
107
k1
m1 G1
k2
m2 G2 u
O l1 + x1 l2 + x2
Fig. 8.2 Syst` eme masses-ressorts. Pour mettre (8.2) sous forme implicite, il sut d eliminer la derni` ere equation, soit m1 x 1 + k1 x1 + 1 (x 1 ) k2 (x2 x1 ) = 0. (8.3)
Montrons quon peut exprimer x2 et u en fonction de x1 . De la premi` ere equation de (8.2), on tire : m1 1 x2 = x 1 + ((k1 + k2 )x1 + 1 (x 1 )) (8.4) k2 k2 et, en d erivant, notant 1 la d eriv ee de la fonction 1 , x 2 = 1 m1 (3) x1 + (k1 + k2 )x 1 + 1 (x 1 ) x1 k2 k2 , (8.5)
puis de la seconde equation de (8.2), utilisant les expressions de x2 et x 2 ci-dessus u= m1 m2 (4) x1 + k2 m2 k1 1 + k1 x1 + 1 (x 1) + m2 + m1 x k2 m1 (3) 1 x + ((k1 + k2 )x 1 + 1 (x 1 ) x1 ) k2 1 k2
m2 (3) + 1 (x 1 )( x1 )2 + 1 (x 1 )x1 + 2 k2
(8.6)
ce qui montre que x2 et u sexpriment en fonction de x1 et dun nombre ni de ses d eriv ees et donc que le syst` eme (8.2) est plat avec x1 comme sortie plate. La transformation obtenue ` a partir de la sortie plate y = x1 revient ` a mettre le syst` eme sous (4) forme canonique commandable (voir la section 4.1.2), qui s ecrit ici y = v .
8.2.2
Commande de robot
On consid` ere un bras de robot ` a n degr es de libert es et n actionneurs. Les equations dynamiques prennent la forme : 0 (q ) q + 1 (q, q ) = Q(q, q )u (8.7) o` u q sont les coordonn ees g en eralis ees (coordonn ees angulaires pour un robot rigide ` a joints roto des), dim q = dim u = n, rang (Q) = n, 0 (q ) etant la matrice dinertie, suppos ee partout
108
C d
mg
Fig. 8.3 Le pendule invers e dans le plan vertical inversible, 1 (q, q ) le vecteur des forces centrifuges et de Coriolis et la matrice Q(q, q ) caract erisant les actionneurs (localisation, entra nement direct ou indirect, pr esence de r educteurs, . . .). On pose x1 = q , x2 = q et le syst` eme devient : x 1 = x2 x 2 = (0 (x1 ))1 (1 (x1 , x2 ) + Q(x1 , x2 )u) . (8.8)
Comme rang (Q) = n, on v erie imm ediatement que toutes les equations de (8.7) peuvent etre elimin ees, si bien que le syst` eme implicite equivalent se r eduit ` a 0 = 0. Comme pr ec edemment, le vecteur x1 est une sortie plate de (8.8). En eet, x2 = x 1 et u = Q1 (x1 , x 1 ) (0 (x1 ) x1 + 1 (x1 , x 1 )) formule, dite du couple calcul e.
8.2.3
Pendule
Consid erons un pendule invers e dans le plan de coordonn ees (x, z ), de masse m, command e au moyen de la force ext erieure F appliqu ee au point A situ e` a une distance d du centre de masse C du pendule (voir gure 8.3). Consid erons le rep` ere inertiel ( , , k ). La force F s ecrit dans ce rep` ere : F = Fx + Fz k . La force r esultante appliqu ee au centre de masse est la somme de F et du poids mg k : Fx + (Fz mg ) k . Notons (xC , O, zC ) les coordonn ees du point C . On a mz C = Fz mg . Notons langle entre le pendule et la verticale (parall` ele ` a k ) et J l inertie du pendule. Le vecteur CA s ecrit CA = d(sin + cos k ) et le moment angulaire autour de C est donn e par J = CA F = d(Fz sin Fx cos ) . mx C = Fx ,
Fz Fx
109
on obtient le mod` ele du pendule : = u1 x z = u2 = u1 cos + (u2 + 1) sin o` u u1 et u2 sont les composantes du vecteur dentr e e u. Une repr esentation implicite de (8.9) est donn ee par : = x cos + ( z + 1) sin .
(8.9)
(8.10)
Consid erons maintenant un autre syst` eme di erentiel implicite ` a 4 fonctions inconnues et 2 equations : ( x)2 + ( z )2 = 2 (8.11) ( z ) ( x)( + 1) = 0 . Ce syst` eme admet linterpr etation g eom etrique suivante : soit (, ) la position dun point Y situ e` a la distance du point C , cest-` a-dire ( x)2 + ( z )2 = 2 , et dont lacc el eration moins le vecteur constant k , acc el eration de la gravit e normalis ee, est colin eaire au vecteur Y C : x . = z +1 Le point Y , v eriant ( x)2 + ( z )2 = 2 , ou, en coordonn ees polaires : = x + sin , = z + cos , (8.13) (8.12)
est appel e centre doscillation ou centre doscillation d Huygens [22, 61]. Montrons que (8.11) est equivalent ` a (8.9) ou, ce qui revient au m eme, que (8.11) et (8.10) sont equivalents. Partant de (8.11) et d erivant deux fois (8.13), on obtient = x cos 2 sin , + = z sin 2 cos . (8.14)
En tenant compte du fait que x = sin et z = cos , on a ( z ) ( + 1)( x) = ( cos ( + 1) sin ) = ( + x cos ( z + 1) sin ). Donc, si (8.11) a lieu, alors (8.10) aussi, et r eciproquement, ce qui prouve l equivalence annonc ee.
110
Dans (8.11), les variables de commande sont x et z , ce qui implique, par (8.13), que x = u1 et z = u2 , o` u (u1 , u2 ) est lentr ee du mod` ele du pendule (8.9). Donc, (8.11) sinterpr` ete comme un mod` ele r eduit o` u les deux doubles int egrateurs d ecrivant lacc el eration du centre de masse du pendule invers e ont et e supprim es. Proposition 18 Le syst` eme (8.9) est plat avec les coordonn ees (, ) du centre doscillation pour sortie plate. Preuve. De (8.13) et (8.12), on tire tan = soit = arctan En outre x= + 1 , sin = )2 + ( + 1)2 ( )2 + ( + 1)2 ( + 1 )2 + ( + 1)2 ( , cos = + 1 )2 + ( + 1)2 ( . x = + 1 z
z =
(8.15)
et la force sen d eduit ais ement en d erivant deux fois les expressions de x et z : 2 + 1 d d2 , u2 = , u1 = 2 dt dt2 2 2 2 2 ( ) + ( + 1) ( ) + ( + 1)
(8.16)
expression qui contient des d eriv ees de et jusqu` a lordre quatre. Il en r esulte que toutes les variables de (8.9) peuvent sexprimer, de fa con inversible, comme , . . . , , , . . .. des fonctions de , et dun nombre ni de leurs d eriv ees par rapport au temps , La platitude du syst` eme sen d eduit imm ediatement avec (, ) pour sortie plate.
8.2.4
Consid erons un v ehicule ` a 4 roues roulant sans glisser sur un plan horizontal. Dans le plan (O, X, Y ), on note (x, y ) les coordonn ees du point P , milieu de lessieu arri` ere, Q le point milieu de lessieu avant, P Q = l, langle entre laxe du v ehicule et laxe Ox, et langle de braquage des roues (voir gure 8.4). Les conditions de roulement sans glissement sexpriment par le fait que dOQ dOP PQ dOP est parall` ele ` a P Q et que est parall` ele aux roues avant. Notons u = . dt dt dt PQ Un calcul cin ematique el ementaire donne : x = u cos y = u sin = u tan . l
(8.17)
8.2. EXEMPLES
111
y O l Q P
Fig. 8.4 V ehicule roulant sans glisser sur un plan. Mis sous forme implicite, ce syst` eme devient : x sin y cos = 0. (8.18)
Montrons que ce syst` eme est plat avec (x, y ) comme sortie plate. Les deux premi` eres equations de (8.17) donnent y tan = , u2 = x 2 + y 2 . (8.19) x x y x (1 + tan2 ) = y do` u lon tire D erivant lexpression de tan , on trouve 2 x x y x =y 2 2 x +y et, par la troisi` eme equation de (8.17), tan = y x y x l =l 3 . v (x 2 + y 2) 2 (8.20)
Toutes les variables du syst` eme x, y, , u, sexpriment donc en fonction de x, x, x , y, y, y , ce qui prouve notre assertion.
8.2.5
V ehicule ` a remorques
Consid erons un camion ` a plusieurs remorques d ecrit sur la gure 8.5, chaque remorque etant attach ee au milieu de lessieu arri` ere de la remorque qui la pr ec` ede. Le camion et les remorques sont suppos es rouler sans glisser.
112
Q y P P y y y
P d
d
y d
P P d
x
x
Les equations du syst` eme, conditions de roulement sans glissement incluses, sont donn ees par
(8.21) i = 1, . . . , n .
cos(j 1 j ) sin(i1 i ) ,
def cos(j 1 j ) = 1.
Rappelons que u est le module de la vitesse du v ehicule de t ete et constitue lune des deux commandes, la seconde etant langle des roues avant.
8.2. EXEMPLES Mis sous forme implicite, ce syst` eme devient : x 0 sin 0 y 0 cos 0 = 0 i (x di 0 cos 0 + y 0 sin 0 )
j =1 i1
113
C
E
E
P
E
E
E
P
E
E
Fig. 8.6 Interpr etation g eom etrique des conditions de roulement sans glissement. Montrons que les coordonn ees (xn , yn ) du milieu de lessieu arri` ere de la derni` ere remorque constituent une sortie plate. On v erie facilement par r ecurrence que le module de la vitesse ui de la i` eme remorque v erie
i
ui = u
j =1
cos(j 1 j ) ,
i = 1, . . . , n
y n1 dautre part, il vient imm ediatement que x n1 xn1 et yn1 sexpriment en fonction de xn , yn et leurs d eriv ees premi` eres et que n1 sexprime en fonction de xn , yn et leurs d eriv ees jusquau second ordre. On montre de la m eme mani` ere, de proche en proche, que tous les xi et yi sexpriment en fonction de xn , yn et leurs d eriv ees jusqu` a lordre n i, et que les i sexpriment en fonction de xn , yn et leurs d eriv ees jusqu` a lordre n i + 1, i = 0, . . . n. Finalement, on d eduit que u est une fonction de xn , yn et leurs d eriv ees jusqu` a lordre n + 1 et de m eme pour jusqu` a lordre n + 2, ce qui ach` eve de prouver notre assertion. Cette propri et e peut etre directement v eri ee sur la gure 8.6.
8.3
Platitude et commandabilit e
Th eor` eme 26 Tout syst` eme plat est localement accessible. Preuve. Consid erons le syst` eme plat (X, f ). correspondant au syst` eme x = f (x, u). Dapr` es la proposition 13, il est localement accessible si le syst` eme etendu X = F (X, u ), avec X = (x, u) et f (x, u) , est aussi localement accessible. Consid erons alors les champs de vecteurs F (X, u ) = u F0 (X, u) = f (x, u) x et Fi (X, u) = u , i = 1, . . . , m. Ils engendrent une distribution D selon i lalgorithme 4.16. Nous allons supposer que x = f (x, u) nest pas accessible, et donc que son syst` eme etendu non plus. Il en r esulte que la dimension de D est, en tout point dun ouvert convenable, egale ` a N0 < n + m. Dapr` es le th eor` eme 20, le syst` eme etendu admet la repr esentation (x, u) = (, ) avec dim = N0 , dim = n + m N0 et
m
= 1 (, ) + = 2 ( )
i=1
u i i (, )
o` u correspond ` a la partie non commandable. En vertu de la platitude du syst` eme, on doit avoir = (y, y, . . . , y (r) ) pour un entier r donn e. En d erivant cette derni` ere expression, on obtient lidentit e: = y + . . . + (r) y (r+1) = 2 ( ) = 2 ( (y, y, . . . , y (r) )). y y Or 2 ne d epend pas de y (r+1) , ce qui prouve que y (r ) , (y, y, . . . , y (r1) ).
y (r)
soit = En it erant ce raisonnement, on en conclut que ne d epend ni de y ni de ses d eriv ees, ce qui contredit la platitude, do` u laccessibilit e du syst` eme. On en d eduit : Corollaire 3 Un syst` eme lin eaire est plat si et seulement sil est commandable.
115
Preuve. Dapr` es le th eor` eme 26, un syst` eme lin eaire plat est localement accessible, et, comme la dimension de D , pour un syst` eme lin eaire, est egale au rang de la matrice de commandabilit e de Kalman (voir la n de la section 4.2.2), un syst` eme lin eaire plat est commandable. Inversement, un syst` eme lin eaire commandable est equivalent par changement de base et bouclage ` a sa forme canonique de Brunovsky, et donc L-B equivalent ` a un syst` eme trivial, ce qui prouve quil est plat.
Analysons maintenant les propri et es de lapproximation tangente dun syst` eme plat autour dun point d equilibre : Th eor` eme 27 Pour quun syst` eme soit plat au voisinage dun point d equilibre il est n ecessaire quil soit commandable au premier ordre au voisinage de ce point. Preuve. Soit un syst` eme (X, f ) plat au voisinage du point d equilibre (x0 , u0 , 0, . . .). Il existe donc de classe C inversible tel que pour tout y dans un voisinage de (y0 , 0, . . .) de Rm , il existe (x, u) dans un voisinage de (x0 , u0 , 0, . . .) de X avec (x, u) = y et (x0 , u0 , 0, . . .) = (y0 , 0, . . .). On v erie facilement que le syst` eme tangent (T(x0 ,u0 ,0,...) X, T(x0 ,u0 ,0,...) f ) avec m T(x0 ,u0 ,0,...) X = Tx0 X T(u0 ,0,...) R = Tx0 X Rm ees (, ), et T(x0 ,u0 ,0,...) f = , de coordonn
f x (x0 , u0 )
f u (x0 , u0 )
(j +1) , j 0 (j )
(j ) tique ` a son lin earis e tangent puisque T(x0 ,u0 ,0,...) = j 0 u(j ) (x0 , u0 , 0, . . .) x (x0 , u0 , 0, . . .) + est lisomorphisme correspondant. Ceci implique alors que le syst` eme lin eaire tangent, qui est plat, est commandable dapr` es le corollaire 3.
8.4
Pour pr eciser le th eor` eme 25 dans le cas des syst` emes plats, introduisons la d enition suivante :
D enition 36 Un syst` eme est dit lin earisable par bouclage dynamique endog` ene sil existe un bouclage dynamique endog` ene de la forme (7.25) et un di eomorphisme de la vari et e etendue X Z telle que le syst` eme transform e soit lin eaire commandable. Corollaire 4 Tout syst` eme plat est lin earisable par bouclage dynamique endog` ene. Inversement, tout syst` eme lin earisable par bouclage dynamique endog` ene est plat. En outre, si le syst` eme admet une repr esentation d etat de dimension n ` a m entr ees, il existe des entiers r1 , . . . , rm avec m r n tels que x et u soient donn e s par i=1 i
(r m ) x = 0 (y1 , y 1 , . . . , y1 1 , . . . , ym , y m , . . . , ym ) (r1 +1) (rm +1) u = 1 (y1 , y 1 , . . . , y1 , . . . , ym , y m , . . . , ym ) (r )
(8.23)
116
et tels que le syst` eme boucl e soit di eomorphe au syst` eme lin eaire commandable sous forme canonique y1 . . .
(r1 +1)
= v1 (8.24) = vm .
(rm +1) ym
equivalent au syst` eme trivial (Rm Preuve. Comme le syst` eme (X, f ) est L-B , m ), par le th eor` eme 25, il existe un bouclage dynamique endog` ene et un di eomorphisme qui transforme le syst` eme en le syst` eme lin eaire commandable y () = v pour assez grand. La r eciproque est evidente puisque le syst` eme boucl e est L-B equivalent au syst` eme trivial (Rm , ) et que le bouclage est endog` e ne, x et u sexprimant alors en fonction de y et un nombre m ni de d eriv ees. Comme dans (8.23), ninterviennent que les d eriv ees de y jusquaux ordres r1 + 1, . . . , rm + 1, un m comme lapplication (0 , 1 ) est surjective, il vient n + m m i=1 ri . Puis, i=1 (ri + 1), do` reprenant la preuve du th eor` eme 25 dans le cas dun syst` eme plat, on v erie quil sut de poser (r +1) vi = yi i pour construire le di eomorphisme et le bouclage dynamique endog` ene, do` u le r esultat.
Remarque 6 Lensemble des di eomorphismes et bouclages statiques d etat etant, de fa con evidente, un sous-ensemble strict des bouclages dynamiques endog` enes, les syst` emes lin earisables par di eomorphisme et bouclage statique d etat (souvent appel es plus simplement lin earisables par bouclage statique) forment donc un sous-ensemble strict de lensemble des syst` emes plats. Dans le cas des syst` emes mono-entr ee (m = 1), on peut cependant montrer que la platitude est equivalente a la propri ` et e de lin earisation par bouclage statique d etat [12, 13]. La propri et e de platitude ne r ev` ele donc toute sa richesse que dans le cas multi-entr ees o` u lin earisation par bouclage statique et par bouclage dynamique ne sont plus equivalents. Le lecteur int eress e v eriera par exemple que le pendule et le v ehicule non holonome sont plats mais ne sont pas lin earisables par bouclage statique (utiliser pour cela le crit` ere de Jakubczyk-Respondek [33]. Voir aussi [29, 31, 38, 41, 42, 44]). Reprenons les exemples pr ec edents et construisons les bouclages lin earisants associ es.
8.4.1
Dapr` es (8.2), (8.4), (8.5), (8.6), x1 est une sortie plate et lentr ee u sexprime en fonction de x1 et ses d eriv ees jusqu` a lordre 4. Posons : x1 = v
(4)
(8.25)
et montrons que les syst` emes (8.2) et (8.25) sont Lie-B acklund equivalents. Dapr` es (8.6), on a : x1 =
(4)
k2 (3) u X (x1 , x 1, x 1 , x1 ) m1 m2
(8.26)
117
et le bouclage lin earisant est donc donn e par v = sagit dans ce cas dun bouclage statique.
8.4.2
On v erie comme au paragraphe pr ec edent que (8.8) est Lie-B acklund equivalent ` a x 1 = v (comme pr ec edemment par bouclage statique).
8.4.3
Pendule (suite)
(4) = v1 , (4) = v2 .
Le calcul du bouclage dynamique endog` ene se fait en identiant les d eriv ees 4` emes de et avec leur valeur en fonction des entr ees u1 et u2 : on a = u1 sin + (u2 + 1) cos 2 sin , soit, en faisant le changement de commande : 2 , w1 = u1 sin + (u2 + 1) cos = w1 sin , en d erivant de nouveau 2 fois et en posant w2 = u1 cos + (u2 + 1) sin 1 cos w1 2 sin = v1 (4) = w 1 sin + w1 w2 cos + 2w 1 1 sin w1 2 cos = v2 . (4) = w 1 cos w1 w2 sin 2w 1 Inversant ce syst` eme lin eaire par rapport ` aw 1 et w2 , il vient 2 w 1 = v1 sin + v2 cos + w1 w2 = v1 cos v2 sin 2w 1 w1 avec 2 ) sin w2 cos u1 = (w1 + 2 ) cos + w2 sin 1 . u2 = (w1 + (8.30) on obtient : (8.29) = w1 cos 1 . (8.28) 2 cos 1 = u1 sin + (u2 + 1) cos
(8.31)
On a donc construit un bouclage dynamique endog` ene en introduisant un compensateur dont l etat est donn e par (w1 , w 1 , w2 ) pour lequel le syst` eme (8.9) est equivalent ` a (8.27).
118
8.4.4
Comme pr ec edemment, montrons que (8.17) est Lie-B acklund equivalent ` a x = v1 , Un calcul el ementaire donne : u2 sin tan = v1 l u2 y =u sin + cos tan = v2 l x =u cos et, apr` es inversion de ce syst` eme lin eaire en u et tan , on obtient le compensateur dynamique endog` ene : l u = v1 cos + v2 sin , tan = 2 (v1 sin + v2 cos ) v do` u le r esultat. y = v2 .
8.5
8.5.1
= n m dans un voisinage donn e dune trajectoire arbitraire. Rappelons quune avec rang F x T sortie plate y est telle que y = (y1 , . . . , ym ) = (x, x, . . . , x(s) ) implique x = (y, y, . . . , y (r ) ) d pour des multi-entiers r et s convenablement choisis, l equation F (, dt ) = 0 etant localement d etant le champ de vecteurs trivial dordre m. identiquement v eri ee, avec dt = Lm , m On a alors Th eor` eme 28 Le syst` eme implicite F (x, x ) = 0 est localement plat en (x0 , y 0 ) avec x0 X0 = k m {x X|LX F = 0 k 0} et y 0 R si et seulement sil existe une application inversible dun voisinage de y 0 de Rm dans un voisinage de x0 de X0 , de classe C , telle que, dans le voisinage consid er e, dFi = 0 pour tout i = 1, . . . , n m. Preuve. Commen cons par remarquer quun syst` eme trivial sexprime de fa con implicite par G 0 puisquil nexiste aucune relation entre les composantes de y et leurs d eriv ees successives. Si le syst` eme (X Rn , , F ) est plat en ( x , y ) , on a, dapr` e s ce qui pr e c` ede, F (0 (y ), 1 (y )) = 0 0 X F 0 F 1 m 0 pour tout y dans un voisinage de y 0 de R . On a donc x y dy + x u la y dy = dF = 0 do` condition n ecessaire. Inversement, comme dFi = d (Fi ), le syst` eme de Pfa dFi = 0 pour tout i = 1, . . . , n m est int egrable par construction. Si lon pose x = (y ), on en d eduit que x sexprime en fonction de y et dun nombre ni de ses d eriv ees et que Fi (x, x ) = ci , les ci etant des constantes arbitraires.
119
Or comme F (x0 , x 0 ) = F (y 0 ) = 0, les constantes sont toutes nulles. Comme en outre est inversible, on conclut que le syst` eme F (x, x ) = 0 est plat en (x0 , y 0 ). C.Q.F.D. Ce r esultat montre que lapplication est caract eris ee par son application tangente puisque limage de cette derni` ere doit etre contenue dans le noyau de dF . En eet, si lon note = (k ) (0,1 , . . . , 0,n , 1,1 , . . . , 1,n , . . .) (rappelons que xi = 0,i (y ) et xi = k,i (y ) pour tout i = 1, . . . , n et k 1, avec k,i = suivante :
dk 0,i ), dtk
0,1
(j ) ym
(j ) dy1 . . = 0. . (j ) dym
j 0
F1 x1
. . .
F1 xn
. . .
F1 x 1
. . .
F1 x n
. . .
Fnm x1
Fnm xn
Fnm x 1
Fnm x n
. . .
. . .
0,n y1 1,1 y1
(j ) (j )
0,n ym 1,1 ym
(j ) (j )
. . .
. . .
1,n y1
(j )
1,n ym
(j )
F1 xn Fnm xn
F1 d + x n dt . . .
Fnm d x 1 dt
Fnm d x n dt
et D0 [ d ]= dt
0,1 dj j 0 y (j ) dtj 1
. . .
0,1 dj j 0 y (j ) dtj m
. . .
0,n dj j 0 y (j ) dtj 1
0,n dj j 0 y (j ) dtj m
Alors dFi = 0 devient DF [ dy1 . avec dy = . . . dym En eet, comme on a dyk la fois dxi
l 0 m k=1 (l )
d d ].D0 [ ]dy = 0 dt dt
(8.33)
=
(l) yk
l 0 d0,i dt
dl dyk dtl
et comme xi =
d0,i dt (y ) l 0 m k=1
0,i (y ) implique ` a = =
0,i yk
(l1)
et x i =
=
(l) yk
1,i (y ) et donc dx i
d0,i dt
dyk +
(l )
0,i yk
(l)
dyk
(l+1)
dyk
(l )
120
l 0 (l ) m 1,i k=1 y (l) dyk , k m n
l 0
k=1 j =1
0,j dl dyk l (l ) y dt
k
=
l0 k=1 j =1 m n
d0,j dt
(l )
dyk +
(l )
=
l0 k=1 j =1
dyk
do` u le r esultat. En outre, comme les composantes de dy doivent etre ind ependantes, l equation (8.33) equivaut a ` d d d d DF|(y) [ ].D0 |y [ ] = DF|x [ ].D0 |(x) [ ] = 0. (8.34) dt dt dt dt
d Cette identit e fait appara tre un produit de matrices polyn omiales par rapport ` a lop erateur dt et ` a coecients dans lensemble des fonctions C sur Rm esultats ou sur X0 . Pour utiliser des r dalg` ebre sur ces matrices, nous aurons besoin davoir des matrices polyn omiales dont les coecients appartiennent ` a un anneau, ce qui nest pas le cas de C (Rm ; R) ou de C (X0 ; R). Cest pourquoi nous allons maintenant nous restreindre ` a nutiliser que des fonctions m eromorphes (repr esentables localement comme des fractions rationnelles de fonctions analytiques) qui forment un anneau (admis). d On suppose donc F m eromorphe sur X muni du champ de Cartan trivial dt = X , ainsi que , m et sur R muni du champ de Cartan trivial m . d On notera K lanneau des fonctions m eromorphes de X dans R, K[ dt ] lanneau principal des d d d a coecients dans K et Mn,m [ dt ] le module des matrices de taille n m sur K[ dt ]. polyn omes de dt ` d Ce dernier nest pas commutatif, m eme si n = m = 1. En eet, par exemple le produit de dt d d erateurs sur K et que dt = LX ) vaut, pour toute fonction et de x dt (rappelons quil sagit dop 2 d d d d d d d d d2 a K, dt (x dt )a = dt (xa ) = x a + xa = (x dt + x dt2 )a, soit dt (x dt ) = x dt + x dt 2 , alors que d d d2 d d d2 d d x dt ( dt )a = xa = x dt2 a, et donc x dt ( dt ) = x dt2 = dt (x dt ). d Les el ements de Mn,n [ dt ] (matrices carr ees de taille n), m eme ceux de rang n, ne poss` edent d pas n ecessairement dinverse dans Mn,n [ dt ]. En eet, une matrice inversible dont les coecients sont des polyn omes a pour inverse une matrice dont les coecients sont des fractions rationnelles, d ] qui poss` edent une inverse g en eralement irr eductibles ` a des polyn omes. Les matrices de Mn,n [ dt d d ees les matrices unimodulaires. Elles forment un sous-groupe, not e Un [ dt ], dans Mn,n [ dt ] sont appel d de Mn,n [ dt ]. d Les matrices de Mn,m [ dt ] admettent, malgr e les faibles propri et es alg ebriques de cet ensemble, d une notion de diagonalisation, appel ee d ecomposition de Smith. Plus pr ecis ement, si M Mn,m [ dt ], d d il existe des matrices unimodulaires U Um [ dt ], V Un [ dt ] et une matrice diagonale de taille d p p avec p = min(n, m), dont les el ements diagonaux di,i K[ dt ] v erient di,i divise dj,j pour tout
8.5. CARACTERISATION DES SORTIES PLATES 0 i j p, telles que (, 0n,mn ) si n < m V MU = si n > m 0nm,m
121
(8.35)
avec 0r,s la matrice de taille r s dont tous les el ements sont nuls. Cette d ecomposition nest pas unique, seule est d enie de mani` ere unique. On peut parler de rang de la matrice M , qui na pas de sens en g en eral dans notre cas, si la matrice est constante, cest-` a-dire si tous les di,i appartiennent ` a K. Dans ce cas, le rang de M est egal au nombre d el ements diagonaux non nuls. Lorsque ce nombre est egal ` a p, on dit que M est hyper-r eguli` ere. Dans ce cas, on peut modier les matrices U et V de sorte que = Ip , la matrice identit e de taille p p. De plus, si M est carr ee de taille n, dire que M est hyper-r eguli` ere, donc d de rang n, equivaut ` a dire que M est unimodulaire, i.e. M Un [ dt ]. Etant donn ee une d ecomposition de Smith dune matrice M avec U et V donn es par (8.35), on note U D Smith (M ) une matrice unimodulaire de la d ecomposition de M ` a droite et V G Smith (M ) de la d ecomposition ` a gauche. d d Dans toute la suite, on va supposer que DF [ dt ] Mnm,n [ dt ] (avec n > m) est hyper-r eguli` ere. On admettra que cette propri et e sinterpr` ete comme la commandabilit e du syst` eme lin eaire tangent d en tout point de X0 . On notera aussi la matrice DF [ dt ] plus simplement DF lorsquil ny a pas dambiguit e. On a alors : Th eor` eme 29 On suppose DF hyper-r eguli` ere dans un voisinage du point x0 X0 . 1. Toute solution hyper-r eguli` ere de taille n m de l equation DF = 0 est donn ee par =U 0nm,m Im W (8.37) (8.36)
0nm,m Im
d et Z Um [ dt ]
Q=
(8.38)
d = (0nm,m , Inm ) Q est et la sous-matrice Q equivalente ` a DF , i.e. L Unm [ dt ] tel que DF = LQ. 3. Enn, une condition n ecessaire et susante pour que le syst` eme (8.32) soit plat en x0 X0 1 . d est que le K[ dt ]-id eal1 , engendr e par les 1-formes 1 , . . . , m avec = . . =
m
1 d si 1 , . . . , r sont r 1-formes ind ependante, le K[ dt ]-id eal engendr e par 1 , . . . , r est lensemble des combinaisons d a coecients dans K[ dt ` ] des formes i avec forme arbitraire de degr e arbitraire sur X0 et i = 1, . . . , r.
122
Preuve. Le point 1 r esulte directement de la d ecomposition de Smith de DF . En eet, comme DF est hyper-r eguli` ere, il existe V G Smith (DF ) et U D Smith (DF ) tels que V DF U = 0nm,m d ], ce qui prouve (Inm , 0nm,m ), do` u V DF U W = 0 pour toute matrice W U[ dt Im (8.37). qui est hyper-r Le point 2 sobtient de mani` ere analogue en d ecomposant U eguli` ere comme produit dune matrice unimodulaire par une hyper-r eguli` ere : soient donc Q G Smith U . On a QU R = et R D Smith U R R 1 W = QU Im Im 0nm,m W , Q = QU W = . Donc, comme = U
Z avec Z = R1 W , qui est bien unimodulaire puisque R, donc R1 , 0nm,m et W le sont. En outre, si lon multiplie cette derni` ere identit e par (0nm,m , Inm ), il vient que = 0 ce qui prouve, en comparant avec DF = 0, que Q et DF sont Q equivalentes. 1 dx1 . . Pour le point 3, soit = . u dx = . . = (Im , 0m,nm ) Qdx o` . et montrons que la m dxn condition de forte fermeture de , id eal engendr e par les i , i = 1, . . . , m, est n ecessaire. Supposons donc que le syst` eme (X, X , F ), avec X = X Rn et le champ de Cartan trivial associ e, est plat X k m en (x0 , y 0 ) avec x0 X0 = {x X|LX F = 0 k 0} et y 0 R . Il existe donc un isomorphisme de Lie-B acklund de Rm eriant (8.34). La matrice D0 | (pour plus de dans X0 , dinverse , v
d simplicit e, nous avons not e D0 | au lieu de D0 | [ dt ]) est n ecessairement hyper-r eguli` ere. En m eet, comme sa taille est n m, sa d ecomposition de Smith est egale ` a . Supposons 0nm,m d ) et de rang m. Alors il existerait que m ne soit pas constante (en tant que polyn ome de dt w combinaison lin eaire des dyi , i = 1, . . . , m, tel que m w = 0, ce qui impliquerait quil existe une equation di erentielle reliant les dyi qui sont ind ependants, do` u la contradiction, et D0 |
est hyper-r eguli` ere. Dapr` es (8.37) et (8.38), on peut identier D0 | avec . Dapr` es le point 2, Im on a alors Q D0 | = Z . Multiplions ` a gauche cette identit e par (Im , 0m,nm ) et 0nm,m = (Im , 0m,nm )Q. Il vient : Q D0 = Z . Par ailleurs, comme x = 0 (y ), en prenant la posons Q | =Q D0 dy = di erentielle des deux membres, on a dx = D0 | dy . On v erie alors que = Qdx | Zdy , autrement dit, dy = Z 1 . Prenant la d eriv ee ext erieure de cette derni` ere expression, comme d d2 y = 0 par d enition, il vient d(Z 1 ) = 0, ce qui prouve que le K[ dt ]-id eal est fortement ferm e. et que , engendr Inversement, supposons que U D Smith (DF ), Q G Smith U e
d , soit fortement ferm par = Qdx e dans un voisinage V0 de x0 X0 . Soit M Um [ dt ] tel que d(M ) = 0 et posons = M . Les m 1-formes 1 , . . . , m sont ind ependantes dans V0 et engendrent . Comme ces 1-formes ne d ependent que dun nombre ni de d eriv ees de x, dans la vari et e de jets correspondante, comme dj = 0 pour tout j = 1, . . . , m, dapr` es le lemme de Poincar e, il
123
. De plus 0 est existe une application 0 C (X0 ; Rm ) telle que d0 = = M = M Qdx m eromorphe sur V0 puisque sa di erentielle lest. Posons alors y = 0 (x) pour tout x V0 , et d0 d2 0 = 0 , dt , dt2 , . . . = (0 , 1 , 2 , . . .). Il nous reste ` a prouver que est lisomorphisme de Lie-B acklund cherch e. Q , notant comme pr = Comme Q G Smith U ec edemment Q = avec Q Q = (0nm,m , Inm ) Q, soit R D Smith (hatU ), i.e. tel que Q U R = Im et (Im , 0m,nm )Q et Q 1 1 QU R = 0nm,m . Posons W = RM . On a alors QU W = M et QU W = 0nm,m , ce qui, com ) bin e avec d0 = M Qdx, donne QU W d0 = Qdx et QU W d0 = 0nm . Il existe donc dz ker(Q tel que U W d0 = dx + dz . Or, Q etant equivalente ` a DF , il vient Qdx = L DF dx = 0 sur X0 et U W d0 = 0 = Qdx + Qdz = Qdz , soit dz ker(Q ) ker(Q ) = {0}. On a donc prouv donc Q e que d 1 dx = U W d0 avec W = RM . Notons alors i le plus haut degr e des polyn omes de dt formant la W . On doit donc avoir n m + 1 + . . . + m par la surjectivit W (consid i` eme colonne de U e de U er e k comme la matrice dont les entr ees sont les (U W )i,j avec lindice sup erieur k correspondant au d +1 1 . . . Rm +1 sur Rn ). De plus, terme dordre k du polyn ome (U W )i,j de dt , et qui envoie R si lon note = max(i |i = 1, . . . , m) and y = y1 , . . . , y1 matrice qui est donc de rang n. Alors, notant j =
dj 0 dtj (0) ( 1 )
, . . . , ym , . . . , ym m , on a =
(0)
( )
x y ,
y = 0 (x) y = 1 (x) . . . y () = (x) est de rang n par rapport ` a x puisque sa matrice Jacobienne est la pseudo-inverse de . Dapr` es le th eor` eme des fonctions implicites, il existe une solution locale donn ee par x = ( ) ( ) 0 (y, . . . , y , x, . . . , x ) pour un entier convenablement choisi. Mais alors, si lon prend la di erentielle de 0 , utilisant le fait que dF et toutes ses d eriv ees sont nulles sur X0 , et donc DF dx = 0, en comparant avec (8.36), avec = D0 | , on trouve que 0 est ind ependante de
d (x, . . . , x() ), soit x = 0 (y ), Alors = (0 , dt 0 , . . .) a pour inverse , ce qui ach` eve de prouver le th eor` eme.
8.5.2
Remarque 7 Le th eor` eme 29 permet dobtenir une sortie plate lin eaire, cest-` a-dire telle que x sexprime comme une combinaison lin eaire des composantes de y et dun nombre ni de ses d eriv ees. M eme dans le cas lin eaire, des sorties plates non lin eaires existent, i.e. telles que x = (y ) avec non lin eaire. Par exemple, le syst` eme lin eaire x 1 = u1 , x 2 = u2 est clairement plat avec y1 = x1 , y2 = x2 pour sortie plate, mais on peut aussi bien choisir x1 = y1 + (y2 )2 , x2 = y2 puisqualors u1 = y 1 + 2y 2 y 2 , u2 = y 2 et y1 = x1 x2 2 , y2 = x2 . Montrons sur un exemple comment la solution de l equation (8.37) permet dobtenir une sortie plate.
124
Ressort
M
Platine
k
Sol
MB -F r
Amortisseur passif
Base
xB
Fig. 8.7 Syst` eme base-platine mobile pour positionnement de haute pr ecision Exemple 35 On consid` ere une platine mobile motoris ee2 (voir gure 8.7) de masse M se d epla cant sans frottement le long dun rail x e` a la base dont la masse est MB . La base est elle-m eme reli ee au sol par une liaison elastique dont la raideur est k et lamortissement r. On note MB = M + MB . La base est suppos ee se d eplacer le long dun axe parall` ele aux rails. On note xB la position du centre de masse de la base dans un rep` ere xe reli e au sol et x la position du centre de masse de la platine, toujours dans le rep` ere xe. On note F la force appliqu ee ` a la platine par le moteur. F est la commande. Le bilan des forces s ecrit : Mx =F MB x B = F kxB rx B ce qui conduit imm ediatement ` a
d M dt 2 0
2 2
(8.39)
d2 MB dt 2
0 d + r dt +k
x xB
1 1
F.
d M dt 0 1 2 Posons = . et B = d2 d 1 0 MB dt2 + r dt + k Pour elimiiner lentr ee F , calculons une matrice C orthogonale ` a B : CT = syst` eme implicite equivalent ` a (8.39) est donc d A[ dt ]
1 1 . Le
C T A[
d ] dt
x xB
d M dt 2
d d MB dt 2 + r dt + k d 1 [ dt ] d 2 [ dt ]
x xB
= 0.
(8.40)
, solution de
d 1 [ dt ] d 2 [ dt ]
C T A[
d d ][ ] = dt dt
d M dt 2
d d MB dt 2 + r dt + k
=0
(8.41)
2 Cette application a fait lobjet du Brevet Europe en N. 00400435.4-2208 et US N. 09/362,643, au prot de la rme Newport Corporation.
125
d d d2 d2 d [ ] = M + k 2 [ ]. 1 B 2 +r 2 dt dt dt dt dt
2
d d d Comme les polyn omes M dt 2 et MB dt2 + r dt + k sont premiers entre eux, il vient
1 [
d 1 ]= dt k
MB
d2 d +r +k , 2 dt dt
2 [
d 1 ]= dt k
d2 dt2
(8.42)
et, gr ace au terme constant egal ` a 1 de 2 , est clairement de rang 1 et donc surjectif. x d x et xB sont alors donn es par = [ dt ]y , soit xB x= et F = M 1 k MB M d r d2 +r +k y = By + y + y, dt2 dt k k
r (3) +k y +y .
xB =
M d2 k dt2
y=
M y k
(8.43)
MB (4) k y
8.5.3
Explicitons les conditions du th eor` eme 29. Donnons un algorithme de calcul des matrices polyn omiales du th eor` eme 29, d eduites de la d d ecomposition de Smith de DF [ dt ]. On commence par choisir sur la premi` ere ligne de DF un polyn ome de plus bas degr e (non n ecessairement unique) et on applique ` a DF une permutation de colonnes (resp. lignes) pour que d ce terme arrive en 1` ere position. Notons ce terme a1,1 [ dt ]. On divise ensuite ` a droite tous les el ements d d de la ligne a1,k [ dt ] (resp. ` a gauche les ak,1 [ dt ]) par a1,1 . Si lun des restes de ces divisions est non nul, soit a1,k = a1,1 q1,k + r1,k , avec r1,k = 0, on soustrait la k -i` eme colonne (resp. ligne) ` a la premi` ere multipli ee ` a droite (resp. ` a gauche) par q1,k (resp. qk;1 d eni par ak,1 = qk,1 a1,1 + rk,1 ). Comme le r esultat est obligatoirement de degr e inf erieur ` a celui de a1,1 , on op` ere une seconde permutation pour que ce nouveau terme soit plac e en premi` ere position. On renouvelle l etape de divisions par ce nouveau terme et on continue ainsi jusqu` a ce que tous les restes soient egaux ` a 0. On applique alors les combinaisons de colonnes (resp. lignes) convenables pour que tous les termes de la premi` ere ligne (resp. colonne), sauf a1,1 , soient nuls. On it` ere ce proc ed e sur la deuxi` eme ligne (resp. colonne) a partir de l ` el ement a2,2 , et ainsi de suite jusqu` a nobtenir que des 0 en dehors de la diagonale.
8.5.4
Exemples
x cos + y sin
dx d DF [ ] dy = 0. dt d
Le calcul de la d ecomposition de Smith se fait comme suit : ` a chaque etape, les matrices de la partie gauche de la page sont le r esultat du calcul pr ec edent et les matrices de la partie droite sont les matrices de transformation. On a : 0 0 1 d d 0 1 0 = U1 1. sin dt cos dt x cos + y sin 1 0 0 d sin d cos 1 x cos +y sin dt x cos +y sin dt d d = U2 0 2. sin dt x cos + y sin cos dt 1 0 0 0 1 x cos + y sin 0 0 . 3. On a donc obtenu DF [ avec 0 d 0 U [ ] = U1 U2 = dt 1 0 1
cos d x cos +y sin dt
d d ]U [ ] = dt dt
0 0 1 0 et = x cos + y sin
Notons quici (n-m=1) la matrice V a rien et que est bien un scalaire. du triplet (U, V, ) ne sert ` 0 1 = U 01,2 o` 1 0 On a donc U = u I2 est la matrice identit e de R2 . I2 cos d sin d dt dt : On applique le m eme algorithme (mais cette fois ` a gauche) pour calculer Q G Smith U Q= 0 1
sin d dt
1 0
d cos dt
0 0 . 1
dx 1 Multiplions Q par dy . La derni` ere ligne est (sin dx cos dy + (x cos + y sin )d) = d 1 d ( x sin y cos ) qui nest autre que le syst` eme lui-m eme et donc est identiquement nul sur X0 . dx dx 0 1 0 1 dy = Les deux premi` eres lignes de Q dy sont . Lid eal est 1 0 0 2 d d donc engendr e par (dx, dy ) et est donc trivialement fortement ferm e, en prenant M = I2 . On trouve donc les sorties plates y1 = y and y2 = x, d ej` a mise en evidence au paragraphe 8.2.4.
127
Exemple 37 Reprenons le pendule pr esent e au paragraphe 8.2.3, sous la forme implicite (8.10) : + x cos ( z + 1) sin = 0. On a DF [ et d ]= dt
2 2 2
d cos dt 2
d sin dt 2
d dt x sin + ( z + 1) cos ) 2 (
dx d dz = 0. DF [ ] dt d
Pour calculer une forme de Smith de DF , commen cons par montrer la relation cos d2 d2 d2 2 . (cos ) + sin (sin ) = dt2 dt2 dt2
d d sin .h pour toute fonction h di (cos .h) = cos .h erentiable, et donc dt (cos ) = On a dt d d d sin . De m cos . En it cos dt eme, on montre que dt (sin ) = sin dt + erant ce calcul, on obtient d2 d2 d d2 d2 d 2 2 (cos ) = cos dt 2 2 sin dt sin cos , dt2 (sin ) = sin dt2 +2 cos dt + cos sin , dt2 do` u la relation annonc ee. 1 0 cos Revenons maintenant ` a la matrice DF et posons U1 = 0 1 sin . On a alors 0 0 1 2 2 2 + A avec DF.U1 = cos d 2 sin d 2 dt dt
A = ( x sin + ( z + 1) cos ). le terme de plus bas degr e se trouve en 3` eme colonne, on multiplie DF.U1 par U2 = 1 2 + A sin d22 cos d22 . Enn, en multipliant le r 0 et DF.U1 .U2 = esultat dt dt 0 d2 cos d2 1 Asin 2 2 2 dt 2 dt A 2 0 0 . La mapar U3 = 0 , on obtient la forme voulue : A 1 0 0 0 1 trice U est donc donn ee par cos2 d2 sin cos d2 cos + 1 2 2 2 dt 2 dt A A sin2 d2 sin cos d2 . sin + 1 U = U1 .U2 .U3 = 2 2 dt 2 dt2 A A d2 cos d2 1 Asin 2 dt2 2 dt2 A 2 . On a alors Posons E = A = U Comme 0 0 0 1 1 0
cos E 1
1 0
d sin E dt2
2
0 1
cos d2 E dt2
1 0
d sin E dt2
2
bd cos dx sin dz + ad
La condition de forte fermeture de lid eal engendr e par (d(z + a cos ), d(x + a sin )) est donc v eri ee. Posons d(z + a cos ) = dy1 , d(x + a sin ) = dy2 on obtient donc y1 = z + a cos , y2 = x + a sin qui correspond bien (` a une permutation pr` es) aux coordonn ees du centre doscillation dHuygens pr ec edemment trouv ees au paragraphe 8.2.3.
Chapitre 9
9.1
Les conditions de platitude reviennent ` a dire quil existe une sortie plate telle que toutes les variables du syst` eme puissent sexprimer en fonction de la sortie plate et dun nombre ni de ses d eriv ees et que les equations di erentielles du syst` eme sont identiquement v eri ees. Il en r esulte que si lon veut construire des trajectoires dont les conditions initiales et nales sont sp eci ees, il sut de calculer la trajectoire de la sortie plate correspondante ce qui evite, en outre, dint egrer les equations di erentielles du syst` eme. 129
130
CHAPITRE 9. PLATITUDE ET PLANIFICATION DE TRAJECTOIRES Plus pr ecis ement, supposons que x = 0 (y, y, . . . , y (r ) ) u = 1 (y, y, . . . , y (r+1) ). (9.1)
Comme les valeurs initiales et nales de x et u sont donn ees, la surjectivit e de (0 , 1 ) permet ( r +1) 1 de d eterminer des valeurs initiales et nales de (y, y, ...,y ). Il sut ensuite de trouver une trajectoire t y (t) au moins r + 1 fois d erivable qui satisfait ces conditions initiales et nales puisque x et u se d eduisent de y et de ses d eriv ees jusqu` a lordre r + 1 par (9.1). Comme, par ailleurs, la trajectoire t y (t) ne doit v erier aucune equation di erentielle, on peut simplement la construire par interpolation polyn omiale, de fa con analogue ` a la synth` ese propos ee dans le cadre des syst` emes lin eaires (voir la section 4.1.2). Avant den rappeler les principes, pr ecisons que, par construction, les trajectoires t x(t) et t u(t) obtenues en rempla cant y et ses d eriv ees par leur valeur en fonction du temps dans (9.1) satisfont identiquement, par d enition des syst` emes plats, les equations di erentielles du syst` eme. Nous allons d etailler la m ethode de construction dune trajectoire dans le cas g en eral dabord, puis dans le cas particulier important des trajectoires dites arr et-arr et, i.e. joignant deux points d equilibre du syst` eme, ou encore telles que le syst` eme soit au repos au d emarrage et ` a larriv ee.
9.1.1
Cas g en eral
Supposons donc que nous disposons des donn ees suivantes ` a linstant ti : y1 (ti ), . . . , y1 et ` a linstant tf : y1 (tf ), . . . , y1
(r +1) (r+1) (tf ), . . . , ym (tf ), . . . , ym (tf ) (r+1) (r +1) (ti ), . . . , ym (ti ), . . . , ym (ti )
(9.2)
(9.3)
qui font en tout 2(r + 2) conditions sur chacune des m composantes de y . Si lon cherche (y1 , . . . , ym ) sous la forme de m polyn omes par rapport au temps, chacun deux doit comporter au moins 2(r + 2) coecients pour satisfaire les conditions initiales et nales et doit donc etre de degr e au moins egal ` a 2r + 3. ti Posons alors T = tf ti , (t) = t T et
2r +3
yj (t) =
k=0
aj,k k (t),
j = 1, . . . , m.
Comme ` a la section 4.1.2, on calcule les coecients aj,k en egalant les d eriv ees successives de yj aux instants initial et nal aux donn ees (9.2) et (9.3) :
(k ) yj (t)
1 = k T
2r +3 l =k
l! aj,l lk (t), j = 1, . . . , m (l k )!
k! aj,k , k = 0, . . . , r + 1, j = 1, . . . , m, Tk
(9.4)
131
1 = k T
2r+3 l =k
l! aj,l , k = 0, . . . , r + 1, j = 1, . . . , m (l k )!
(9.5)
ce qui fait au total 2r +4 equations lin eaires en les 2r +4 coecients aj,0 , . . . , aj,2r+3 , pour chaque j = 1, . . . , m, qui peuvent en fait se ramener ` a r+2 equations lin eaires en les r + 2 coecients inconnus aj,r+2 , . . . , aj,2r+3 , puisque les r + 2 premi` eres equations (9.2) sont r esolues en aj,0 , . . . , aj,r+1 : aj,k = T k (k ) y (ti ) , k = 0, . . . , r + 1. k! j
Les r + 2 coecients restants sont alors donn es par : 1 1 ... 1 r+2 r+3 2r + 3 (r + 1)(r + 2) (r + 2)(r + 3) (2r + 2)(2r + 3) . . . . . . (2r +3)! (r +3)! ... (r + 2)! 2 (r +2)! = k T yj (tf )
aj,r+2 . . . aj,2r+3
r+1 l=0
T l (l ) y (ti ) l! j T l k (l ) y (ti ) (l k )! j
(r +1)
. (9.6)
. . .
r +1
yj (tf )
l =k
(k )
. . .
T r+1 yj
(r+1)
(tf ) yj
(ti )
Remarque 8 Il est int eressant de noter que dans cette construction, la relation donnant y en fonction de x, u et d eriv ees nest ` a aucun moment n ecessaire, si bien que linterpr etation de y par rapport aux variables naturelles du mod` ele, m eme si elle apporte un eclairage souvent int eressant pour dautres questions, napporte rien pour la planication de trajectoires.
9.1.2
Si les points de d epart (x(ti ), u(ti )) et darriv ee (x(tf ), u(tf )) sont des points d equilibre, on a x (ti ) = 0 , u (ti ) = 0 et x (tf ) = 0 , u (tf ) = 0. On sait, dapr` es le th eor` eme 24 que y (ti ) et y (tf ) sont aussi des points d equilibre pour le syst` eme trivial associ e et, dapr` es (9.1), on a x(ti ) = 0 (y (ti ), 0, . . . , 0), x(tf ) = 0 (y (tf ), 0, . . . , 0), u(ti ) = 1 (y (ti ), 0, . . . , 0) u(tf ) = 1 (y (tf ), 0, . . . , 0).
La construction pr ec edente sadapte donc facilement en rempla cant toutes les d eriv ees de y par 0 en ti et en tf . On obtient
132
Proposition 19 Les trajectoires arr et-arr et sont de la forme yj (t) = yj (ti ) + (yj (tf ) yj (ti )) t ti t f ti
r+2 r +1
j,k
k=0
t ti tf ti
j = 1, . . . , m
(9.7)
avec j,0 , . . . , j,r+1 solution de 1 1 ... 1 r+2 r+3 2r + 3 (r + 1)(r + 2) (r + 2)(r + 3) (2 r + 2)(2r + 3) . . . . . . (r +3)! (2r +3)! (r + 2)! ... 2 (r+2)!
Preuve. Il sut de remplacer les d eriv ees de y par 0 dans (9.6). On obtient alors aj,0 = yj (ti ), aj,k = 0 pour k = 1, . . . , r + 1 et les polyn omes
2r+3
yj (t) = yj (ti ) +
k=r+2
aj,k k (t),
En outre, le syst` eme lin eaire (9.6) a pour membre de droite le vecteur en posant j,kr2
Remarque 9 Comme toutes les d eriv ees de y doivent etre nulles ` a l equilibre, on peut ajouter un nombre ni arbitraire de conditions initiales et nales nulles sur les d eriv ees dordre sup erieur ` a r +1 sans changer les points d equilibre de d epart et darriv ee. De cette mani` ere, on peut augmenter la r egularit e de la trajectoire et ainsi rendre le d emarrage et larriv ee plus calmes. Cette remarque peut etre utile en pratique si lon veut eviter, ` a larriv ee, dexciter des modes oscillants ou instables.
9.2
On aborde deux types de contraintes : des contraintes de type g eom etrique, i.e. la trajectoire de la sortie plate ne doit pas sortir dun certain domaine de lespace, ou des contraintes quantitatives sur certaines positions, vitesses, acc el erations, etc.
9.2.1
Supposons que lon veuille planier des trajectoires arr et-arr et dun syst` eme plat a ` m entr ees et n etats, et quon d esire garantir que les trajectoires de la sortie plate restent dans un domaine de lespace d ecrit par lin equation A(y ) 0. (9.9)
133
On va supposer, pour simplier, que A est surjective de Rm dans R et C et que les points de d epart yi et darriv ee yf appartiennent ` a la fronti` ere de ce domaine, i.e. A(yi ) = A(yf ) = 0 et ` a la m eme composante connexe, not ee A0 , de lensemble A = 0. On peut alors construire une trajectoire t y (t) v eriant A(y (t)) = 0 pour tout t, et donc v eriant (9.9), de la mani` ere suivante : comme A est surjective, par le th eor` eme des fonctions implicites, il existe une application Y dun voisinage de U de Rm1 dans A0 R telle que, apr` es renum erotation eventuelle des composantes de y , ym = Y (y1 , . . . , ym1 ) implique A(y1 , . . . , ym1 , Y (y1 , . . . , ym1 )) = 0 pour tout (y1 , . . . , ym1 ) U . On a alors en particulier ym (ti ) = Y (y1 (ti ), . . . , ym (ti )) et ym (tf ) = Y (y1 (tf ), . . . , ym (tf ). Il sut alors de construire m 1 courbes t yj (t), j = 1, . . . , m 1, v eriant, ` a linstant (r +1) initial, pour tout j = 1, . . . , m 1, y j (ti ) = . . . = yj (ti ) = 0 et, ` a linstant nal, y j (tf ) = . . . = yj
(r +1)
(tf ) = 0. En eet, dans ce cas, on aura ym (ti ) = Y (y1 (ti ), . . . , ym (ti )), y m (ti ) =
(r+1) ym (ti )
m1 Y j (ti ) j =1 yj y
= 0,
et, par r ecurrence, = 0, de sorte que les conditions initiales et nales arr et-arr et sont automatiquement satisfaites. Reste ` a construire les m 1 courbes t yj (t), j = 1, . . . , m 1 v eriant les conditions initiales et nales ci-dessus. On proc` ede alors comme en 9.1.2 : yj (t) = yj (ti ) + (yj (tf ) yj (ti )) t ti t f ti
r +2 r +1
j,k
k=0
t ti tf t i
avec les j,k donn es par (9.8) pour tout j = 1, . . . , m 1. On termine la construction en composant ces trajectoires avec Y pour obtenir la derni` ere composante de y et ainsi la trajectoire y cherch ee. On d eduit ensuite x et u de la fa con habituelle. Exemple 38 Reprenons lexemple de v ehicule non holonome de 8.2.4 et 8.4.4. Supposons quon veuille r ealiser un cr eneau le long dun trottoir en marche arri` ere. Remarquons quen marche arri` ere, il faut prendre u < 0 dans les equations du syst` eme (8.17). Choisissons laxe des abscisses du rep` ere xe parall` ele au trottoir. La position de d epart, ` a linstant ti , est not ee (xi , yi ), laxe du v ehicule et les roues avant parall` eles ` a laxe des x, et la position nale, ` a linstant tf , est not ee (xf , yf ), laxe du v ehicule et les roues avant toujours parall` eles ` a laxe des x. La vitesse initiale (dans la direction du trottoir) est egale ` a 0 ainsi que la vitesse nale. La contrainte g eom etrique se traduit ici par le fait que les coordonn ees du milieu de lessieu arri` ere doivent rester a ` une distance donn ee du v ehicule gar e et du trottoir. Plut ot que dentrer dans cette description, donnons nous directement une courbe y = Y (x) v eriant yi = Y (xi ) , yf = Y (xf ) , La fonction Y (x) = yi + (yf yi ) x xi xf xi
3
0=
10 15
x xi xf xi
+6
x xi xf xi
134
satisfait ces conditions. On doit donc maintenant trouver une courbe t x(t) telle que x(ti ) = xi , x (ti ) = 0 et x(tf ) = xf , x (tf ) = 0. Linterpolation polyn omiale donne x(t) = xi + (xf xi ) t ti tf t i
2
32
t ti t f ti
Il sut alors de composer y (t) = Y (x(t)) pour avoir la trajectoire du milieu de lessieu arri` ere 1 2 2 2 du v ehicule. On en d eduit imm ediatement u = (x (t) + y (t)) . Les autres variables, , , sobtiennent par les formules (8.19), (8.20) pour tout t ]ti , tf [. On v erie en outre (exercice) que lim tan (t) = 0, lim tan (t) = 0, lim tan (t) = 0, lim tan (t) = t ti t ti t tf t tf t ti t ti t tf t tf 0, ce qui ach` eve la construction. Notons que les trajectoires obtenues d emarrent et arrivent en des points d equilibre qui ne sont pas commandables au premier ordre, ce qui se traduit par le fait que les formules (8.19), (8.20) ny sont pas d enies, puisque la vitesse sannule. Cependant, la construction en deux temps propos ee ici joue le r ole dune d esingularisation. Exemple 39 Reprenons lexemple de grue de la section 7.1 et montrons comment planier des trajectoires arr et-arr et qui evitent un obstacle situ e vers le milieu de la trajectoire de la charge. Rappelons que la position de la charge constitue une sortie plate et donc que les contraintes sur la trajectoire de la charge sexpriment directement sur la sortie plate. On va, comme dans lexemple pr ec edent, commencer par construire une trajectoire passant au-dessus de lobstacle, puis on va r egler l evolution sur cette courbe pour avoir le comportement arr et-arr et voulu. On suppose donc quon veut amener la charge de la position de d epart (i , i ) ` a linstant ti , au + repos, ` a la position nale (f , f ) ` a linstant tf , au repos, et la faire passer par le point ( f 2 i , 2f i ) qui doit etre le maximum de cette courbe entre i et f . Construisons donc la trajectoire . Elle doit v erier les 4 conditions (i ) = i ,
2
(f ) = f ,
f + i ) = 2f i , 2
d f + i ( ) = 0. d 2
f i ( 2 ) < 0 pour avoir un maximum local en ce point. avec la contrainte d d 2 Le polyn ome du 3` eme degr e en :
( ) = i + (f i )
i f i
9 12
i f i
+4
i f i
satisfait les conditions pos ees (voir Fig 9.1). Il reste donc ` a construire un trajectoire t (t) qui v erie (ti ) = 0, . . . , (5) (ti ) = 0 (ti ) = i , (tf ) = 0, . . . , (5) (tf ) = 0 (tf ) = f ,
135
1.8
1.6
1.4
1.2 ( - i)/(f- i)
0.8
0.6
0.4
0.2
0.1
0.2
0.3
0.4
0.5 (- i)/(f- i)
0.6
0.7
0.8
0.9
i f i
en fonction de
i f i .
o` u lon a exig e que toutes les d eriv ees de jusqu` a lordre 5 soient nulles pour assurer que les d eriv ees de la force appliqu ee au chariot et du couple appliqu e au treuil soient nulles. Les d eriv ees jusqu` a lordre 4 sont n ecessaires pour que la grue soit au repos et la condition dordre 5 doit permettre un d emarrage et une arriv ee plus progressifs. On obtient donc le polyn ome de degr e 11 : (t) = i + (f i ) 6 (t) 462 1980 (t) + 3465 2 (t) 3080 3 (t) + 1386 4 (t) 252 5 (t)
ti avec (t) = tt . f ti Les trajectoires de x, R, , T , F et C se d eduisent alors de t ( (t), ( (t))) par les formules (7.8)-(7.9)-(7.10).
9.2.2
Contraintes quantitatives
On demande souvent, en plus des contraintes g eom etriques, que certaines variables du syst` eme soient born ees, et notamment les entr ees. On peut r egler la dur ee totale T de la trajectoire de sorte que ces bornes soient respect ees. En eet, on a vu que la sortie plate pouvait sexprimer en fonction du temps r eduit (t) = On a alors y (t) = de sorte que
t[ti ,tf ]
t ti t ti = . tf t i T 1 dk y ( (t)), T k d k
1 dy ( (t)), T d max
y (t) =
1 d2 y ( (t)), T 2 d 2
...,
y (k) (t) =
...
y (k) (t) =
1 dk y max ( ) , T k [0,1] d k
k 1.
136
Si lon veut assurer que |y C1 , . . . , y (k) Ck pour des constantes C1 , . . . , Ck donn ees, il sut alors de choisir la dur ee T : T = max 1 dy max ,..., C1 [0,1] d 1 dk y max Ck [0,1] d k
1 k
(9.10)
Les constantes Cj sont alors choisies de sorte ` a garantir les bornes voulues sur les variables dorigine du syst` eme gr ace aux expressions obtenues par transformation de Lie-B acklund. Supposons par exemple que lon veuille assurer que u Cu . Comme u = 1 (y, y, . . . , y (r+1) ), pour T susamment grand, on a u = 1 (y, y, . . . , y (r+1) ) = 1 (y, 1 dy 1 dr+1 y , . . . , r+1 r+1 ) T d T d 1 1 dy 1 1 1 (y, 0, . . . , 0) + + . . . + r+1 T y d T y (r+1) 1 1 1 (y, 0, . . . , 0) + C1 + . . . + Cr+1 y y (r+1) Cu
dr+1 y d r+1
ce qui permet de choisir les constantes Ck , k = 1, . . . , r + 1 en fonction de Cu puis T par la formule (9.10). Pour conclure, sil existe des trajectoires qui satisfont les contraintes donn ees, on peut arriver a les obtenir en augmentant susamment la dur ` ee T de la trajectoire.
9.3
La commande pr edictive consiste ` a se donner un horizon T , un horizon glissant T0 g en eralement petit devant T , des conditions nales et des contraintes comme dans le probl` eme de planication de trajectoires, ` a ceci pr` es que lon prend en compte la pr esence de perturbations qui peuvent faire d evier les trajectoires. Pour contrer ces d eviations, au bout de la dur ee T0 , on mesure l etat du syst` eme ` a cet instant et on calcule une nouvelle trajectoire de r ef erence reliant ces nouvelles conditions initiales aux conditions nales d esir ees, et ainsi de suite. Plus pr ecis ement, etant donn ee la condition initiale (xi , ui ), on cherche une trajectoire de r ef erence arrivant ` a la cible (xf , uf ) ` a linstant tf = ti + T et satisfaisant les contraintes x ees. Puis, ` a linstant ti + T0 , on mesure (x(ti + T0 ), u(ti + T0 )) et, si ce nouveau point nest pas dans un voisinage susamment petit de la trajectoire de r ef erence, on recalcule une trajectoire partant de (x(ti + T0 ), u(ti + T0 )) et arrivant en (xf , uf ) ` a linstant ti + T0 + T 1 , toujours satisfaisant les contraintes x ees. On it` ere cette d emarche tant quon na pas atteint un voisinage susamment petit de la cible. Si au cours de ce processus, on ne peut plus trouver de trajectoire satisfaisant les contraintes, on peut soit augmenter T , soit rallier un point interm ediaire do` u la cible pourra de nouveau etre atteinte sans violer les contraintes.
1 cest ce quon appelle un horizon glissant car la fen etre dans laquelle on travaille, [ti , ti +T ], puis [ti +T0 , ti +T0 +T ], etc. se d ecale progressivement
137
On peut clairement appliquer les m ethodes qui pr ec` edent en calculant les trajectoires par linterm ediaire dune sortie plate : ` a chaque it eration, on calcule une trajectoire de la sortie plate partant de (y (ti + kT0 ), . . . , y (r+1) (ti + kT0 )) tel que x(ti + kT0 ) = 0 (y (ti + kT0 ), . . . , y (r) (ti + kT0 )), u(ti + kT0 ) = 1 (y (ti + kT0 ), . . . , y (r+1) (ti + kT0 )), o` u x(ti + kT0 ) est le nouveau point mesur e, assurant ainsi la continuit e des d eriv ees de la sortie plate ` a cet instant pour ne pas cr eer d` a-coups. Notons que les perturbations peuvent correspondre ` a des ph enom` enes non mod elis es ou aussi, lorsque la commande assure une assistance ` a la conduite dun syst` eme sous la supervision dun op erateur, ` a des modications du fonctionnement demand ees par lop erateur. Il ny a pas de r esultat g en eral permettant de garantir que les objectifs x es sont eectivement r ealis es pour toute perturbation, et encore moins destimation du temps n ecessaire ` a leur r ealisation. Cependant, cette m ethode est tr` es populaire dans lindustrie, notamment lindustrie des proc ed es chimiques, et, en pratique, elle donne souvent de tr` es bons r esultats lorsque le syst` eme est susamment stable en boucle ouverte, ou instable avec une dynamique tr` es lente par rapport ` a lhorizon glissant T0 , ou peu perturb e avec un mod` ele dynamique susamment pr ecis.
138
Chapitre 10
Pour la planication de trajectoires, la seule connaissance requise est le mod` ele dynamique et le temps. Cette conception est dite en boucle ouverte car elle nutilise pas dinformation obtenue au fur et ` a mesure du fonctionnement du syst` eme : la trajectoire de r ef erence est calcul ee ` a partir de linstant pr esent jusqu` a un instant futur en fonction de ce que lon conna t sur la fa con de r eagir du syst` eme. Il sagit donc dune anticipation. Clairement, si la dynamique du syst` eme est pr ecis ement connue et si les perturbations venant de lenvironnement ext erieur nont pas un eet important dans le domaine dutilisation du syst` eme, lanticipation, ` a elle seule, va nous permettre de nous rapprocher de lobjectif x e. Par contre, si la mod elisation nest pas assez pr ecise ou trop perturb ee, lanticipation va devoir etre compl et ee par une loi de commande pour fermer la boucle : si lon mesure, par linterm ediaire de capteurs, l etat du syst` eme ` a chaque instant, on peut evaluer l ecart entre la trajectoire r eellement parcourue et la trajectoire de r ef erence et en d eduire une loi de commande en boucle ferm ee permettant de r eduire cet ecart. Le probl` eme du suivi de trajectoires consiste donc ` a trouver une loi de commande en boucle ferm ee permettant de garantir que, pour une classe de perturbations donn ee, l etat du syst` eme va tendre asymptotiquement vers la trajectoire de r ef erence. Pour un syst` eme plat, dans un domaine ouvert ne contenant pas de point singulier (point o` u lisomorphisme de Lie-B acklund d eg en` ere ou nest plus d eni), le suivi de trajectoires peut etre r esolu gr ace au corollaire 4 sur l equivalence par bouclage dynamique endog` ene ` a un syst` eme trivial. En eet, si y est une sortie plate correspondant ` a l etat x et lentr ee u, suppos es mesur es, et , i = 1, . . . , m. Par le si y est la trajectoire de r ef erence de la sortie plate, posons ei = yi yi corollaire 4, on sait construire un bouclage dynamique endog` ene tel que le syst` eme s ecrive, ` a un di eomorphisme pr` es, y (r+1) = v . Si lon pose v = (y )(r+1) , l equation derreur en e s ecrit e(r+1) = v v . Il sut alors de poser, composante par composante :
r
vi =
vi
+
j =0
ki,j ei
(j )
i = 1, . . . , m
(10.1)
139
140
(j ) = 0 aient toutes leurs racines ` a avec les gains ki,j tels que les m polyn omes sr+1 r j =0 ki,j s partie r eelle strictement n egative, i = 1, . . . , m. Alors e converge exponentiellement vers 0 : r (r+1) ei (j )
=
j =0
ki,j ei
i = 1, . . . , m,
(10.2)
et donc y et toutes ses d eriv ees jusqu` a lordre r + 1 convergent vers leur r ef erence y , . . ., (y )(r+1) . Utilisant la di erentiabilit e de lisomorphisme de Lie-B acklund x = 0 (y, . . . , y (r) ), u = 1 (y, . . . , y (r+1) )
on en conclut que lensemble des variables x et u du syst` eme dorigine convergent localement exponentiellement vers leur r ef erence.
10.1.1
Pendule (suite et n)
Reprenons le bouclage dynamique endog` ene calcul e au paragraphe 8.4.3. Utilisant (8.30) et (8.31), le syst` eme boucl e s ecrit, pour w1 = 0, ) cos 2 ) sin (v1 cos v2 sin 2w 1 = (w1 + x w1 z ) sin 1 2 ) cos + (v1 cos v2 sin 2w 1 = (w1 + w1 = (v1 cos v2 sin 2w ) 1 w 1 w 2 . = v sin + v cos + w
1 1 2 1 et v sont les entr et y , Donc, si v1 ees de r ef erence correspondant aux trajectoires de r ef erence y1 2 2 ), il sut de choisir et si lon mesure tout l etat (x, x, z, z, , 3 vi = vi + j =0 (j ) )(j ) par leurs expressions en fonction de (x, x, w1 , w en rempla cant les yi et (yi z, z, , , 1 ), pour avoir la convergence exponentielle locale de lensemble des variables (x, x, z, z, , , w1 , w 1 ) vers leur r ef erence. (j ) ki,j (yi (yi ) ), (j )
i = 1, 2 ,
10.1.2
Reprenons le bouclage obtenu au paragraphe 8.4.4 : x = u cos y = u sin = 1 (v1 sin + v2 cos ) u v = v1 cos + v2 sin .
141
Si lon mesure l etat (x, y, ), et si la vitesse u ne sannule pas, on peut poser, comme pr ec edemment,
1 v1 = v1 + j =0 1
v2 = v2 + j =0
k2,j (y (j ) (y )(j ) )
pour obtenir la convergence de x, y et vers leurs r ef erences. On peut en fait etendre cette construction au cas o` u la vitesse sannule, ce qui est n ecessaire lorsquon fait un cr eneau, en exploitant la propri et e dhomog en eit e du syst` eme : divisons les deux membres du syst` eme par une fonction de classe C en t, de signe constant sur [ti , tf ], introduisons le changement de temps d = (t) dt et le changement dentr ee u v= . Le syst` eme devient : dx x u = = cos = v cos d y u dy = = sin = vsin d d u v = = tan = tan . d l l On retrouve un syst` eme analogue au syst` eme initial par rapport au nouveau temps
t
=
ti
(s)ds
et avec une nouvelle entr ee v . u(t) u(t) On peut ainsi d esingulariser le syst` eme en choisissant tel que limtti (t) = 0 et limttf (t) = 0 alors que u(ti ) = 0 et u(tf ) = 0. Il sut pour cela de choisir (t) = u (t), la vitesse de la trajectoire de r ef erence r ealisant la manuvre du cr eneau. En eet, la r ef erence v de v est v = u = 1 et, en recopiant la loi de u commande pr ec edente dans le cas o` u la vitesse ne sannule pas, mais cette fois par rapport au nouveau temps , on obtient : d2 x dx dx = v = v k ( x x ) k 1 1 , 0 1 , 1 1 d 2 d d dy d2 y dy = v = v k ( y y ) k 2 2 , 0 2 , 1 2 d 2 d d avec 1 v1 = sin tan l 1 v2 = cos tan . l
(10.3)
(10.4)
142
Choisissons les gains ki,j , i = 1, 2, j = 0, 1, de la fa con suivante : k1,1 = k2,1 = K1 + K2 et k1,0 = k2,0 = K1 K2 , avec K1 , K2 > 0 et K = min(K1 , K2 ). On v erie alors facilement que la solution de (10.3) satisfait les in egalit es : |x( (t)) x ( (t))| |y ( (t)) y ( (t))| C1 |x(ti ) xi | + C2 C1 |y (ti ) yi | + C2 dx ( (ti )) eK (t) d dy ( (ti )) eK (t) d
(10.5)
o` u C1 , C2 , C1 et C2 sont des constantes qui ne d ependent que de K1 et K2 , ce qui montre que lerreur par rapport ` a la trajectoire de r ef erence d ecro t par rapport ` a (t). Comme par ailleurs t (t) = ti u (s)ds est lint egrale du module de la vitesse, il repr esente en fait la longueur darc entre le point initial (xi , yi ) et le point de coordonn ees (x(t), y (t)), de sorte que est major e par L la longueur darc totale entre (xi , yi ) et (xf , yf ). Lerreur en n de cr eneau est donc donn ee par dx (10.5) pour (tf ) = L. On obtient egalement des in egalit es analogues pour dx d ( (t)) d ( (t)) et
dy d ( (t)) 2 2 dy dx 2 , entra ne la d ecroissance dy e au fait que v = + d d ( (t)) , ce qui, combin d lerreur v v et donc, si les ecarts initiaux sont susamment faibles, v ( (tf )) v (tf ) = 1 ce
1
CKH=JE
E EJE= A
I HJEA F =JA
@ >KJ
BE
Fig. 10.1 Cr eneau en boucle ferm ee avec erreur intiale sur la position et lorientation. En haut : trajectoire de la sortie plate et de sa r ef erence. En bas : repr esentation stroboscopique du mouvement de la voiture.
10.2
Commande de lhorloge
Dans le cas de sous-syst` emes dont le fonctionnement doit etre synchronis e, chacun des soussyst` emes etant soumis ` a des perturbations di erentes, et si les actionneurs ne sont pas susamment puissants pour rattraper tr` es vite les ecarts, ou tout simplement si lon se xe des trajectoires de
143
r ef erence qui peuvent etre irr ealistes en pr esence de perturbations, on peut utiliser la m ethode dite de commande de lhorloge qui consiste ` a ralentir la vitesse de parcours de la trajectoire de r ef erence tant que l ecart entre la trajectoire du syst` eme et sa r ef erence nest pas redescendue en dessous dune niveau acceptable. Pla cons-nous dans le cadre du suivi de la trajectoire de r ef erence t y (t) avec la loi de bouclage (10.1). Soit alors une fonction au moins continue de Rm(r+1) dans R telle que (0) = 0. Appelons (t) le temps de parcours sur la trajectoire de r ef erence, avec 0 (t) t pour tout t. Comme on utilise les d eriv ees de y jusqu` a lordre r + 1, si lon parcourt cette trajectoire au temps modi e (t), il faut que soit au moins r + 1 fois d erivable par rapport ` a t. En eet, la d eriv ee r + 1` eme dr+1 y ((t)) d epend de toutes les d eriv ees de jusqu` a lordre r + 1. dtr+1 Par ailleurs, si lon ne sint eresse qu` a la synchronisation ou au respect des contraintes, on ne cherche pas n ecessairement ` a rattraper le temps perdu ` a cause du ralentissement, i.e. (t) t. d Par contre, la synchronisation exige que dt ((t) t) = 1 converge vers 0. On va donc poser = 1 et r egler la dynamique de cet ecart en fonction de l ecart ` a la trajectoire de r ef erence par linterm ediaire de la fonction :
r
(r+1)
(t) =
j =0
(10.6)
avec les gains i > 0 choisis pour assurer le comportement voulu. Comme doit toujours etre compris entre -1 et 0, on remplace (t) par -1 d` es que la solution de (10.6) descend en dessous de 1 et on ne reprend en compte la solution de (10.6) que lorsque d epasse de nouveau le seuil de -1. Autrement dit, on remplace par (t) = max((t), 1). On v erie que si (e(t), e (t), . . . , e(r+1) (t)) > 0, alors que = 0, la d eriv ee r + 1` eme de d ecroit et donc, en int egrant r + 1 fois, 1. Si maintenant l ecart ` a la r ef erence et ses d eriv ees e reste ` a peu pr` es constant pendant une certaine dur ee, la vitesse de d eroulement du temps va se stabiliser ` a la valeur d equilibre 0 (e) = 0 ce qui permet de r egler 0 pour que le retard reste sup erieur ` a -1, pour eviter darr eter l evolution du syst` eme, puisque limmobilit e se traduit par = 0, ce qui equivaut ` a = 1. On v erie par ailleurs que l equation derreur de la boucle ferm ee (10.2) nest pas modi ee par cette m ethode puisque seule la trajectoire de r ef erence est modi ee. On a en fait, en regroupant (10.2) et (10.6) :
r
ei
(r +1)
=
j =0
ki,j ei
r
(j )
(r+1)
(t) =
j =0
(j )
(t))
et on constate bien que l equation de l ecart par rapport ` a la trajectoire de r ef erence, et donc sa stabilit e, nest pas aect ee par la commande de lhorloge alors que l ecart ` a la trajectoire de r ef erence inuence eectivement le retard de lhorloge.
144
Bibliographie
[1] R. Abraham and J. Marsden. Foundations of Mechanics. Benjamin/Cummings Pub. Co., Reading Mass., 2nd edition, 1978. [2] R. L. Anderson and N. H. Ibragimov. Lie-B acklund Transformations in Applications. SIAM, Philadelphia, 1979. [3] D.V. Anosov and V.I. Arnold. Dynamical Systems, I., volume 1 of Encyclopaedia of Mathematical Sciences. Springer-Verlag, New York, 1980. [4] V.I. Arnold. Equations Di erentielles Ordinaires. MIR, Moscou, 1974. [5] V.I. Arnold. Chapitres Suppl ementaires de la Th eorie des Equations Di erentielles Ordinaires. MIR, Moscou, 1980. [6] W. Boothby. An introduction to Dierentiable Manifolds and Riemannian Geometry. Academic Press, New York, 1975. ements de Math [7] N. Bourbaki. Alg` ebre. El ematiques, Chapitres I-3. Hermann, Paris, 1970. [8] P. Brunovsk y. A classication of linear controllable systems. Kybernetica, 6 :176178, 1970. [9] J. Carr. Application of Center Manifold Theory. Springer, 1981. Cartan. Sur l [10] E. equivalence absolue de certains syst` emes d equations di erentielles et sur certaines familles de courbes. Bull. Soc. Math. France, 42 :1248, 1914. re edit e in Oeuvres Compl` etes, part II, vol 2, pp. 11331168, CNRS, Paris, 1984. [11] H. Cartan. Calcul Di erentiel. Hermann, Paris, 1967. [12] B. Charlet, J. L evine, and R. Marino. On dynamic feedback linearization. Systems & Control Letters, 13 :143151, 1989. [13] B. Charlet, J. L evine, and R. Marino. Sucient conditions for dynamic state feedback linearization. SIAM J. Control Optimization, 29(1) :3857, 1991. [14] C. Chevalley. Theory of Lie Groups. Princeton University Press, 1946. [15] Y. Choquet-Bruhat. G eom etrie di erentielle et syst` emes ext erieurs. Dunod, Paris, 1968. [16] Ruelle D. Elements of Dierentiable Dynamics and Bifurcation Theory. Academic Press, 1989. [17] M. Demazure. G eom etrie, Catastrophes et Bifurcations. Presses de lEcole Polytechnique, Palaiseau, 1987. [18] J. Dieudonn e. Fondements de lAnalyse Moderne. Gauthier-Villars, Paris, 1960. [19] N. Fenichel. Geometric singular perturbation theory for ordinary dierential equations. J. Di. Equations, 31 :5398, 1979. 145
146
BIBLIOGRAPHIE
[20] A.F. Filippov. Dierential Equations with Discontinuous Righthand Sides. Kluwer Academic Publishers, Dordrecht, Boston, London, 1988. [21] M. Fliess, J. L evine, Ph. Martin, and P. Rouchon. Flatness and defect of nonlinear systems : introductory theory and examples. Int. J. Control, 61(6) :13271361, 1995. [22] M. Fliess, J. L evine, Ph. Martin, and P. Rouchon. A Lie-B acklund approach to equivalence and atness of nonlinear systems. IEEE Trans. Automat. Control, 44(5) :922937, 1999. [23] F.R. Gantmacher. Th eorie des Matrices, t. I, II. Dunod, Paris, 1966. [24] C. Godbillon. G eom etrie Di erentielle et M ecanique Analytique. Hermann, 1969. [25] J. Guckenheimer and P. Holmes. Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer-Verlag, New York, 1983. [26] D. Hilbert. Uber den Begri der Klasse von Dierentialgleichungen. Math. Ann., 73 :95108, 1912. also in Gesammelte Abhandlungen, vol. III, pp. 8193, Chelsea, New York, 1965. [27] M.W. Hirsch, C.C. Pugh, and M. Shub. Invariant Manifolds. Lecture Note in Mathematics. Springer, 1977. [28] M.W. Hirsch and S. Smale. Dierential Equations, Dynamical Systems and Linear Algebra. Acamedic Press, New-York, 1974. [29] L.R. Hunt, R. Su, and G. Meyer. Design for multi-input nonlinear systems. In R.W. Brockett, R.S. Millman, and H.J. Sussmann, editors, Dierential Geometric Control Theory, pages 268 298. Birkh auser, Boston, 1983. [30] N. H. Ibragimov. Transformation Groups Applied to Mathematical Physics. Reidel, Boston, 1985. [31] A. Isidori. Nonlinear Control Systems. Springer, New York, 3rd edition, 1995. [32] B. Jakubczyk. Invariants of dynamic feedback and free systems. In Proc. ECC93, Groningen, pages 15101513, 1993. [33] B. Jakubczyk and W. Respondek. On linearization of control systems. Bull. Acad. Pol. Sci. Ser. Sci. Math., 28(910) :517522, 1980. [34] T. Kailath. Linear Systems. Prentice Hall, Englewood Clis, NJ, 1980. [35] H. K. Khalil. Nonlinear Systems. Prentice Hall, Englewood Clis, NJ, 1996. [36] I. S. Krasilshchik, V. V. Lychagin, and A. M. Vinogradov. Geometry of Jet Spaces and Nonlinear Partial Dierential Equations. Gordon and Breach, New York, 1986. [37] J.P. LaSalle and S. Lefschetz. Stability by Liapounovs Direct Method With Application. Academic Press, New York, 1961. [38] J. L evine. Static and dynamic state feedback linearization. In A. Fossard and D. NormandCyrot, editors, Nonlinear Systems, volume 3, pages 93126. Chapman & Hall, 1997. [39] J. L evine and D.V. Nguyen. Flat output characterization for linear systems using polynomial matrices. Systems & Control Letters, 48 :6975, 2003. [40] A. Liapouno. Probl` eme G en eral de la Stabilit e du Mouvement. Annales de la Facult e des Sciences de Toulouse, deuxi` eme s erie. Edouard Privat, 1907. reprint J. Gabay, Paris, 1988.
BIBLIOGRAPHIE
147
[41] R. Marino. On the largest feedback linearizable subsystem. Systems & Control Letters, 6 :345 351, 1986. [42] R. Marino and P. Tomei. Nonlinear Control Design. Prentice Hall, Englewood Clis, NJ, 1995. [43] J. Milnor. Topology from the Dierential Viewpoint. University Press of Virginia, Charlottesville, 1978. [44] H. Nijmeijer and A.J. van der Schaft. Nonlinear Dynamical Control Systems. Springer, New York, 1990. [45] F. Pham. G eom etrie et Calcul Di erentiel sur les Vari et es. InterEditions, Paris, 1992. [46] J.B. Pomet. A dierential geometric setting for dynamic equivalence and dynamic linearization. In B. Jakubczyk, W. Respondek, and T. Rze zuchowski, editors, Geometry in Nonlinear Control and Dierential Inclusions, pages 319339. Banach Center Publications, Warsaw, 1993. [47] J.B. Pomet. On dynamic feedback linearization of four-dimensional ane control systems with two inputs. ESAIM-COCV, 1997. http ://www.emath.fr/Maths/Cocv/Articles/articleEng.html. [48] J.B. Pomet, C. Moog, and E. Aranda. A non-exact Brunovsky form and dynamic feedback linearization. In Proc. 31st. IEEE Conf. Decision Cont., pages 20122017, 1992. [49] L. Pontriaguine. Equations di erentielles Ordinaires. MIR, Moscou, 1975. [50] S. Sastry. Nonlinear Systems, Analysis, Stability and Control. Springer, New York, 1999. [51] J.A. Saunders and F. Verhulst. Averaging Methods in Nonlinear Dynamical Systems. Springer, 1987. [52] W.F. Shadwick. Absolute equivalence and dynamic feedback linearization. Systems Control Letters, 15 :3539, 1990. [53] J.J.E. Slotine and W. Li. Applied Nonlinear Control. Prentice Hall, Englewood Clis, NJ, 1991. [54] W.M. Sluis. A necessary condition for dynamic feedback linearization. Systems Control Letters, 21 :277283, 1993. [55] E.D. Sontag. Mathematical Control Theory, Deterministic Finite Dimensional Systems. Springer, New York, 2nd edition, 1998. [56] H.J. Sussmann. A general theorem on local controllability. SIAM J. Control and Optimiz., 25 :158194, 1987. [57] R Thom. Stabilit e Structurelle et Morphog en` ese. InterEdition, Paris, 2nd edition, 1977. [58] A. Tikhonov, A. Vasileva, and A. Sveshnikov. Dierential Equations. Springer, New York, 1980. [59] M. van Nieuwstadt, M. Rathinam, and R.M. Murray. Dierential atness and absolute equivalence. In Proc. 33th IEEE Conf. Decision Control, Lake Buena Vista, Fl., pages 326332, 1994. [60] M. Vidyasagar. Nonlinear Systems Analysis. Prentice Hall, Englewood Clis, NJ, 2nd edition, 1993.
148
BIBLIOGRAPHIE
[61] E.T. Whittaker. A Treatise on the Analytical Dynamics of Particules and Rigid Bodies. Cambridge University Press, Cambridge, 4th edition, 1937. [62] W.A. Wolovich. Linear Multivariable Systems, volume 11 of Series in Applied Mathematical Sciences. Springer, New York, 1974. [63] W.M. Wonham. Linear Multivariable Control : a Geometric Approach. Springer, 1974. [64] V.V. Zharinov. Geometrical Aspect of Partial Dierential Equations. World Scientic, Singapore, 1992.