Vous êtes sur la page 1sur 390

Mathmatiques pour lingnieur

Abdennebi ACHOUR, Lot BELKOURA, Michel DAMBRINE, Mekki KSOURI, Hugues MOUNIER, Wilfrid PERRUQUETTI, Jean-Pierre RICHARD, Joachim RUDOLPH, Frank WOITTENNEK, Salah SALHI, Selma BEN ATTIA

Illustration du livre des procds ingnieux (Kitb al-Hiyal) publi en 850 par les trois frres Ahmed, Mohamed et Hasan bin Msa ibn Shkir, travaillant dans la maison de la sagesse (Bayt al-Hikma) Bagdad.

Table des matires

1 Introduction aux Distributions 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 1.2 Espaces des fonctions tests-Espaces des distributions 1.3 Oprations sur les distributions . . . . . . . . . . . . 1.4 Convolution des distributions . . . . . . . . . . . . . 1.5 Transformes de Fourier et de Laplace . . . . . . . . 1.6 Travaux Dirigs . . . . . . . . . . . . . . . . . . . . . 1.7 Travaux Pratiques . . . . . . . . . . . . . . . . . . . 1.8 Bibliographie . . . . . . . . . . . . . . . . . . . . . . 2 Optimisation et LMI 2.1 Gnralits . . . . . . . . . . . . . 2.2 Minimisation sans contraintes . . . 2.3 Minimisation avec contraintes . . . 2.4 Optimisation convexe . . . . . . . . 2.5 Programmation linaire . . . . . . 2.6 Programmation semi-dnie - LMI 2.7 Bibliographie . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

1 1 2 7 13 23 28 28 30 31 31 34 42 49 51 71 74

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

3 Systmes stochastiques 77 3.1 Introduction aux probabilits . . . . . . . . . . . . . . . . . . . . 77 3.2 Probabilits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 3.3 Le thorme central de la limite et les lois fortes des grands nombres 99 3.4 Esprances conditionnelles . . . . . . . . . . . . . . . . . . . . . . 105 3.5 Loi de Poisson et loi exponentielle . . . . . . . . . . . . . . . . . 112 3.6 La loi du Chi deux . . . . . . . . . . . . . . . . . . . . . . . . . . 116 3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.8 Processus stochastiques . . . . . . . . . . . . . . . . . . . . . . . 123 3.9 Processus de Markov . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.10 Processus de Wiener (ou mouvement brownien) . . . . . . . . . . 133 3.11 Problmes et exercices pour lIngnieur . . . . . . . . . . . . . . . 136 ii

TABLE DES MATIRES 4 EDO non-linaire 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Equations direntielles ordinaires sous forme implicite 4.3 Equations direntielles du premier ordre . . . . . . . 4.4 EDO Linaire : des comportements simplistes . . . . . 4.5 EDO Non linaire . . . . . . . . . . . . . . . . . . . . . 4.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . 5 Calcul des variations 5.1 Quelques exemples introductifs . . . . . 5.2 Formulation du Problme . . . . . . . . 5.3 Condition Ncessaire : quations dEuler 5.4 Que faire dans dautres cadres . . . . . . 5.5 Quelques rsultats annexes . . . . . . . 5.6 Exercices . . . . . . . . . . . . . . . . .

iii 153 153 157 159 170 172 195 207 209 209 210 213 217 219 220 235 235 239 242 245 246 259 262 265 274 277 277 289 289 289 290 297 300 303 309 311 317 320 324 329 331

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

6 Systmes retard 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . 6.2 Classes dquations dierentielles fonctionnelles . 6.3 Le problme de Cauchy pour les EDR . . . . . . 6.4 Mthode pas pas . . . . . . . . . . . . . . . . . 6.5 Stabilit des systmes retards . . . . . . . . . . 6.6 Cas des systmes de type neutre . . . . . . . . . 6.7 Modles pour les systmes linaires stationnaires 6.8 Quelques liens entre modlisation et stabilit . . 6.9 Proprits structurelles . . . . . . . . . . . . . . . 6.10 Complments bibliographiques . . . . . . . . . . 6.11 Bibliographie . . . . . . . . . . . . . . . . . . . . 7 Commande algbrique des EDPs 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . 7.2 Motivations et mthodologie . . . . . . . . . . . . 7.3 Notion de libert . . . . . . . . . . . . . . . . . . 7.4 Notions de commandabilit . . . . . . . . . . . . 7.5 Des systmes retards aux EDPs . . . . . . . . . 7.6 Exemple de lquation de la chaleur . . . . . . . . 7.7 Calcul oprationnel utilis . . . . . . . . . . . . . 7.8 EDPs frontires comme systmes de convolution . 7.9 Systmes du deuxime ordre . . . . . . . . . . . . 7.10 Bibliographie . . . . . . . . . . . . . . . . . . . . 7.A Rappels dalgbre . . . . . . . . . . . . . . . . . . 7.B Rappels sur les fonctions Gevrey . . . . . . . . . 7.C Reprsentation des oprateurs S(x) et C(x) . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

iv

TABLE DES MATIRES 333 334 336 339 340 345 347 348 350 352 352 354 355 370 375

8 Platitude et algbre direntielle 8.1 Systmes plats . . . . . . . . . . . . . . . . . . . . . . 8.2 Platitude direntielle . . . . . . . . . . . . . . . . . . 8.3 Entres et dynamiques . . . . . . . . . . . . . . . . . . 8.4 Systmes entre-sortie . . . . . . . . . . . . . . . . . . 8.5 tats gnraliss . . . . . . . . . . . . . . . . . . . . . 8.6 tat de Brunovsk et forme de commande gnralise 8.7 quivalence par bouclages quasi statiques . . . . . . . 8.8 Linarisabilit par bouclages quasi statiques . . . . . . 8.9 Poursuite de trajectoires pour des systmes plats . . . 8.10 Les systmes linaires tangents . . . . . . . . . . . . . 8.11 Observabilit . . . . . . . . . . . . . . . . . . . . . . . 8.12 Exemple: Une grue . . . . . . . . . . . . . . . . . . . . 8.13 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . 8.A Bases mathmatiques . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

Introduction aux Distributions

Lot Belkoura1 & INRIA-ALIEN, Universit des Sciences et Technologies de Lille, Bt. P2, 59650 Villeneuve dAscq, France. E-mail : Lotfi.Belkoura@univ-lille1.fr
1 LAGIS

1.1

Introduction

La thorie des distributions permet, en se plaant dans un cadre plus large que celui, classique, des quations direntielles ordinaires, de rsoudre de nombreuses quations issues de la physique, de la mcanique des uides ou du traitement du signal. Elle permet ainsi, par exemple, de driver, mme indniment, en un certain sens, une fonction qui nest drivable au sens usuel, et des informations essentielles tels que les discontinuits des fonctions ne sont pas perdues par drivation. Une des ides fondamentales de cette thorie consiste dnir les distributions au travers de leur action sur un espace de fonctions, dites fonctions tests. Ce chapitre limite son ambition lacquisition rapide de techniques de calculs puissantes, et les aspects tels que ceux relatifs aux proprits topologiques des dirents espaces ne sont as abords. Il ne faut donc pas hsiter consulter les ouvrages tels que celui de Laurent Schwartz, auteur de cette thorie, pour des dveloppements et dmonstrations plus complets. Les exemples et noncs sont pour la plus grande partie extraits des ouvrages cits en rfrences [10, 7, 1, 9, 4, 2, 5, 12, 6, 11, 3, 8]. Bien que restreintes aux situations une dimension (de la variable t), les reprsentations dveloppes dans ce chapitre admettent gnralement une extension naturelle aux dimensions dordre suprieur, permettant dapprhender les problmes dquation aux drives partielles. 1

1. Introduction aux Distributions

1.2

Espaces des fonctions tests-Espaces des distributions

Une distribution est une forme linaire continue sur un espace vectoriel de fonctions, dites fonctions tests. Il existe dirents types de distributions correspondant aux dirents espaces de fonctions de test. Plus les conditions de rgularit imposes aux fonctions tests sont svres, plus les fonctionnelles ainsi dnies seront gnrales. Les distributions, gnralisant la notion de mesure, sont dnies partir de lespace D() dnit ci-aprs. Dans tout ce qui suit, les dnitions gnrales et exemples sont bass sur des fonctions tests notes (t), en nous bornant, sauf mention contraire, au cas des fonctions dnies sur R ;

Espace vectoriel D()


Dnition 1.2.1. Soit un ouvert de R. On note D() lespace des fonctions indniment drivables support compact dans . Rappelons au passage la dnition du support dune fonction ; soit A lensemble des t tels que (t) = 0. Le support de la fonction , not supp est le sous ensemble ferm A. Ainsi par exemple, pour la fonction "porte" T de largeur T > 0, dnie par : T (t) = 1 |t| 0 |t| >
T 2 T 2

nous aurons :

T T supp T = , . 2 2

(1.1)

Des exemples de fonctions appartenant lespace vectoriel ainsi dni ne viennent pas immdiatement lesprit. Un exemple frquent est fournit par la fonction suivante 0 |t| 1 (t) = , (1.2) 1 exp t2 1 |t| < 1 de support [1, +1]. Plus gnralement, toute fonction ab (t) dnie par 0 ab (t) =
1 exp 2 1 tb

t ]a, b[ /
1 ta

t ]a, b[

(1.3)

est une fonction de D ayant pour support [a, b]. Enn, le thorme suivant permet den construire bien dautres : Thorme 1.2.1. Si D et si f est une fonction sommable support born, alors : (t) = f ()(t )d est une fonction de D.

Distributions
Dnition 1.2.2. Une distribution sur un ouvert de R est une forme linaire continue sur lespace D(). Les distributions forment un espace vectoriel not D (). 2

1.2. Espaces des fonctions tests-Espaces des distributions

0.1

0.05

0 1.5

2.5

3.5

Fig. 1.1: Trac de 23 (t).

Une distribution T est donc un application de D() dans C faisant correspondre une fonction test un nombre complexe not T (t), (t) , ou plus simplement T, lorsquil ny a pas ambigut sur la variable. Cest la valeur prise par la distribution sur la fonction . Les proprits de linarit et de continuit se traduisent respectivement par 1 , 2 D() : T, 1 + 2 = T, 1 + T, 2 , (1.4) D(), C : T, = T, , et pour la continuit par : Si k converge dans D vers , la suite T, k converge au sens usuel vers T, , cest dire : > 0 N ( ), kN | T, T, k | . (1.5)

Les distributions gnralisent la notion de mesure dnie par une fonctionnelle linaire et continue sur lespace D0 des fonctions continues support born. Distributions rgulires On examine maintenant des distributions particulires, nommes distributions rgulires, dnies par une intgrale et qui permettent dassocier de manire univoque une fonction localement sommable (cest dire sommable sur tout ensemble born) et la distribution qui lui est associe. Nous utiliserons pour simplier la mme notation pour dsigner une fonction f (t) et la distribution f quelle dnit, le sens tant prcis par le contexte. Pour une fonction f (t) localement sommable, on dnit la distribution f par f, = f (t)(t)dt D, (1.6)

qui a toujours un sens puisque est support born. Notons que dans ce cas on ne peut attribuer la distribution f une valeur pour chaque t, mme si la 3

1. Introduction aux Distributions fonction f (t) est une fonction rgulire. En eet, deux distributions f et g seront considres comme identiques si pour tout D, f, = g, . (1.7)

Cela nentrane lgalit des fonctions f (t) et g(t) dont elles sont issues que si ces dernires sont continues. Cependant, lorsque f et g sont des fonctions localement sommables quelconques, nous avons le thorme suivant ; Thorme 1.2.2. Deux fonctions localement sommables f et g dnissent la mme distribution si, et seulement si, elles sont gales presque partout. On voit ainsi que les distributions sont une extension non pas des fonctions localement sommables, mais des classes de fonctions sommables presque partout gales. Ceci provient du fait lintgrale de Lebesgue nest pas modie sur une ensemble de mesure nulle. Distributions singulires On appelle distribution singulire toute distribution qui nest pas rgulire. Lexemple le plus usuel est la distribution de Dirac dnie en un point a quelconque par : a , = (a), D . (1.8) Une telle distribution a t introduite initialement par Dirac pour les besoins de la mcanique quantique. Elle est parfois improprement appele fonction de Dirac et manipule comme une fonction en crivant a , = (a) = 1= (t a)dt. (t)(t a)dt, (1.9) (1.10)

Une telle fonction devrait tre nulle pour t = a et valoir au point t = a. Daprs la thorie classique des fonctions, son intgrale serait nulle ce qui est en contradiction avec (1.10). La distribution de Dirac dnit galement une mesure, et cest aussi lexemple le plus simple de mesure qui ne soit pas une fonction. Plus gnralement, toute combinaison linaire, nie ou non, bi ai dnit une distribution singulire, mais dautres distributions singulires, qui ne sont plus des mesures, peuvent tre dnis. Ainsi, comme on le verra au paragraphe sur la drivation, la drive dun Dirac au point a admettra naturellement pour dnition : a , = (a), D . (1.11) Une distribution peut parfois galement tre dnie partir dune fonction qui nest pas localement intgrable. Sa valeur sur une fonction est dnie par la partie nie (note pf) dune intgrale divergente, notion introduite par Hadamard pour les besoins de la thorie des quations aux drives partielles. La 4

1.2. Espaces des fonctions tests-Espaces des distributions distribution associe est appele pseudo-fonction, galement note pf et, f tant la fonction, on crit :

pf f, = pf

f (t)(t)dt.

(1.12)

Il faut dans chaque cas dnir les conditions dexistence de la partie nie. Un exemple classique concernant la fonction log |x| et la pseudo-fonction 1/x est abord au paragraphe portant sur la drivation. Support dune distribution La dnition du support dune distribution T , not supp T peut tre envisag au travers de celle de restriction dune distribution un ouvert dnie ci-dessous : Restriction dune distribution un ouvert Considrons deux ouverts de R et soit T D ( ). Nous pouvons associer T une distribution T appele restriction de T , dnie pour toute D() par : T , = T, , (1.13)

et dans laquelle est le prolongement par 0 de . Il faut cependant prendre garde au fait que, contrairement aux fonctions, deux distributions distinctes sur peuvent avoir la mme restriction . Ainsi par exemple, pour a et = a, la distribution nulle et la mesure de Dirac a ont mme restriction. Cela permet dintroduire la Dnition 1.2.3. Le support de T , not supp T est le complmentaire dans du plus grand ouvert de tel que la restriction de T soit nulle. Il y a cohrence entre la notion de support tablie du point de vue de la thorie des fonctions et celle issue de la thorie des distributions. Le support dune fonction concide avec celui de la distribution quelle dnit. Pour des distribution singulires, et titre dexemple, supp a = {a} . (1.14)

Inversement, un thorme trs utile est notre disposition concernant les distributions support ponctuel. Thorme 1.2.3. Toute distribution de support lorigine admet une dcomposition unique comme combinaison linaire nie de drives de la distribution de Dirac : T = cp (p) , (1.15)
pm

les cp tant des constantes. 5

1. Introduction aux Distributions Deux classes de distributions sont appeles jouer un rle important en physique. Les distributions support born, et celles support contenu dans [0, ). Toutes deux forment des espaces vectoriels nots respectivement E et D+ . Les distributions support born gauche sont souvent appele en physique distributions causales (la variable tant dans ce cas le temps). Elles reprsentent des phnomnes qui ne peuvent avoir lieu avant la cause qui les produit et par consquent sont nulles pour t < 0. Ordre dune distribution La notion dordre dune distribution peut savrer utile dans certaines applications. On note DK () lensemble des fonction de D() ayant leur support inclut dans K . Dnition 1.2.4. On appelle distribution dordre ni toute distribution T de D () pour laquelle il existe k N, tel que pour tout compact K inclus dans , on ait : CK > 0, D(),
K

| T, | CK sup sup |D (t)|.


||k t

(1.16)

Lentier k, qui ne dpend pas de K, est appel ordre de la distribution T . Ainsi par exemple, la distribution de Dirac au point a est dordre 0 car : D(), | a , | = |(a)| sup |(t)|.
t

(1.17)

Aussi, on tablit que les fonctions localement sommables dnissent des distributions dordre 0, tandis que les distributions singulires sous forme de somme nie ( r ar (r) + fonctions) sont dordre r. 0 Sous espaces de D () Comme mentionn en introduction, si lon prend des espaces de fonctions tests moins restreints que D, on obtient des sous espaces de D . Les espaces de fonctions tests les plus couramment utiliss sont les espace S et E ci-aprs, vriant D S E, et dnis par : espace S : espace des fonctions indniment drivables dcroissant linni, ainsi que toutes leurs drives, plus vite que toute puissance de 1/|x|. espace E : espace des fonctions indniment drivables quelconques. Ils conduisent aux sous espaces de D suivants : espace S : espace des distributions tempres, espace E : espace des distributions support born. 6

1.3. Oprations sur les distributions

avec les inclusions D S E . Les distributions tempres jouent un rle particulirement important en physique, grce notamment la transforme de Fourier. Ainsi, toute distribution tempre admet une une transforme de Fourier qui est elle mme une distribution tempre.

1.3

Oprations sur les distributions

Changement dchelle et translation


Ces oprations peuvent tre ralises en considrant limage dune distribution par un oprateur ane. Soit v un oprateur linaire continu dans D. On dnit par transposition dans lespace dual D loprateur t v qui T D associe t v(T ) tel que :
t

v(T ), = T, v()
v

D, T D .

(1.18)

Lorsque v est loprateur (t) (at + b), et f une fonction localement sommable, une application classique du changement de variable dans lintgrale permet dobtenir : f (t), (at + b) = 1 |a| f( tb ), (t) . a (1.19)

Par analogie, pour une distribution T quelconque, on dnit :


t

v(T )(t) =

1 tb T( ). |a| a

(1.20)

Cette formule permet par exemple dcrire, pour un changement dchelle de temps, en prenant b = 0 : t (1.21) ( ) = |a|(t). a De mme, la parit dune distribution peut tre dnie en prenant a = 1 et b = 0. Avec le notations T (t) = T (t), nous dirons quune distribution est paire = T (resp T = T ). Enn, en prenant a = 1, on (resp. impaire) lorsque T obtient limage dune distribution par translation damplitude b : T (t b), (t) = T, (t + b) , (1.22)

et une distribution sera dite priodique de priode b > 0 lorsque T (t b) = T (t).

Drivation
La proprit essentielle des distributions est quelles sont indniment drivables. On introduit tout dabord la drive dune distribution de sorte que sa 7

1. Introduction aux Distributions dnition concide avec avec la dnition usuelle pour une fonction localement sommable f , drive f continue. Par intgration par partie, il vient pour cette dernire : f (t), (t) = f (t)(t)dt = f (t) (t)dt = f, . (1.23)

Ceci dnit bien une distribution rgulire puisque D. On est ainsi conduit la dnition : T , = T, , (1.24) et plus gnralement pour la drive dordre m : T (m) , = (1)(m) T, (m) , Exemples de drivation Drive de la distribution de Dirac . Un premier exemple de drivation ne conduisant pas une mesure est donne par la relation (1.11) donnant lexpression de la drive dune distribution de Dirac : , = , = (0). (1.26) (1.25)

Drive de la fonction de Heaviside H(t). La fonction de Heaviside, dnie par : +1 t > 0 , (1.27) H(t) = 0 t<0 est une fonction localement sommable qui dnit donc une distribution. A noter quen tant que distribution, la valeur de cette fonction en t = 0 na pas besoin dtre prcise. Sa drive scrit :

H (t), (t)

= H(t), (t) = = [(t)] = (0). 0


0

(t)dt (1.28) (1.29)

On en conclut que : H = .

Fonctions rgulires par morceaux. Lexemple prcdent se gnralise aisment aux fonctions f qui possdent les caractristiques suivantes : Soit {t }Z un suite de nombres rels dstincts tels que lim+ t = , et lim t = . On suppose f indniment drivable au sens classique dans les intervalles ]t , t+1 [, et f , ainsi que toute ses drives dordre p au sens usuel, notes f (p) , ont des discontinuits de premire espce (i.e. les limites droite et gauche de p f (p) (t ) existent). On note alors les sauts de f (p) en t :
p = f (p) (t + 0) f (p) (t 0)).

(1.30)

1.3. Oprations sur les distributions On note enn par la suite Dp f la drive distribution dordre p de la fonction f , et ce an de la distinguer de la drive usuelle f (p) . La drive distribution Df de f est dnie par :
t+1

Df, = f,

f (t) (t)dt =
t

f (t) (t)dt,

(1.31)

pour toute D. Une intgration par parties montre alors que : Df, = ce qui scrit : Df, = f +

f (t)(t)dt +

(t ) ,

(1.32)

(1.33)

Ainsi, les discontinuits de f apparaissent dans la drive Df sous forme de mesures de Dirac. Les informations concernant les discontinuits de la fonction f ne sont donc pas perdues par la drivation. Cette formule se gnralise de proche en proche pour les drivations dordre suprieur, faisant apparatre les drives successives de la distribution de Dirac : Dp f, = f (p) +
p1 + p2 + + (p1) .

(1.34)

Drivation de log |t| et pseudo fonction pf 1/tn . La drivation de distributions rgulires peut conduire des distributions singulires. Cest le cas de la fonction log |t| qui dnit une distribution rgulire, mais dont la drive au sens des fonction 1/t nest pas localement sommable. Elle ne peut donc reprsenter la distribution drive. Cette dernire scrit au sens des distributions :

D log |t|,

= log |t|, (t)dt =

log |t|, (t)dt

= lim
0 |t|

log |t|, (t)dt

= lim log [( ) ( )] +
0

(t) (t) dt t (1.35)

= lim

(t) (t) dt, t

car log [( ) ( )] 0 grce au thorme des accroissements nis. Ce der nier terme est not alors partie nie de lintgrale divergente (t) dt et dnit t une distribution note pf 1 . On obtient alors : t D log |t| = pf 1 t (1.36) 9

1. Introduction aux Distributions Notons galement que la drivation de pf 1 conduit son tour la formule t gnrale : 1 1 D[pf n ] = n pf n+1 . (1.37) t t Autrement dit, la rgle de drivation est celle classique de la thorie des fonctions. Ces rsultats permettent de considrer des distributions bases sur des fraction rationnelle quelconques. Il sut de dcomposer en lment simples pour faire apparatre, outre les lments qui sont indniment drivables, une somme de A termes de la forme (ta)m qui sont des pseudo fonctions translates de a. En restreignant le domaine dtude t > 0, nous pourrions de manire analogue introduire la pseudo-fonction pf H(t) par : t pf H(t) , t

= lim

(t) dt + (0) log( ) , t

(1.38)

et pour laquelle une intgration par parties permet dobtenir : pf H(t) , t


=
0

(t) log t dt =

(t)H(t) log t dt.

(1.39)

La fonction log t est intgrable, ce qui justie lexistence de la partie nie. En outre, le dernier terme conduit, par dnition de la drive dune distribution, : H(t) D[H(t) log t] = pf . (1.40) t Dans ce cas, on montre que les drivations successives conduisent la formule suivante faisant intervenir les drives de la distribution de Dirac lorigine : D[pf H(t) H(t) (1)n (n) ] = n pf n+1 + . tn t n! (1.41)

Multiplication des distributions


Si f et g sont deux fonctions localement sommables, et si Tf et Tg dsignent les distributions correspondantes, nous souhaitons, comme pour le cas des fonctions, pouvoir crire : Tf .Tg = Tf g . (1.42) Malheureusement, lexistence de Tf et de Tg nentrane pas automatiquement celle de Tf g , car les deux fonctions peuvent tre localement sommables sans que le produit le soit (lexemple le plus courant tant f (t) = g(t) = 1/ t). Il semble donc ne pas y avoir de dnition naturelle pour le produit de deux distributions quelconques.

10

1.3. Oprations sur les distributions Dans le cas du produit dune distribution T et dune fonction indniment drivable, on dnit le produit T par : T, = T, , D . (1.43)

La fonction appartient bien D car, comme , elle est support born, et indniment drivable (comme produit de deux fonctions indniment drivables). Donc T , le produit T a un sens. Pour certaines distributions, la dnition du produit reste applicable mme si la fonction nest pas indniment drivable. Il sut par exemple que (t) soit continue en 0 pour pouvoir dnir : (t)(t), (t) = = On obtient donc (t)(t) = (0)(t). (1.45) On tablit de mme, en un point a quelconque o est continue, (t)(t a) = (a)(t a), et en particulier : t = 0. (1.46) Parmi les premires proprits du produit multiplicatif, on note celle relative aux supports : supp T supp supp T. (1.47) Dune manire plus gnrale, nous avons le thorme suivant, aux conditions assez restrictives : Thorme 1.3.1. Le produit de plusieurs distributions, lorsque toutes, sauf une au plus, sont des fonctions indniment drivables au sens usuel, est associatif et commutatif. (t), (t)(t) = (0)(0) (0)(t), (t) . (1.44)

(1 + 2 )T (1 2 )T

= 1 T + 2 T, = 1 (2 T ),

(1.48) (1.49) (1.50)

(T1 + T2 ) = T1 + T2

Si les conditions ne sont pas vries, la multiplication nest plus ncessairement associative, comme le montre lexemple suivant avec , t, et pf 1 : t ( t) pf (t pf
1 t

= 0 car t = 0, (1.51) = car t pf


1 t

1 t)

= 1.

Dans ce dernier cas en eet, nous avons : 1 t pf , t = 1 pf , t t

= pf

t dt = t

(t)dt.

(1.52) 11

1. Introduction aux Distributions Toujours dans la mesure ou le le produit T a un sens, la rgle de drivation m! k sobtient par la formule usuelle de Leibniz, avec Cm = k!(mk)! : Dm (T ) =
km k Cm (D(mk) )Dk T.

(1.53)

La dmonstration pour la drive dordre 1 est simple et permet de revisiter les dnitions prcdemment introduites : (T ) , = T, = = T, = T, () (1.54)

= T, () + T, = T , + T, T , + T, = T + T, .

Le thorme ci-dessous peut savrer bien utile dans certaines applications : Thorme 1.3.2. Si T a un support compact K, et est dordre (ncessairement ni) m, T est nulle toutes les fois que et ses drives dordre m sont nulles sur K ; si T a un support quelconque et est dordre quelconque, ni ou inni, T est nulle si est nulle ainsi que toute ses drives sur le support de T . Compte tenu de ce qui prcde, on tablit ainsi que : tl (n) = et plus gnralement : (n) =
qn q (1)(nq) Cn (nq) (0) (q) .

0 (1)l

n! (nl)!

(nl)

l > n, l n.

(1.55)

(1.56)

Le produit de deux distributions peut galement tre tendu en faisant appel la notion de support singulier : Dnition 1.3.1. Soit T une distribution sur un ouvert de R. Le support singulier de T est par dnition le complmentaire du plus grand ouvert de tel que la restriction de T D() concide avec la distribution associe une fonction de classe C sur . Ainsi, par exemple, les distributions pf H(t) ou plus simplement la fonction de tn Heaviside (en prenant n = 0) ont pour support [0, [ et pour support singulier lorigine. On a alors la Proposition 1.3.1. Soient T1 et T2 deux distributions de supports singuliers disjoints. On peut alors donner un sens au produit T1 T2 en tant que distribution. 12

1.4. Convolution des distributions Le problme de la division La formule (1.46) (i.e. t = 0) montre que le produit de deux distributions peut tre nul sans quaucune delles le soit. Rciproquement, que peut-on dire dune distribution T telle que tT = 0 ? Nous avons la Proposition 1.3.2. Les solutions de lquation tT = 0 sont les distributions T = c, o c C. Plus gnralement, on dmontres que si (t) est une fonction indniment drivable, nadmettant que des racines simples ai lquation = 0, alors toutes les solutions de lquations T = 0 sont de la forme : T = ci (t ai ), (1.57)

o les ci sont des constantes arbitraires. Le problme de la division est assez dlicat dans un cadre plus gnral, mais on notera que, avec la fonction prcdente, pour rsoudre le problme T = S, (1.58)

o S est une distribution donne, et en supposant connatre une solution T0 particulire, nous avons immdiatement (T T0 ) = 0, et par suite, T = T0 + ci (t ai ). (1.59)

Lorsque la fonction admet des racines multiples, lnonc prcdent nest plus valable, mais nous disposons de la Proposition 1.3.3. Pour toue distribution S, il existe un innit de distributions T vriant tk T = S. Deux dentres elles quelconques dirent dune combinaison linaire de drives (m) , m k. Exemples : 1. Soit rsoudre tT = 1, o 1 est la distribution dnie par la fonction constante. En notant que pf 1 constitue une solution particulire (car t t pf 1 = 1), T admet la forme gnrale T = c + pf 1 . t t 2. Si maintenant on cherche rsoudre tT = , une astuce pour obtenir une solution particulire consiste driver t = 0 pour obtenir + t = 0, ce qui suggre comme solution particulire T0 = , et par suite la solution gnrale T = + c.

1.4

Convolution des distributions

Le produit de convolution est une opration essentielle dans les mathmatiques appliques. La convolution possde un lment neutre, ce qui va permettre de rsoudre certaines quations de convolution et dobtenir des solutions lmentaires doprateurs direntiels. 13

1. Introduction aux Distributions

Produit tensoriel de deux distributions


La dnition du produit de convolution requiert celle de produit tensoriel (ou produit direct) dont lexistence est fonde sur le thorme suivant. Thorme 1.4.1. Soient deux distributions U et V sur R et deux fonctions g et h de D(R)). Il existe une et une seule distribution sur R2 , note U V et telle que : U V, g(u) h(v) = U, g(u) V, h(v) . (1.60) Cest le produit tensoriel de U et V . Sa valeur sur une fonction (u, v) D(R2 ) est : U V, = U (u), V (v), (u, v) = V (v), U (u), (u, v) . (1.61)

Les expressions V (v), (u, v) et U (u), (u, v) se calculent en laissant respectivement u et v xes. Ainsi, si f et g sont deux fonctions localement sommables, le produit tensoriel des distributions associes scrit : f g, = f (u)g(v)(u, v)du dv), (1.62) (1.63)

si bien que (f g)(u, v) = f (u) g(v). Si maintenant on calcule le produit tensoriel de (u) et (v), il vient : (u) (v), (u, v) = (0, 0)

(1.64) (1.65)

si bien que (u) (v) = (u, v).

Dnition et conditions dexistence


On commence par rappeler le produit de convolution de deux fonctions f et g, pour chercher ensuite ltendre au produit de convolution de distributions. Lorsquil existe le produit de convolution de f et g est la fonction h dnie par : h(t) = f (t )g()d, (1.66)

et on note h = f g ce produit. Lorsque f et g sont intgrable, h existe et est intgrable. Calculons alors la distribution associe h, en dnissant pour toute D: f g, = = = h, = h(t)(t)dt

f (t )g()(t)d dt f (u)g(v)(u + v)du dv, (1.67)

dans lequel nous avons pos le changement de variable v = et u = t . Ceci suggre de dnir le produit de convolutions S et T par : 14

1.4. Convolution des distributions Dnition 1.4.1. On appelle produit de convolution de deux distributions S et T , la distribution S T , quand elle existe, telle que pour toute D : S T, = S(u) T (v), (u + v) , et dans lequel S(u) T (v) est le produit direct de S et T . Le produit de convolution de deux distributions quelconques nest pas toujours dni car, si la fonction t (t) est support born dans R, il nen est pas de mme de la fonction (u, v) (u + v). En eet, si (a, b) est le support de , le support de (u, v) (u + v) est la bande a u + v b, et par suite (u + v) nest pas un lment de D. Nanmoins, on montre que le produit de convolution existe dans un des cas de gures suivant, que lon rencontre trs largement dans la pratique : lune au moins des deux distributions est support compact, les deux distributions sont support limit gauche (resp. droite). Il est clair que le produit de convolution est commutatif, S T = T S. Lextension au produit de plusieurs distributions (dans cet exemple 3) se gnralise en : R S T, = R(u) S(v) T (w), (u + v + w) , (1.69) et lexistence est assure dans lun ou lautre des trois cas suivants : toutes sauf une au plus sont support compact, toutes ont leur support limit gauche (resp. droite), les produit deux deux sont bien dnis. De plus, lorsquil existe, ce produit est associatif. Il faut garder en mmoire quil sagit ici de conditions susantes, le produit de convolution pouvant exister dans dautres situations. Nanmoins, ne pas en tenir compte peut conduire des conclusions errones telles celle considrant sans prcaution le produit 1 H pour aboutir aux deux dirents rsultats : 1 ( H) = 1 = 1 (1 ) H = 0 H = 0. (1.70) (1.71) (1.68)

Proprits
Support du produit de convolution : Nous disposons de linclusion suivante : supp S T supp S + supp T, (1.72) et dans laquelle le membre de droite se lit (somme de Minkowski) : {x + y; x supp S, y supp T } . (1.73) 15

1. Introduction aux Distributions Ainsi, par exemple, si le support de S est inclut dans (a, ) et celui de T dans (b, ), celui de S T sera inclut dans (a + b, ). A noter galement un rsultat plus prcis, connu sous le nom de Thorme des supports, et qui snonce, conv(supp S T ) = conv(supp S) + conv(supp T ), (1.74)

et dans laquelle conv(supp X) dsigne lenveloppe convexe du support de X. Convolution par : tant support compact, T existe pour toute distribution T , et, par dnition : T, = = Ce qui montre que T = T, (1.76) cest dire que la distribution de Dirac joue le rle de lunit pour le produit de convolution. Convolution par (m) : par dnition : T, = on considre tout dabord le cas m = 1 qui conduit (u)T (v), (u + v) = T (v), (u), (u + v) T (v), (v + 0) = T, (1.75)

(u)T (v), (u + v) = T (v), (u), (u + v) (1.77)

= T (v), (v) = T , ,

ce qui montre que la drivation quivaut un convolution avec . On tablirait de mme que : (m) T = T (m) . (1.78) Plus gnralement encore, si T = RS, le produit de convolution tant associatif, on obtiendrait : (R S)(m) = R S (m) = R(m) S, (1.79) que lon retient en disant que pour driver un produit de convolution, il sut de driver lun quelconque de ses termes. Convolution par (t a) : Ici encore, lapplication de la dnition conduit : (t a) T (t), (t) = = = (u a)T (v), (u + v) T (v), (u a), (u + v) T (v), (v + a) = T (t a), (t) , (1.80)

ce qui permet de conclure que pour translater une distribution de a, il sut de la convoluer avec la translate (t a) de la distribution de Dirac . 16

1.4. Convolution des distributions Primitives dordre n dans D+ : Si f est une fonction de D+ , cest dire dont le support est contenu dans (0, ), nous pouvons crire :
t

f () d =
0 0

H(t )f () d = (H f )(t),

(1.81)

de sorte quintgrer f de 0 t revient convoluer f avec la fonction de Heaviside. Nous avons, en dautres termes, obtenu une primitive de la fonction f . Plus gnralement, la primitive dordre n scrit :
t 0 0 n1 1

f () d1 dn1 d =
n1

1 (n 1)!

f ()(t )n1 d. (1.82)


0

Si on note Hn la fonction t H(t)t , la primitive dordre n de f scrit Hn f . (n) Ces considrations se gnralisent galement lobtention de la drive et la primitive dordre avec complexe. Convolution de polynmes-exponentiels : Toujours dans le cas de fonctions sommables f1 et f2 , le produit de convolution de deux distributions sidentie au produit usuel de deux fonctions. En particulier, si elles appartiennent D+ , nous aurons :
t

h(t) = (f1 f2 )(t) = H(t)


0

f1 ()f2 (t )d.

(1.83)

A titre dexemple, par application directe de cette relation, on obtient facilement : e 1 t e 2 t H(t)e1 t H(t)e2 t = H(t) . (1.84) 1 2 Un autre exemple qui sera utile par la suite est celui o fn (t) = pour lequel on obtient que : H(t)tn1 t H(t)tm1 t H(t)tn+m1 t e e = e (n) (m) (n + m)
H(t)tn1 t (n) e ,

et

(1.85)

Il sagit ici dune application directe de (1.83), suivie du changement de variable = t, et utilisant la proprit :
1

(1 )(n1) (m1) d =
0

(n)(m) . (n + m)

(1.86)

Multiplication par tn , eat , et convolution : La multiplication par un polynme ou une exponentielle, combine avec la convolution peut avoir des proprits intressantes dans certaines applications. On tablit ainsi que si lune des distibution S ou T est support compact, alors :
n

tn (S T ) =
0

k Cn (tk S) (tnk T )

(1.87) (1.88) 17

eat (S T ) = (eat S) (eat T )

1. Introduction aux Distributions Rgularisation et continuit de la convolution : La convolution par une fonction a un eet rgularisant (lissant), ce qui se traduit notamment par : Thorme 1.4.2. Lorsquil existe, le produit de convolution dun distribution T et dune fonction indniment drivable est une fonction h donne par h(t) = T (u), (t u) . (1.89)

Cette fonction est elle mme indniment drivable lorsque est support born, et de drive : h(m) (t) = T (u), (m) (t u) . (1.90)

On tablit de mme que la convolution est une opration continue dans D dans le sens o : Thorme 1.4.3. S tant une distribution xe, T T entrane T S T S dans chacune des circonstances suivantes : (a) les distributions T ont leur support contenu dans un ensemble compact xe, indpendant de , (b) S est support compact, (c) T et S sont des lments de D+ . On en dduit la proprit dite de densit de D dans D , savoir que toute distribution est limite dans D dune suite de fonctions appartenant D.

Algbres de convolution
On appelle algbre sur le corps des nombres rels ou complexes, un ensemble A muni des trois oprations : somme, produit par un scalaire, et produit, ayant les proprits : A muni de la somme et du produit par un scalaire est un espace vectoriel, le produit est une application bilinaire de A A dans A, le produit est associatif. On sintresse ici aux algbres pour les oprations : somme de deux distributions, produit dune distribution par un scalaire, et convolution de deux distributions. On doit donc vrier que le produit de convolution de deux distributions de A est encore un lment de A, et que la convolution est associative lorsquon la restreint aux lments de A. Lintrt de ces algbres rside dans le fait que si A (A possde donc un lment unit), et si une distribution T admet une inverse (note par la suite T 1 ou T 1 lorsquil ny a pas de risque de confusion), cest dire vrie T T 1 = , (1.91)

cette inverse est unique, et on saura rsoudre toute les quations de convolutions (en X) T X = W, (1.92) 18

1.4. Convolution des distributions o W A. On notera cependant que linverse de convolution nexiste pas toujours. Cest par exemple la cas o T D car dans ce cas nous avons vu que, quel que soit X, T X est une fonction indniment drivable qui ne saurait tre gale . Lassociativit du produit de convolution permet aussi de montrer que 1 1 si T1 , , Tm admettent pour inverses T1 , , Tm , il vient :
1 1 (T1 Tm )1 = T1 Tm .

(1.93)

On distingue essentiellement deux algbres que sont les : algbre E des distributions support compact, algbre D+ des distributions support contenu dans [0, ). Lorsquon sintresse particulirement aux quations direntielles (ou aux drives partielles) coecients constants, lalgbre E prsente un intrt limit. On montre en eet que si T E nest pas de la forme c, lquation en X, T X = nadmet aucune solution support compact. On concentrera donc notre tude lalgbre D+ . Exemples simples dapplication : Soit W D+ et soit rsoudre dans D+ lquation X = W . Cette relation scrit encore : X = X = W. (1.94) Sachant par ailleurs que H = , la fonction de Heaviside H est donc bien linverse de convolution de , si bien la solution unique X est donne par X = H W . En dautres termes, la seule primitive de W est H W . Il est ais de vrier que dans D+ , linverse de , C, est donne par H(t)et . Il est en eet simple de montrer que (H(t)et ) = + H(t)et , pour obtenir : ( ) H(t)et = . (1.95) Equations direntielles Toute quation direntielle coecients constants admet la reprsentation quivalente : y (n) + an1 y (n1) + + a0 y = f, P () y = f, o P () est le polynme symbolique en : P () = (n) + an1 (n1) + + a0 , = ( (1) 0 ) ( (1) n ), (1.98) 19 (1.96) (1.97)

1. Introduction aux Distributions et o 0 , , n sont les racines, distinctes ou non, du polynme z n +an1 z n1 + + a0 . La rsolution de lquation direntielle se ramne donc la recherche de linverse de convolution de P (), soit en utilisant (1.93), la recherche de des inverses de ( (1) i ). Cette inverse a dj t tablit en (1.95), si bien que : (P ())1 = H(t)e0 t H(t)en t . (1.99)

On notera galement que la prsence de racines multiples 0 = = m = conduit, en accord avec la relation (1.85), : (( (1) )m )1 = H(t)tm1 t e (m 1)! (1.100)

Exemple : ltre RC passe-bas. En supposant la capacit initialement non charge, le courant i(t) du circuit est li la force lectromotrice de charge e(t) par la relation :

Fig. 1.2: Circuit RC. R i(t) + 1 C


t

i()d = e(t),
0

t 0.

(1.101)

Au sens des distributions dans D+ , cela se traduit par : (R + 1 H) i = e. C


t

(1.102)

1 Si la mesure consiste en la tension v(t) = C 0 i()d aux bornes de la capacit, 1 cela scrit v = C H i, soit i = C v et par suite :

(RC + ) v = T v = e.

(1.103)

Il sut donc de savoir inverser la distribution T = (RC + ) pour retrouver lexpression de v(t) pour toute entre e(t). Il vient : T 1 =
t 1 He RC . RC

(1.104)

La distribution ainsi obtenue porte le nom de rponse impulsionelle du systme, dans le sens ou elle correspond la solution de (1.103) lorsque lentre e est 20

1.4. Convolution des distributions une distribution (impulsion) de Dirac. A titre dexemple, si e(t) consiste en la fonction de Heaviside, e = H, il vient immdiatement, compte tenu de (1.84) 1 avec (1 , 2 ) = (0, RC ) : v = T 1 H =
t t 1 He RC H = H(t) 1 e RC . RC

(1.105)

Prise en compte des conditions initiales Il arrive frquemment que lon cherche rsoudre, au sens des fonctions, une quation direntielle en y, dordre n, connaissant les conditions initiales y(0), y (1) (0), , y (n1) (0), notes par la n1 1 suite y0 , y0 , , y0 . Il sut pour cela multiplier lquation par H(t), de poser z(t) = H(t)y(t), et de former lquation direntielle vrie par z, en tenant compte de la formule des sauts prsente au paragraphe 1.3, ou plus directement par drivation. Illustrons cette approche sur une quation direntielle du second ordre : y (2) + a1 y (1) + a0 y = f. (1.106)
1 Compte tenu que z (1) = Hy (1) + y0 , z (2) = Hy (2) + y0 (1) + y0 , la substitution dans la relation prcdente (multiplie par H) conduit : 1 z (2) + a1 z (1) + a0 z = Hf + y0 (1) + y0 + a1 y0 .

(1.107)

Il sut alors dinverser loprateur P () = (2) + a1 (1) + a0 pour obtenir :


1 z = (P ())1 Hf + y0 (1) + y0 + a1 y0 .

(1.108)

Equations intgrales Dans certaines quations intgrales, nous pouvons tre amen inverser dans D+ des lments de le forme + K o K est une fonction de D+ . Lexistence ainsi quune formulation de cette inverse sont donnes par la : Proposition 1.4.1. Si K D+ est une fonction localement sommable et localement borne, alors + K est inversible dans D+ et ( + K)1 = + S, o S est la somme de la srie de terme gnral (1)n K n . Ainsi les quations de Volterra de la forme, pour t 0 :
t

y(t) +
0

K(t )y()d = g(t),

(1.109)

o K et g sont localement sommables, scrivent en terme de distributions : ( + K) y = g, (1.110)

et la solution recherche admet la forme y = g + S g, soit, lorsque S est une fonction :


t

y(t) = g(t) +
0

S(t ) g()(d.

(1.111) 21

1. Introduction aux Distributions Ce rsultat peut galement tre appliqu aux quations direntielles avec retards, comme le montre lexemple simple suivant : y (1) (t) + y(t ) = g(t). (1.112)

En faisant abstraction des conditions initiales, et en notant H = H(t ) et = (t ), cette quation se recrit : ( (1) ) y = (1) ( H ) y = g, et lapplication de la proposition prcdente conduit la solution : y = ( H )1 H g
2 n = ( H + H + + (1)n H + ) H g.

(1.113)

(1.114)

A noter que chaque terme de la srie admet le formulation explicite ci-dessous de support (n, ) :
n H = [( H) ( H)] = n H n n fois

= H(t n )

(t n )n1 . (n 1)!

(1.115)

Equations matricielles La manipulation de systmes dquations de convolution se plie aux mmes rgles que celles du produit matriciel ordinaire, dans lequel la multiplication est remplace par le produit de convolution. Dans ce cadre nous aurons la Proposition 1.4.2. Une matrice A (n n) de convolution est inversible si et seulement si son dterminant est inversible au sens de la convolution dans D+ . Son inverse sobtient en convolant 1 par la matrices des cofacteurs. A titre dexemple, reprenons lexemple du second ordre dcrit en (1.106), avec f = b u, b constant et u fonction de D+ dsignant la commande applique au systme. Cette quation admet la reprsentation dite dtat, qui au sens des fonction scrit : x(1) = 0 1 a0 a1 x+ 0 b u, avec x = y y (1) . (1.116)

Notant comme prcdemment le vecteur z = Hx, il vient z (1) = Hx(1) + x0 avec x0 = (y(0), y (1) (0))t , et la substitution dans la reprsentation dtat se lit : z (1) = soit 0 a0 a1 (1) (1) + a a0 1
A

z+ z =

0 b 0 b

u + x0 u + x0
B

(1.117) (1.118)

22

1.5. Transformes de Fourier et de Laplace Il sut donc de savoir inverser la matrice A au sens de la convolution. Son dterminant est le polynme de drivation = (2) +a1 (1) +a0 , dj rencontr au paragraphe prcdent. Il est toujours inversible et la solution z sexprime par : z = 1 (1) + a1 a0 (1) 0 b u + x0 . (1.119)

Cette dmarche ne se limite pas aux quations direntielles et peut stendre aux quations direntielles intgrales, faisant intervenir des termes de retard, ponctuels ou distribus. Considrons par exemple le systme ci-dessous, pour lequel nous ferons abstraction des conditions initiales, un peu plus dlicates dans le cadre gnral : y1 (t) = y1 (t) + 0 y2 (t + )d 1 (1.120) y (t) = y (t 1) + y (t) + 0 u(t + )d 2 1 2 1 En notant (t) = H(t) H(t 1), il est ais de constater que les termes faisant intervenir les intgrales se traduisent galement sous forme de produit de convolution. On obtient alors la description matricielle : 1 y1 y2 = 0 u (1.121)

1.5

Transformes de Fourier et de Laplace

Transforme de Fourier
Rappelons tout dabord la dnition de la transforme de Fourier de fonctions. Si f est une fonction Lebesgue intgrable sur R, on dnit sa transforme de Fourier, note indiremment F [f ]() ou f (), par F [f ]() = f () = f (t) e2it dt. (1.122)

Au vu de cette dnition, nous sommes tents de dnir, pour toute D, la transforme dune distribution T par : F [T ], = T, F [] , D . (1.123)

Cette dnition ne peut pas tre retenue car le membre de droite ne dnit pas un distribution. Plus prcisment, tant support born, on montre que F [] nest jamais support born. Aussi sommes amen considrer une classe plus restreinte de distributions (espace S D ), et, par consquent, une classe plus large pour les fonctions tests (espace S D). De tels espaces ont dj t voqus plus haut, rappels plus prcisment ici : 23

1. Introduction aux Distributions Dnition 1.5.1 (Espaces S ). On appelle S lespace des fonctions indniment drivables, dcroissant ainsi que toute leurs drives, quand t , plus vite que toute puissance de 1 . t Les fonctions S D ne sont donc pas ncessairement support compact, comme celle de D. Leur dcroissance linni se traduit par, m, p entiers non ngatifs, sup |tm (p) (t)| < . (1.124)
t

Dnition 1.5.2 (Espaces S ). On appelle distribution tempre toute forme linaire continue sur S . Les distributions tempres forment un espace vectoriel S qui est un sous espace de D . La plupart des fonctions que lon rencontre en physique sont des distributions tempres. Il en est de mme des distributions de Dirac et ses drives qui sont support compact. Notons aussi que la drive dune distribution tempre, ainsi que la multiplication dune distribution tempre par un polynme, forment des distributions tempres. Des contre exemples 2 sont donns par des fonctions telles que et , et , qui elles nappartiennent pas S. Dnition 1.5.3. Si T S , on dnit sa transforme de Fourier par : F [T ], = T, F [] , S . (1.125)

On montre alors que F [T ] est toujours une distribution tempre si T lest, et cette dnition concide avec celle obtenue en (1.122) pour des distributions fonctions. Plus encore, dans le cas particulier o T est un distribution support compact, on montre que sa transforme est la fonction indniment drivable : T () = T (t), e2it , (1.126)

prolongeable, pour les valeurs complexes de en une une fonction holomorphe dans tout le plan complexe. Plus gnralement, on notera la tendance selon laquelle plus la fonction T (t) dcrot linni, et plus T () sera drivable. Les tableaux ci-dessous fournissent quelques proprits et exemples de transformes de Fourier de distributions singulires et rgulires. Les proprits relatives la multiplication et au produit de convolution sont considrer avec les rserves dexistence prcdemment noncs. Drivation Translation Changement dchelle Convolution Produit 24 F [T (t)] = 2i T () F [T (t a)] = e2i a T () F [T (at)] =
1 |a| T ( a )

F [S T ] = F [S]. F [T ] F [S.T ] = F [S] F [T ]

1.5. Transformes de Fourier et de Laplace Quelques proprits de la transforme de Fourier F [1] = F [e2i 0 t ] = ( 0 ) F [sgn(t)] = pf F [] = 1 F [ (n) ] = (2i)n F [(t a)] = e2i a Exemples de transformes de Fourier
i

Transforme de Laplace
On procde ici aussi par analogie avec les transformes de Laplace des fonctions, et on se limite aux situations les plus frquentes pour lesquelles la fonction f (t) tudie est nulle pour t < 0, donc appartient D+ . On appelle transforme de Laplace de f la fonction s L(s, f ), note aussi f (s) lorsquil ny a pas de confusion possible avec la transform de Fourier, dnie dans C par :

L(s, f ) =
0

f (t) est dt.

(1.127)

Cette dnition na pas toujours un sens. On appelle abscisse de sommabilit de f (t) le rel a, borne infrieure de lensemble = Re(s) telle que |f (t)et | soit sommable. Dans ces conditions, L(s, f ) est dnie pour Re(s) > a. On note plus prcisment les cas de gures suivants : Si Si Si Si f f f f est est est est support compact, a = , dcroissance rapide, a < 0, tempre, a = 0, croissance rapide , 0 < a .

Ce dernier cas montre que la transforme de Laplace de f peut exister tandis que sa transforme de Fourier nest pas dnie. Si a est ni, s L(s, f ) est une fonction holomorphe dans le demi plan Re(s) > a. Cette dnition est tendue aux distributions comme suit : Dnition 1.5.4. Soit T une distribution de D+ . On dnit sa transforme de Laplace par la fonction s L(s, T ) dnie dans C par :
s t . L(s, T ) = T (t), e

(1.128)

Cette dnition na de sens que si T vrie galement certaines conditions, en gnral satisfaites dans la majeure partie des applications. Plus prcisment, 25

1. Introduction aux Distributions on montre que sil existe un rel tel la distribution et T soit tempre, alors L(s, T ) existe et dnie une fonction analytique dans le demi plan Re(s) > . On trouve dans certains ouvrages une autre dnition de la transforme de Laplace dune distribution T : Dnition 1.5.5. Soit T une distribution de D+ qui est une drive nime au sens des distributions dune fonction continue f D+ , avec abscisse de sommabilit a. On dnit sa transforme de Laplace par la fonction L(s, T ) dnie, pour Re(s) > a, par : L(s, T ) = s L(s, f ).
n

(1.129)

Les tableaux ci-dessous fournissent quelques proprits et exemples de transformes de Laplace de distributions singulires et rgulires. Comme pour la transforme de Fourier, Les proprits relatives la multiplication et au produit de convolution sont considrer avec les rserves dexistence prcdemment noncs, de mme que les abscisses de sommabilit doivent tre prcises. Drivation Translation Changement dchelle Convolution Produit L(s, T ) = s L(s, T ) L(s, T (t a)) = ea s L(s, T ) L(s, T (at)) =
1 |a| s L( a , T )

L(s, S T ) = L(s, S). L(s, T ) L(s, eat T ) = L(s + a, T )

Quelques proprits de la transforme de Laplace L(s, ) = 1 L(s, (n) ) = sn L(s, (t a)) = ea s 1 L(s, H(t)) = s n1 1 at t )= L(s, H(t)e (n 1)! (s a)n Exemples de transformes de Laplace On notera galement ce cas particulier intressant dune multiplication dune fonction f indniment drivable par un peigne de Dirac, conduisant une srie entire en la variable z = es : f (t)
n=0 (t

n) = L =

n=0 f (n)(t n n=0 f (n)z .

n) (1.130)

ns n=0 f (n)e

26

1.5. Transformes de Fourier et de Laplace Cette srie est appele transforme en z de f et intervient frquemment lorsquun signal est sujet un chantillonnage . Calcul symbolique Une application particulirement pratique de la transforme de Laplace rside dans la rsolution dquations de convolutions qui se ramne au calcul dinverse de transformes de Laplace. Sous rserve dexistence, cela se traduit par : b(s) a y = b y (s) = . (1.131) a(s) En particulier, pour les quations direntielles coecients constants, a = P () = ai (i) est un polynme de drivation dont linverse de convolution admet pour transforme une fraction rationnelle pouvant tre dcompose en lment simples :
1 L(s, a ) =

1 = P (s)

k . (s k )k

(1.132)

Les inverses de chaque lment tant connus (cf. Exemples), il vient : a1 = H(t)
k

k ek t

tk 1 . (k 1)!

(1.133)

On obtient ainsi lexpression de la solution lmentaire de lquation, cest dire celle de a y = . Cette dcomposition en lments simples peut galement sappliquer la fraction b(s)/(s) lorsque le second membre b admet une a transforme de Laplace analytique, conduisant ainsi directement lexpression de la solution y. Ainsi, lexemple trait en (1.119) avec u = H et les valeurs numriques a1 = 2, a0 = 1, x0 = 0, b = 1, se traduit par : 1 2 z (s) = s(s + 1) 1 (s + 1)2 z = H(t) 1 et tet tet . (1.134)

Cette dmarche peut aussi sappliquer certaines quation intgrales qui se traduisent sous forme dquation de convolution, comme par exemple la recherche dune solution y support positif et vriant, pour t 0 :
t

y() sin(t )d = t2
0

(H(t) sin t) y = H(t)t2

(1.135)

et qui fournissent par transforme de Laplace et inversion 2 1 y (s) = 3 , s2 + 1 s y (s) = 2 2 + , s s3 y(t) = H(t)(2 + t2 ). (1.136) 27

1. Introduction aux Distributions

1.6

Travaux Dirigs

Note : cette section a t rdige par Kaouther Ibn Taarit et Lot Belkoura

Objectifs
Mettre en vidence les proprits issues de la combinaison de la multiplication et du produit de convolution. Ces proprits fournissent un cadre plus gnral aux approches du type intgration par parties et conduisent des techniques simple destimation de paramtres. Exercice 1 En sinspirant de la preuve tablie en annexe pour la multiplication dun produit de convolution de deux distributions S et T par des fonctions exponentielles, tablir la relation (1.137) et la gnraliser (1.138) : t(S T ) = (tS) (T ) + (S) (tT )
n

(1.137) (1.138)

tn (S T ) =
0

k Cn (tk S) (tnk T ),

k o Cn dsigne les coecients du dveloppement binomial. En dduire la relation :

t y (1) = z0 + z1 ,

(1)

avec

zi = ti y,

et donner lexpression correspondante au produit t2 y (2) . En supposant y D+ et en notant H lchelon de Heaviside, quelles simples manipulations se rsument alors H (t y (1) ) et H H (t2 y (2) ). Exercice 2 On considre un systme linaire du premier ordre dentre u(t), 1 de sortie y(t), dtat initial y(0) et de fonction de transfert F (s) = s+a . Pour une entre en chelon retard u(t) = H(t ), et en considrant y dans D+ , donner lquation direntielle dcrivant ce processus au sens des distributions. En dduire que la rponse de ce systme vrie la relation : t(t ) [y (2) + a y (1) ] = 0. En supposant a connu, discuter de la possibilit dobtenir une estimation du retard ne ncessitant pas la connaissance des drives de y. (On pourra sinspirer des rsultats de lexercice prcdent, et on examinera avec soin les supports des quantits formules).

1.7

Travaux Pratiques

Lobjectif de ces manipulation consiste illustrer numriquement quelques proprits fondamentales sur les distributions. Par la suite, le produit de convolution a b pourra tre approch par la fonction conv(a, b).te de Matlab, te dsignant le pas dchantillonnage choisi. 28

1.7. Travaux Pratiques

Objectif 1
Pour un produit de convolution de deux distributions, nous disposons de linclusion suivante dans laquelle le membre de droite (somme de Minkowsky) se lit : supp S T supp S + supp T = {x + y; x supp S, y supp T } . (1.139)

Cette inclusion est en gnral au sens strict. Un rsultat plus prcis existe (Thorme des supports), dans lequel conv(supp X) dsigne lenveloppe convexe du support de X. conv(supp S T ) = conv(supp S) + conv(supp T ). Manipulation On note [a,b] la fonction caractristique de lintervalle [a, b]. Eectuer le produit de convolution [2,3] [4,5] . Reprsenter sur un mme graphique les trois courbes et vrier (graphiquement) la proprit sur les supports. Reprendre cette manipulation avec le produit de convolution ([0,0.5] + [2,3] ) [4,5] .

Objectif 2
Une suite de distribution Tn converge dans D vers T lorsque la suite de nombres complexes Tn , converge dans C vers T, pour toute D. En particulier, la distribution peut tre aussi vue comme limite (dans D ) de fonctions sommables. Ainsi, une suite de fk 0 localement sommables telles que fk (x)dx = 1 et vriant fk (x) 0 uniformment dans tout ensemble 0 < a < |x| < 1/a, tend vers . Manipulation Pour direntes valeurs de k entier, reprsenter graphiquement les fonctions k et k ci-dessous : 0 |t| 1 1 2 (t) = k (t) = k(kt) k (t) = ke k2 t2 1 (1.140) 1 |t| < 1
2

Raliser ensuite les produits de convolutions k y et k y pour une fonction continue arbitraire et comparer les courbes obtenues avec la fonction y. Conclure.

Objectif 3
On tablit que si une suite de distribution Tn converge dans D vers T , alors (m) les drives Tn converge dans D vers T (m) . La drivation est une opration linaire et continue dans D et on peut toujours permuter les signe de drivation et de limite (proprit plus simple que pour les fonctions). 29

Bibliographie Manipulation Calculer au sens des distributions les drives k et k des fonctions k et k prcdentes. Raliser les produits de convolutions k y et k y et comparer les courbes obtenues avec la fonction y (calcule ou approche par les fonctions di ou gradient de Matlab). Conclure.

Annexe
Rappel de formules sur la multiplication et la drivation : tl (n) = 0 pour l > n, et tl (n) = (1)l n! (nl) pour l n. (n l)! =

eat (S T )t , (t) = (S T )t , eat (t) = S , T , ea+a ( + ) S , ea+a T , ( + ) = ea S , ea T , ( + )

= eat S eat T, .

1.8

Bibliographie

[1] Boccara, N.: Distributions. Mathmatiques pour lingnieur, Ellipses, 1997. [2] Demengel, F. et G. Demengel: Mesures et distributions. Thorie et illustration par les exemples. Ellipses, 2000. [3] Demengel, G.: Transformation de Laplace, Thorie et illustration par les exemples. Ellipses, 2002. [4] Dupraz, J.: La thorie des distributions et ses applications. Editions, 1977. Cepadues-

[5] F. Hirsh, F. et G. Lacombe: Elements danalyse fonctionnelle. Masson, 1997. [6] Lacroix-Sonier, M T.: Distributions, Espaces de Sobolev, Applications. Ellipses, 1998. [7] Petit, R.: loutil mathmatique. Enseignement de la physique, Masson, 1995. [8] R. Dautray, R. et J L. Lions: Analyse mathmatique et calcul numrique, vol. 4, mthodes variationnelles. Masson, 1988. [9] Rodier, F.: Distributions et Transformation de Fourier. Ediscience international, 1993. [10] Schwartz, L.: Thorie des distributions, 2nd ed. Hermann, Paris, 1966. [11] Yger, A.: Analyse complexe et distributions. Ellipses, 2001. [12] Zuily, C.: Elements de distributions et dquations aux drives partielles. Dunod, 2002. 30

Optimisation et LMI

M. Dambrine1
1 LAMIH,

ENSIAME - Universit de Valenciennes et du Hainaut-Cambrsis, 59313 Valenciennes cedex 9, France. E-mail : Michel.Dambrine@univ-valenciennes.fr

2.1

Gnralits

Notions de base et notations


Minimiser les cots, maximiser le rendement, trouver le meilleur modle possible, ... toutes ces expressions montrent quel point loptimisation a une place fondamentale dans les sciences de lingnieur. Les donnes dun problme doptimisation de dimension nie sont les suivantes : un vecteur x compos des variables de dcision x1 , . . . , xn ; un ensemble K reprsentant lensemble des vecteurs x correspondant des valeurs ralistes des variables de dcision. Il peut tre dcrit par un ensemble dgalits ou dingalits devant tre vri par la solution. K sera appel dans la suite ensemble des contraintes ou ensemble admissible ; enn, une fonction J dnie au moins sur K et valeurs relles reprsentant la quantit que lon cherche optimiser. La fonction J est appele le critre, le cot ou la fonction-objectif Le problme doptimisation (formul ici sous forme dun problme de minimisation1 ) consiste trouver sil en existe un un lment xmin de K minimisant la fonction J sur K, cest--dire, tel que J(xmin ) J(x) x K, ou de manire quivalente xmin K
1

(2.1)

et J(xmin ) = inf J(x).


xK

pour la recherche dun maximum, il sut de remplacer J par son oppos J

31

2. Optimisation et LMI Un tel lment est appel minimum global du critre J sur K.
60

50

40

30

20

10

1 Fig. 2.1: une partie du graphe de ( 0.04+x + 0.5x2 ) (2 + sin(20x))

La caractrisation dun tel lment pouvant tre dlicate (cf. gure 2.1), on se contente souvent en pratique de la recherche dun minimum local, cest--dire, un lment xmin pour lequel lingalit (2.1) nest vraie que pour des lments x K pris dans un voisinage V de xmin : J(xmin ) J(x) x V K, (2.2)

Un minimum global ou local sera dit strict si lingalit large (2.1) ou (2.2) peut tre remplace par une ingalit stricte lorsque x = xmin : J(xmin ) < J(x) x V K, x = xmin . (2.3)

Le sous-ensemble K reprsente lensemble des contraintes du problme (ou ensemble admissible). Lorsque K = Rn , on parle de problme sans contraintes, sinon de problme avec contraintes. Couramment, les contraintes sont dnies par un systme dquations non linaires gi (x) = 0 i {1, . . . , m}, (contraintes de type galit) ou un systme dingalits fj (x) 0 j {1, . . . , p}, (contraintes de type ingalit) voire une combinaison de ces deux types. 32

2.1. Gnralits

Classication des problmes doptimisation


Suivant le type des variables de dcision, la nature du critre J et de lensemble des contraintes K, on distingue direntes sortes de problmes doptimisation. Dans le cadre de ce cours, on supposera que les composantes de x sont relles : on parle alors doptimisation continue. Mais, on peut aussi considrer des problmes pour lesquelles les variables sont entires, voire boolennes (0 ou 1) (optimisation combinatoire ou discrte) et dautres o les variables sont des fonctions (optimisation en dimension innie). Dans le cadre mme de loptimisation continue, on catalogue les problmes suivant les proprits (linarit, convexit, direntiabilit, ...) des fonctions J, gi et fi . On distingue ainsi les problmes linaires pour lesquels les fonctions J, gi et fj sont des fonctions anes de x ; les problmes non linaires (lorsquils ne sont pas linaires) ; les problmes quadratiques lorsque J est une fonction quadratique, les fonctions gi et fj tant anes ; les problmes convexes quand les fonction J et fj sont convexes, les fonctions gi tant anes ; les problmes direntiables ou non direntiables suivant que les fonctions J, gi et fj sont direntiables (en un certain sens) ou non.

Existence dun minimum


La premire question que lon peut se poser avant de rechercher la ou les solutions optimales dun problme est de dterminer si le problme admet bien une solution optimale. Cette tape peut se rvler ardue mme pour des problmes catalogus comme simples tels les problmes doptimisation linaire. Le point de dpart des critres dexistence dun optimum repose sur un rsultat classique dAnalyse : le thorme de Weierstrass. Thorme 2.1.1 (Weierstrass). Toute fonction continue sur un compact non vide y admet un minimum. Rappelons quen dimension nie, les ensembles compacts sont les ensembles ferms et borns. Il est possible de gnraliser ce thorme au cas dun sousensemble ferm F Rn mais non ncessairement born lorsque le critre optimiser J est coercif : pour toute suite (xk )k0 dlments de F, on a
k

lim xk = + lim J(xk ) = +.


k

(2.4)

On convient ici que cette condition est systmatiquement remplie lorsque lensemble F est born. En eet, soit (xk ) une suite minimisante de J sur F , cest-dire, une suite telle que J(xk ) converge vers inf xF J(x). La suite J(xk ) tant majore, la condition (2.4) (dite de coercivit) implique alors que (xk ) est une 33

2. Optimisation et LMI suite borne. Daprs le thorme de Bolzano-Weierstrass, il est possible dextraire de (xk ) une sous-suite (xnk ) convergente vers un point xmin de Rn . Lensemble F tant ferm, xmin appartient F. Si J est continue, alors on a : J(xmin ) = lim J(xnk ) = inf J(x).
xF

Thorme 2.1.2. Soit F un ensemble ferm non vide de Rn , et J : F R une fonction continue sur F et vriant la proprit de coercivit (2.4). Alors, la fonction J possde un minimum sur F .

2.2

Minimisation sans contraintes

On suppose ici que K = Rn tout entier ou un ouvert O de Rn . On sattaque dans cette partie au problme plus pratique de la caractrisation des points de minimum, cest--dire tablir des conditions qui sont automatiquement remplies ds lors quun point correspond un minimum local de la fonction minimiser. Cest laide de ces conditions ncessaires que seront tablis les algorithmes doptimisation.

Notions prliminaires
lments de calcul direntiel Soit J : Rn Rm , on dit que J est direntiable en x sil existe une application linaire L de Rn dans Rm telle que J(x + h) = J(x) + L(h) + h (h),
h0

lim (h) = 0

Lapplication L est lapplication drive de J en x et est note J (x). Lorsque m = 1 (c--d, J valeurs relles), L est une forme linaire (une application linaire valeurs relles), il existe alors un vecteur not J(x) Rn le vecteur gradient de J en x tel que L(h) = J (x)(h) = (produit scalaire de J(x)T h, h Rn

J(x) et de h) et on a J(x) =

J (x) x1

. J xn (x)

. . .

La drive de J dans la direction h est alors donne par J(x + h) J(x) = 0,R lim 34 J(x)T h. (2.5)

2.2. Minimisation sans contraintes Dans le cas gnral, la matrice associe L (dans les bases canoniques de Rn et Rm ) est la Jacobienne de J en x que lon notera encore J (x). Si J1 (x) J2 (x) J(x) = . , . . Jm (x) alors J (x) =
J1 x1 (x)

...

. . .

Jm x1 (x)

...

J1 (x)T . . . = . . . Jm T Jm (x) xn (x)


J1 xn (x)

Pour une application J : Rn R deux fois drivable en un point x, on dnit la matrice Hessienne 2 J(x) Rnn par : 2 J 2J . . . x1 xn (x) 2 (x) x1 . . 2 . . J(x) = . . . 2J 2J (x) xn x1 (x) . . . x 2
n

Cest une matrice symtrique : 2 J(x)/xi xj = 2 J(x)/xj xi . Le thorme suivant donne le dveloppement limit lordre 2 de J. Thorme 2.2.1 (Formule de Taylor-Young). Si J : Rn R est diffrentiable dans Rn et deux fois direntiable en x, alors J(x + h) = J(x) + 1 J(x)T h + hT 2
2

J(x)h + h

(h),

h0

lim (h) = 0.

Notion danalyse convexe Une partie C de Rn est dite convexe si tout segment dextrmits prises dans C est inclus dans C, cest--dire : x + (1 )y C x, y C, [0, 1],.

Un point x est une combinaison convexe des points x1 , . . . , xk sil existe des nombres rels 1 , . . . , k tels que 1 , . . . , k 0, 1 + + k = 1 et x = 1 x1 + +k xk . Par extension du rsultat prcdent, toute combinaison convexe dlments appartenant un ensemble convexe C est galement dans C. Dnition 2.2.1 (convexit, convexit stricte). Une fonction J : C R, o C est un ensemble convexe non vide de Rn , est dite convexe si 35

2. Optimisation et LMI J(x + (1 )y) J(x) + (1 )J(y) x, y C, [0, 1]. J est dite strictement convexe si lingalit prcdente est stricte lorsque x = y et ]0, 1[. Citons ici quelques proprits des fonctions convexes : Proposition 2.2.1. Lensemble des fonctions convexes sur Rn est un cne convexe : si J1 et J2 sont convexes alors la fonction 1 J1 + 2 J2 est galement convexe quels que soient 1 , 2 0. Lenveloppe suprieure f (x) = supiI fi (x) dune famille (fi )iI de fonctions convexes est convexe. Si J est une fonction convexe sur un ensemble convexe C, tout point de minimum local de J sur C est un minimum global et lensemble des points de minimum est un ensemble convexe (ventuellement vide). Si de plus J est strictement convexe, alors il ne peut exister quau plus un point de minimum. Si la fonction J est direntiable, il est alors possible de caractriser les direntes notions de convexit laide des proprits suivantes : 1. J est convexe sur C si et seulement si J(x ) J(x) + J(x), x x , x, x C. (2.6)

2. J est strictement convexe sur C si et seulement si J(x ) > J(x) + J(x), x x , x, x C, x = x.

Notons que la premire proprit admet une interprtation gomtrique simple : une fonction est convexe si et seulement si le plan tangent en chaque point est situ en dessous du graphe de la fonction. Enn, si la fonction J est deux fois direntiable, alors 3. J est convexe sur C si et seulement si 2 J(x) est une matrice semi-dnie positive, x C. 4. J est strictement convexe sur C si et seulement si 2 J(x) est une matrice dnie positive, x C.

Caractrisation dun point de minimum


Conditions de minimalit du premier ordre Soit O un ouvert de Rn et xmin O un minimum local de la fonction J sur O, la fonction J tant suppose direntiable au point xmin . Le point xmin tant lintrieur de O, pour tout vecteur d Rn , on peut alors trouver un max tel que xmin + d O 36 et J(xmin + d) J(xmin ) 0 ] max , max [,

2.2. Minimisation sans contraintes On a alors

J(xmin + d) J(xmin ) 0, d Rn , 0 lim J(xmin )T d 0 pour tout vecteur d Rn . On a donc J(xmin ) = 0.

cest--dire,

Thorme 2.2.2 (Condition ncessaire du premier ordre). Soit J : O R une fonction direntiable au point xmin O. Si J admet un minimum local en xmin , alors le gradient de J au point xmin est nul : J(xmin ) = 0 (quation dEuler).

Cette condition nest bien sr pas susante : le mme raisonnement ralis pour un maximum conduirait au mme rsultat. De plus, on sait que la drive de J(x) = x3 (pour x rel) sannule en x = 0 sans que ce point ne soit un minimum ou un maximum. Les points pour lesquels le gradient dune fonction est nul sont appels points stationnaires ou points critiques de cette fonction. Comment dtecter si un point stationnaire est bel et bien un minimum ? Il faut pour cela une tude plus pousse du comportement du critre J au voisinage de ce point. Ainsi, si J est convexe alors la CN de minimalit du premier ordre devient susante : Thorme 2.2.3. Soit J : O R une fonction convexe direntiable sur louvert convexe O. Alors, J admet au point xmin O un minimum local si et seulement si J(xmin ) = 0. En eet, puisque J est convexe, on a J(x) J(xmin ) + J(xmin )T (x xmin ), x, xmin O,

et donc, si xmin est un point stationnaire de J, on a J(x) J(xmin ) x O. Notons qualors, du fait de la convexit de J, xmin est un minimum global de J. Si la fonction nest pas convexe, on peut essayer le rsultat suivant : Thorme 2.2.4. Si J est continue en xmin sur O et quil existe un voisinage V de ce point tel que : la fonction J est direntiable sur V \ {xmin }, lingalit J(x)T (x xmin ) 0 (resp. > 0) est vrie pour tout x dans V \ {xmin }, alors J admet an point xmin O un minimum local (resp. minimum local strict). La dmonstration de ce thorme repose sur lutilisation du thorme des accroissements nis. 37

2. Optimisation et LMI Conditions de minimalit du second ordre On suppose, cette fois, la fonction J : O R deux fois direntiable au point xmin O. Si J admet en xmin un minimum local, alors on a J(xmin ) = 0 et la formule de Taylor-Young lordre 2 scrit 0 J(xmin + d) J(xmin ) = avec lim0 () = 0. On a donc ncessairement d
2

2 T d 2

J(xmin )d + 2 (),

J(xmin )d 0,

d Rn .

Thorme 2.2.5 (CN de minimalit du second ordre). Soit J : O R une fonction deux fois direntiable au point xmin O. Si J admet un minimum local en xmin , alors J(xmin ) = 0 et
2

J(xmin ) est semi-dnie positive.

Il est possible dobtenir une condition susante de minimalit sous des hypothses plus restrictives : Thorme 2.2.6 (CS de minimalit du second ordre). Soient J : O R et un point xmin O o J est deux fois direntiable. Si J(xmin ) = 0 et
2

J(xmin ) est dnie positive,

alors J admet un minimum local strict au point xmin . En eet, soit min > 0 la plus petite valeur propre de tout d Rn , on a dT 2 J(xmin )d min d 2 ,
2 J(x min ),

alors, pour

il sut alors dappliquer la formule de Taylor-Young lordre 2 pour dmontrer le rsultat.

Algorithmes
Le but ici nest pas de prsenter un catalogue complet dalgorithmes mais quelques mthodes de base ainsi que leur principe-cl. La plupart des algorithmes de rsolution numrique des problmes doptimisation sont des procds itratifs : on construit une suite (xk ) par une rcurrence du type xk+1 = xk + k hk . (2.7) La direction hk est choisie telle que 38

2.2. Minimisation sans contraintes J(xk )T hk < 0 (on dit alors que hk est une direction de descente). Le coecient k est pris tel que J(xk + k hk ) < J(xk ), la suite (J(xk )) est dcroissante, on parle dalgorithmes de descente. Mthodes du gradient On suppose ici la fonction J au moins une fois continment direntiable sur Rn . Dans le cas sans contraintes, un minimum ne peut tre atteint quen un point stationnaire du critre J, cest--dire en un point xmin tel que J(xmin ) = 0. Les techniques itratives de recherche des zros dune fonction peuvent donc tre appliques la recherche dun optimum : si la suite (xk ) vriant la rcurrence xk+1 = xk k J(xk ), avec k = 0 (2.8) converge vers une limite xmin , alors, par continuit de J(xmin ) = 0. Les mthodes du gradient reposent toutes sur le choix de loppos du gradient comme direction de descente : chaque tape, on a hk = J(xk ). Suivant le choix du paramtre k , on distingue direntes mthodes : Mthode du gradient pas xe (k prend la mme valeur toutes les tapes). Mthode du gradient pas optimal : chaque tape, k est la solution du problme doptimisation unidimensionnel
R

J, on a ncessairement

inf fk (),

(2.9)

o fk () = J(xk + hk ). Remarquons que, de la condition doptimalit fk (k ) = 0, lon dduit la relation J(xk+1 ) J(xk ) = 0, exprimant que deux directions de descente conscutives sont toujours orthogonales. La convergence de cet algorithme peut donc se rvler assez lente lorsque les valeurs propres de la matrice hessienne de J au point optimal ne sont pas du mme ordre de grandeur (cf. Fig. 2.2), Mthodes du gradient pas variable : en pratique, la rsolution complte, chaque tape, du problme (2.9) est trop coteuse en temps de calcul. Pour viter cela, la valeur du pas est choisie en considrant les lments une suite gomtrique de raison strictement infrieure 1. La valeur du pas retenue tant la premire satisfaire certaines conditions (pour plus de dtail, se rfrer [8]) 39

2. Optimisation et LMI

0.03

0.02

0.01

0.01

0.02

0.03

0.04

0.05

0.06 0.04 0.02 0 0.02 0.04 0.06 0.08

Fig. 2.2: Meth. du gradient pas optimal

Mthode de Newton Recherche des zros dune fonction : mthode de Newton-Raphson Un algorithme couramment utilis pour la recherche des zros dune fonction F : Rn R est la mthode de Newton-Raphson. Le principe est le suivant : soit xk un point donn de Rn constituant une estimation dun zro de F , on approche au voisinage de ce point, la fonction F par son dveloppement limit au premier ordre : F (x) = F (xk ) + F (xk )(x xk ) Le point suivant xk+1 est alors pris comme le zro de F (obtenu en rsolvant le systme dquations linaires F (xk )(dk ) = F (xk ), avec xk+1 = xk + dk ) (la gure 2.3 illustre le cas dune fonction F une seule variable relle x). On peut montrer que si F est continment direntiable au voisinage dun de ces zros x tel que det(F (x )) = 0, alors pour un point initial x0 choisi susamment proche de x , la suite (xk ) converge vers x . Application loptimisation : mthode de Newton On suppose que la fonction J est deux fois continment drivable et que lon peut calculer de manire relativement aise la matrice Hessienne en tout point. Alors, la mthode de Newton-Raphson applique la recherche dun zro de J conduit un algorithme itratif de la forme (2.7) o la direction de descente est hk = (
2

J(xk ))1 J(xk ).

(2.10)

Le paramtre k peut tre pris gal 1 (mthode de Newton pure) ou dtermin en rsolvant le problme doptimisation une seule variable relle (2.9). 40

2.2. Minimisation sans contraintes


6

x
1

k+1

x*
1 1.5

0.5

Fig. 2.3: Recherche dun zro de la fonction F (x) = (1 x)(x 2)(x 3)

Mthodes de quasi-Newton La convergence de la mthode de Newton est rapide, mais la dtermination de la matrice Hessienne de J et la rsolution, chaque tape, du systme linaire
2

J(xk ) hk = J(xk )

ncessitent un nombre important de calculs, ce qui rend cette technique inapplicable pour des problmes de grande dimension. Un remde consiste alors gnraliser la formule (2.10) en choisissant pour direction de descente un vecteur de la forme hk = Hk J(xk ), o Hk est une matrice symtrique, dnie positive. Les critres de slection pour Hk sont : 1. tre calculable facilement et rapidement. On peut, pour cela, dterminer les matrices Hk laide dune rcurrence de la forme Hk+1 = Hk + k , la matrice k pouvant tre une fonction de Hk , xk+1 , xk , ... 2. Converger vers linverse de la matrice Hessienne de J au point de minimum (au moins pour toute fonction J quadratique et elliptique) ou tre telle que la direction de descente hk converge vers la direction (2.10). Pour cela, il sut que Hk vrie lgalit Hk ( J(xk ) J(xk1 )) = xk xk1 . 41

2. Optimisation et LMI Parmi les mthodes de quasi-Newton, lalgorithme BFGS ( Broyden, Fletcher, Goldfarb et Shanno) est considr comme le plus ecace. La mise jour des matrices Hk se fait alors laide de la relation de rcurrence Hk+1 = Hk + (1 + o k = xk+1 xk et gk =
T T T T gk Hk gk k k k gk Hk + Hk gk k ) T , T T k gk k gk k gk

J(xk+1 )

J(xk ).

2.3

Minimisation avec contraintes

Caractrisation du minimum
On considre ici le problme de la recherche du minimum dune fonction J : Rn R sur K, un sous-ensemble ferm de Rn reprsentant les contraintes. Le raisonnement que lon a eectu pour obtenir la condition ncessaire de minimalit dans le cas sans contraintes nest plus valide ici : du fait des contraintes, le point de minimum peut tre sur la frontire de K et seules les suites de la forme xmin + k d restant dans K pour k susamment petit sont considrer. On introduit alors la notion de direction admissible. Dnition 2.3.1. h Rn est une direction admissible de K au point x K sil existe une suite (xk ) dlments de K et une suite de rels strictement positifs (k ) telles que lim xk = x, lim k = 0 et lim(xk x)/k = h. Lensemble des directions admissibles au point x K constitue un cne ferm de Rn not K(x). Une autre faon dinterprter le fait que d est une direction admissible de K en xmin est de dire quil existe une suite de vecteurs (dk ) convergeant vers d et une suite de rels positifs (k ) convergeant vers 0 telles que xmin + k dk K pour tout K. Si xmin est un minimum local de J sur K, on a alors J(xmin + k dk ) J(xmin ) 0 k Si J est direntiable en xmin , il sut alors de passer la limite lorsque k pour montrer le rsultat suivant : Thorme 2.3.1 (inquation dEuler). Soit K un sous-ensemble ferm de Rn et J : Rn R une fonction direntiable au point xmin K. Si J admet sur K un minimum local en xmin , alors J(xmin ) d 0 d K(xmin ). (2.11)

La dicult dans lapplication de ce thorme est de caractriser lensemble (ou un sous-ensemble) des directions admissibles. Avant de le faire pour des contraintes de type galit et/ou ingalit, considrons deux cas particuliers simples traiter. 42

2.3. Minimisation avec contraintes Si x est un point intrieur de K, alors K(x) = Rn et on retrouve la mme condition ncessaire doptimalit que dans le cas sans contrainte : J(xmin ) = 0. Si K est convexe, alors, tant donns deux points x et y de K, le point x + (y x) est aussi dans K pour tout [0, 1], autrement dit, y x est une direction admissible au point x. On a donc K \ {x} K(x). Il vient alors le corollaire suivant : Corollaire 2.3.1. Soit K un sous-ensemble convexe et ferm de Rn et J : Rn R une fonction direntiable au point xmin K. Si J admet sur K un minimum local en xmin , alors J(xmin ) (x xmin ) 0 x K.

Si de plus J est convexe, alors la rciproque est vraie. En eet, on a J(x) J(xmin ) + do J(x) J(xmin ). La fonction J admet donc un minimum global en xmin . J(xmin ) (x xmin ) x K,

Cas des contraintes de type galit


On suppose ici que lensemble des contraintes est de la forme suivante : K = {x Rn : gi (x) = 0 i {1, . . . , m}} o g1 , . . . , gm sont des fonctions dnies sur Rn et valeurs dans R. Recherche des directions admissibles Soit x un point de K c--d. tel que gi (x) = 0 i {1, . . . , m} et recherchons les directions admissibles K en x. Soit d une direction admissible K en x, alors il existe (dk ) d et (k ) 0 telles que x + k dk K, k, cest--dire : gi (x + k dk ) = 0 i {1, . . . , m} Si les fonctions gi sont continment direntiables en x, alors en dveloppant au premier ordre et en prenant la limite lorsque (dk ) d, on montre que : gi (x) d = 0 i {1, . . . , m} Do K(x) TK (x) d Rn : gi (x) d = 0, i {1, . . . , m} (2.14) (2.13) (2.12)

Par extension, si les vecteurs (gi (x))1im sont linairement indpendants cas dit rgulier alors, laide du thorme des fonctions implicites, il est possible de montrer que les deux ensembles K(x) et TK (x) sont confondus : 43

2. Optimisation et LMI K(x) = d Rn : gi (x) d = 0, i {1, . . . , m}

Dans ce contexte, K(x) est le sous-espace tangent K en x et reprsente lorthogonal du sous-espace vectoriel engendr par les gi (x). Condition au premier ordre : rgle de Lagrange On se place dans le cas rgulier. Si d est une direction admissible, alors d lest aussi. La condition de minimalit (2.11) scrit alors J(xmin ) d = 0, d K(x) = h Rn : gi (x) h = 0, i {1, . . . , m}

On a donc J(xmin ) K(x) , puisque les vecteurs (gi (x)) pour 1 i m sont supposs linairement indpendants, ncessairement J(xmin ) est un lment du sous-espace vectoriel engendr par les gi (x). Thorme 2.3.2 (Rgle de Lagrange). Soient J, g1 , . . ., gm des fonctions dnies sur Rn et valeurs dans R et K le sous-ensemble de Rn dni par (2.12). On suppose que les fonctions J et gi (pour i = 1, . . . , m) sont direntiables en un point xmin K et que les vecteurs ( gi (xmin ))1im sont linairement indpendants. Si J admet sur K un minimum local en xmin , alors il existe 1 , . . . , m R tels que
m

J(xmin ) +
i=1

i gi (xmin ) = 0.

(2.15)

Les coecients i sont appels les multiplicateurs de Lagrange associs au point de minimum xmin . Dnissons la fonction L : Rn Rm R par
m

L(x, ) = J(x) +
i=1

i gi (x),

o = [1 , . . . , m ] . Cette fonction est appele fonction de Lagrange ou Lagrangien du problme de la minimisation de J sur K. La rgle de Lagrange dit alors que si xmin minimise J sur K, alors il existe un vecteur Rm tel que le vecteur xmin , soit un point stationnaire de L. Pour trouver la solution dun problme doptimisation avec des contraintes galits, il sut de rsoudre le systme n + m quations et n + m inconnues
x L(x, )

= 0 et

L(x, )

=0

La rgle de Lagrange ne donne quune condition ncessaire de minimalit (on obtiendrait de toute faon la mme condition pour un maximum). Pour obtenir des conditions susantes, il faut rajouter des hypothses, par exemple la convexit : 44

2.3. Minimisation avec contraintes Thorme 2.3.3. Soit J une fonction convexe direntiable sur Rn . Et soient m fonctions gi (pour i = 1, . . . , m) supposes anes (de la forme gi (x) = ai x+bi ). Alors, un lment xmin K = {x Rn : gi (x) = 0, i {1, . . . , m}} pour lequel il existe un vecteur Rm vriant (2.15) est un minimum (global) de J sur K. Conditions du second ordre On suppose cette fois les fonctions J et gi deux fois direntiables. On admettra les deux rsultats suivants. Thorme 2.3.4 (CN au 2nd ordre). Soient J, g1 , . . ., gm des fonctions dnies sur Rn et valeurs dans R et K le sous-ensemble de Rn dni par (2.12). On suppose que J et les fonctions gi sont deux fois direntiables en un point xmin K et que les dirents vecteurs ( gi (xmin ))1im sont linairement indpendants. Si J admet sur K un minimum local en xmin , alors il existe = [1 , . . . , m ] Rm tels que d pour tout d h Rn :
x L(xmin , ) 2 x L(xmin , )d

= 0. 0,

(2.16) (2.17)

gi (x) h = 0,

i {1, . . . , m}

Thorme 2.3.5 (CS au 2nd ordre). Sous les mmes hypothses quau thorme prcdent, sil existe Rm tel que pour xmin K
x L(xmin , ) 2 x L(xmin , )d

= 0. > 0,

(2.18) (2.19)

pour tout d = 0 dans h Rn : gi (x) h = 0, est un minimum local strict de J sur K.

i {1, . . . , m} , alors, xmin

Cas des contraintes de type ingalit


On suppose maintenant que lensemble des contraintes est de la forme suivante : K = {x Rn : fj (x) 0 j {1, . . . , p}} (2.20) o f1 , . . . , fp sont des fonctions dnies sur Rn et valeurs dans R. Une contrainte fj (x) 0 sera dite active ou sature au point x si fj (x) = 0. Seules ces contraintes ont un rle dans le problme doptimisation. En eet, si, loptimum, on a fj (xmin ) < 0, j {1, . . . , p}, alors le point xmin est lintrieur de K et alors K(x) = Rn . Pour un point x K, on notera I(x) lensemble des indices des contraintes actives dni par I(x) = {j {1, . . . , p} : fj (x) = 0}. 45

2. Optimisation et LMI Recherche des directions admissibles Soit d Rn une direction admissible K en x, alors il existe deux suites (dk ) d et (k ) 0 telles que x + k dk K, k, cest--dire : fj (x + k dk ) 0 j I(x) Si les fonctions fj sont continment direntiables en x, alors en dveloppant au premier ordre et en prenant la limite lorsque (dk ) d, on montre que : fj (x) d 0 j I(x) En fait, on vient de montrer que K(x) K (x) = {d Rn : fj (x) d 0, j I(x)} (2.21)

Lgalit nest vraie que sous certaines hypothses dites de qualication des contraintes. Il existe direntes conditions de qualication des contraintes, une des plus simples est la suivante : Thorme 2.3.6. Supposons les fonctions fj direntiables, alors les contraintes sont qualies au point x K sil existe h Rn tel fj (x) h < 0 j I(x). (2.22)

Lorsque fj est une fonction ane, on peut remplacer lingalit stricte (2.22) par lingalit fj (x) h 0. Remarquons alors que si toutes les contraintes fj sont anes, alors les contraintes sont systmatiquement qualies : il sut de choisir h = 0. Gomtriquement, lensemble K (x) est un cne (cf. illustration dans le plan gure 2.4).
1.6

f2(x*)
1.4

f1(x)=0 f1(x*)

1.2

0.8

Cone des directions admissibles

0.6

f2(x)=0

0.4

0.2

0.4

0.6

0.8

1.2

1.4

1.6

1.8

Fig. 2.4: cne des dir. admissibles

46

2.3. Minimisation avec contraintes Condition au premier ordre En supposant les contraintes qualies, la condition de minimalit (2.11) scrit ici : J(xmin ) d 0, pour tout d dans {h Rn : fj (x) h 0, j I(xmin )}. On peut alors montrer que cela est quivalent lexistence dun vecteur Rp composante j 0 tel que J(xmin ) +
jI(xmin )

j fj (xmin ) = 0

(cf. interprtation gomtrique sur la gure 2.5)


1.6 f2(x ) 1.4 f (x*)
1 *

1.2

0.8

0.6 J(x*) 0.4 0.6 0.8 1 1.2 1.4 1.6

Fig. 2.5: CN de minimalit : J(xmin ) doit tre dans le cne convexe engendr par les fj (xmin ) pour j I(xmin )

En rsum : Thorme 2.3.7. Soient J, f1 , . . . , fp des fonctions dnies sur Rn et valeurs dans R et K le sous-ensemble de X dni par (2.20). On suppose que J et les fonctions fj sont direntiables en un point xmin K et quen ce point lhypothse de qualication des contraintes est remplie. Si J admet sur K un minimum local en xmin , alors il existe des rels 1 , . . . , p 0 tels que
p

J(xmin ) +
j=1

j fj (xmin ) = 0, j {1, . . . , p}.

(2.23) (2.24)

j fj (xmin ) = 0,

Les coecients i jouent le mme rle que les multiplicateurs de Lagrange pour les problmes avec contraintes galits : on les appelle parfois multiplicateurs de Lagrange gnraliss. Attention, toutefois au signe positif impos 47

2. Optimisation et LMI dans le cadre de contraintes ingalits. La condition (2.24) est appele condition de complmentarit, elle prcise que si une contrainte est inactive au point de minimum, alors ncessairement le multiplicateur associ est nul.

Cas des contraintes de type mixte


CN de minimalit du premier ordre : conditions de KKT Il est possible dtendre sans dicult majeure les rsultats prcdents de faon prendre en compte des contraintes se prsentant sous les deux formes galits et ingalits : K = {x Rn : fj (x) 0 j {1, . . . , p} et gi (x) = 0 i {1, . . . , m}} . (2.25) n. Les fonctions fj et gi sont supposes direntiables sur R Pour ce problme, les principales conditions de qualication des contraintes en un point x sont les suivantes : QC1 les fonctions fj (pour j I(x)) et gi (pour i = 1, . . . , m) sont anes. QC2 les gradients fj (x), rement indpendants. QC3 si
m

gi (x) (pour j I(x) et i = 1, . . . , m) sont linai-

i gi (x)+
i=1 jI(x)

j fj (x) = 0 et j 0, j I(x) i = 0,

j = 0

On a alors le rsultat : Thorme 2.3.8 (Karush-Kuhn-Tucker). Soient J, f1 , . . . , fp , g1 , . . . , gm des fonctions dnies sur Rn et valeurs dans R et K le sous-ensemble de Rn dni par (2.25). On suppose que J et les fonctions fj , gi sont direntiables en un point xmin K et quen ce point les contraintes sont qualies. Si J admet sur K un minimum local en xmin , alors il existe des rels 1 ,. . . , p 0 et 1 ,. . . , m tels que
m p

J(xmin ) +
i=1

i gi (xmin ) +
j=1

j fj (xmin ) = 0,

j fj (xmin ) = 0,

i {1, . . . , p}.

Les coecients i , j sont appels coecients de Lagrange (gnraliss) ou de Karush-Kuhn-Tucker. On peut reformuler les conditions de KKT en introduisant le Lagrangien du problme : L : Rn Rm Rp + 48

2.4. Optimisation convexe L(x, , ) = J(x) +


1im

i gi (x) +
1jp

i fj (x)

Conditions de KKT : x L(xmin , , ) = 0, (i) ; gi (xmin ) = 0 (1 i m), (ii) ; f (x ) 0 j min 0 j f (x ) = 0 j j min (1 j p), (1 j p), (1 j p),

(iii) ; (iv) ; (v).

2.4

Optimisation convexe

Optimisation convexe
La notion de convexit possde un rle privilgi en thorie de loptimisation car elle permet dobtenir des conditions globales dexistence, mais aussi par lexistence de conditions ncessaires et susantes doptimalit et cela mme dans le cas non direntiable. Elle est galement dune grande importance pratique puisquil existe des algorithmes de rsolution numrique trs ecaces et, consquence logique, de plus en plus de problmes concrets sont traits au moyen de loptimisation convexe. Le problme (P ) min J(x),
xK

est un problme convexe si la fonction objectif J et lensemble des contraintes K sont convexes. Lorsque lensemble K est dni par des galits et des ingalits : K = {x Rn : gi (x) = 0, i {1, . . . , m} et fj (x) 0, j {1, . . . , p}} , (2.26) alors il sut que les fonctions gi (pour i = 1, . . . , m) soient anes et les fonctions fj (pour j = 1, . . . , p) convexes pour que K soit lui-mme convexe. On supposera que cest toujours le cas dans la suite. Une proprit importante en optimisation convexe est la suivante Thorme 2.4.1. Si J est une fonction convexe sur un ensemble convexe C, tout point de minimum local de J sur C est un minimum global et lensemble des points de minimum est un ensemble convexe (ventuellement vide). Si de plus J est strictement convexe, alors il ne peut exister au plus quun point de minimum.

Conditions doptimalit
La plupart des conditions ncessaires doptimalit donnes dans les sections prcdentes sont galement susantes dans le cas convexe. Il en est de mme 49

2. Optimisation et LMI pour les conditions doptimalit de Karush, Kuhn et Tucker. Un autre avantage non ngligeable obtenu laide de la proprit de convexit est la possibilit dutiliser une condition de qualication des contraintes (dite de Slater), plus simple demploi car valable non plus localement mais globalement : QC4 Si, en crivant les contraintes galits sous la forme matricielle Ax = b, les m lignes de A sont linairement indpendantes et sil existe un point x Rn tel que Ax = b et fj (x) < 0, j {1, . . . , p}, (2.27)

alors les contraintes sont qualies en tout x de K. Pour toutes les fonctions fj anes, lingalit stricte (2.27) peut tre remplace par lingalit large (fj (x) 0). Thorme 2.4.2 (Conditions de Karush, Kuhn et Tucker). Soient J, f1 , . . ., fp , g1 ,. . . , gm des fonctions dnies sur Rn et valeurs dans R et K lensemble dni par (2.26). On suppose que les fonctions J et fj (1 j p) sont convexes et direntiables en un point xmin K et que les fonctions gi sont toutes anes. 1. Si J admet sur K un minimum en xmin et si les contraintes sont qualies, alors il existe des rels 1 ,. . . ,m (de signe quelconque) et 1 ,. . . , p 0, tels que
p m

J(xmin ) +
j=1

j fj (xmin ) +
i=1

j gi (xmin ) = 0, j fj (xmin ) = 0

(2.28a) j {1, . . . , p}. (2.28b)

2. Rciproquement, sil existe des rels 1 ,. . . ,m et 1 , . . . , p 0, vriant les relations (2.28), alors J admet sur K un minimum en xmin .

Exemples de problmes convexes


Il existe des familles de problmes convexes ayant une porte trs importante en pratique : Les problmes doptimisation linaires pour laquelle la fonction objectif est linaire par rapport aux variables de dcision xi , et les fonctions contraintes (galits et ingalits) sont des fonctions anes des xi : minimiser J(x) = c x, (P L) s.l.c. x Rn : ai x = bi , i = 1, . . . , m d x e , j = 1, . . . , p
j j

Ces problmes seront tudis au chapitre suivant. 50

2.5. Programmation linaire Les problmes quadratiques o la fonction objectif est quadratique (convexe) et les contraintes anes : minimiser s.l.c. x Rn : J(x) = 1/2x Qx + c x + c0 , ai x = bi , dj x ej , i = 1, . . . , m j = 1, . . . , p

(P Q)

Les problmes doptimisation quadratique avec contraintes quadratiques o la fonction objectif ainsi que les contraintes ingalits sont quadratiques (convexes) et les contraintes galits anes : minimiser J(x) = 1/2x Q0 x + p0 x + r0 , j = 1, . . . , p

(P QCQ)

s.l.c. x Rn : 1/2x Qj x + pj x + rj 0, ai x = bi ,

i = 1, . . . , m

Les problmes doptimisation semi-dnie pouvant tre mis sous la forme : minimiser J(x) = c x 0

(SDP )

s.l.c. x Rn : F + x F + + x F 0 1 1 n n

o les Fi , pour i = 0, 1, . . . , n, sont des matrices coecients rels, symtriques et de mme dimension et lingalit A 0 signie que la matrice symtrique A est semi-dnie positive. Ces problmes seront traits au chapitre 2.6.

2.5

Programmation linaire

Dnitions - formes ingalit et standard


On appelle programme linaire un problme doptimisation o le critre J et toutes les fonctions fi , gj intervenant dans les contraintes sont anes en x. Ce sont donc des problmes pouvant scrire sous la forme minimiser J(x) = c x, i = 1, . . . , m j = 1, . . . , p

(P )

s.l.c. x Rn : ai x = bi , dj x ej ,

(s.l.c. = sous les contraintes). Remarquons quil nexiste pas une faon unique dcrire un programme linaire : 51

2. Optimisation et LMI une contrainte galit peut tre transforme en deux contraintes ingalits : a x bi i ai x = bi a x b
i i

une contrainte ingalit peut tre transforme en une contrainte de type galit et une condition de signe sur une variable en introduisant une variable dite dcart d x + z j = ej j dj x ej zj R : z 0
j

une variable xi de signe quelconque peut tre remplace par la dirence de 2 nouvelles variables positives : xi = x+ x , i i x+ 0, x 0. i i

On peut ainsi crire tout programme linaire de manire quivalente sous : une forme ingalit : minimiser J(x) = c x i = 1, . . . , m

s.l.c. x Rn : ai x bi ,

o toutes les contraintes sont de type ingalit (on rcrira ces ingalits de manire plus condense sous lcriture matricielle Ax b, o A Rmm est la matrice de ie ligne ai , et b = [b1 . . . bm ] Rm ) ; une forme ingalit variables positives : minimiser J(x) = c x, i = 1, . . . , m j = 1, . . . , n

s.l.c. x Rn : ai x bi , xj 0, une forme standard : minimiser

J(x) = c x, i = 1, . . . , m j = 1, . . . , n

s.l.c. x Rn : ai x = bi , xj 0,

o toutes les contraintes sont de type galit, les variables doptimisation xi tant toutes de signe positif. On rcrira les contraintes sous lcriture matricielle Ax = b, x 0. Remarque : dans ces trois formulations, le vecteur x, le nombre de variables n et le nombre de contraintes m ne sont pas ncessairement conservs. 52

2.5. Programmation linaire

Un exemple simple
Un laminoir peut produire deux types de bobines dpaisseurs direntes, nommes B1 et B2. La premire plus paisse est produite 200 tonnes par heure et est vendue avec un bnce de 25 euros/tonne, la seconde est produite 140 tonnes/heure avec un bnce de 30 euros/tonne. Pour des raisons de saturation du march, on ne veut pas produire cette semaine plus de 6000 tonnes de bobines B1 et de 4000 tonnes de B2. Il ny a que 40 heures de production disponibles cette semaine, quelle quantit de chacune des bobines doit-on produire pour maximiser le prot ? Si on note x1 et x2 les quantits de bobines B1 et B2 produites, alors il sagit de rsoudre le problme doptimisation suivant : maximiser s.l.c. 25x1 + 30x2 x1 6000 x2 4000 x1 /200 + x2 /140 40 x1 , x2 0 Il est facile de rsoudre graphiquement cet exemple :
x2

4000

6000

x1

Fig. 2.6: Rsolution graphique de lexemple On peut tirer de cet exemple simpliste quelques conclusions gnrales : le domaine des contraintes est un polydre convexe (ici un pentagone), la solution optimale est situe sur un sommet de ce polydre. 53

2. Optimisation et LMI

Polydres convexes
Dnition Considrons un problme doptimisation linaire mis sous forme ingalit minimiser s.l.c. x Rn J(x) = c x Ax b

o A Rmn et b Rm . Lensemble des contraintes (appel aussi ensemble admissible) K = {x Rn | Ax b} dnit ce que lon appelle un polydre (convexe). Il correspond lintersection des m demi-espaces {x Rn | ai x bi } o les ai correspondent aux lignes de la matrice A. Cest un ensemble ventuellement vide, born ou non et convexe : on peut facilement vrier que x, y K [0, 1], Sommets dun polydre Dnition 2.5.1 (sommet). Un sommet dun polydre convexe K Rn est un point x0 de K pour lequel il existe un vecteur c Rn tel que c x0 < c x, x K, x = x0 x + (1 )y K.

cTx

= cT x

x0

54

2.5. Programmation linaire On peut reformuler cette dnition en disant quun point x0 est un sommet du polydre convexe K Rn sil existe un vecteur c Rn tel que x0 soit lunique point de K minimisant la fonction x c x sur K. Caractrisation gomtrique Un sommet x0 est galement caractris gomtriquement par le fait quil ne peut tre situ strictement lintrieur dun segment contenu dans K : x0 = y + (1 )z, [0, 1], y, z K x0 = y ou x0 = z (on parle de point extrmal du convexe K). Caractrisation algbrique Intuitivement, on conoit bien quun sommet est dni comme tant lintersection de n hyperplans indpendants constituant la frontire du polydre. Pour formaliser cela, dnissons pour un point x de K : I(x) lensemble des contraintes actives (ou satures) en x dni par I(x) = {i {1, . . . , m} | ai x = bi }. (I(x) est un ensemble dindices dont on notera k le cardinal et i1 , . . . , ik les lments.) A(x) la sous-matrice de A obtenue en ne prenant que les lignes correspondant des contraintes actives en x : a i1 . A(x) = . , avec I(x) = {i1 , . . . , ik }. . a ik Alors, x0 est un sommet de K si x0 K et vrie rang(A(x0 )) = n (dans la littrature, un tel point est appel une solution basique admissible). Thorme 2.5.1. Les 3 caractrisations dun sommet sont quivalentes. Dmonstration : Si x0 est un sommet de K, cest aussi un point extrmal de K. En eet, soient y, z K, y = x0 , z = x0 . x0 est un sommet de K : il existe donc c Rn tel que : c x0 < c y, Pour [0, 1], on a alors c x0 < c (y + (1 )z) do x0 = y + (1 )z 55 c x0 < c z.

2. Optimisation et LMI Si x0 est un point extrmal de K, alors cest aussi une solution basique admissible. En eet, supposons quil existe un vecteur d = 0 tel que A(x0 )d = 0, cest--dire ai d = 0, i I(x0 ). Pour > 0 susamment petit, on a y = x +0 d K, z = x0 d K,

car pour i I(x0 ) : ai y = ai z = ai x0 = bi , pour i I(x0 ) : ai x0 bi < 0, prenons < /


aj x0 bj dj

pour tous les

j {1, . . . , m} \ I(x0 ) tels que dj = 0, alors ai y < bi et ai z < bi . On a alors x0 = (y + z)/2 : ce qui contredit le fait que x0 est un point extrmal de K. Conclusion : Ker(A(x0 )) = {0} rang(A(x0 )) = n : x0 est une solution basique admissible de K. Si x0 est une solution basique admissible de K, alors cest aussi un sommet. Posons c = iI(x0 ) ai . Alors, pour tout y K : c x0 c y = (ai y bi ) 0,
iI(x0 )

avec c y = c x0 si et seulement si ai y = bi pour tout i I(x0 ). Or rang(A(x0 )) = n : il ne peut y avoir au plus quune seule solution ce systme dquations, donc y = x0 . Conclusion : c x0 < c y pour tout y K, y = x0 . Proprits des polydres sous forme standard Soit K un polydre reprsent sous forme standard : K = {x Rn : Ax = b, x 0}. Si 0 K, alors cest un sommet de K. Un point x de K , x = 0, est un sommet si et seulement si les colonnes de A correspondant au composantes non nulles de x sont linairement indpendantes, c--d. rang {aj1 , aj2 , . . . , ajN } = N, o {j1 , j2 , . . . , jN } = I + (x) = {j {1, 2, . . . , n} : xj > 0}
e et aj reprsente la j i`me colonne de A. Le sommet x de K est dit dgnr sil a plus que n m composantes nulles (ou encore lentier N est strictement infrieur m).

56

2.5. Programmation linaire Remarque : on peut dduire de ce rsultat quun polydre nadmet quun nombre ni de sommets. Thorme 2.5.2. Tout polydre non vide reprsent sous forme standard K = {x Rn : Ax = b, x 0} possde au moins un sommet.

Thorme fondamental de la programmation linaire


On considre le problme doptimisation linaire mis sous forme standard minimiser c x (Ps ) : s.l.c. x K = {x Rn : Ax = b, Notons p = inf (c x)
xK

. x 0}

la valeur (optimale) du problme. On conviendra que p = + si K est vide et p = si lensemble {c x : x K} est non minor On appellera ensemble des solutions optimales lensemble des x K tels que c x = p . Thorme 2.5.3. Si p est ni, alors lensemble des solutions optimales contient au moins un sommet de K.

Mthode du simplexe
La mthode du simplexe est due George Dantzig (1947). Son principe consiste construire une suite de sommets {xk } telle que, chaque tape, on ait J(xk+1 ) J(xk ). Le nombre de sommets dun polydre tant ni, lalgorithme doit normalement converger en un nombre ni dtapes. Avant de formaliser lalgorithme du simplexe, on va voir sa mise en uvre sur un exemple simple. 57

2. Optimisation et LMI Exemple On reprend lexemple prcdent (mis sous forme minimisation) : minimiser J(x1 , x2 ) = 25x1 30x2 s.l.c. x1 6000 x2 4000 x1 /200 + x2 /140 40 x1 , x2 0 Reformulons ce problme sous forme standard en introduisant trois variables dcart x3 , x4 , x5 : minimiser J(x1 , x2 , x3 , x4 , x5 ) = 25x1 30x2 s.l.c. x1 + x3 = 6000 x2 + x4 = 4000 x1 /200 + x2 /140 + x5 = 40 x1 , x2 , x3 , x4 , x5 0

Phase I du simplexe : dtermination dun sommet initial Pour x1 = x2 = 0, on obtient x3 = 6000, x4 = 4000, x5 = 40. On obtient ainsi une solution admissible puisque x1 , x2 , x3 , x4 , x5 0. Le point obtenu constitue en fait un sommet de lensemble des contraintes2 . Ce premier sommet a t obtenu ici relativement facilement, il nen est pas toujours de mme. On verra cependant au paragraphe 2.5 comment un premier sommet peut tre obtenu systmatiquement. Remarquons que pour ce premier sommet, la fonction J a pour valeur 0.

Premire tape Test de loptimalit du sommet courant Lensemble des contraintes est donn par un ensemble de 3 contraintes galits liant les 5 variables x1 ,. . . , x5 : on a donc 2 degrs de libert. En choisissant dexprimer la fonction cot ainsi que les variables x3 , x4 et x5 en fonction des variables x1 et x2 (qui lorsquelles sont nulles nous redonne le sommet courant), on obtient une formulation quivalente
2

vrier que les conditions donnes au paragraphe 2.5 sont remplies

58

2.5. Programmation linaire du problme de dpart minimiser J(x1 , x2 , x3 , x4 , x5 ) = 25x1 30x2 s.l.c. x3 = 6000 x1 x4 = 4000 x2 x5 = 40 x1 /200 x2 /140 x1 , x2 , x3 , x4 , x5 0 Lexpression ci-dessus de la fonction J montre quil sut daugmenter x1 ou x2 pour faire dcrotre le cot : le sommet courant (correspondant x1 = x2 = 0) nest pas une solution optimale ! Passage un nouveau sommet Pour faire dcrotre J, il sut, par exemple, daugmenter x1 en laissant x2 zro. La variable x1 ne peut cependant pas augmenter indniment : la premire contrainte nous limite une valeur de 6 000, tandis que la troisime, moins svre, nous autorise une valeur maximale de 8 000. Pour la plus petite de ces deux valeurs, c--d. x1 = 6000 (en laissant pour linstant x2 0), on obtient x3 = 0 (normal !), x4 = 4000, x5 = 10 . Ce point est un autre sommet de lensemble des contraintes. La valeur de la fonction cot J est passe de 0 150 000. Deuxime tape Test de loptimalit Ce deuxime sommet est-il optimal ? Pour le voir, choisissons cette fois de tout exprimer en fonction des variables x3 , x2 . Les contraintes galits scrivent alors : x1 = 6000 x3 x4 = 4000 x2 x5 = 10 + et la fonction cot a pour expression J(x1 , x2 , x3 , x4 , x5 ) = 150 000 + 25x3 30x2 On voit donc que la solution nest pas optimale puisque lon peut faire encore diminuer J en augmentant x2 . Recherche dun nouveau sommet On augmente x2 en laissant cette fois x3 zro. La valeur maximale de x2 , gale 1400, est maintenant xe par la troisime ingalit. On obtient alors le nouveau sommet x1 = 6000, x2 = 1400, x4 = 2600, x3 = x5 = 0. En ce sommet, J vaut 192 000. 59
1 200 x3

1 140 x2

2. Optimisation et LMI Dernire tape Cette solution est optimale. En eet, si lon formule de nouveau le problme en choisissant comme variables indpendantes x3 et x5 , on obtient le problme minimiser J(x1 , x2 , x3 , x4 , x5 ) = 192 000 + 4x3 + 4200x5 s.l.c. x1 = 6000 x3 x4 = 2600 x2 = 1400 +
7 10 x3 7 10 x3

+ 140x5 140x5

x1 , x2 , x3 , x4 , x5 0 Puisque J(x1 , x2 , x3 , x4 , x5 ) = 192 000+4x3 +4200x5 et x3 , x5 sont positifs, on a bien J(x1 , x2 , x3 , x4 , x5 ) 192 000 et cette valeur est atteinte pour x3 = x5 = 0 : cest donc bien la valeur la plus faible possible. La solution optimale est donc obtenue en produisant 6000 bobines B1 et 1400 bobines B2. Formalisation de lalgorithme Hypothses : On considre un problme linaire mis sous forme standard : minimiser c x (Ps ) : s.l.c. x Rn Ax = b, x 0,

o A Rmn . On suppose dans cette section que A est de rang m (sinon, soit le systme dquations Ax = b est incompatible, lensemble des contraintes est alors vide, soit il y a des quations redondantes que lon peut supprimer).

Terminologie : Une base B est un ensemble de m indices pris dans {1, 2, . . . , n} note ci-dessous {j1 , j2 , . . . , jm } telles que les colonnes correspondantes de A (cest--dire, aj1 , aj2 , . . . , ajm ) soient linairement indpendantes. On notera N lensemble des autres indices (indices non basiques). Selon le choix de cette base, aprs permutation des composantes, on partitionnera un vecteur x de Rn sous la forme xB , x xN 60

2.5. Programmation linaire o xB = [xj1 . . . xjm ] regroupe les composantes basiques (xj pour j B) et xN les composantes non basiques (les autres composantes). On utilisera la mme partition pour le vecteur c et la matrice A : cB , A AB AN c cN On a alors c x = cB xB + cN xN et, la matrice AB tant inversible Ax = b AB xB + AN xN = b xB = A1 b A1 AN xN . B B On appelle point basique une solution de lquation Ax = b ayant toute ses composantes non basiques nulles : on a alors xB = A1 b, B xN = 0.

Si un point basique a toutes ses composantes basiques xB positives, alors cest un sommet (on rencontre galement lexpression point ou solution basique admissible) xB = A1 b 0, B xN = 0

Si xB > 0, on dira que x est un sommet non dgnr : il ne peut correspondre quune seule base un tel sommet. Inversement, si au moins une des composantes de xB est nulle, on parle alors de sommet dgnr (qui peut alors tre associ des bases direntes). Deux sommets x et x sont dits adjacents si leurs bases ne dirent que dun seul lment. Gomtriquement, le segment [x, x] est une arte du polydre K. Une itration courante de la mthode du simplexe On suppose que litration prcdente nous a fourni un sommet x de K = {x Rn : Ax = b et x 0} et sa base B associe. Le but de cette itration est de tester si x est une solution optimale du problme, ou alors, trouver un nouveau sommet x+ adjacent x de cot infrieur + ) J()). (J( x x * Reconnatre loptimalit Soit x un sommet de base B et x un point quelconque de K c x = cB xB + cN xN = cB A1 b + cN cB A1 AN xN B B 61

2. Optimisation et LMI Si le vecteur cN cB A1 AN a toutes ses composantes 0. Alors, tant donn B que x K, on a xN 0 et donc c x cB A1 b = c x B * Passage dun sommet un sommet adjacent 1 Si le vecteur cN cB AB AN admet au moins une composante j < 0, alors en faisant augmenter xj la fonction objectif diminue (il ne faut pas toutefois sortir de lensemble des contraintes). Soit j N (un indice nappartenant pas B). On va rechercher un sommet + adjacent x sous la forme x x+ = x + td, o t R+ et d est un vecteur tel que dj = 1 et dj = 0 pour j N \ {j } (on ne veut modier quune seule composante non basique de x : la j i`me). e Choisissons le vecteur d tel que Ad = 0, car si x+ et x sont dans K, on a 0 = b b = A+ A = tAd. x x On a donc aj dj + aj = 0 dB = A1 aj . B
jB

Si x est un sommet non dgnr, alors pour t > 0 susamment petit, le point x + td appartient aussi K : A( + td) = b, x ( + td)j > 0, pour j B et t > 0 susamment petit, x ( + td)j = t, pour tout t x ( + td)j = 0, pour j N \ {j } et tout t. x On recherche alors la plus grande valeur de t pour laquelle ( + td) reste dans x K : + si dB 0 tmax = min{ xj : j B, d < 0} sinon j dj Remarque : si x est dgnr, on peut avoir tmax = 0, sinon on a toujours tmax > 0. Si tmax est inni, alors K contient la demi-droite { + tmax d, t 0}. x + = x+t Si tmax est ni et non nul, alors le point x max d est un nouveau sommet de K adjacent x de base B + = {j } B \ {k}3 , o k B est tel que k xk = tmax (on dit alors quon a fait rentrer j dans la base et sortir k de la d base). Si tmax est nul, alors on reste sur le mme sommet x+ = x, mais avec la + = {j } B \ {k}. nouvelle base B * Variation de la fonction cot
Cest bien une base, car sinon aj serait une combinaison linaire des aj , j J \ {k}, c--d il existerait un vecteur u tel que aj = Bu avec uk = 0, donc on aurait u = dJ ce qui contredit le fait que dk < 0.
3

62

2.5. Programmation linaire On a J(x + tmax d) = c (x + tmax d) = c x + tmax (cj + cB dB ) = J(x) + tmax (cj cB A1 aj ). B On appelle cj = cj cB A1 aj le cot rduit associ lindice non basique j. B Si cj < 0, alors le cot diminue si lon fait entrer j dans la base. Si de plus dB 0 (cest--dire tmax = +), alors le problme est non born infrieurement. Si cj 0 pour tous les indices j non basiques (j {1, . . . , n} \ B), alors le point x est une solution optimale du problme. Algorithme du simplexe On suppose que lon dispose dun sommet x Rn de base B. 1. On calcule les cots rduits cj = cj cB A1 aj associs aux indices non B basiques. Si cj 0 pour tous les j B, alors x est une solution du programme (n). / tel que c < 0. Sinon, on choisit un indice j j 2. On calcule la direction d : dB = A1 aj , dj = 1 et dj = 0 pour les autres indices. B Si d 0, alors le problme est non born (n), sinon on calcule tmax = min{ xj : j B, dj < 0} dj

On choisit lindice k sortant de la base parmi ceux qui vrient tmax = j /dj . x 3. On remet jour x : x := x + tmax d, ainsi que la base B : B = (B {j }) \ {k} Remarques : A la n de la premire tape, le choix de lindice j peut se faire selon plusieurs critres : minimiser cj minimiser tmax cj plus petit indice tel que cj < 0. Pour une meilleure ecacit, ce sont les deux premires rgles qui sont utilises dans les algorithmes disponibles dans les bibliothques spcialises (netlib, ...) 63

2. Optimisation et LMI Si le point x est non dgnr, alors soit il est optimal, soit le nouveau sommet obtenu un cot strictement infrieur J(). Si tous les sommets x successifs sont non dgnrs, on est sr que lalgorithme converge en un nombre ni dtapes (il ny a quun nombre ni de sommets). Si le sommet x est dgnr, il se peut que tmax = 0 : le point suivant est encore x mais avec une autre base. Il y a alors risque de cyclage : lalgorithme reste coll au mme sommet en reproduisant priodiquement les mmes bases. Ce phnomne est trs rarement rencontr en pratique et les algorithmes disponibles ne prennent pas en compte ce phnomne, mais il existe des remdes ce phnomne de cyclage, comme par exemple en choisissant comme indices entrant et sortant de la base les plus petits indices parmi ceux possibles (rgle de Bland). Lorsque tmax = 0, il y a deux situations possibles : soit il existe des valeurs de j permettant de faire progresser normalement lalgorithme (rgle anticyclage), soit toutes les valeurs de j tel que cj < 0 conduisent au mme cas (tmax = 0) et la solution x est en fait optimale. Initialisation de la mthode du simplexe (phase I) Il reste obtenir un premier sommet (et sa base associe) pour dmarrer lalgorithme ou montrer quil nen existe pas (K peut tre vide). Pour cela, on va en fait appliquer lalgorithme prcdent au problme m minimiser zi i=1 (Ps ) : n m Ax + Dz = b, s.l.c. x R , z R x 0, z 0 o D est une matrice diagonale avec Dii = 1 si bi 0 et Dii = 1 si bi < 0. Pour ce problme, on dispose dun sommet vident : x = 0, z = Db de composantes zi = |bi | 0. Remarquons que le problme (Ps ) a une valeur nie comprise entre 0 (car
m

z 0) et
i=1

|bi |.

Lensemble des contraintes du problme de dpart (P) est non vide si et seulement si le problme (Ps ) admet 0 comme valeur optimale. En eet, si lensemble des contraintes de (P) est non vide, il existe x 0 tel que Ax = b. Il sut de prendre pour z le vecteur nul : toute les contraintes de (Ps ) sont vrim

es et
i=1

zi = 0, ce qui est le minimum pour une somme de nombres positifs.

Rciproquement, si (Ps ) a 0 comme valeur optimale pour la solution optimale (, z ) alors x


m

zi = 0,
i=1

zi 0 zi = 0, i = 1, . . . , m

64

2.5. Programmation linaire et donc, x est un point vriant les contraintes du problme (P). En rsolvant le problme (Ps ) avec la mthode prcdente et en prenant comme premier sommet x = 0, zi = |bi |, on obtient alors deux cas possibles : la valeur optimale est strictement positive : il n y a pas de point vriant les contraintes du problme (P) (n de lalgorithme) ; la valeur optimale est obtenue en un sommet (0,). On peut alors vrier x que x est un sommet particulier de (P) : on peut alors dmarrer la phase II.

Dualit
Motivation Reprenons lexemple introductif minimiser J(x1 , x2 ) = 25x1 30x2 s.l.c. x1 6000 x2 4000 x1 /200 + x2 /140 40 x1 , x2 0 Il est facile dobtenir un majorant de la valeur p du problme si lon connat un point (x1 , x2 ) vriant les contraintes, par exemple pour x1 = 2000, x2 = 1400, on obtient : p 25 2000 30 1400 = 92 000. Comment peut-on obtenir un minorant de p ? Soient z1 , z2 et z3 des nombres positifs. Multiplions la premire ingalit par z1 , la seconde par z2 et la troisime par z3 et additionnons les ingalits obtenues, on obtient alors z1 x1 z2 x2 z3 (x1 /200 + x2 /140) (6000z1 + 4000z2 + 40z3 ) Si z1 z3 /200 25 et z2 z3 /140 30, alors, x1 , x2 tant positifs, on a J(x1 , x2 ) = 25x1 30x2 (z1 z3 /200) x1 + (z2 z3 /140) x2 (z1 z3 /200) x1 (z2 + z3 /140) x2 (6000z1 + 4000z2 + 40z3 ) On a ainsi obtenu un minorant de p : p (6000z1 + 4000z2 + 40z3 ) 65

2. Optimisation et LMI La recherche du plus grand de ces minorants conduit alors au nouveau problme maximiser (6000z1 + 4000z2 + 40z3 ) s.l.c. z1 z3 /200 25 z2 z3 /140 30 z1 , z2 , z3 0 Si on choisit z1 = 4, z2 = 0 et z3 = 4200, on obtient p 192000 (et cest le plus grand minorant possible puisque p = 192000). Problme dual Considrons le problme doptimisation linaire, appel dans ce contexte le primal, admettant x comme solution optimale minimiser J(x) = c x, (P ) s.l.c. x Rn : Ax = b, b Rm x 0, Considrons la fonction g(p) = min c x + p (b Ax) .
x0

On a alors g(p) c x + p (b Ax ) = c x . g(p) est donc un minorant de la valeur de (P). Cherchons le plus grand de ces minorants, cest--dire : max g(p). Avec quelques manipulations : g(p) = min c x + p (b Ax)
x0

= p b + min(c p A)x.
x0

et en remarquant que 0 si c p A 0 min(c p A)x = sinon x0 on voit que maximiser g(p) revient rsoudre le nouveau problme doptimisation maximiser bT p (D) s.l.c. p Rm : AT p c 66

2.5. Programmation linaire Cest le problme dual de (P). De manire gnrale, on passe du primal au dual en utilisant les transformations suivantes min. c x max. s.l.c. b p pi 0 pi 0 pi libre p Aj cj p Aj cj p Aj = cj i M1 i M2 i M3 j N1 j N2 j N3

s.l.c. ai x bi i M1 ai x bi i M2 ai x = bi i M3 xj 0 xj 0 xj libre j N1 j N2 j N3

o les Aj reprsente la j-ime colonne de la matrice A de i-ime ligne ai . Remarque : le dual du dual est le primal. Dualit faible On considre de nouveau les problmes (P) et (D) minimiser c x, (P ) (D) s.l.c. x Rn : Ax = b, b Rm x 0, prcdents : maximiser b p

s.l.c. p Rm : A p c

On notera : K = {x Rn : Ax = b, x 0} lensemble des solutions primales admissibles ; p la valeur du problme (P), cest--dire p = inf(c x : x K) ; K = p Rm : A p c lensemble des solutions duales admissibles ; d la valeur du problme (D), cest--dire d = sup(b p : p K ). On convient toujours que p = si K est vide, p = + si lensemble c x : x K est non minor (problme non born). De mme, d = si K est vide, d = + si lensemble b p : p K est non major. Si x est une solution primale admissible (x K) et z une solution duale admissible (p K ), alors b p c x. En eet, b p = (Ax) p = x A p c x Moralit : en minimisant par rapport x, on voit que b p constitue un minorant de la valeur du problme primal : p b p. 67

2. Optimisation et LMI Dans cet esprit, le problme dual consiste rechercher le plus grand de ces minorants, on a alors (en maximisant par rapport p) p d . et pour toute paire (x, p) K K , on a :

c x p d b p. On en dduit que si lon trouve une paire (x, p) telle que x est solution primale admissible, p une solution duale admissible et c x = b p, alors x est une solution (primale) optimale (et p une solution duale optimale). Dualit forte En utilisant les proprits des ensembles convexes, on peut montrer le lemme suivant Lemme 2.5.1 (Farkas). Soit A Rmn et b Rm , alors une et une seule des propositions suivantes est vraie : i) il existe un x Rn , x 0 tel que Ax = b, ii) il existe un y Rm tel que A y 0 et b y < 0. A laide de ce rsultat, on peut montrer quen fait les problmes primal et dual ont la mme valeur : p = d sauf si le problme primal est irralisable ( cest--dire K est vide et donc p = +), on peut alors avoir : d = + (problme dual non born) ou d = (problme dual irralisable : K = ). Dmonstration : i) On va dabord dmontrer le rsultat, pour un problme mis sous forme ingalit minimiser c x, (Pi ) : s.l.c. x Rn : F x g, Le dual associ est maximiser g z, (Di ) : s.l.c. F z = c, z 0 La proprit de dualit faible est toujours valable : x Rn : F x g, z 0 : F z = c, g z d p c x. i i 68

2.5. Programmation linaire Supposons p ni et soit x une solution optimale de (Pi ). i On note I() lensemble des contraintes actives (ou satures) en x dni par x I() = {i {1, . . . , m} | fi x = gi }, x o les fi reprsentent les lignes de F Puisque x est une solution optimale, il nexiste pas de vecteur d tel que fi d 0, i I() et c d < 0 x sinon, pour t > 0 susamment petit, on aurait fi ( + td) gi pour i = x 1, . . . , m et c ( + td) < c x. x Daprs le lemme de Farkas, il existe donc des rels i , i I() tels que x i 0 et
iI() x

i ai = c

Dnissons le vecteur z par zi = i , i I() et zi = 0 sinon. Alors z est une x solution duale admissible (z 0, A z + c = 0) et g z =
iI() x

g i zi =
iI() x

(fi x)zi = z F x = c x.

do z est une solution duale optimale et p = d . ii) Le problme (P) peut tre mis sous la forme (Pi ) en posant A b

F = A , I

g = b . 0

Daprs le rsultat prcdent, il existe z 0 tel que F z +c = 0 et g z = c x. Considrons la partition suivante du vecteur z : z1 z = z2 , avec z1 , z2 , z3 Rm et 0, z3 et posons p = z2 z1 . Alors, A z + c = 0 A p z3 + c = 0 AT p c, et g z = c x b p = c x. 69

2. Optimisation et LMI Lien entre la mthode du simplexe et la dualit On suppose que le problme (P) admet une solution optimale et que lalgorithme du simplexe sest termin en donnant une base pour laquelle les cots rduits cj = cj cB A1 aj associs aux indices non basiques sont tous positifs. B Le vecteur des cots rduits cN = cN AN AT cB na donc que des composantes B T reprsente la transpose de linverse de M qui est aussi positives ou nulles (M linverse de la transpose de M ). Posons p = AT cB . B On a, dune part, AB cB A1 cB = A p= B AN AN A1 cB B Puisque les cots rduits associs aux composantes non basiques sont positives ou nulles, on a A p c : p est un vecteur admissible pour le dual. Dautre part, p b = cB A1 b, B cest--dire la valeur optimale du problme primal. Par dualit forte, le vecteur p = AT cB est donc une solution optimale du problme dual. B Applications de la dualit Conditions doptimalit : Une solution primale admissible x est optimale si, et seulement si, il existe un vecteur p Rm tel que A p c tel que xj (cj p Aj ) = 0, j = 1, . . . , n (conditions de complmentarit)

On peut reformuler ce rsultat en disant quun point x Rn est une solution de (P) si et seulement si il existe p Rm et s Rn tels que A p + s = c, s 0 Ax = b, x 0 x s=0 Remarque : on retrouve les conditions doptimalit de Karush, Kahn et Tucker donnes en 2.3, page 48. Analyse de la sensibilit : Que devient la valeur optimale dun problme lorsquon modie ses donnes (par exemple, les contraintes) ? Considrons le problme perturb suivant : minimiser c x (P ) : s.l.c. x Rn Ax = b + d, x 0 70

2.6. Programmation semi-dnie - LMI o le vecteur d Rm est donn. Analyse globale. Si p est la solution optimale du problme dual de (P), alors cest aussi une solution duale admissible pour le problme dual de (P ). Par dualit faible, la valeur optimale p () du problme perturb vrie donc : p () (b + d) p = p + d p. Analyse locale. On suppose que lensemble des solutions optimales de (P) contient un sommet non dgnr x, soit B la base associe. On a alors xB = A1 b > 0, xN = 0. B La condition doptimalit sexprime alors sous la forme cN cB A1 AN 0. B Notons que cette condition est indpendante du vecteur b. Considrons alors la solution du problme perturb (P ) en conservant la base B : dnissons la solution x() par ses composantes basiques et non basiques : xB () = A1 (b + d), B xN () = 0.

La condition doptimalit tant remplie, il sut de sassurer que x() est admissible (c--d xB () 0), ce qui est vrai si est susamment petit. La valeur du problme perturb vaut alors p () = cB A1 (b + d) = p + cB A1 d B B = p + d p Le nombre pi est donc la sensibilit du cot par rapport au membre ` de droite de la ieme contrainte, on rencontre aussi lexpression de cot ` marginal associ la ieme contrainte.

2.6

Programmation semi-dnie - LMI

Ingalits matricielles linaires (LMI)


Un programme semi-dni est un problme doptimisation pouvant tre mis sous la forme : minimiser c x (SDP ) s.l.c. x Rn : F + x F + + x F 0
0 1 1 n n

o les Fi , pour i = 0, 1, . . . , n, sont des matrices coecients rels, symtriques et de mme dimension et o lingalit A 0 signie que la matrice symtrique A est semi-dnie positive. 71

2. Optimisation et LMI Lensemble des contraintes de ce problme est dnie par une LMI, cest-dire une ingalit linaire matricielle : F0 + x1 F1 + + xn Fn 0 (2.29)

Dans la suite, on notera x = [x1 , . . . , xn ]T et F (x) = F0 + x1 F1 + + xn Fn . La LMI (2.29) scrit alors de manire plus compacte sous la forme F (x) 0. Remarquons quun systme de LMI (F1 (x) 0, . . . , FN (x) 0 peut se rcrire sous la forme dune seule LMI diag (F1 (x), . . . , FN (x)) 0

Dans la plupart des applications, on utilisera plutt des variables matricielles. Par exemple, en thorie de la stabilit des systmes linaires, lexistence dune matrice P symtrique et dnie positive vriant lingalit AT P + P A 0 (2.30)

est une condition ncessaire et susante pour assurer la convergence vers 0 de toutes les solutions du systme dquations direntielles ordinaires x(t) = Ax(t) (2.31)

o x(t) Rn et A Rnn . Lingalit 2.30 sera dite une LMI en la variable P . Pour obtenir une forme obissant stricto sensu la dnition donne prcdemment, il sut de dcomposer la matrice P dans une base de lespace vectoriel compos des matrices symtriques de dimension n. Par exemple, pour n = 2, on aura la dcomposition x1 x2 1 0 0 1 0 0 = x1 + x2 + x3 P = x2 x3 0 0 1 0 0 1 Deux types de question peuvent tre envisag concernant le problme (SDP) : Ralisabilit : Dterminer si lensemble des x vriant la LMI (2.29) est vide ou non (et sil est non vide, donner un de ses lments) Optimisation : rsoudre le problme (SDP). Remarque : on peut montrer facilement (en raisonnant sur la forme quadratique associe) que cest bien un problme doptimisation convexe, cest--dire, lensemble des x tels que F (x) 0 est un sous-ensemble convexe de Rn .

Quelques outils pour LMI


Transformation de congruence - Formule du complment de Schur Deux matrices M, N sont dites congruentes sil existe une matrice inversible T telle que N = T N T . On alors la proposition suivante 72

2.6. Programmation semi-dnie - LMI Proposition 2.6.1. Soit M et N deux matrices symtriques congruentes alors M 0 si et seulement si N 0. La dmonstration est laisse titre dexercice au lecteur. Soit M une matrice symtrique admettant la partition M11 M12 M = M21 M22 o M11 est une matrice carre alors, en eectuant une transformation de congruence avec la matrice partitionne 1 I M11 M12 T = 0 I on tablit la proposition suivante Proposition 2.6.2 (Complment de Schur). Sous les hypothses prcdentes, on a M 0 si et seulement si M11 0 1 M22 M21 M11 M12

En eectuant cette fois une transformation de congruence avec la matrice I 0 T = 1 M22 M21 I on obtient Proposition 2.6.3 (Complment de Schur). Sous les hypothses prcdentes, on a M 0 si et seulement si M22 0 1 M11 M12 M22 M21 Lemme dlimination Lemme 2.6.1 (Lemme dlimination). Pour des matrices relles W = W T , M , N de taille approprie, les quatre proprits suivantes sont quivalentes : 1. Il existe une matrice relle K telle que : W + M KN T + N K T M T < 0. 73

Bibliographie 2. Il existe deux matrices U , V telles que : W + MU + UT MT < 0 3. Il existe un scalaire tel que W < M M T et W < N N T , et W + N V + V T N T < 0.

4. Les complments orthogonaux M et N de M et N , respectivement, vrient T T M W M < 0 et N W N < 0. Rappelons que le complment orthogonal dune matrice M est une matrice T M de rang maximal telle que M M = 0.

2.7

Bibliographie

[1] Ben Tal, A. et A. Nemirovski: Optimization I-II : convex analysis, nonlinear programming theory, nonlinear programming algorithms. rapport technique, Department ISYE, Georgia Institute of Technology, 2004. Lecture notes disponibles URL : http ://www2.isye.gatech.eduemirovs/. [2] Bonnans, J.F., J.C. Gilbert, C. Lemarchal et C.A. Sagastizbal: Numerical Optimization. Theoretical and Practical Aspects. Springer, 2nd dition, 2006. [3] Boyd, S., L. El Ghaoui, E. Feron et V. Balakrishnan: Linear Matrix Inequalities in Systems and Control Theory. SIAM, 1994. Disponible sur internet ladresse http://www.stanford.edu/~boyd/books.html. [4] Boyd, S. et L. Vandenberghe: Convex Optimization. Cambridge University Press, 2004. Disponible sur internet ladresse URL : http ://www.stanford.edu/ boyd/cvxbook/. [5] Meinsma, G.: Interior Point Methods. rapport technique, Systems and Control Group, Dept. of applied Mathematics, Univ. of Twente, 1997. disponible URL : http ://wwwhome.math.utwente.nl/ meinsmag/courses/. [6] Nemirovski, A.: Lectures on Modern Convex Optimization. rapport technique, Department ISYE, Georgia Institute of Technology, 2005. Lecture notes disponibles URL : http ://www2.isye.gatech.eduemirovs/. [7] Nesterov, Y. et A. Nemirovsky: Interior point polynomial methods in convex programming : Theory and Applications. SIAM, Philadelphie, 1994. [8] Nocedal, J. et S. Wright: Numerical Optimization. Springer Series in Operation Research and Financial Engineering. Springer, 2nd dition, 2006. 74

Bibliographie [9] Scherer, C. et S. Weiland: Disc Course on Linear Matrix Inequalities in Control 2004/2005. rapport technique, DISC graduate course, 2004. [10] Vanderbei, R.J.: Linear Programming. Foundations and Extensions. Kluwers international series, 2nd dition, 2001.

75

Systmes stochastiques

A. Achour1 , M. Ksouri2 , S. Salhi3 et S. Ben Attia2 des Sciences de Tunis, FST Campus Universitaire, 2092 El Manar, Tunis, Tunisie. E-mail : Abdennebi.Achour@fst.rnu.tn 2 ENIT, BP 37, Le Belvdre 1002, Tunis, Tunisie. E-mail : Mekki.Ksouri@insat.rnu.tn, benattiaselma@yahoo.fr 3 Institut Suprieur dInformatique de Tunis, 2 rue Abourraihan Al Bayrouni, 2080 Ariana, Tunis, Tunisie. E-mail : salhis@lycos.com
1 Facult

3.1

Introduction aux probabilits

Si on jette un d, le rsultat de lpreuve est un lment de lensemble = {1, 2, 3, 4, 5, 6} Lespace est appel univers des possibles, ses sous-ensembles sont appels vnements et les vnements qui ne contiennent quun seul lment sont appels vnements lmentaires. On dit que lvnement A (A est donc une partie de ) est ralis si le rsultat du jet du d appartient A. Le but du calcul des probabilits est dassocier chaque vnement un nombre qui mesure en quelque sorte la chance qua cet vnement de se raliser. Intuitivement, lorsquon dit que la probabilit de lvnement A vaut a , cela implique que si lon rpte lexprience (si on jette le d) un grand nombre n de fois, lvnement A va se raliser, peu-prs, n a fois. Cela justie la dnition suivante : Une probabilit est une application P : P() [0, 1] vriant les proprits suivantes : P () = 0 , P () = 1 et P (A B) = P (A) + P (B) P (A B) La probabilit la plus classique est celle quon appelle probabilit uniforme : elle 77

3. Systmes stochastiques est dnie par : nombre dlments de A nombre dlments de Les vnements lmentaires ont alors tous la mme probabilit de se raliser et on dit quils sont quiprobables. En labsence dindications contraires, cest cette probabilit que lon utilisera. P (A) = Exemple On jette deux ds et on marque un point si le rsultat total est suprieur ou gal 10. On recommence 600 fois la mme opration. Combien de points pensez-vous ainsi approximativement marquer ? Le tableau ci-contre donne les dirents totaux que lon peut obtenir ainsi que la manire de les obtenir. Le total 4 sobtient de 3 faons : 4=3+1=2+2=1+3 et la probabilit davoir un total gal 4 est donc P (4) = 3/36 = 1/12.
A B C D E F A B C D E F

2 3 4 5 6 7

3 4 5 6 7 8

4 5 6 7 8 9

5 6 7 8 9 10

6 7 8 9 10 11

7 8 9 10 11 12

Notons T la somme des points obtenus, cest une variable alatoire dont la loi de probabilit est donne par le tableau ci-dessous. T PT
B
1 36

C
2 36

D
3 36

E
4 36

F
5 36

G
6 36

H
5 36

I
4 36

3 36

2 36

1 36

Ce tableau permet de calculer la probabilit pour que la somme des points soit suprieure ou gale 10 : P (T 10) = P (T = 10) + P (T = 11) + P (T = 12) = Pour 600 jets des 2 ds, on peut esprer marquer 600 Le jeu de pile ou face On dispose dune pice quilibre dont les faces sont marques 1 et 0. On la lance huit fois de suite et on marque chaque fois le chire obtenu. On peut obtenir par exemple le rsultat 11010100. Il y a 28 = 256 issues possibles qui sont toutes quiprobables puisquon a suppos que la pice tait quilibre. 78
1 6

3+2+1 1 = 36 6

= 100 points.

3.1. Introduction aux probabilits Quelle est la probabilit dobtenir exactement trois fois le nombre 1 ? Dterminons le nombre de cas favorables : Pour avoir exactement trois fois le nombre 1, il nous faut choisir trois places parmi huit pour mettre les 1 et remplir 8! ensuite le reste par des 0. Cela se fait de 8 = 3!5! = 56 faons direntes et la 3 probabilit demande vaut : p= 8 8 2 = 0. 21875 3

Quelle est la probabilit dobtenir exactement quatre sries ? Rappelons dabord ce quest une srie dans un jeu de pile ou face. Le rsultat prcdent 11010100 se compose de six sries : 11 0 1 0 1 00 On a utilis 5 sparateurs , lautre rsultat correspondant la mme rpartition des sparateurs est 00 1 0 1 0 11. Pour compter les rsultats comportant 4 sries, on compte le nombre de faons de mettre 3 sparateurs dans les 7 places sparant les huit chires et on multiplie ensuite par 2. Il y a donc 2 7 = 70 rsultats comportant 4 sries et 3 la probabilit demande vaut p = 70 28 = 0.27344 Quelle est la probabilit dobtenir au moins une srie de deux 1 ? Nous allons calculer cette probabilit lorsquon lance n fois la pice (la question initiale pour 8 lancers tant dicile, on prfre tudier le cas gnral pour pouvoir examiner dabord les cas o n est petit). Notons An lensemble de cas dfavorables et an le nombre dlments de An .Pour n = 1, 2, 3 et 4 , on a le tableau ci-dessous : n 1 2 3 4 An 0,1 00,10,01 000,100,010,001,101 0000,1000,0100,0010,0001,1010,1001,0101 an 2 3 5 8

Cela suggre que les an vrient la relation an+2 = an+1 + an et que An+2 79

3. Systmes stochastiques sobtient donc partir de An+1 et An . Le mme tableau montre que lon obtient les lments de A3 en faisant suivre les lments de A2 de 0 et les lments de A1 de 01. Il est maintenant facile de se convaincre que An+2 est la runion disjointe de lensemble An+1 0 (dont les lments sobtiennent en faisant suivre ceux de An+1 par 0) et de lensemble An 01 (dont les lments sobtiennent en faisant suivre ceux de An de 01). Les probabilits cherches sont donc donnes par : a1 = 2, a2 = 3, an+2 = an+1 + an et pn = 1 an 2n = 2n (2n an ) On a donc pour les premires valeurs de n : n an 2n pn 1 2 2 0 2 3 4 0.25 3 5 8 0.375 4 8 16 0.5 5 13 32 0.594 6 21 64 0.672 7 34 128 0.734 8 55 256 0.785 9 89 512 0.826 10 144 1024 0.859

Probabilit conditionnelle La probabilit dun vnement (la chance qua cet vnement de se raliser) change lorsque nos informations concernant lexprience augmentent. Ainsi la probabilit dobtenir un 6 en lanant un d vaut priori 1 , mais elle devient 6 1 gale 3 si on nous dit que le nombre obtenu est pair et 0 si on nous dit quil est impair. Lorsque A et B sont deux vnements quelconques, la probabilit que A se ralise sachant que B est ralis est dnie par P (A | B) = P (A B) P (B)

Cela implique P (A B) = P (B) P (A | B) et cest ce quon appelle le principe des probabilits composes. Noter que lapplication qui A associe P (A | B) est aussi une probabilit sur . Formule de Bayes La formule de Bayes, quoique triviale, est dun intrt considrable puisquelle permet de modier notre estimation des probabilits en fonction des informations nouvelles. Soit E1 , E2 , , En un systme complet dvnements (Cela veut dire quils sont deux deux disjoints et que leur runion est gale tout entier.). Pour tout autre vnement A , on peut crire :
n n

P (A Ek ) = P (A)P (Ek | A) ; P (A) =


i=1

P (A Ei ) =
i=1

P (Ei )P (A | Ei )

80

3.1. Introduction aux probabilits On en tire la formule de Bayes : P (Ek | A) = Exemple On mne lenqute sur les causes dune catastrophe arienne. On peut mettre trois hypothses H1 , H2 et H3 dont les probabilits priori (avant le dbut de lenqute) sont P (H1 ) = 0, 7 , P (H2 ) = 0, 2 et P (H3 ) = 0, 1. Lenqute a rvl que le combustible a brl (notons A cet vnement). Des donnes statistiques nous permettent dcrire P (A | H1 ) = 0, 1 , P (A | H2 ) = 0, 3 et P (A | H3 ) = 1. P (Ek )P (A | Ek ) P (A Ek ) = P (A) P (E1 )P (A | E1 ) + + P (En )P (A | En )

Dterminer lhypothse la plus probable de laccident. Les probabilits P (Hi | A) sobtiennent grce la formule de Bayes : i P (Hi | A) 1 0, 304 2 0, 261 3 0, 435

et lhypothse la plus probable de laccident est donc lhypothse H3 . Exemple Deux urnes dapparence identique contiennent lune 300 boules blanches et 700 boules noires et lautre 700 boules blanches et 300 boules noires. Je choisis une des deux urnes, tes-vous prt parier 10 millimes contre 10 millimes que lurne choisie est celle qui contient 300 boules blanches ? Je choisis une des deux urnes, je tire, avec remise, 12 boules de cette urne et jobtiens 4 boules blanches et 8 noires. Etes-vous prt parier 10 millimes contre 10 que lurne choisie contient 700 boules blanches ? Sinon, acceptez-vous de parier 5 millimes contre 10 ? Pour la premire question, vous pouvez accepter le jeu puisque vous gagnerez 10 millimes avec une probabilit gale 0,5 et perdrez 10 millimes avec la mme probabilit et le jeu est donc quitable. Pour la deuxime question, on est en droit de penser que lurne choisie contient plus de boules noires que de boules blanches et quil devient imprudent de parier 10 contre 10.Voyons vos chances de gagner si vous pariez 5 contre 10. Notons U1 lurne qui contient 300 boules blanches, U2 lautre urne, B lvnement tirer une boule blanche et N lvnement tirer une boule noire. Par hypothse, on a : P (U1 ) = 0, 5 P (U2 ) = 0, 5 P (B | U1 ) = 0, 3 P (B | U2 ) = 0, 7 P (N | U1 ) = 0, 7 P (N | U2 ) = 0, 3

81

3. Systmes stochastiques Notons A lvnement tirer 4 boules blanches et 8 boules noires, on a : P (A | U1 ) = 12 0, 34 0, 78 ; P (A | U2 ) = 4 12 0, 38 0, 74 4

La formule de Bayes permet maintenant de calculer P (U1 | A) et P (U2 | A) : P (U1 | A) = P (U 1 ) P (A | U 1 ) P (U 1 ) P (A | U 1 ) + P (U 2 ) P (A | U 2 )

On trouve P (U1 | A) = 0, 96737 et donc P (U2 | A) = 1 0, 96737 = 0, 03263. Cela implique, par exemple, que si vous jouez 100000 parties, vous allez, approximativement, perdre 5 100000 0, 96737 millimes et gagner 10 100000 0, 03263, soit en tout perdre 451045 millimes et vous ferez mieux de refuser de jouer. Esprance et Ecart Type Dans lexemple prcdent, on a vu quen acceptant de jouer 100000 parties 5 contre 10, le gain probable tait : 100000 (10 0.03263 5 0.96737) = 451045 Le gain moyen par partie est de 10 0.03263 5 0.96737 = 4, 51045 et on dit que lesprance de gain est de 4, 51045. Plus gnralement, lesprance dune variable alatoire X : R est le nombre E(X) dni par : E(X) =

X() P ()

On dnit aussi la variance V (X) et lcart type (X) de X par : V (X) = E( [X E(X)]2 ) , (X) = V (X)

Noter que lesprance de X reprsente le nombre moyen que prend la fonction X et que la variance de X nest nulle que si X ne varie pas (X est donc constante sauf peut tre sur un ensemble de probabilit nulle). Exemple : La loi binomiale. Si X prend les valeurs k = 0, 1, ..., n avec les probabilits respectives pk = P (X = k) = n k p (1 p)nk k

o p est compris entre 0 et 1 et si g est la fonction dnie par


n

g(x) =
k=0

pk xk = (px + 1 p)n

82

3.1. Introduction aux probabilits alors on peut calculer E(X) et V (X) de la manire suivante : E(X) =
n k=0 kpk

= g (1) = np.
n k=0 k(k

E( X(X 1) ) =

1)pk = g (1) = n(n 1)p2 .

E(X 2 ) = E( X(X 1) ) + E(X) = n(n 1)p2 + np. V (X) = E(X 2 ) E(X)2 = n(n 1)p2 + np n2 p2 = np(1 p) La loi des trois sigma Dans la pratique, on adopte cette loi qui dit quil est fort improbable que la variable alatoire X scarte de plus de 3(X) de sa valeur moyenne E(X). Exemple On a demand un lve de lancer 50 fois un jeton quilibr dont les faces sont marques 0 et 1 et de noter ce quil obtient. Il dclare avoir obtenu : 10101101001010100101100101011000101010011001010100 Quen pensez-vous ? Notons X la variable alatoire qui compte le nombre de 1 obtenus quand on lance 50 fois le jeton. X prend les valeurs k = 0, 1, ..., 50 avec les probabilits pk = 50 250 . On a donc E(X) = 5021 = 25 et V (X) = 5021 21 = 12, 5 k si bien que (X) = 12.5 = 3, 5355. Llve, a obtenu 23 fois le nombre 1. On a donc X() = 23 et comme | X() E(X) |= 2 < 3 (X) ,on peut considrer que la suite obtenue par llve est plausible si on se contente de ce test. Notons maintenant Y la variable alatoire qui compte le nombre de sries e obtenues quand on lance 50 fois le jeton. Y prend les valeurs k + 1, o k = 0, 1, ..., 49, avec les probabilits qk = 49 249 . On a donc k E(Y ) = 49 21 + 1 = 25, 5 et V (Y ) = 49 22 = 12, 25 si bien que (Y ) = 3. 5 Cette fois, on a Y () = 38 et | Y () E(Y ) |= 12, 5 3 (Y ) = 11, 5 et on est en droit de penser que la liste donne par llve est ctive et na pas t obtenue en lanant 50 fois le jeton. Bibliographie Pour sinitier aux probabilits, on conseille les livres : Les probabilits.Par Albert Jacquard, Que sais-je ? n 1571 Lenseignement des probabilits et de la statistique Vol 1, Arthur Engel. Collection : Cedic. Statistique et Probabilits pour aujourdhui, Irving Adler. Edition O.C.D.L., Paris. Chacun de ces trois livres constitue une trs bonne introduction aux probabilits et donnera, sans aucun doute, satisfaction aux enseignants qui doivent initier les lves au calcul des probabilits qui est devenu un des outils mathmatiques les plus utiliss. 83

3. Systmes stochastiques Et pour nir, on vous propose ce jeu probabiliste quon peut trouver dans le livre dEngel : Les faces des quatre ds, A, B, C, D sont marques comme lindique la gure ci-dessus : 0 4 0 4 4 A 4 3 3 3 3 3 B 3 2 2 2 6 6 C 2 1 5 1 5 5 D 1

Il y a deux joueurs, lun des deux choisit un d, puis lautre choisit un des trois d restants. Chacun jette son d. Celui qui obtient le nombre le plus grand est dclar vainqueur. Ce qui tonne dans ce jeu, cest que celui qui choisit le premier est dsavantag. Montrer quen choisissant judicieusement, le second joueur gagne avec une probabilit gale 2 . 3

3.2

Probabilits

Tribus et probabilits
Soit un ensemble non vide. Une tribu de est un ensemble T de parties de vriant les trois proprits suivantes Lensemble vide et lensemble lui-mme sont dans T . Si A est dans T , il en est de mme de son complmentaire Ac = \ A. Si les ensembles An (n 0) sont dans T , leur runion An est dans T . n=0 Une probabilit sur une tribu T est une application P : T [0, 1] vriant P () = 0 et P () = 1. Si les An sont dans T et sils sont deux deux disjoints, alors P(
n=0 An )

n=0 P (An )

Exemple. Masse de Dirac. Lensemble P() de toutes les parties de et une tribu et si a est un lment quelconque de , lapplication a : P() [0, 1] dnie par a (A) = 1 si a A et a (A) = 0 sinon est une probabilit (appele masse de Dirac au point a) sur P(). De la mme manire si an est une suite dlments dans et si les rels positifs n sont de somme gale 1, lapplication
n=0 n an

: P() [0, 1] , (

n=0 n an ) (A)

n=0 n .an (A)

84

3.2. Probabilits est une probabilit sur P(). Exemple. La tribu des borliens. - La tribu des borliens de R, note B(R), est la plus petite tribu de R contenant tous les intervalles de R. Si la fonction f : R [0, [ vrie

f (x)dx =
R

f (x)dx = 1

alors lapplication P : B(R) [0, 1] , P (A) =


A

f (x)dx

est une probabilit sur B(R) et on dit quelle est de densit f par rapport la mesure de Lebesgue. - De la mme manire, la tribu des borliens de Rn , note B(Rn ), est la plus petite tribu de Rn contenant tous les ensembles R de la forme R = I1 In , Ij est un intervalle de R Si f : Rn [0, [ vrie
Rn

f (x)dx = 1, alors lapplication f (x)dx


A

P : B(Rn ) [0, 1] , P (A) =

est une probabilit sur B(Rn ) et on dit quelle est de densit f par rapport la mesure de Lebesgue. Exemple. Tribu produit. - Soit (1 , T1 ) et (2 , T2 ) deux ensembles probabilisables (i.e. i est un ensemble et Ti est une tribu de i ). Un rectangle de lensemble produit 1 2 est un ensemble de la forme A1 A2 , A1 T1 et A2 T2 On notera T1 T2 (lire T1 tensoriel T2 ) la plus petite tribu de 1 2 contenant tous les rectangles de 1 2 . Si P1 : T1 [0, 1] et P2 : T2 [0, 1] sont deux probabilits, on notera P1 P2 : T1 T2 [0, 1] lunique probabilit sur la tribu T1 T2 qui vrie P1 P2 (A1 A2 ) = P1 (A1 ).P2 (A2 ) - De la mme manire, si (i , Ti ) (1 i n) sont des espaces probabilisables, on notera n Ti = T1 Tn la plus petite tribu de lespace produit n i = i=1 i=1 1 n contenant tous les rectangles
n i=1 Ai

= A1 An , Ai Ti 85

3. Systmes stochastiques Si Pi : Ti [0, 1] sont des probabilits, on notera n Pi = P1 Pn i=1 lunique probabilit sur T1 Tn qui vrie P1 Pn (A1 An ) = P1 (A1 ) Pn (An ) - Soit (n , Tn ) une suite innie despaces probabilisables et = produit des ensembles n . Un lment de =
n=1 n n=1 n

le

scrit donc

= ((1), (2), . . . , (n), . . .) , (n) n On appelle cylindre de =


n=1 n ,

tout ensemble de la forme , m 1 et Ai Ti

C = A1 Am m+1 m+2

La plus petite tribu contenant ces cylindres est note Ti et lunique probai=1 bilit P vriant P (A1 Am m+1 m+2 ) = P1 (A1 ). . . . .Pm (Am ) pour tout cylindre est note Pi . i=1 Exemple. Image directe. Soit (, T , P ) un espace probabilis (i.e. T est une tribu de et P est une probabilit sur T ). Soit X : Z une application quelconque de dans un ensemble quelconque Z. - Lensemble X T = {B Z ; X 1 (B) T } est une tribu de Z appele image directe de la tribu T par lapplication X. - Lapplication X P : X T [0, 1] dnie par X P (B) = P ( X 1 (B) ) est une probabilit sur X T appele image directe de la probabilit P par X.

Variables alatoires
Soit (, T , P ) un espace probabilis. Une variable alatoire est une application X : [, +] vriant {X < a} = { ; X() < a} T pour tout a R. Exemple. Fonctions tages. 86

3.2. Probabilits Si A T , sa fonction caractristique 1A qui est dnie par 1A () = 1 si A et 1A () = 0 sinon est une variable alatoire et on pose 1A ()dP () =
A

dP = P (A)

Une fonction tage est une application g : ] , +] de la forme g=


n i=1 i 1Ai

, Ai T et < i +

Cest une variable alatoire et on pose, pour une telle fonction, g()dP () =
n i=1 i 1Ai ()dP ()

n i=1 i

1Ai ()dP () =

n i=1 i P (Ai )

o lon convient que P (Ai ) = si P (Ai ) > 0 et P (Ai ) = 0 si P (Ai ) = 0. Intgrale dune variable alatoire positive. Si X : [0, +] est une variable alatoire positive, son intgrale est par dnition llment de [0, ] dni par X()dP () = sup

g()dP () ; g tage et 0 g X

Cette dnition implique aussitt ces deux importants rsultats : Thorme de convergence monotone. Si Xn : [0, +] est une suite croissante de variables alatoires positives, alors
n

lim

Xn ()dP () =

lim Xn ()dP ()

Thorme de Beppo-Levy. Si Xn : [0, +] est une suite de variables alatoires positives, alors
n=1 Xn ()dP ()

n=1

Xn ()dP ()

Une consquence directe du thorme de convergence monotone est le lemme de Fatou qui est dun usage frquent Lemme de Fatou. Si Xn : [0, +] est une suite de variables alatoires positives, alors lim inf

Xn ()dP ()

lim infXn ()dP () 87

3. Systmes stochastiques

Variables alatoires intgrables. Une variable alatoire X : [, +] est dite intgrable si elle vrie |X()| dP () <

et dans ce cas son intgrale est dnie par X()dP () =


X()1{X

0} ()dP ()

X()1{X

< 0} ()dP ()

On montre, grce au lemme de Fatou, cet important rsultat Thorme de convergence domine. Soit Xn : [, +] une suite de variables alatoires qui converge presque srement vers une variable alatoire X : [, +]. Sil existe une variable alatoire positive g : [0, +] vriant |Xn ()| g() ,

g()dP () <

alors la limite X est intgrable et on a lim Xn ()dP () = lim Xn ()dP () =

X ()dP ()

Corollaire. Soit Xn : [, +] une suite de variables alatoires telle que


n=1

|Xn ()| dP () <

alors la srie Xn () converge presque srement vers une variable alatoire n=1 intgrable et on a
n=1 Xn ().dP ()

n=1

Xn ().dP ()

Notation. Etant donn une variable alatoire X positive ou intgrable et un lment A de la tribu T , on pose X()dP () =
A

X()1A ()dP ()

Thorme. Ingalit de Chebyshev. 88

3.2. Probabilits Si X : [0, +] est une variable alatoire positive et si a [0, ], alors a P (X a)

XdP

Preuve. Cela rsulte de XdP =


{X a}

XdP +
{X < a}

XdP
{X a}

XdP a P (X a)

Exemple dapplication. Soit An une suite dlments de T , on appelle limite suprieure de ces An , et on note lim sup An , lensemble de dans qui appartiennet une innit de An . Considrons la variable alatoire X dnie par X=
n=1 1An

Elle est positive et vrie lim sup An = {X = +} ; lingalit de Chebyshev implique P (lim sup An )

XdP =

n=1 1An dP

n=1

1An dP =

n=1 P (An )

(justier chaque galit). Il en rsulte cette implication


n=1 P (An )

< = P (lim sup An ) = 0

Remarques. - Etant donn une variable alatoire X positive ou intgrable, son intgrale XdP est aussi appele esprance de X ou valeur moyenne de X et elle se note E(X). On a donc E(X) =

XdP =

X()dP ()

- Une application X : C est dite une variable alatoire si les deux applications ReX : R , ImX : R sont des variables alatoires. De plus, on pose E(X) =

XdP =

ReXdP + i

ImXdP = E(ReX) + iE(ImX)

lorsque les deux variables alatoires ReX et ImX sont intgrables. - La variance de la variable alatoire X est llment de [0, +] dni par V(X) = E |X E(X)|2 = E(X 2 ) E2 (X) Noter alors que V(X) = 0 si et seulement si X() = E(X) presque srement. 89

3. Systmes stochastiques

Loi de probabilit dune variable alatoire


Soit (, T , P ) un espace probabilis et X : [, ] une variable alatoire. On rappelle que limage directe, par X, de la tribu T est la tribu X T de [, ] dnie par X T = {A [, ] ; X 1 (A) T } Comme X est une variable alatoire, limage rciproque par X de tout intervalle de R est un lment de X T et par consquent X T contient la tribu des borliens B(R) de R. On a aussi dni limage directe, par X, de la probabilit P comme tant la probabilit X P sur X T vriant X P (A) = P ( X 1 (A) ) = P (X A) , A X T Cette probabilit se note aussi PX et elle est appele loi de probabilit de X. Le thorme suivant est une consquence directe de la dnition dune intgrale. Thorme de transfert. Si f : [, +] C, alors f ( X() )dP () =
[,+]

f (x)dPX (x)

chaque fois que le second membre a un sens. Preuve. Cest vrai lorsque f = 1A (avec A X T ) par dnition de PX et cest vrai dans tous les cas par dnition de lintgrale. Exemple. Loi gomtrique. Considrons lensemble {0, 1} que lon munit de la probabilit P1 dnie par P1 ({1}) = 1 , P1 ({0}) = 1 p , 0 < p < 1 Considrons maintenant lensemble = {0, 1}N dont les lments scrivent = ((1), (2), . . . , (n), . . .) , (i) {0, 1} et chaque est donc une suite ((n))n1 de 0 et 1. On munit lensemble produit de la probabilit P produit (tensoriel) des (Pn )n1 o chaque Pn vaut P1 . Cela veut dire que si C = A1 Am {0, 1} {0, 1} , est un cylindre de , alors P (C) = P1 (A1 ) Pm (Am ) = P1 (A1 ) P1 (Am ) 90 Ai {0, 1}

3.2. Probabilits Soit X : {1, 2, . . . , n, . . .} {+} la variable alatoire dnie par + si il nexiste aucun n tel que (n) = 1 X() = inf{n ; (n) = 1} si il existe des n tels que (n) = 1 Lvnement {X = 3} est le cylindre {X = 3} = {0} {0} {1} {0, 1} {0, 1} et sa probabilit est donne par P (X = 3) = (1 p) (1 p) p = (1 p)2 p De la mme manire, on a P (X = n) = (1 p)n1 p , n 1 Il en rsulte que P (X < +) =
1n< (1

p)n1 p =

p =1 1 (1 p)

si bien que P (X = +) = 1 P (X < +) = 1 1 = 0. - Lesprance de X est par dnition E(X) = = = XdP =


n=1

XdP + P (X = +) 0=
n=1 nP (X

{X=n} nP (X = n) + n=1 n 1 n=1 n(1 p) p = p

= n)

On dit quune variable alatoire suit une loi de probabilit gomtrique de paramtre p si elle vrie P (X = n) = (1 p)n1 p , n 1 Lesprance dune telle variable vaut donc p1 . Interprtation. On suppose que lon dispose dun jeton dont les faces sont marques 0 et 1. On suppose aussi, quen le lanant, il retombe et la face marque 1 apparat avec la probabilit p et que lautre face apparat donc avec la probabilit 1 p. On lance plusieurs fois ce jeton et on dsigne par X la variable alatoire qui compte le nombre de lancers ncessaires pour obtenir la face 1. Si par exemple le lanceur obtient la suite (0, 0, 1, 0, 1, . . .) alors X() = 3. Si les lancers sont "indpendants" (cest ce quon a suppos plus haut en introduisant la probabilit P produit tensoriel), alors X suit une loi gomtrique de paramtre p et cest pour cette raison quune loi gomtrique sappelle aussi loi du premier succs. 91

3. Systmes stochastiques

Fonction gnratrice
Lorsquune variable alatoire X prend ses valeurs dans N = {0, 1, . . . , n, . . .}, on introduit la fonction gnratrice g(z) = gX (z) =
n=0 P (X

= n)z n = n) = 1 et dont la rayon

Cest une srie entire qui vrie g(1) = de convergence est donc au moins gal 1.

n=0 P (X

Elle permet de calculer lesprance de X par drivation, et on a E(X) =


n=0 nP (X

= n) = gX (1) [0, +]

et elle permet aussi de calculer la variance de X parce que gX (1) =


n=0 n(n

1)P (X = n) = E(X(X 1)) = E(X 2 ) E(X)

do lon tire E(X 2 ) = gX (1) + gX (1) et ensuite V(X) = E(X 2 ) E2 (X) = gX (1) + gX (1) gX (1)
2

Exemple. On dit quune variable alatoire X suit la loi de Poisson de paramtre a > 0 si elle vrie P (X = n) = Comme on a
n=0 P (X

an exp(a) , n 0 n!
n a exp(a) n=0

=1 n! il en rsulte que X prend (preque srement) ses valeurs dans N. La fonction gnratrice dune telle variable est donne par gX (z) = exp(a)exp(az) et il en rsulte que son esprance et sa variance son donnes par E(X) = a , V(X) = a

= n) =

Fonction caractristique
Soit X : R une variable alatoire, sa fonction caractristique est lapplication X : R C , X (t) = E(exp(itX)) =

exp(itX())dP () =
R

eitx dPX (x)

Lorsque la variable alatoire X est intgrable, on a X (t) =


R

ixeitx dPX (x)

92

3.2. Probabilits si bien que lon a cette formule qui permet de calculer lesprance de X X (0) =
R

ixdPX (x) = i
R

xdPX (x) = iE(X)

Lorsque la variable alatoire est de carr intgrable, on a X (t) =


R

x2 eitx dPX (x) , E(X 2 ) = X (0)

et il en rsulte que V(X) = E(X 2 ) E2 (X) = (X (0))2 X (0) Exemple. On dit quune variable X alatoire suit la loi normale rduite si sa loi de probabilit PX admet pour densit, par rapport la mesure de Lebesgue, la fonction 1 x2 G(x) = exp 2 2 Rappelons que cela veut dire que x2 1 dPX (x) = G(x)dx = exp 2 2 dx

La fonction caractristique dune telle variable alatoire est donne par X (t) = exp et il sensuit que E(X) = 0 , V(X) = 1 Remarque. - On dit dune variable alatoire quelle est rduite lorsque son esprance est nul et sa variance vaut 1. - Lorsquune variable alatoire est de carr intgrable et quelle nest pas presque srement contante, sa rduite est la variable alatoire X dnie par X = X m t2 2

o on a pos m = E(X) et = V(X). Le rel m est donc la moyenne de X et le rel > 0 est lcart-type de X. Remarque. La fonction caractristique X caractrise parfaitement la loi de probabilit PX dans ce sens que X = Y = PX = PY 93

3. Systmes stochastiques

Fonction de rpartition
Etant donn une variable alatoire X : R, sa fonction de rpartition est lapplication F = FX : R [0, 1] , FX (x) = P (X < x) Cest une fonction croissante vriant FX () = 0 , FX (+) = 1 Elle et continue gauche (limxa FX (x) = F (a) pour tout a) et elle est discontinue aux points a vriant P (X = a) = FX (a+) FX (a) > 0 Exercice corrig. Soit X une variable alatoire qui suit la loi normale rduite, m un rel quelconque et un nombre strictement positif. 1) Dterminer la loi de la variable alatoire Y = X + m. 2) Dterminer la loi de la variable alatoire Z = |X|. Solution. On peut procder de la manire suivante P (Y < x) = P (X + m < x) 1 = P (X < 1 (x m)) = 2
1 (xm)

exp

t2 2

dt

et alors la densit dPY (x) de la loi de probabilit PY de Y est donne par dPY (x) = d 1 (x m)2 P (Y < x) = exp dx 2 2 2

De la mme manire, on obtient dPZ (x) = = d d d 1 P (Z < x) = P (x < X < x) = dx dx dx 2 2 x2 exp 2


x

exp
x

t2 2

dt

Thormes de Fubini-Tonelli et de Fubini


Soit (1 , T1 , P1 ) et (2 , , T2 , P2 ) deux espaces probabiliss et considrons lespace probabilis produit (1 2 , T1 T1 , P1 P2 ) 94

3.2. Probabilits Les deux thormes suivants vont permettre dintgrer les fonctions f : 1 2 C et ils disent que Thorme de Fubini-Tonelli. Si la fonction mesurable f : 1 2 [0, ] est positive alors f (1 , 2 )dP1 P2 (1 , 2 ) =
1 2 1 2

f (1 , 2 )dP2 (2 ) dP1 (1 )

Thorme de Fubini. Si la fonction mesurable f : 1 2 C est intgrable alors f (1 , 2 )dP1 P2 (1 , 2 ) =


1 2 1 2

f (1 , 2 )dP2 (2 ) dP1 (1 )

Variables alatoires indpendantes


Soit (, T , P ) un espace probabilis et X : Rn une application. - On dit que cest une variable alatoire si limage directe X T , par X, de la tribu T est incluse dans la tribu B(Rn ) des borliens de Rn . - Limage directe X P , par X, de la probabilit P est une probabilit sur X T et donc sur B(Rn ) lorsque X est une variable alatoire. On notera dornavant PX cette probabilit. Etant donn deux variables alatoires X : Rn et Y : Rm , on a de faon naturelle une variable alatoire (X, Y ) : Rn Rm , (X, Y )() = (X(), Y ()) et on dit que ces deux variables sont indpendantes si P(X,Y ) = PX PY Cela quivaut dire que si A B(Rn ) et B B(Rm ) alors P (X A, Y B) = P (X A)P (Y B) Preuve. Cela rsulte immdiatement des dnitions puisque P (X A, Y B) = P ((X, Y ) A B) = P(X,Y ) (A B) = PX PY (A B) = PX (A)PY (B) = P (X A)P (Y B) De la mme manire, on dit que des variables alatoires X1 , . . . , Xm sont indpendantes si P(X1 ,...,Xm ) = PX1 PXm et cela quivaut dire que si A1 , . . . , Am B(Rni ), alors P (X1 A1 , . . . , Xm Am ) = P (X1 A1 ) P (Xm Am ) 95

3. Systmes stochastiques On dit que la suite de variables alatoires (Xn )n est indpendante si les v.a X1 , . . . , Xm sont indpendantes pour tout m. Les deux propositions suivantes sont dun usage frquent. Proposition. Si les variables alatoires X : Rn et Y : Rm sont indpendantes et si les fonctions h : Rn Rn et k : Rm Rm sont borliennes (i.e. limage rciproque, par h et k,dun borlien est un borlien), alors les variables alatoires h X : Rn et k Y : Rm sont aussi indpendantes. Preuve. Si A B(Rn ) et B B(Rm ), alors P (h X A, k Y B) = P (X h1 (A), Y k 1 (B)) = P (X h1 (A))P (Y k 1 (B)) = P (h X A)P (k Y B) Proposition. Si les variables alatoires X1 , . . . , Xn+m : R sont indpendantes et si h : Rn R et k : Rm R sont borliennes, alors 1) Les variables alatoires (X1 , . . . , Xn ) : Rn et (Xn+1 , . . . , Xm ) : Rm sont indpendantes. 2) Les variables alatoires h(X1 , . . . , Xn ) : R et k(Xn+1 , . . . , Xm ) : R sont indpendantes. Les variables alatoires simplient normment les calculs, comme on va le voir dans les thormes suivants. Thorme. 1) Si les v.a. X1 , . . . , Xn sont indpendantes et intgrables, il en est de mme de leur produit et E ( n Xi ) = n E(Xi ) i=1 i=1 2) Si les v.a. X1 , . . . , Xn sont indpendantes et de carr intgrables, alors V(
n i=1 Xi )

n i=1 V

(Xi )

Preuve. On se contentera du cas de seulement deux variables alatoires indpendantes X et Y . Considrons la fonction m : R R R dnie par m(x, y) = xy de sorte que XY = m (X, Y ) Etudions dabord le cas o les v.a. sont positives. La formule du transfert implique E(XY ) =

X()Y ()dP () =
RR

m(x, y)dP(X,Y ) (x, y) xydPX (x)dPY (y)


RR

96

3.2. Probabilits et le thorme de Fubini-Tonelli implique E(XY ) =


R

xdPX (x)
R

ydPY (y) = E(X)E(Y )

Le cas gnral sobtient ainsi : Les v.a. |X| et |Y | sont positives et indpendantes et donc E(|XY |) = E(|X|)E(|Y |) < Cela prouve que la v.a. XY est intgrable et il sut de reprendre la dmonstration ci-dessus en invoquant cette fois le thorme de Fubini la place du thorme de Fubini-Tonelli. La deuxime assertion du thorme rsulte essentiellement du fait que E([X E(X)][Y E(Y )]) = E(X E(X))E(Y E(Y )) = 0 0 = 0 Thorme. Si les v.a. X1 , . . . , Xn : R sont indpendantes, alors la fonction caractristique de leur somme est le produit de leurs fonctions caractristiques X1 ++Xn =
n i=1 Xi

Preuve. Faisons la dmonstration pour n = 2. Si X et Y sont indpendantes, alors il en est de mme des v.a. exp(itX) et exp(itY ) si bien que X+Y (t) =

exp(it(X() + Y ())dP () =

exp(it(X())exp(itY ())dP ()

exp(it(X())dP ()

exp(it(())dP () = X (t)Y (t)

Produit de convolution de mesures nies


Notons : Rn Rn Rn lapplication "laddition" dnie par (x, y) = x + y. Si maintenant et sont deux mesures nies sur les borliens de Rn , alors est une mesure sur les borliens de Rn Rn et on pose = ( ) Le produit de convolution de et est donc limage directe de par . Exemples. - Pour les masses de Dirac, la rgle de calcul est a b = a+b - Pour les mesures densit, on a : Si d(x) = f (x)dx et d(x) = g(x)dx, alors d (x) = h(x)dx , h(x) =
Rn

f (y)g(x y)dy := f g(x) 97

3. Systmes stochastiques Proposition. Si X, Y : R sont deux v.a. indpendantes alors la loi de probabilit de leur somme est gale au produit de convolution de leurs lois de probabilits : PX+Y = PX PY Preuve. Cela rsulte des galits PX+Y = P(X,Y ) = PX PY = PX PY

Le lemme de Borel-Cantelli
Soit ( , T , P ) est un espace probabilis. - Deux vnements A et B (i.e. deux lments de T ) sont indpendants si P (A B) = P (A)P (B) Cela quivaut dire que les v. a. 1A et 1B sont indpendantes. - Par rcurrence sur n, on dit que les vnements A1 , A2 , . . . , An sont indpendants si a) n 1 quelconques de ces vnements sont indpendants. b) P (A1 A2 An ) = P (A1 )P (A2 ) P (An ). Cela quivaut dire que les v. a. 1A1 , . . . , 1An sont indpendantes. Exemple. Une urne contient quatre boules, trois de ces boules portent respectivement les numros 1, 2, 3, et la quatrime porte ces trois numros la fois. On tire une boule et on dsigne par Ai lvnement la boule tire porte le numro i . On a P (A1 ) = P (A2 ) = P (A3 ) =
1 2 1 4

P (A1 A2 ) = P (A2 A3 ) = P (A3 A1 ) = P (A1 A2 A3 ) =


1 4

et ces trois vnements sont donc deux deux indpendants sans tre indpendants. - On dit quune suite An dvnements est une suite dvnements indpendants si, pour tout n, les vnements A1 , A2 , . . . , An sont indpendants. Cela quivaut dire que la suite des v. a. 1An est une suite de v.a. indpendantes. Soit An une suite dvnements, lvnement une innit dvnements Ak a lieu sappelle limite suprieure des An et scrit

lim sup An =
n=1 k=n

Ak

98

3.3. Le thorme central de la limite et les lois fortes des grands nombres Lemme de Borel-Cantelli 1) Si une suite dvnements An est telle que P (An ) < , alors P (lim sup An ) = 0. 2) Si une suite dvnements indpendants An est telle que P (An ) = , alors P (lim sup An ) = 1. Preuve : 1) Soit X : [0, ] une variable alatoire (i.e. une fonction mesurable). Pour tout [0, ], on a XdP =
{X < }

XdP +
{X }

XdP P (X )
n 1 1An

En appliquant cette ingalit de Chebyshev la v. a. X = = , on obtient

et

P (An ) =
n=1

XdP P (X ) = P (lim sup An )

et cela dmontre la premire assertion. 2) On a


P (lim sup An ) = lim P (


n k=n

Ak ) = lim

1 P(
k=n

Ac ) k

et comme les vnements An sont indpendants, on a on*et lassertion 2 en rsulte.

3.3

Le thorme central de la limite et les lois fortes des grands nombres

Le thorme central de la limite


Si est une mesure nie sur (Rn , B(Rn )), sa transforme de Fourier : n C est dnie par R (y) =
Rn

exp(i < x | y > d(x)

La transformation de Fourier vrie les deux proprits suivantes : Elle est injective : = = . Elle transforme le produit de convolution en produit ordinaire : = .. Soit (, T , P ) un espace probabilis et X une variable alatoire sur , sa fonction caractristique X : R C est dnie par X (x) =

exp(ixX())dP () =
R

exp(ixy)dPX (y) 99

3. Systmes stochastiques La fonction caractristique de X est donc la transforme de Fourier de sa loi de probabilit PX . Convergence de mesures. Notons Cc (R) lespace des fonctions continues sur R qui sont support compact et Cb (R) celui des fonctions continues et bornes sur R. Soit n , des mesures bornes sur (R, B(R)). On dit que la suite : n converge vaguement vers si n (f ) tend vers (f ) pour tout f Cc (R), n converge troitement vers si n (f ) tend vers (f ) pour tout f Cb (R). Lemme. Si les mesures n converge vaguement vers et si n (R) tend vers (R) alors les mesures n converge troitement vers . Lemme. Les assertions suivantes sont quivalentes : a) n converge troitement vers . b) n converge simplement vers . Preuve de b a. On aura besoin de lespace de Schwartz S(R) qui est lensembles des fonctions f : R C indniment drivables et dont toutes les drives dcroissent rapidement (i.e. limx xm f (n) (x) = 0 pour tous les entiers naturels m et n). Cet espace est dense, pour la norme uniforme, dans Cc (R) et il est invariant par la transformation de Fourier. La suite n (R) = n (0) tend vers (0) = (R), elle est donc borne. Soit g S(R), il rsulte du thorme de convergence domine que : g(t)dn (t) = g(x)n (x)dx g(x)(x)dx = g(t)d(t)

Soit h Cc (R) et > 0, il existe g S(R) telle que donne pour n assez grand : | hdn

hg

et cela

hd | | (h g)dn | + | (h g)d | + | . sup n (R) + (R) +

gdn

gd |

Lemme Si n converge vaguement vers et si ({a}) = 0 alors lim n ({a}) = 0. Si n converge troitement vers et si ({a}) = 0 alors lim n (] , a]) = (] , a]) Le Thorme central de la limite. Soit G la mesure (dite loi normale ou loi de Gauss) sur (R, B(R)) dnie par 1 1 dG(t) = exp( t2 ) 2 2 100

3.3. Le thorme central de la limite et les lois fortes des grands nombres Cest une probabilit vriant G(x) = exp( 1 x2 ). 2 Thorme central de la limite. Soit une probabilit sur (R, B(R)) et posons pour tout A B(R) n (A) = n ( nA) = ( nA) , (n fois) Si
R td(t)

= 0 et

2 R t d(t)

= 1 alors n converge troitement vers G.

Preuve : Posons h(x) = (x) si bien que h(x) = 1 1 2 x + o(x2 ) , n (x) = hn (x/ n) = [1 x2 /n + o(n3/2 )]n 2

On en dduit que limn n (x) = exp( 1 x2 ) = G(x). 2 Consquence : Thorme central de la limite. Soit Xn une suite de v.a. indpendantes, de mme loi, desprance m et dcart-type . Si Sn = X1 + Xn , alors sa rduite
Sn =

Sn n.m n.

converge en loi vers la loi normale (i.e. les lois de probabilit de Sn convergent troitement vers la loi normale de Gauss G).

Les lois fortes des grands nombres


On va noncer les deux lois fortes de Kolmogorov qui vont rsulter essentiellement dune ingalit due Kolmogorov laquelle gnralise lingalit de Chebyshev. Ingalit de Chebyshev. Soit (X, T , ) en espace mesur et f : X [0, ] une fonction mesurable. Pour tout a [0, ], on a f d =
X {f a}

f d +
{f < a}

f d a.({f a})

Soit (, T , P ) un espace probabilis et X : R une variable alatoire de carr intgrable. Si a > 0, lingalit ci-dessus implique cette ingalit de Chebyshev P (| X E(X) | a) = P (| X E(X) |2 a2 ) a2 V (X) Ingalit de Kolmogorov. Soit S une v.a. de carr intgrable, lingalit de Chebyshev dit que : P (| S E(S) | ) 2 V (S) 101

3. Systmes stochastiques et lingalit de Kolmogorov amliore lingalit de Chebyshev lorsque S est une somme de v.a. indpendantes. Ingalit de Kolmogorov. Soit X1 , . . . , Xn des v. a. indpendantes de carr intgrables et posons Sm = X1 + Xm . On a P ( { max | Sj E(Sj ) | } ) 2 V (Sn )
1 j n

Preuve En remplaant Xi par Xi E(Xi ), on se ramne aux cas o E(Xi ) = 0. Posons A = { max | Sj | } et Ak = { max
1 j n 1 j k1

| Sj | < , | Sk | }

Lensemble A est la runion disjointe des Ak et alors


n

V (Sn ) =

2 E(Sn )

2 E(1A .Sn )

=
k=1

2 E(1Ak .Sn )

Posons Yk = Xk+1 + Xn si bien que Sn = Sk + Yk et donc


2 2 1Ak .Sn = 1Ak .Sk + 2.1Ak .Sk .Yk + 1Ak .Yk2

Comme les v.a. Yk et 1Ak .Sk sont indpendantes et que E(Yk ) = 0, on a aussi E(1Ak .Sk .Yk ) = 0 et alors
2 2 2 E(1Ak .Sn ) = E(1Ak .Sk ) + E(1Ak .Yk2 ) E(1Ak .Sk ) 2 P (Ak )

On en dduit V (Sn )

n 2 k=1 E(1Ak .Sn )

n 2 k=1 P (Ak )

= 2 P (A).

Lois des grands nombres. Soit Xn une suite de v.a. indpendantes et intgrables. On dit que la suite Xn obit la loi forte des grands nombres si, presque srement, on a n 1 lim [Xk E(Xk )] = 0. n n
k=1

la suite Xn obit la loi faible des grands nombres si, pour tout > 0, lim P ( | 1 n
n

[Xk E(Xk )] | ) = 0
k=1

Thorme de Markov Si une suite de v.a. Xn vrie limn n2 V ( la loi faible des grands nombres. 102
n k=1 Xn )

= 0 alors elle obit

3.3. Le thorme central de la limite et les lois fortes des grands nombres Preuve : Cest une consquence directe de lingalit de Chebyshev. Le lemme suivant sera utile pour la dmonstration des deux lois fortes de Kolmogorov. Lemme. Soit Xn une suite de v.a. indpendantes. Si la srie V (Xn ) des variances des Xn converge alors la srie [Xn E(Xn )] converge presque srement. Preuve. On se ramne au cas o E(Xn ) = 0. Posons Sm = X1 + + Xm , il sut de montrer que pour tout > 0
m

lim P (

p=1 { |

Sm+p Sm | } ) = 0

Cela rsulte de lingalit de Kolmogorov P(


p=1 {

| Sm+p Sm | } ) = limn P ( 2 V (Sm+n Sm ) 2

n p=1 { |

Sm+p Sm | } ) (Xp ) 0
m

p=m+1 V

Premier thorme de Kolmogorov. Soit Xn une suite de v.a. indpendantes. Si la srie n2 V (Xn ) converge alors Xn obit la loi forte des grands nombres. Preuve : Posons Yn = [Xn E(Xn )]/n. La srie V (Yn ) converge et il rsulte du lemme prcdent que Yn converge presque srement et cela implique que Xn obit la loi forte des grands nombres. (Le dernier passage utilise le lemme de Kronecker qui dit que si la srie zn 1 converge alors la suite n n kzk tend vers zro : cela sobtient en utilisant le k=1 procd de sommation dAbel.) Deuxime thorme de Kolmogorov. Soit Xn une suite de v.a. indpendantes ayant la mme loi de probabilit. Si X1 est intgrable alors Xn obit la loi forte des grands nombres. Preuve : Posons Yn = Xn .1{ | Xn | < n } , on a

n
n=1

V (Yn )
n=1

2 n2 E(Yn )

2 E(| X1 |) 6

Il rsulte du premier thorme de Kolmogorov que Yn obit la loi forte des grands nombres et puisque lim E(Yn ) = E(X1 ) on a 1 n On a maintenant
n

Yk E(X1 )
k=1

P (Xk = Yk ) =
k=1 k=1

P (| Xk | k) =
k=1

P (| X1 | k) E(| X1 |) < 103

3. Systmes stochastiques et il rsulte du lemme de Borel-Cantelli que P (lim sup{Xk = Yk }) = 0. Cela implique que les deux suites 1 n Xk et 1 n Yk sont presque srement k=1 k=1 n n de mme nature. Thorme de Glivenko-Cantelli. Pour cet important thorme, on a besoin du lemme suivant qui gnralise un lemme classique d Dini. Lemme : Soit Fn , F des fonctions croissantes, bornes et continues droite et soit S une partie dense dans R contenant tous les points de discontinuit de la fonction F . Si lim Fn (x) = F (x) et lim Fn (x ) = F (x ) pour tout x S {} alors Fn converge uniformment vers F sur R. Thorme de Glivenko-Cantelli. Si Xn est une suite de v.a. indpendantes et de mme loi de probabilit et si F (x) = P (X1 x) et Fn (x, ) = 1 n
n

1{ Xk x } ()
k=1

alors, presque srement, Fn ( , ) converge uniformment vers F : P({ ; sup


< x <

| Fn (x, ) F (x) | 0 } ) = 1

Preuve. Posons, pour x R, Yk (x, ) = 1{ Xk x } () et Zk (x, ) = 1{ Xk < x } () On a E(Yk (x, .)) = F (x) et E(Zk (x, .)) = F (x ) et il rsulte du deuxime thorme de Kolmogorov, que les v.a. Yk (x, .) et Zk (x, .) obissent la loi forte des grands nombres et il existe alors un ensemble Ax de probabilit nulle tel que Ax lim Fn (x, ) = F (x) et lim Fn (x , ) = F (x ) / Soit S une partie dnombrable, dense dans R et contenant tous les points de discontinuit de F et posons A = xS Ax . Il rsulte du lemme prcdent que si A alors Fn ( , ) converge uniformment vers F sur R. / Bibliographie. Pour des livres de cours, on pourra consulter avec prot : Gerald B. FOLLAND. Real analysis. Wiley-Interscience, 1984. Robert B. ASH. Real analysis and probabilty. Academic Press, 1972. Pour des livres dexercices, on conseille : G. LETAC. Intgration et probabilits, exercices. Masson, 1982. M. COTTRELL, . . . . Exercices de probabilits. Belin, DIA, 1980. 104

3.4. Esprances conditionnelles

3.4

Esprances conditionnelles

Soit (, , P ) un espace probabilis et Y : R une variable alatoire intgrable. Soit A une sous-tribu de , lapplication : A R dnie par (A) =
A

Y () dP ()

est une mesure (non ncessairement positive) qui est absolument continue par rapport la probabilit P (restreinte A) : P (A) = 0 (A) = 0 Il rsulte alors dun thorme dit de Radon-Nikodym quil existe une fonction Z : R vriant a) Z est A-mesurable. b) Pour tout A A , on a Y () dP () = (A) =
A A

Z() dP ()

La v. a. Z est appele esprance conditionnelle de Y sachant A et est note E( Y | A ) ou E A (Y ). Remarques. 1) Lesprance conditionnelle E( Y | A ) est une variable alatoire contrairement lesprance mathmatique ordinaire E(Y ) qui est une constante (cest donc aussi une fonction constante sur ). 2) Il rsulte de la dnition mme de E( Y | A ) que lon a : E (E( Y | A)) = E(Y )

Remarque. Si la variable alatoire Y : R est de carr intgrable, on sait que la fonction h : R R dnie par h(a) = E |Y a|2 atteint son minimum pour a = E(X). Une proprit analogue a ction orthogonale de Y sur L2 (, A, P ) : a L2 (, A, P ) E (a (Y E( Y | A))) = 0 Cela provient de lidentit aE( Y | A) = E( aY | A) qui implique E (a (Y E( Y | A))) = E(aY )E( aE( Y | A) ) = E(aY )E( E( aY | A) ) = 0 105

3. Systmes stochastiques On vient de montrer que loprateur E A , quand on le restreint L2 (, , P ) , reprsente la projection orthogonale sur le sous-espace ferm L2 (, A, P ). Exemples. 1) Si A = { , } alors toute fonction A-mesurable est constante et E( Y | A) = E(Y ) Cela montre que la notion desprance conditionnelle gnralise la notion desprance ordinaire. En gnral, lesprance conditionnelle E( Y | A) est un meilleur rsum, pour ceux qui sintressent aux lments de A , que lesprance ordinaire E(Y ). 2) Si A = {, A, Ac , } et si P (A) et P (Ac ) sont non nuls, lesprance conditionnelle E( Y | A) est de la forme E( Y | A) = 1A + 1Ac , , R et les constantes et , qui sobtiennent en intgrant sur A et Ac , sont donnes par 1 1 = Y ()dP () , = Y ()dP () P (A) A P (Ac ) Ac Elles reprsentent donc les moyennes de la v. a. Y sur les lments non divisibles A et Ac de A . 3) Si la tribu A est engendre par la partition An et si les P (An ) sont non nuls, on posera 1 E( Y | An ) = Y ()dP () P (An ) An de sorte que E( Y | An ) reprsente la valeur moyenne de Y sur An et alors E( Y | A) =
n

E( Y | An ) 1An

et lidentit E (E( Y | A)) = E(Y ) donne E(Y ) =


n

E( Y | An ) P (An )

Cela veut dire, tout simplement, que la moyenne E(Y ) est gale la moyenne des moyennes E( Y | An ). Exemple et notation. Soit X : R une variable alatoire et (X) la tribu engendre par X : (X) = { 1 (B) , B est un borlien de R } La tribu (X) est une sous-tribu de et cest la plus petite tribu qui rend X mesurable. 106

3.4. Esprances conditionnelles Pour simplier lcriture, on crira E( Y | X ) au lieu de E( Y | (X) ). Comme E( Y | X ) est une fonction (X)-mesurable, il existe une fonction : R R borlienne telle que E( Y | X ) = X Par analogie au cas o la tribu A est engendre par une partition dnombrable, nous poserons E( Y | X = x ) = (x) , x R et nous dirons que cest la moyenne de Y sur lensemble (X = x). Noter que cela permet de donner un sens cette phrase qui ne veut rien dire lorsque P (X = x) = 0. Exemple. On munit lintervalle [1, 1] de la probabilit uniforme et on considre la v. a. X dnie par X(x) = x2 Il est facile de vrier que la tribu (X) est forme des borliens de [1, 1] qui sont symtriques par rapport lorigine : (X) = { B B([1, 1]) ; B = B } et que si Y : [1, 1] R est une v. a., alors son esprance conditionnelle sachant X est gale la partie paire de Y : E(Y | X)(x) = et on dduit que E(Y | X = x) = Y ( x) + Y ( x) , x [0, 1] 2 Y (x) + Y (x) , x [1, 1] 2

Remarques et dnitions. 1) Il rsulte de la dnition de lesprance conditionnelle que lon a E(Y ) = E(E( Y | X )) =
R

(x)dPX (x) =
R

E( Y | X = x )dPX (x)

et cela exprime encore une fois que la moyenne de Y est la moyenne des moyennes E( Y | X = x ). 2) Lorsque Y est la fonction caractristique dun ensemble C , on posera P (C | X) = E(1C | X) et on dira que P (C | X) est la probabilit conditionnelle de C sachant X. La formule ci-dessus devient dans ce cas P (C | X) =
R

P (C | X = x)dPX (x) 107

3. Systmes stochastiques et cela gnralise cette formule trs utile : P (C) =


n

P (C | An )P (An )

qui est valable chaque fois que les An forment une partition de en vnements de probabilits non nulles. 3) Soit h : R R une fonction borlienne telle que la v. a. h Y soit intgrable, on sait quil existe une fonction borlienne : R R telle que E( h Y | X ) = X et que si A est (X)-mesurable E(1A X) = E(1A E( h Y | X )) = E(1A h Y ) Lensemble A est de la forme X 1 (B) o B est un borlien de R si bien que 1A = 1B X, et on montre facilement que si k : R R est une fonction borlienne et positive, alors E(k X X) = E(k X h Y ) Cela donne cette formule k(x)(x)dPX (x) =
R RR

k(x)h(y)dP(X,Y ) (x, y)

qui permet souvent de dterminer lapplication et donc lesprance conditionnelle E( h Y | X ). Exemple. Soit X, Y : R deux v. a. indpendantes de mme loi de probabilit dPX (x) = dPY (x) = exp(x)1[0,[ (x)dx Dterminer lesprance conditionnelle E(X | max{ X, Y } ). Solution. Posons Z = max{ X, Y }. On sait que, si h : R R est borlienne et si la v. a. h X est intgrable, il existe une fonction borlienne : R R telle que E(h X | Z ) = Z et que, pour toute fonction k : R R borlienne positive, on a E(k Z Z) = E(k Z h X) Dterminons la loi de probabilit de Z : On a P (Z < z) = P (max{ X, Y } < z) = P (X < z, Y < z) = (1 e z )2 si bien que la loi de probabilit de Z est donne par dPZ (z) = 108 d P (Z < a)dz = 2(1 e z )ez dz dz

3.4. Esprances conditionnelles Il en rsulte que lon a


0

k(z)(z)2(1 e z )ez dz =
0

k(max{x, y})h(x)e x e y dxdy

Le second membre (notons-le S) vaut


x

S =
0

k(x)h(x)
0

e y dy e x dx +
0 x 0

k(y)
0

h(x)e x dx e y dy

=
0

k(x) h(x)(1 e x ) +

h(t)e t dt e x dx

Il en rsulte que lon a (x)2(1 e x ) = h(x)(1 e x ) +


0 x

h(t)e t dt

de sorte que (x) =

h(t)e t dt h(x) + 0 2 2(1 e x )

Cette relation permet dcrire, en faisant h(x) = x, E(X | max{ X, Y } = x) = x x 1 + 2 2 2(exp(x) 1)

et de dire que la loi conditionnelle de X sachant que max{ X, Y } = x est gale 1 1 x + 1 (t)e t dt 2 2(1 e x ) [0,x] Exercice. 1) Soit X la v. a. qui vaut 1 si le premier essai donne un succs et qui vaut 0 sinon. 1a) Calculer E(Y1 | X = 1) et montrer que E(Y1 | X = 0) = 1 + E(Y1 ). 1b) Calculer E(Y1 ). 2) Montrer que E(Ym+1 | Ym ) = Ym + 1 + (1 p)E(Ym+1 ). 3) En dduire que
m

E(Ym ) =
n=1

p n

Exercice. Soit Xn une suite de v. a. indpendantes, quidistribues, de moyenne m et N une v. a. entire et indpendante des Xn . On pose
n N ()

Sn () =
i=1

Xi () , SN () =
i=1

Xi () 109

3. Systmes stochastiques 1) Montrer que E(SN | N = n) = E(Sn ). 2) Montrer que E(SN ) = E(N )E(X1 ) 3) On suppose que X1 et N sont de carr intgrables, prouver que V (SN ) = E(N )V (X1 ) + V (N )E 2 (X1 ) Exercice. Dterminer lesprance conditionnelle E(X | X + Y ). Solution : Posons T = X + Y, la fonction E(X | X + Y ) est de la forme T o : R R est borlienne et vrie si A est (T )-mesurable alors E(1A . T ) = E(1A . X) et donc si g est borlienne positive alors E(g T . T ) = E(g T . X) On sait que T est une v. a. de densit texp(t)1[0,[ (t) si bien que

E(g T . T ) =
0

g(t)(t)texp(t)dt

Par ailleurs, on a

E(g T . X) =
0 0

g(x + y)xexp(x)exp(y)dxdy

Le changement de variables (x, y) (t = x + y, s = x) donne


t

E(g T . X) =
0

g(t)exp(t)
0

sds) dt

Il sensuit que (t)t =

t 0 sds

et (t) = t/2. On a donc obtenu X +Y 2

E(X | X + Y ) =

On montre de la mme manire que si h est positive E(h X | X + Y ) = et cela permet dcrire E(h X | X + Y = t) = 110 1 t
t t

1 X +Y

X+Y

h(s)ds
0

h(s)ds =
0 0

h(s) . t1 ds

3.4. Esprances conditionnelles et on dira que la loi de X sachant X + Y = t est la loi uniforme t1 ds sur [0, t]. Remarque. Lorsque la loi du couple (X, Y ) est donne par dP(X,Y ) (x, y) = f (x, y)d(x)d(y) o et sont deux mesures -nies, on posera f2 (x) = fy (x) =
R

f (x, y)d(y)

de sorte que fy (x)d(x) est exactement la loi de X. Noter quil rsulte du thorme de Fubini que lon a le droit de dire f est nulle sur lensemble {x ; fy (x) = 0} R On posera ensuite f (x, y)/fy (x) si fy (x) = 0 f (y | x) = 0 si fy (x) = 0 de sorte que lon a f (x, y) = f (y | x)fy (x). Soit h une fonction borlienne positive, lesprance conditionnelle E(h Y | X) est de la forme X o est une fonction borlienne vriant si g est borlienne positive alors E(g X . X) = E(g X .h Y ) On va montrer que (x) =
R

h(y)f (y | x)d(y)

et on dira que f (y | x)d(y) est la loi conditionnelle de Y sachant que X = x. Cela rsulte des galits E(g X .h Y ) =
R R

g(x)h(y)f (x, y)d(x)d(y) g(x)h(y)f (y | x)fy (x)d(x)d(y)


R R

= =
R

g(x)
R

h(y)f (y | x)d(y) fy (x)d(x)

et de lidentit E(g X . X) =
R

g(x)(x)fy (x)d(x) 111

3. Systmes stochastiques

3.5

Loi de Poisson et loi exponentielle

Introduction. On observe, partir de linstant t = 0, un ux (une succession) dvnements et on dsigne par Nt le nombre dvnements aperus dans lintervalle de temps [0, t[. Cest une variable alatoire et on fait les hypothses suivantes : 1) Le ux est stationnaire : La loi de la v. a. Na+t Na , qui compte le nombre dvnements qui se ralisent dans lintervalle de temps [a, a + t[, ne dpend que de t (et non de a). Cela permet de poser pn (t) = P (Nt = n) = P (Na+t Na = n) 2) Le ux est sans postaction : Pour toute suite strictement croissante tn , les v. a. Ntn+1 Ntn sont indpendantes. 3) Il existe une constante telle que

p1 (t) = t + o(t) ,
n=2

pn (t) = o(t)

Il en rsulte que p0 (t) = 1 t + o(t) Calcul de pn (a) , loi de probabilit de Na Pour t = 0 : Il rsulte des hypothses que p0 (0) = 1 et donc pn (0) = 0 pour tout n 1. On a p0 (a + t) = P (Na+t = 0) = P (Na = 0 , Na+t Na = 0) = P (Na = 0)P (Na+t Na = 0) = p0 (a)p0 (t) = p0 (a)(1 t + o(t)) Cela implique p0 (a) = p0 (a) et comme p0 (0) = 1, on en dduit que p0 (a) = exp(a) On a
n

pn (a + t) =
i=0

P (Na = n i)P (Na+t Na = i)

= pn (a)(1 t + o(t)) + pn1 (a)(t + o(t)) + o(t) = (1 t)pn (a) + tpn1 (a) + o(t) Cela donne pn (a) = pn (a) + pn1 (a) et, par rcurrence sur n 1, pn (a) = 112 (a)n exp(a) , n 0 n!

3.5. Loi de Poisson et loi exponentielle Il en rsulte que Na suit une loi de Poisson de paramtre a. La fonction gnratrice de la v. a. Na est

ga (z) =
n=0

P (Na = n) z =
n=0

pn (a) z n = exp(a + az)

et en particulier E(Na ) = a , V (Na ) = a Il en rsulte que la constante reprsente le nombre moyen dvnements aperus par unit de temps. La variable alatoire T = T 1 = T1 . Soit T = T 1 = T1 la v. a. qui mesure le temps dattente du premier vnement. Nous allons dterminer la densit de sa loi de probabilit : On a P (T > t) = P (Nt = 0) = p0 (t) = exp(t) et il en rsulte que la densit de T est donne par d P (T > t) = exp(t) , t > 0 dt

La v. a. T suit donc la loi exponentielle de paramtre et en particulier E(T ) = 1 = (T )


1

Cela donne cette autre interprtation de : tente du premier vnement. Les variables alatoires T n , n 2.

reprsente le temps moyen dat-

Soit T n la v. a. qui mesure le temps dattente du n-ime vnement. On a


n1

P (T n > t) = P (Nt n 1) =
k= 0

(t)k exp(t) k!

et on en dduit que la densit de T n est donne par (t)n1 d P (T n > t) = exp(t) dt (n 1)!

La v. a. T n suit donc la loi gamma de paramtres (n, ). Rappelons que sa fonction caractristique est donne par exp(ixT n ()) dP () =
n

ix

113

3. Systmes stochastiques si bien que son esprance et sa variance sont donnes par n n E(T n ) = , V (T n ) = 2 Les variables alatoires Tn = T n T n1 , n 2. Notons Tn la v. a. qui mesure le temps qui spare le n-ime vnement du prcdent. Pour dterminer sa loi de probabilit, nous allons commencer par donner celle du couple (T n1 , T n ). On a P (T n1 < a , T n > b) = P (Na = n 1 , Nb Na = 0) (a)n1 (a)n1 = exp(a) exp((b a)) = exp(b) (n 1)! (n 1)! On en dduit que P (T n1 < a , T n < b) = P (T n1 < a) P (T n1 < a , T n > b) si bien que la densit du couple (T n1 , T n ) est donne par 2 (a)n2 P (T n1 < a , T n < b) = 2 exp(b) , 0 < a < b ab (n 2)! On en dduit que P (Tn < b) = P (T n T n1 < b) =
{yx < b}

(x)n2 exp(y)dxdy (n 2)!

=
0

(x)n2 (n 2)!
x

x+b

exp(y)dy dx

et la loi de Tn est donc donne par d P (Tn < b) = db 2


0

(x)n2 exp((x + b))dx = exp(b) (n 2)!

En particulier les v. a. Tn , n 1 suivent toutes la loi exponentielle de paramtre . Indpendance des Tn , n 1. Commenons par montrer que T1 et T2 sont indpendantes. On a {T1 < x , T2 < y} = {T 1 < x , T 2 T 1 < y} si bien que
x a+y

P (T1 < x , T2 < y) =


0 a

2 exp(b)db da

et il en rsulte que 2 2 x P (T1 < x , T2 < y) = exp((a + y))da xy x 0 = exp(x) exp(y) 114

3.5. Loi de Poisson et loi exponentielle et cette expression de la densit du couple (T1 , T2 ) prouve que ces deux v. a. T1 et T1 sont indpendantes. Montrons par exemple que T1 , T2 , T3 et T4 sont indpendantes. Si a < b < c < d, alors lvnement A = {T 1 < a, T 2 > b, T 3 < c, T 4 > d} concide avec lvnement {Na = 1, Nb Na = 0, Nc Nb = 2, Nd Nc = 0} si bien que P (A) = aea e(ba) = 1 3 a(c b)2 ed 2 2 (c b)2 (cb) e e(dc) 2

La densit de la loi de (T1 , T2 , T3 , T4 ) est donc donne par a b c d P (A) = 4 ed 1{a < b< c< d}

On peut donc calculer la probabilit de lvnement B = {T1 < x, T2 < y, T3 < z, T4 < t} = {T 1 < x, T 2 T 1 < y, T 3 T 2 < z, T 4 T 3 < t} qui vaut
x y+t1 z+t2 t+t3

=
0

(
t1

(
t2

(
t3

4 et4 dt4 )dt3 )dt2 )dt1

Cela permet de dterminer la densit de (T 1 , T 2 , T 3 , T 4 ) ; elle vaut 4 xyzt = = = 3 yzt 2 zt d dt


y+x z+t2 t+t3

( (

( e

4 et4 dt4 )dt3 )dt2 dt4 )dt3

x t2 t3 z+y+x t+t3 4 t4 y+x t3 t+z+y+x 4 t4

dt4

z+y+x

= 4 exp((t + z + y + x)) et cette expression de la densit prouve que les v. a. T1 , T2 , T3 et T4 sont indpendantes. Il devient clair maintenant que Tn (n 1) est une suite de v. a. indpendantes. 115

3. Systmes stochastiques

3.6

La loi du Chi deux

La loi gamma. Une variable alatoire X suit une loi gamma de paramtres (, ) ( > 0, > 0) si sa densit f est donne par f (x) = 1 x x e 1[ 0, [ (x) ()

La fonction caractristique dune telle v. a. est donne par

X (t) =

eitx f (x)dx =

it

et il en rsulte que son esprance et sa variance sont donns par E(X) = , V (X) = 2

Pour = 1, la loi gamma se rduit la loi exponentielle. Pour = n/2 et = 1/2, la loi gamma est la loi du 2 n degrs de libert. Exemples. - Si la v. a. X suit une loi normale rduite, alors la v. a. Y = X 2 suit une loi gamma de paramtre (1/2, 1/2). Preuve.

d d P (Y < a) = da da

2 2

exp(x2 /2)dx
0

1 = a1/2 ea/2 2

- Si les v. a. Xi sont indpendantes est suivent la loi normale rduite, la v. a.


2 2 V = X1 + + Xn

suit la loi du 2 n degrs de libert. Preuve. La fonction caractristique de V est en eet donne par (t) = (1 2it)1/2
n

Thorme. Soit X1 , . . . , Xn des variables alatoires indpendantes qui suivent la loi normale de paramtres (m, 2 ) et posons X= 1 n
n i=1 Xi

, Y =

1 2

n i=1 (Xi

X)2 , Z =

X m n

Les v. a. Y et Z sont indpendantes et Y suit la loi du 2 n 1 degrs de libert. 116

3.6. La loi du Chi deux Preuve. On se ramne au cas o m = 0 et = 1. Posons Yi = 1 (X1 + + Xi iXi+1 ) et Yn = (X1 + + Xn ) n i.(i + 1) 1

Cest une transformation orthogonale si bien que


2 2 2 X1 + + Xn = Y12 + + Yn 2 et comme Yn = nX , il en rsulte que 2

Y =

n 2 i=1 Yi

2 Yn =

n1 2 i=1 Yi

et cela implique que Y suit la loi du 2 n 1 degrs de libert. Comme la transformation ci-dessus est orthogonale et que la loi de (X1 , . . . , Xn ) est invariante par ces transformations, on en dduit que les v. a. Y1 , . . . , Yn sont indpendantes et il en rsulte que Y et Z sont indpendantes. Convergence de la loi multinomiale. Soit p1 , . . . , pk des rels tels que 0 < pi < 1 et p1 + + pk = 1 Soit Z = (Z1 , . . . , Zk ) une variable alatoire valeurs dans Nk . On dit que Z suit une loi multinomiale de paramtres (p1 , . . . , pk ; n) si P (Z1 = n1 , . . . , Zk = nk ) = n! pn1 pnk k n1 ! n k ! 1

pour n1 + + nk = n. Interprtation. Si les vnements E1 , . . . , Ek se produisent respectivement avec les probabilits p1 , . . . , pk , alors la probabilit pour que lvnement se produise n1 fois, . . . , Ek se produise nk fois est donne par n! pn1 pnk k n1 ! nk ! 1 Cette loi est une gnralisation de la loi binomiale et sappelle loi multinomiale parce que les probabilits ci dessus sont les termes du dveloppement de (p1 + + pk )n . Noter que chacune des v. a. Zi sui une loi binomiale de paramtre (n, pi ) Considrons maintenant la variable alatoires 2 = (Zi npi )2 i=1 npi
k

Comme E(Zi npi )2 = V (Zi ) = npi (1 pi ), il en rsulte que E(2 ) = k 1 = f 117

3. Systmes stochastiques La variance de 2 est plus dicile calculer et vaut V (2 ) = 2f + 1 n 1 1 + + k 2 2k + 2 p1 pk

et il sut de retenir que pour n assez grand, cette variance est voisine de 2f. Thorme. Lorsque n tend vers linni, la variable alatoire 2 tend en loi vers une loi de 2 k 1 degrs de libert. Application. On dsire vrier la rgularit dun d, cest--dire examiner si toutes ses faces sont quiprobables : p1 = p2 = p3 = p4 = p5 = p6 = On a lanc ce d 120 fois et on a obtenu issue i frquence observe Xi frquence espre npi 1 15 20 2 21 20 3 25 20 4 19 20 5 14 20 6 26 20 1 6

Pour mesurer les carts entre les Xi et les npi , on calcule 2 = (Xi npi )2 = 6, 2 i=1 npi
6

La valeur observe de 2 est 6, 2 ; elle est infrieure f + 2f 8, 16 et on na pas de raison de douter du d. En rgle gnrale, on adopte ces deux principes : 1) Lorsque la valeur observe est suprieure f + 2 2f , on doit rejeter lhypothse. 2) Lorsque la valeur observe est trop petite, on est en droit de souponner quelquun davoir traqu les donnes pour dmontrer quelque chose.

3.7

Exercices

Exercice. Variable de Bernoulli. Soit A T un vnement et X = 1A . Cette v.a. ne prend que les valeurs 0 et 1 et sa loi de probabilit est donc porte par lensemble {0, 1} ; elle est donne par PX = P (X = 1)1 + P (X = 0)0 118

3.7. Exercices On dit quune v.a. X est de Bernoulli de paramtre p , 0 < p < 1 si sa loi de probabilit est gale PX = p1 + (1 p)0 Montrer que E(X) = p et V (X) = p(1 p). Exercice. Fonction de rpartition. Soit ( , T , P ) un espace probabilis et X : R une variable alatoire. La fonction de rpartition de X est la fonction F : R R dnie par F (x) = P ( X < x ) 1) Montrer que F est une application croissante, continue gauche et que F () = 0 , F (+) = 1 2) Dterminer F lorsque la loi de probabilit de X est donne par a) PX = 0.20 + 0.82 b) dPX (x) = e x 1[0,[ (x)dx

3) Montrer que P (X = a) = F (a+) F (a). 4) Montrer que si F est de classe C 1 sur un intervalle ]a, b[, alors P(X A ) =
A

F (x)dx

pour tout borlien A inclus dans ]a, b[. 5) Montrer que si F est continue sur tout R et drivable sauf en un nombre ni de points, alors
x

P (x < x) = F (x) =

F (t)dt , x R

Cela montre que la loi de X est une mesure densit par rapport la mesure de Lebesgue : dPX (x) = f (x)dx , f (x) = d P( X < x) dx X dont la fonction de rpar-

6) Dterminer la loi de probabilit dune v. a. tition F vrie 0 si x/3 si F (x) = 1/2 si (x 6)2 /16 + 3/4 si

x0 x1 1<x6 6<x8 119

3. Systmes stochastiques Exercice. Soit X une variable alatoire dont la loi est donne par dPX (x) = e x 1[0,[ (x)dx 1) Dterminer les fonctions de rpartitions puis les lois de probabilit des variables alatoires a) Y = 2X + 6 b) Z = |X| c) T = ln X

2) Dterminer les esprances des v. a. X , Y , Z et T. Exercice. Soit X et Y deux v. a. indpendantes et de mme loi donne dPX (t) = dPY (t) = t2 1[1,[ (t)dt 1) Calculer les probabilits P (X 1) , P (2 < X 3) et P (2 < X < 3 , 4 < Y 6). 2) Dterminer les lois de probabilit des v. a. X 2 et ln X. 3) Calculer les probabilits P (XY 2), P (Y /X < 1/2) et P (Y /X 2). 4) En dduire que les v. a. U = XY et V = Y /X ne sont pas indpendantes 5) Dterminer les lois de probabilit des v. a. U = XY et V = Y /X. Exercice. Soit X, Y deux variables alatoires indpendantes et normales de paramtres (1, 0) : 1 dPX (t) = dPY (t) = exp(t2 /2)dt 2 1) Dterminer la loi de X 2 . 2) Dterminer la loi de X 2 + Y 2 . 3) Dterminer la loi de X 2 + Y 2 . 4) Dterminer la loi de Y /X. Exercice. Soit X, Y deux variables alatoires indpendantes et normales de paramtres (m, 2 ) : dPX (t) = dPY (t) = 1 (t m)2 exp 2 2 2 dt

1) Dterminer la fonction caractristique de la v. a. X. 2) Dterminer lesprance et la variance de X. 2) Que peut-on dire de la v.a. (X m)/ ? 3) Que peut-on dire de la v. a. X + Y ? Remarque. La v.a. X prend avec une probabilit leve des valeurs proches de son esprance : k P (|X m| k) 0, 6745 0, 5 1 0, 6827 1, 645 0, 9 1, 96 0, 95 2 0, 9545 2, 58 0, 99 3 0, 9973

120

3.7. Exercices Deux de ces probabilits mritent dtre retenus P (|X m| > 1, 96) = 0, 05 , P (|X m| > 2, 58) = 0, 01 Exercice. 1) Soit X : N une v. a. entire, prouver que

E(X) =
n= 0

P (X > n)

2) Soit X : [0, [ une variable alatoire, prouver que

E(X) =
0

P (X > x)dx

et montrer que si X est intgrable alors limx xP (X > x) = 0. Exercice. Loi gomtrique. On dit quune v. a. X valeurs dans N suit une loi gomtrique de paramtre p , 0 < p < 1, si sa loi est donne par P (X = n) = p(1 p)n1 , n N 1) Dterminer la fonction gnratrice de X :

g(z) = E(z X ) =
n=1

P (X = n)z n

2) Calculer E(X) , E(X(X 1)) et en dduire V (X). 3) Montrer que cette v. a. vrie P (X > m + n | X > n) = P (X > m) Application. On eectue des essais indpendants de probabilit de succs constante et gale p , 0 < p < 1, et on note X la v. a. qui compte le nombre de coups ncessaires pour obtenir le premier succs. 1) Calculer P (X = 1), P (X = 2), P (X = 3) et P (X = n). 2) Que dire de X et que vaut son esprance ? Exercice. Loi binomiale ngative. On dit quune v. a. X suit une loi binomiale ngative de paramtres m et p, m N et 0 < p < 1, si sa loi est donne par P (X = n) = n1 m p (1 p)nm , n m m1

1) Que peut-on dire de X lorsque m = 1 ? 121

3. Systmes stochastiques 2) Dterminer la fonction gnratrice de X :

g(z) = E(z ) =
n=1

P (X = n)z n

3) Calculer E(X) , E(X(X 1)) et en dduire V (X). Application. On eectue des essais indpendants de probabilit de succs constante et gale p , 0 < p < 1, et on note Xm la v. a. qui compte le nombre de coups ncessaires pour obtenir le m-ime succs. 1) Montrer que si n m 1 alors P (Xm = n) = m1 m p (1 p)n m n1

2) Que dire de Xm et que vaut son esprance. Exercice. Soit X1 , . . . , Xm des v. a. indpendantes suivant la loi gomtrique de paramtre p et posons S = X1 + + Xm 1) Dterminer la fonction gnratrice de S et en dduire que S suit la loi binomiale ngative de paramtres m et p. 2) Que peut-on dire de la loi de la somme de deux v. a. indpendantes suivant des lois binomiales ngatives de paramtres (m, p) et (n, p) ? Exercice. On suppose que la v. a. X suit une loi binomiale ngative de paramtre (m, p). 1) Dterminer le maximum de p P (X = n) en fonction de n et m. 2) Montrer que si m 2 E 3) Montrer que si m 2 E m1 X 1 =p

m >p X

Exercice. Loi de Poisson. On dit quune v. a. X suit une loi de Poisson de paramtre a si sa loi est donne par an P (X = n) = e a , nN n! 1) Dterminer la fonction gnratrice de X

g(z) = E( z X ) =
n=0

P (X = n) z n

2) En dduire que E(X) = V (X) = a 122

3.8. Processus stochastiques 3) Que peut-on dire de la somme de deux v. a. indpendantes suivant des loi de Poisson ? Soit pn une suite dlments de ]0, 1[ tels que la limite a = lim npn
n

existe. Montrer que, pour tout k N, on a lim n k ak pn (1 pn )nk = e a k k!

Pour n = 50 et p = 0.04, on a np = 2 k 0 1 2 3 4 Binomiale 0.1299 0.2706 0.2762 0.1842 0.0902 Poisson 0.1385 0.2707 0.2767 0.1804 0.0902 k 5 6 7 8 9 Binomiale 0.0346 0.0108 0.0028 0.0006 0.0001 Poisson 0.0361 0.0120 0.0034 0.0009 0.0002

Exercice. Soit X1 , X2 : R deux variables alatoires indpendantes et posons X(1) = min(X1 , X2 ) , X2 = max(X1 , X2 ) 1) Dterminer les fonctions de rpartition de X(1) et X(2) en fonction de celles de X1 et X2 . 2) On suppose que X1 , X2 suivent des lois exponentielles de paramtres a et b dPX1 (x) = aeax 1[0,[ (x)dx , dPX2 (x) = bebx 1[0,[ (x)dx Dterminer les densits de X(1) et X(2) .

3.8

Processus stochastiques

Introduction
Les processus stochastiques dcrivent lvolution dune grandeur alatoire en fonction du temps ou bien de lespace. Il existe de nombreuses applications des processus alatoires notamment en physique statistique (par exemple le ferromagntisme, les transitions de Phases), en biologie (lvolution, la gntique et la gntique des populations), en mdecine (croissance de tumeurs, pidmie), 123

3. Systmes stochastiques et bien entendu les sciences de lingnieur. Dans ce dernier domaine, les applications principales sont pour ladministration des rseaux, de lInternet, des tlcommunications ainsi que dans le domaine de lconomie et des nances. Un processus stochastique tend reprsenter lvolution dun systme en fonction du temps. Il met en oeuvre des modles probabilistes spciques dans le but de grer lincertitude et la manque dinformation. Un processus stochastique (alatoire) reprsente une volution gnralement dans le temps, dune variable alatoire. Notations Dans la suite, on adoptera les notations suivantes : [, F, IP ] un espace de probabilit (A, A) un espace mesurable E lespace o X(t) prend ses valeurs : lespace dtat du processus stochastique X T lespace du temps

Dnition
Processus stochastique : Un processus stochastique (ou processus alatoire) reprsente une volution, gnralement dans le temps, dune variable alatoire. On appelle processus alatoire valeurs dans (A, A), un lment ((Xt ())t0, ), o pour tout t T , Xt est une variable alatoire valeurs dans (A, A). Si (Ft )t est une ltration, on appelle processus alatoire adapt, valeurs dans (A, A), un lment X tel que Xt soit une variable alatoire|mesurable valeurs dans (A, A). Pour x, la fonction de + dans A qui t associe Xt () est appele la trajectoire associe la ralisation . Un processus stochastique peut aussi tre vu comme une fonction alatoire : chaque dans , on associe la fonction de T dans E :t Xt () , appele la trajectoire associe la ralisation . Si T est dnombrable alors X est appel un processus stochastique en temps discret. Si T est non dnombrable alors X est appel un processus stochastique en temps continu. Si E est dnombrable alors X est appel un processus stochastique espace discret. Si E est non dnombrable alors X est appel un processus stochastique espace continu. Exemple
t

Soit le processus stochastique somme St = S0 +


i=1

Xi

Avec X1 , X2 ... une suite des variables alatoires indpendantes, prenant chacune la valeur 1 avec probabilit p et la valeur -1 avec probabilit 1-p. La suite est une marche alatoire partant de S0 . St reprsente la fortune 124

3.9. Processus de Markov dun joueur ayant jou t parties, recevant 1 dinars sil gagne payant 1 dinars sil perd et ayant une richesse initiale de francs S0 dinars. Martingale Dnition : On se donne un espace de probabilit [, F, IP ] muni dune ltration (Ft )t . (Ft )t est donc une famille croissante de sous-tribus de F. Une famille de variable alatoires (Xt )t0 est une martingale par rapport la ltration Ft si : Xt est Ft -mesurable et intgrable pour tout t E[Xt /Fs ] = Xs , s t

Exemples des processus stochastiques


Processus stochastique en temps discret et espace discret Xn =nombre de programmes excuts durant la n-ime heure de la journe. E=Xn ,n=1,2,...,24 est un processus stochastique en temps discret et espace discret. Avec : T=1,2,...,24 et E=N Processus stochastique en temps discret et espace continu Xn =temps mis par un serveur Web pour traiter la n-ime requte de la journe. E=Xn ,n=1,2,... est un processus stochastique en temps discret et espace continu. Avec : T=N et E=[0, [ Processus stochastique en temps continu et espace discret X(t) = nombre de bits qui traversent un routeur Internet donn dans [0,t]. Alors,{X(t), t 0} est un processus stochastique en temps continu et espace discret avec E=N,T= [0,t]. Processus stochastique en temps continu et espace continu X(t) = temps dattente dune requte (par exemple un serveur Web) reue linstant t.

3.9

Processus de Markov

Introduction
La notion dune chane de Markov a t conue, au dbut du vingtime sicle, par le Russe mathmaticien A.A. Markov qui a tudi lalternance des voyelles et des consonnes en posie .Onegin de Pushkin. Markov a dvelopp un modle de probabilit dans lequel les rsultats des preuves successives dpendent les uns des autres et chaque preuve dpend seulement de son prdcesseur immdiat. Ce modle, tant la gnralisation la plus simple de la probabilit des preuves indpendantes et semble donner une excellente description de lalternance des 125

3. Systmes stochastiques voyelles et des consonnes. Markov a ainsi pu calculer avec une manire prcise la frquence laquelle les consonnes se produisent en posie de Pushkin. La thorie des processus de Markov apparat dans de nombreuses applications telles que la biologie,linformatique, la technologie et la recherche oprationnelle. Un processus de Markov permet de modliser lincertitude aectant plusieurs systmes rels dont la dynamique varie au cours du temps. Les concepts de base dun processus de Markov sont ceux dun tat et dune transition dtat. La modlisation de certaines applications, consiste trouver une description dtat tel que le processus stochastique associ vrie la proprit markovienne cest--dire que la connaissance de ltat actuel est susante pour prvoir le comportement futur stochastique. Un processus de Markov est une squence alatoire dont le comportement futur probabiliste du processus dpend seulement de ltat actuel du processus et non plus de son pass. On parle alors de la proprit Markovienne. Les processus de Markov constituent lexemple le plus simple des processus stochastiques, lorsque dans ltude dune suite de variables alatoires, on abandonne lhypothse dindpendance On distingue deux types de processus de Markov : Les processus de Markov temps discret appels aussi chane de Markov temps discret dans lesquels les transitions dtat se produisent dans des instants de temps xes. Les processus de Markov temps continu appels aussi chane de Markov temps continu ou encore processus Markoviens de sauts dans lesquels ltat peut changer en tout point de temps.

Processus de Markov temps discret


Un processus de Markov temps discret est un processus stochastique temps discret reprsentant une squence des variables alatoires indpendantes. Dnitions Soit E un espace dnombrable, cest--dire soit ni, soit en bijection avec N . Noyau : on appelle noyau (ou matrice de probabilit) de transition sur E une famille P (i, j), i, j E de rels telle que : (i) P(i,j) 0, pour tout i,j E (ii) Pour tout i E, P (i, j) = 1
jE

Formulation mathmatique Processus de Markov : Soit Xn (n 0) une suite des variables alatoires valeurs dans lensemble E (E=N). On dit que cette suite est un processus de Markov temps discret, si : Pour tout n 1 et pour toute suite (i0 , ..., in ) ) dlments de E, telle que la probabilit P (X0 = i0 , ..., Xn1 = in1 , Xn = in ) est strictement positive : On a la relation suivante entre les probabilits conditionnelles : 126

3.9. Processus de Markov P {Xn+1 = j\X0 = i0 , ..., Xn1 = in1 , Xn = in } = P {Xn+1 = j\Xn = in } Autrement dit, dans lvolution au cours du temps, ltat du processus linstant (n+1) ne dpend que de celui linstant n prcdent, mais non de ses tats antrieurs. On dit que le processus est sans mmoire ou non hrditaire. Remarque : Le processus de Markov temps discret est dit homogne (dans le temps), si la probabilit prcdente ne dpend pas de n. Matrice de passage (ou de transition) :la matrice P dnie par : p0,0 p0,1 p0,2 ... p0,0 p0,0 p0,0 ... P = . . . . . . . . . . . . . . . . . . . . . . . . pi,j = P {Xn+1 = j\Xn = i} (n 0) Cette probabilit est appell la probabilit de passage de ltat i ltat j, en une tape, ou une opration, ou encore, en une transition.

Processus de Markov temps continu (Processus Markoviens sauts)


Un processus de Markov temps continu est un processus alatoire (Xt )t0 dont lvolution future est indpendante du pass sachant ltat prsent.Dans ce qui suit , on considre que le processus (Xt )t0 prend ses valeurs dans un espace dtat E qui est dnombrable, typiquement E ni ou E=N. Dnitions Processus de Markov temps continu : Le processus stochastique (Xt )t0 est une chane de Markov temps continu si 0 t0 < t1 < ... < tn < t P (Xt = x\Xt0 = x0 , ..., Xtn = xn ) = P (Xt = x\Xtn = xn ) La loi de la variable alatoire (Xt )t0 est donne par le vecteur ligne de probabilit suivant : p(t) = [p0 (t), p1 (t), ...] = [P (Xt = 0), P (Xt = 1), ...] Les probabilits de transition p(t, t ) sont les matrices (ventuellement de taille innie) pi,j (t, t ) = P (Xt = j\Xt = i) Dans de nombreux modles, les transitions entre deux instants t et t ne dpendent pas des dates t et t , mais plutt de la dure entre ces deux dates, cest--dire de (t t). Cest ce quon appelle lhomognit du processus. Processus de Markov homogne : le processus de Markov (Xt )t0 est homogne si les probabilits de transi127

3. Systmes stochastiques tion p(t, t ) ne dpendent que de (t t ). On note alors : pij (t) = pij (0, t) = P (Xt = j\X0 = i) Equations de Chapman-Kolmogorov : Les transitions de probabilits satisfont les quations suivantes, dites de Chapman-Kolmogorov : Pour tous entiers i et j, pour tous rels positifs t et t , on a :
+

pij (t + t ) =
k=0

pik (t)pkj (t )

Preuve :
+

=
k=0

{Xt = k} qui est une partition de lspace dtats.


P(X
t+t

pij (t + t ) = P (Xt+t = j\X0 = i)= Et en reconditionnant :


+

=j,X0 =i)

P (X0 =i)

+ P(X k=0

t+t

=j,Xt =k,X0 =i) P (X0 =i)

pij (t + t ) =
k=0

P (Xt+t = j\Xt = k, X0 = i)P (Xt = k\X0 = i)

Or la proprit de Markov assure que : P (Xt+t = j\Xt = k, X0 = i) = P (Xt+t = j\Xt = k) = pij (t ) La dernire galit venant de lhomognit de la chane. Do nalement :
+

pij (t + t ) =
k=0

pkj (t )pik (t)

Notation Il est alors naturel dintroduire les matrices (innies) de transition : (P (t))t0 pour tout t 0 par : P (t) = [pij (t)](i,j)IN 2 Les quations de Chapman-Kolmogorov se rsument alors comme suit : pour tous rels positifs t et t P (t + t ) = P (t)P (t ) A tout instant t, la somme de chaque ligne de P (t) vaut 1 (cest la somme dune srie). On peut donc voir une chane de Markov en temps continu comme une famille de matrice (P (t))t0 satisfaisant lquation ci-dessous. Nanmoins, il convient dajouter une hypothse de rgularit, savoir : (i, j) IN 2 , pij (t) ij t0 cest--dire : lim P (t) = I
t0

I est la matrice identit. On parle alors de processus de Markov standard. Gnrateur innitsimal : La matrice A dnie par : A = P (0) = lim P (t)I t
t0+

est appele gnrateur innitsimal du processus de Markov temps continu. 128

3.9. Processus de Markov On a donc : p (t) aij = lim ijt si i = j


t0+

aii = lim

t0+

pii (t)1 t

sinon

Et on peut crire les dveloppements limits lordre 1 : pij (t) = aij t + o(t) Si le processus est dans ltat i initialement, la probabilit quelle lait quitt linstant t est environ aii t. Le coecient positif -aii le taux instantan de dpart de ltat i. En reprenant les quations prcdentes, on montre par ailleurs que : i IN aii =
j=i

aij

En dautres termes, la somme de chaque ligne de A est nulle. Processus de Poisson : une chane de Markov en temps continu est compltement dnie partir de son gnrateur innitsimal A et de la distribution initiale p(0). Un processus de Poisson est une chane de Markov en temps continu (N (t))t0 valeurs dans N de gnrateur A tel que : aii = ai,i+1 = aij = 0 sinon On dit alors que le processus est de densit ou de taux . Remarques : Concernant la condition initiale, on supposera gnralement que N0 = 0, i.e p(0) =0 On note ce processus (N (t))t0 plutt que (X(t))t0 , car Nt correspond souvent au nombre dvnements qui sont survenus entre linstant 0 et linstant t, par exemple le nombre de voitures arrivant un page, les appels un central tlphonique, les missions de particules radioactives. Cest pourquoi on lappelle aussi processus de comptage. Loi du nombre de points dun processus de Poisson dans un intervalle donn : Soit Pn (t) la probabilit que exactement n vnements arrivent dans un intervalle de longueur t,cest--dire, Pn (t) = P (N (t) = n) . On a, pour tout n 0, 1, 2, ... 0 Pn (t) =
(t)n t n! e

129

3. Systmes stochastiques Nombre moyen de points dun processus de Poisson dans un intervalle de longueur t : Pour tout t 0 E [N(t)] = t Ainsi, le nombre moyen dvnements par unit de temps est donn par . Il y a en fait un lien trs fort entre un processus de Poisson et la loi exponentielle. Pour cela, on considre le temps qui spare loccurrence de deux vnements conscutifs dun processus de Poisson. Loi des interarrives dun processus de Poisson : Pour chaque x 0, P ( x) = 1 ex Ainsi, le temps qui spare loccurrence de deux points conscutifs dun processus de Poisson dintensit est distribu selon une loi exponentielle de paramtre . Proprit sans mmoire de la loi exponentielle : P (X > x + y\X > x) = P (X > y) Exemples de Processus Markoviens de sauts Une machine est soit en bon tat de fonctionnement, tat 1, ou bien en panne, tat 0. Lorsquelle est en panne, on appelle un rparateur, qui met un temps alatoire la rparer. Dans ce cas E= 0,1 est un espace dtats nis. On observe les arrives un page dautoroutes partir dun instant initial t = 0. Dans ce cas lespace d.tats est E =N et chaque trajectoire est croissante. On tudie lvolution dune population au cours du temps : celle-ci peut augmenter (naissance) ou diminuer (mort). Ici encore lespace dtats est E Dans ces situations, on sintresse surtout la convergence en loi de processus (X(t))t0 , cest--dire quon veut savoir sil existe une loi de probabilit = [0 , 1 , ...] sur E telle que : i E; P(Xt = i) i
t+

Dans la gure 1, on observe quelques exemples de trajectoires de processus alatoires.

File dattente
Introduction Une le dattente est constitue de clients qui arrivent de lextrieur pour rejoindre cette le, de guichets o les clients vont se faire servir par des serveurs. 130

3.9. Processus de Markov

Fig. 3.1: Exemples des trajectoires de processus alatoires

Dans certains cas les clients attendent dans une salle dattente de capacit limite. Un client servi disparat. Les instants darrive des clients et les temps de service sont alatoires. On suppose que le premier arriv est le premier servi (discipline FIFO : First In First Out).La thorie de ces les sest dveloppe pour la modlisation des centraux tlphoniques : un central recueille tous les appels dune zone gographique donne et les met en relation avec les correspondants. Les caisses dun hypermarch donnent un exemple dj assez compliqu de le dattente. Un autre exemple important est donn par la le lentre dun lment dun systme informatique (Unit centrale CPU, imprimante, ...) lorsque les travaux qui arrivent se mettent en attente avant dtre traits par cet lment. Une le dattente est dcrite par la loi dinterarrives des clients, la loi des temps de service, le nombre de serveurs, la taille maximale. La taille du systme un instant donn est le nombre de clients en train dtre servis et dattendre. Nous supposerons toujours que les interarrives sont des variables alatoires indpendantes et de mme loi, indpendantes des temps de service, eux mmes indpendants et de mme loi. Pour les les simples, on utilise les notations de Kendall : Loi dinterarrive / Loi de service / Nombre de serveurs / Taille max. Les lois sont notes symboliquement : M lorsquelles sont exponentielles (M pour Markov), G (G pour Gnral) sinon. La le M/M/1 On considre une le M/M/1, donc daprs la notation de Kendall donne en 131

3. Systmes stochastiques haut, il sagit dune le un serveur. Les clients arrivent des instants successifs selon un processus de Poisson de paramtre . Ils se mettent en le dattente et sont servis selon leur ordre darrive. Le temps de service pour chaque client est une variable alatoire de loi exponentielle de paramtre . Toutes les variables alatoires qui interviennent sont indpendantes. On considre le processus (X(t))t0 qui reprsente le nombre de clients en attente (y compris le client en train dtre servi) au temps t . Cest un processus de sauts valeurs dans N. Quand un client arrive, le processus saute de +1 et quand un client sen va la n de son service, le processus saute de -1. Si un certain instant le processus saute et prend la valeur i (i > 0), il va rester en i un temps alatoire qui vaut inf (U1 , U2 ) o U1 est le temps ncessaire pour larrive du prochain client et U2 est le temps ncessaire pour la n du service en cours. Or ces variables alatoires sont indpendantes de lois exponentielles de paramtre et : Le temps de sjour dans ltat i sera donc une variable alatoire de loi exponentielle de paramtre + . La probabilit que le saut suivant soit de +1 est la probabilit que U1 soit plus petite que U2 , cest--dire, + , tandis que la probabilit pour que le saut soit de -1 vaut de la mme manire + . Si un certain instant le processus saute et prend la valeur 0, il va rester en 0 un temps alatoire qui vaut U1 o U1 est le temps ncessaire pour larrive du prochain client, cest--dire un temps alatoire de loi exponentielle de paramtre . Le saut lissue de ce temps est ncessairement de +1. On a bien la description dun processus markovien de sauts. Soit = lintensit de trac. Ce rapport dnit le taux dutilisation ou doccupation dun serveur. La distribution stationnaire du nombre de clients dans la le M/M/1 est donc gomtrique. La probabilit stationnaire davoir n clients dans le systme (le dattente + service) est donne par lexpression suivante : Pn = (1 )n , t Soit L la moyenne de la distribution gomtrique. L reprsente ainsi le nombre moyen de clients dans le systme.
+ +

L = E(n) =
n=0

nPn =
n=0

n(1 )n =

La le M/M/1 est dcrite par un processus Markovien de saut. Soit Xt le nombre total de clients dans le systme linstant t, cest--dire le nombre de clients dans la le plus le nombre de clients en train dtre servis. Le processus Xt ,t IR+ valeurs dans N est un processus de Markov de gnrateur : A(n, n + 1) = , A(n, n 1) = si n > 0 et A(n, m) = 0si | n m| 2

132

3.10. Processus de Wiener (ou mouvement brownien) Analyse du comportement de la le M/M/1 On se propose dutiliser une fonction qui permet de simuler un systme avec le dattente M/M/1. Larrive du systme est dtermine par un processus de poisson dintensit . Le temps de service poisson est dintensit . Les entres du systme sont : n (nombre de sauts), (intensit darrive) et (intensit de temps de service), Les sorties du systme sont : le temps de saut cumulative ainsi que la longueur de systme. Pour tudier lvolution du systme, on dnit Zn la chane de matrice P associe au processus de saut Xt (nombre alatoire de clients dans le systme), et soient Ui des variables indpendantes quidistribues valeurs -1,1 telles que : P {Ui = 1} = + et P {Ui = 1} = + La forme rcurrente : Zn+1 = |Zn + Un+1 | dnit une chane de Markov de matrice de transition P. Trois cas peuvent se prsenter. 1er cas : < Dans la gure 2, le dbit moyen darrive est strictement infrieur au dbit maximum de service. Le nombre alatoire Xt de personnes dans le systme est un processus rcurrent positif : il prend en presque sr (p.s) une innit de fois toute valeur arbitrairement grande et une innit de fois la valeur zro. Un rgime stationnaire stablit. Ainsi, en rgime stationnaire, la probabilit de trouver n clients dans le serveur est Pn . Lexpression rgime stationnaire signie quon a attendu assez longtemps pour oublier la situation initiale (le vide par exemple). On a donc convergence en loi (X(t))t0 de vers une variable alatoire X. 2me cas : > Dans la gure 3, la le sature. Le nombre de clients dans la le tend presque srement vers linni. Cest le cas transitoire. 3me cas : = Dans la gure 4, le nombre alatoire Xt de personnes dans le systme est un processus rcurrent nul. La le se vide rgulirement mais le temps moyen entre deux retours zro est inni et il ny a pas de convergence en loi du nombre de clients dans la le. Aucun rgime stationnaire ne stablit.

3.10

Processus de Wiener (ou mouvement brownien)

Introduction
Le mouvement brownien est le plus clbre et le plus important des processus stochastiques et ceci pour plusieurs raisons. Historiquement, la dcouverte du processus qui sest faite durant la priode 19001930 et laquelle sont attachs les noms de Bachelier, Einstein, Wiener et Kolmogorov, fut le premier cas o 133

3. Systmes stochastiques

Fig. 3.2: Simulation pour =0.8 et =1

Fig. 3.3: Simulation pour =0.9 et =0.6

134

3.10. Processus de Wiener (ou mouvement brownien)

Fig. 3.4: Simulation pour =0.9 et =0.9

le calcul des probabilits sappliquait la description dun phnomne physique indpendamment de tout jeu de hasard, savoir la description du mouvement dune petite particule dans un liquide ou gaz soumise des chocs molculaires dus lagitation thermique. Le champ dapplication du mouvement brownien est beaucoup plus vaste que ltude des particules microscopiques en suspension et inclut la modlisation du prix des actions boursires, du bruit thermique dans les circuits lectroniques, du comportement limite des problmes de les dattente et des perturbations alatoires dans un grand nombre de systmes physiques, biologiques ou conomiques.

Proprits du Processus de Wiener


Soit le processus de Wiener normalis W(t), dni sur (, A, P ), index sur valeurs dans Rd . W(t) est un processus gaussien, du second ordre, centr, trajectoires continus p.s. De plus, il vrie les proprits suivantes : Les processus (W1 , ..., Wd ) sont indpendants dans leur ensemble W(0)=0 p.s Pour tout 0 t t , laccroissement Wt,t = Wt Wt est une variable T alatoire gaussienne,centre, de covariance RW = E(Wt,t Wt,t ) t,t Ses accroissements Wt,t sont indpendants et stationnaires Par ailleurs, la drive au sens des processus gnralis du processus de Wiener norma lis est le bruit blanc gaussien normalis W = N En conclusion, ce processus est un objet mathmatique remarquable sur lequel saccumulent un nombre considrable de proprits : R+ Cest le seul processus ( un changement de repre prs) accroissement 135

3. Systmes stochastiques indpendants stationnaires trajectoires continues, Il est reli la fois la thorie des processus stationnaires, au bruit blanc et la thorie des fonctions harmoniques appeles aussi thorie du potentiel (fonctions relles sur Rd telle que f = 0), Tous les processus de Markov trajectoires continues peuvent se reprsenter partir du mouvement brownien, cest la thorie des quations direntielles stochastiques. La gure 5 dcrit lvolution de la trajectoire du mouvement brownien.

Fig. 3.5: Trajectoire dun mouvement brownien

3.11

Problmes et exercices pour lIngnieur

Esprance mathmatique, variance


Exercice 3.11.1. On eectue la mesure dune grandeur x laide de deux capteurs dirents. Soient z1 et z2 les mesures obtenues. On admet quelles sont respectivement pollues par des bruits additifs v1 et v2 supposs indpendants 2 2 de moyennes nulles et de variances respectives 1 et 2 . Faire la synthse dun estimateur optimal de la grandeur x. Solution : On crit : z1 = x + v 1 et z2 = x + v 2 . 136

3.11. Problmes et exercices pour lIngnieur Si x est la valeur estime de x, on pose x = az1 + bz2 . a) On exprime que lestimateur est sans biais soit : E[x] = x, do : E[az1 + bz2 ] = aE[z1 ] + bE[z2 ] = ax + bx = (a + b) x x. Soit : a + b = 1 = a = 1 b . et x = (1 b)z1 + bz2 . a) On minimise e la variance de lerreur destimation. Soit e lerreur destimation, on a e = x x, do la variance de e : J = E[e2 ] = J = E[(x x)2 ] Calculons lerreur destimation : e = x x = x (1 b)z1 bz2 = x (1 b) (x + v1 ) b (x + v2 ) , do : e = bv2 (1 b) v1 . Il vient :
2 2 J = E (bv2 (1 b)v1 )2 = J = (1 b)2 1 + b2 2 .

minJ dJ = 0 db
b

do :
1 b = 2 +2 ; 1 2 on en dduit : 2 2 a = 2 +2 ; 1 2 et enn : 2 2 x = 2 +2 z1 +

On peut calculer la variance de lerreur destimation : 2 2 1 2 2 =J e min = 2 + 2 . 1 2 On voit que e est infrieur 1 et 2 . Remarque : Ce rsultat peut aussi tre obtenu en utilisant la mthode des moindres carrs 2 2 moyennant une normalisation des variances 1 et 2 . On obtient : 1 1 1 z1 = 1 x + e1
1 2 z2

2 e

2 1 2 + 2 1 2

z2

=
v1 1

1 2 x

+ e2

avec : e1 = et 137

3. Systmes stochastiques e2 = do e1 = e2 = 1. On pose Y =


z1 1 z2 2 v2 2 ;

, H =

1 1 1 2

,e =

e1 e2

et = x.

do le modle : Y = H + e. et la solution : = (H T H)1 H T Y =

2 2 z 2 1 + 2 1 2

2 1 z . 2 1 + 2 2 2

Probabilit conditionnelle, maximum de vraisemblance, esprance mathmatique conditionnelle


Exercice 3.11.2. Soit le modle linaire Y = H + e, avec vecteur de paramtres estimer, Y vecteur des observations, H une matrice dterministe connue et e vecteur de bruit suppos gaussien de moyenne nulle et de matrice de covariance E eeT = 2 I, I tant la matrice unit. On considre la variable alatoire Y / et la probalit conditionnelle p(Y /). Calculer la valeur de qui rend cette probabilt maximale. Etudier la statistique de cet estimateur. Rponse Le vecteur e tant gaussien, il sen suit que Y / est aussi gaussien. Calculons sa moyenne et sa matrise de covariance P . E [Y /] = E [(H + e) /] = H + E [e/] = H. P = E (Y H) (Y H)T / = E eeT = 2 I. Y / tant gaussien sa densit de probabilit est donne par : T 1 1 1 ((Y H)T (Y H)) p(Y /) = Ke( 2 ((Y H) P (Y H))) = Ke 22 . M axp (Y /)
p(Y /)

= 0

(ln (p (Y /))) = 0

d o` : u

(Y H)T (Y H) = 0

On obtient : = (H T H)1 H T Y. Lerreur destimation est donne par : e = . Soit : e= (H T H)1 H T Y = (H T H)1 H T (H + e) = (H T H)1 H T e. On calcule la moyenne de lerreur destimation : E [e] = (H T H)1 H T E [e] = 0. 138

3.11. Problmes et exercices pour lIngnieur Puis sa variance : E e eT = E (H T H)1 H T e (H T H)1 H T e


T

= (H T H)1 H T E eeT H(H T H)1 , Do : E e eT = 2 (H T H)1 .

Estimation dun paramtre


Exercice 3.11.3. On procde la mesure de la concentration z en sel dun lac durant lt (en absence de pluie). Une mesure est eectue tous les jours midi. Les mesures sont entaches de bruit v suppos gaussien ayant ses composantes indpendantes entre elles, une moyenne nulle et une variance 2 . On donne la relation z = z0 et + v o t est le temps de mesure exprim en jours et une constante positive assez faible. Journe e 6 7 8 9 10

z(g/l) 5.0457 5.0543 5.0629 5.0716 5.0802 1. On suppose connu gal 0.001 et on demande : 1. 1. Estimer la valeur de la concentration initiale z0 . 1. 2. Donner une estimation de 2 . 1. 3. Calculer la variance de lerreur destimation. 2. En fait est inconnu, proposer un estimateur de z0 et de .

Estimation de la variance de bruit


Exercice 3.11.4. On admet les hypothses de lexercice 2 et on demande de proposer un estimateur de la variance de bruit puis de calculer dans ces conditions la variance de lerreur destimation. Solution Rappelons que dans lexercice 2, nous avons tabli lexpression de la variance de e (erreur destimation) : E e eT = 2 (H T H)1 . Cette expression sexprime en fonction de 2 , variance du bruit, souvent inconnue. Dans cet excercice il est propos destimer cette variance. Pour cela, considrons le terme M = Y H appel terme rsiduel : 1 M = Y H = (H + e) H H T H HT Y do M = H + e H H T H soit :
1

H T (H + e) = e H H T H

H T e,

139

3. Systmes stochastiques M = I H HT H Calculons : E Y H


T 1

H T e = F e.

Y H

= E (F e)T (F e) = E eT F T F e .

Remarquons au passage que la matrice F est symtrique et idempotente, do : E Y H E


T

Y H
T

= E eT F e = E eT I H H T H Y H = E eT e E eT H H T H = N 2 E eT H H T H

HT e ; HT e .

Soit : Y H

Soit N la dimension du vecteur e, il vient : E Y H


T

Y H

HT e .

Le calcul du deuxime terme de lexpression prcdente peut se faire en 1 remarquant que lexpression G = eT H H T H HT e est un scalaire et par suite : 1 1 E [G] = E eT H H T H H T e = E trace eT H H T H HT e . Or, on sait que si les produits AB et BA existent : trace(AB) = trace(BA) il vient : 1 1 trace eT H H T H H T e = trace H T H H T eeT H . Do : 1 1 E [G] = E trace H T H H T eeT H = trace E H T H H T eeT H Soit : E [G] = trace = trace HT H HT H
1 1

H T E eeT H H T 2 IN H = n 2 .

n tant le nombre de colonne de H, cest dire le nombre de paramtres estimer. Il vient : E Y H


T

Y H

= (N n) 2 .

En dnitive, nous pouvons choisir lexpression suivante comme estimateur de la variance du bruit : T 2 = (Y H ) (Y H ) . N n

Processus gaussien markovien, exprience mathmatique, Matrice de covariance


Exercice 3.11.5. Soit lquation dtat Xk+1 = Ak Xk + k vk et la condition initiale X(0) = X0 .Avec Xk ltat, u(k) la commande suppose dterministe, vk un bruit blanc gaussien dni par E[vk ] = 0 et E[vi vj ] = Qij . X0 ltat initial 140

3.11. Problmes et exercices pour lIngnieur est une variable alatoire gaussienne donne par E[X0 ] = m0 et cov(X0 ) = P0 . T On suppose que E[X0 vk ] = 0 k. Q1 : Montrer que Xk est un processus gaussien markovien. Q2 : Calculer lsprance mathmatique de Xk+1 . Q3 : Montrer que la matrice de covariance de Xk+1 donne par Pk+1 = Ak Pk AT + k QT . k k Q4 : Calculer C(k + n, k) la matrice de covariance entre deux instants tk et tk+n . Rponse : Q1 On a : Xk = Ak1 Xk1 + k1 vk1 , soit en remplaant Xk par son expression en fonction de Xk1 : Xk = Ak1 (Ak2 Xk2 + k2 vk2 ) + k1 vk1 = Ak1 Ak2 Xk2 + Ak1 k2 vk2 + k1 vk1 , et en poursuivant le mme processus : Xk = X0 + Ak1 ....A1 0 v0 + Ak1 ....A2 1 v1 + .....k1 vk1 . Si on pose : A(k, i) = Ak1 Ak2 ...Aki avec A(k, k) = I, il vient : Xk = A(k, 0)X0 + A(k, 1)0 v0 + A(k, 2)1 v1 + .....k1 vk1 . Do :
k1 i=0

Xk = A(k, 0)X0 +

A(k, i + 1)i vi .

On en dduit que Xk est indpendant de vk il en est de mme pour Xk1 , Xk2 , . . . Dans ce cas, on peut crire P (Xk+1 , Xk , Xk1 , ..., X0 ) = P (Xk+1 /Xk ). Xk est donc markovien car la connaissance de Xk1 sut pour calculer Xk , tout le pass est rsum dans ltat prcdent. Xk est aussi gaussien car il est ob tenu par une transformation linaire de vecteurs alatoires gaussiens. Q2 On crit : E[Xk+1 ] = E[Ak Xk + k vk ] = Ak E[Xk ] + k E[vk ] = Ak mk ; On en dduit : mk+1 = Ak mk , do : mk = Ak1 mk1 = Ak1 (Ak2 mk2 ) = Ak1 (Ak2 (Ak3 ((...)))) = A(k, 0)m0 . Q3 Cov(Xk+1 ) = Pk+1 = E[(Xk+1 mk+1 )(Xk+1 mk+1 )T ]; 141

3. Systmes stochastiques Or : Xk+1 mk+1 = Ak (Xk mk ) + k vk T Pk+1 = E[(Ak (Xm mk ) + k vk )((Xk mk )T AT + T vk ]; k k do : Pk+1 = Ak Pk AT + k QT k k Q4 C(k + n, k) = E[(Xk+n mk+n )(Xk mk )T ] soit : C(k + n, k) = E A(k + n, k)(Xk mk )+
k+n1

A(k + n, i + 1)i vi (Xk mk )T


i=k

Do : C(k + n, k) = A(k + n, k)Pk . Un calcul analogue conduirait : C(k + n, k) = Pk AT (k + n, k).

Esprance mathmatique, Processus scalaire, Matrice de covariance, Processus stationnaire, Processus gaussien
Exercice 3.11.6. On considre le processus scalaire suivant xk+1 = a xk + vk avec vk bruit blanc gaussien tel que E[vk ] = 0, E[vi vj ] = qij ltat initial x0 est une variable alatoire gaussienne tel que E[x0 ] = 0; E[x2 ] = P0 et E[x0 vk ] = 0k. 0 Q1 : Calculer la variance Pk+1 de xk+1 en fonction de P0 , a et q. Q2 : En dduire la limite quand k tend vers linni de Pk+1 , on suppose que |a| < 1 Q3 : Montrer alors que le processus xk+1 est stationnaire. Q4 : Comment choisir E[x2 ] pour que le processus devient stationnaire 0 linstant initial. Rponse : Q1 Calculons dabord lesprence mathmatique de xk+1 : E[xk+1 ] = E[a xk +vk ] = aE[xk ]+0 = aE[a xk1 +vk1 ] = a2 E[xk1 ] = ..... = ak+1 E[x0 ] = 0. Do : Pk+1 = E[(xk+1 E [xk+1 ])2 ] = E[x2 ] k+1 soit : 2 Pk+1 = E[(a xk + vk )2 ] = a2 E[x2 ] + E[vk ] = a2 Pk + q. k On en dduit ( par exemple en utilisant la transforme en z) : q Pk+1 = a2(k+1) P0 + 1a2 (1 a2(k+1) ) Q2 142

3.11. Problmes et exercices pour lIngnieur Si k et |a| < 1, ilvient : Pk+1 P = Q3 On vrie E[xk+1 ] = 0; et lim E[x2 ] = P = cst , k+1
k

q . 1a2

lLe Processus est donc Stationnaire. Q4 : Il sut de prendre q P0 = 1a2 . En eet, dans ce cas, 2 E[x2 ] = E[(a x0 + v0 )2 ] = E a2 x0 + 2ax0 v0 + v0 = a2 p0 + q ; 1 do : q q E[x2 ] = 1a2 = E[x2 ] = 1a2 i. 1 i

Esprence mathmatique, matrice de covariance, processus stationnaire


Exercice 3.11.7. On donne lquation dtat Xk+1 = Ak Xk + vk , mme hypothses que lexercice 8 avec Ak = A = cste et k = cste Q1 : Calculer mk = E[xk ] ainsi que la matrice de covariance Pk de Xk en fonction de m0 et P0 Q2 : Quelles conditions doit-on imposer pour que le processus soit stationnaire Rponse : Q1 : mk = E[xk ] = E[A Xk1 + vk1 ] = Amk1 mk = Amk1 = A2 mk1 = .... = Ak m0 Pk = E[(xk mk )(xk mk )T ] = E[(A(xk1 mk1 ) + vk )(A(xk1 mk1 ) + vk )T ] Pk = APk1 AT + QT Pk = Ak P0 (AT )k +
k1 i=0

Ai QT (AT )i

Q2 : Processus stationnaire impose mk et Pk indpendants de m0 et P0 quand k tend vers linni. Il vient alors : 1. lim Ak nie, A est stable (valeurs propres lintrieur du cercle unit).
k

2. lim Pk nie, P solution de P = AP AT + QT


k

143

3. Systmes stochastiques

Variable alatoire conditionnelle


Exercice 3.11.8. Soit le processus gaussien markovien : Xk+1 = Ak Xk + k vk .On admet les hypothses de lexercice 8. Q1 : Calculer la moyenne de la variable alatoire conditionnelle Xk+1 /Xk . Q2 : Calculer la matrice de covariance de cette variable conditionnelle. Q3 : En dduire sa densit de probabilit p (Xk+1 /Xk ) .

Rponse :

Q1 : E [Xk+1 /Xk ] = Ak Xk + k E[vk ] = Ak Xk .

Q2 : T E (Xk+1 Ak Xk ) (Xk+1 Ak Xk )T /Xk = E[k vk vk T /Xk ] = k QT . k k Q3 : Xk+1 /Xk tant gaussien, on peut crire : 1 (Xk+1 Ak Xk )T k QT k 2 (Xk+1 Ak Xk )).

p (Xk+1 /Xk ) = (2)

1
n 2

exp(

det(k QT ) k

Vecteur alatoire gaussien, transformation linaire de v.a.g.


Exercice 3.11.9. Soit X une variable alatoire gaussienne , et Z obtenue par la transformation linaire Z=AX+b, avec A et b dterministe. Montrer que Z est une variable alatoire gaussienne.

Rponse :

On crit la fonction caractristique de Z : T T T T Z () = E ejv Z = E ejv (AX+b) = ejv b E ejv AX . or X est une variable alatoire gaussienne, sa fonction caractristique scrit : 1 T T T X (u) = E eju X = e(ju E[X] 2 u P u) , avec P est la matrice de covariance de X. On en dduit : 1 T T T T T Z (v) = ejv b X (AT v) = ejv b e(jv AE[X] 2 v AP A v) ; soit : 1 T T T Z (v) = e(jv (AE[X]+b) 2 v (AP A )v) . On en dduit que Z est une variable alatoire gaussienne de moyenne E[Z] = AE[X] + b et de matrice de covariance PZZ = AP AT .

144

3.11. Problmes et exercices pour lIngnieur

Partition dune v.a.g


Exercice 3.11.10. Soit J une variable alatoire gaussienne et X, Y une partition sur J : J = X Y montrer que X etY sont gaussiens.

Rponse : On peut crire X = (I : 0)J = AJ et Y = (I : 0)J = BJ . X et Y scrivent comme combinaison linaire de J, qui est une variable alatoire gaussienne, X etY sont gaussiens.

Esprance mathmatique conditionnelle, variable alatoire gaussienne, matrice de covariance


Exercice 3.11.11. Soient X et Y deux vecteurs alatoires gaussiens, on pose 1 W1 = X + M Y et W2 = Y avec M = PXY PY Y o PXY et PY Y sont respectivement matrices de covariances de X, Y et de Y . On forme le vecteur les W = W1 W2 .

Q1 : Montrer que W1 et W2 sont indpendants. Q2 : Calculer la matrice de covariance de W . Q3 : Exprimer X en fonction de W1 et Y et en dduire la moyenne ainsi que la variance de la variable conditionnelle X/Y. Q4 : Dduire que E[X/Y ] est une variable alatoire gaussienne, fonction linaire de Y et que E[X/Y ] est indpendante de Y .

Rponse : Soit :

Q1 : PW1 W2 = E (W1 E[W1 ]) (W2 E[W2 ])T

PW1 W2 = E (X + M Y E [X + M Y ]) (Y E[Y ])T = E (X E [X] + M (Y E[Y ])) (Y E[Y ])T . Do :


1 PW1 W2 = PXY + M PY Y = PXY PXY PY Y PY Y = 0.

Q2 : La matrice de covariance de W = PW W = W1 W2 est donne par : PW1 W2 PW2 W2 .

PW1 W1 PW2 W1

145

3. Systmes stochastiques Or

PW1 W1 = E (W1 E[W1 ]) (W1 E[W1 ])T = PXX + PXY M T + M PY X + M PY Y M T ;

soit
1 PW1 W1 = PXX PXY PY Y PY X .

Puis : PW1 W2 = 0; PW2 W1 = 0; et Do PW W Q3 : On a W1 = X + M Y ; do : X = W1 M Y. On en dduit :


1 E[X/Y ] = E[W1 ] M Y = E[W1 ] + PXY PY Y Y.

PW2 W2 = PY Y 1 PXX PXY PY Y PY X = 0

0 PY Y

Or :
1 PXY PY Y E [Y ] ; do :

E[W1 ] = E[X + M Y ] = E[X] + M E[Y ] = E[X]

1 E[X/Y ] = E[X] + PXY PY Y (Y E [Y ]). La variance de X/Y est donne par : PX/Y = E (X E[X/Y ]) (X E[X/Y ])T /Y . Or : 1 X E[X/Y ] = X E[X] PXY PY Y (Y E [Y ]) = W1 E[W1 ]; do 1 PX/Y = PW1 W1 = PXY PXY PY Y PY X . Q4 : Lexpression tablie prcdemment de E[X/Y ] montre cette dernire est obtenue par transformation linaire de la variable alatoire gaussienne Y . Il sen suit que X/Y est aussi une variable alatoire gaussienne. Lexpression X E[X/Y ] = W1 E[W1 ] et lindpendance entre W1 et Y prouvent que X E[X] est indpendant de Y .

146

3.11. Problmes et exercices pour lIngnieur

variable alatoire conditionnelle, Estimation des paramtres dans un modle statique, Variables gaussiennes, Probabilit conditionnelle, moyenne, matrice de covariance
Exercice 3.11.12. On considre le modle linaire Y = H + e, avec Y un vecteur des observations, le vecteur des paramtres estimer, e une variable alatoire gaussienne caractrise par E [e] = 0, E eeT = 2 I et H une matrice de transformation connue. On suppose que H est dterministe. Q1 : Montrer que la variable Y / est gaussienne. Calculer sa moyenne et sa matrice de covariance. Q2 : En dduire lexpression de la densit de probabilit conditionnelle p (Y /) . Q3 : Montrer que p (Y /) est maximale pour = (H T H)1 H T Y. Q4 : Montrer que cet estimateur nest pas biais si H et e sont indpendants et E[e]=0. Rponse : Q1 : Y / est une transformation linaire de la variable alatoire gaussienne e. Elle est aussi gaussienne. E [Y /] = E [H/] + E[e/] = H + E[e] = H. E (Y H)(Y H)T / = E eeT = 2 I. Q2 : Y / est une variable alatoire gaussienne, on en dduit : p (Y /) = K exp( 1 (Y H)T 2 I 2 Q3 : p (Y /) est maximale si :
p(Y /) 1

(Y H)).

= 0

(Log (p (Y /))) = 0

do : = (H T H)1 H T Y. Q4 : E[] = E[(H T H)1 H T Y ] = E[(H T H)1 H T (H + e)] do : E[] = E[ + (H T H)1 H T e] = E[] + (H T H)1 H T E [e] Do lestimateur est donc sans biais.

E[] = ;

Puissance spectrale, Extration de signal


Exercice 3.11.13. Un signal inconnu f (t) est corrompu par un bruit additif v(t). On mesure x(t) et on a la relation x(t) = f (t) + v(t). On admet que f (t) et v(t) sont stationnaires non corrls et de puissance spectrale connue. On cherche 147

3. Systmes stochastiques raliser un ltre linaire dont la sortie f (t) est une estime de f(t) au sens du critre J = E f (t) f (t)
2

Solution : Soit h(t) la rponse impulsionnelle du ltre linaire on a : + f (t) = x(t )h()d. Le critre scrit alors sous la forme : J =E Il est minimal si : J h = 0 do : E f (t) x(t )h()d x(t ) = 0. On notera Rf x la fonction dintercorrlation de f (t) et x(t) : Rf x ( ) = E [f (t)x(t )] , et Rxx la fonction dautocorrlation de x(t) : Rxx ( ) = E [x(t)x(t )] . Il sen suit : + J = Rf x ( ) Rxx ( )h()d = 0. Soit en passant la transforme de Fourier : Sf x () Sxx ()H() = 0. Do : Sf x () H() = Sxx () . Or f (t) et v(t) sont orthogonaux : Sxx () = Sf f () + Svv (); do : Sf x () H() = Sf f ()+S () .
vv

f (t)

+ x(t

)h()d

Intgrale stochastique, processus de Wiener


Exercice 3.11.14. On donne le processus de Wiener dni par lquation stochastique dx = A(t)xdt + G(t)dv(t), on demande de calculer la moyenne et la matrice de covariance de x(t). dv(t) est un accroissement innitsimal du mouvement brownien, ou processus de Wiener. Envisager le cas stationnaire. Rponse : On doit rappeler les proprits de lintgrale stochastique Si 1. E 2. E 148 E |f (t, )|
b a f 2

f (t)dv(t). alors :

< et E [dv] = 0 et E (dv)

2 dt

(t, ) dv(t) = 0.
T b a f2 (t, ) dv(t)

b a f1 (t, ) dv(t)

= 2

b a E

[f1 (t, ) f2 (t, ) dt] .

3.11. Problmes et exercices pour lIngnieur L intgration lquation stochastique conduit lexpression suivante qui contient une intgrale stochastique :
t

x(t) = (t, t0 )x(t0 ) +


t0

(t, )G()dv().

(t, t0 ) est la matrice de transition solution de lquation direntielle matricielle : d(t, t0 ) = A(t)(t, t0 ). dt Revenons lexercice et calculons lexprence mathmatique de x(t).
t

m(t) = E [x(t)] = E (t, t0 )x(t0 ) +


t0

(t, )G()dv()

Soit :
t

m(t) = (t, t0 )E [x(t0 )] + E


t0

(t, )G()dv() .

Il vient alors : m(t) = (t, t0 )m0 . La matrice de covariance P (t) est dnie par : P (t) = E (x(t) m(t)) (x(t) m(t))T . Le centrage de la variable alatoire x(t) donne :
t

x(t) m(t) = (t, t0 ) (x(t0 ) m0 ) +


t0

(t, )G()dv();

do :
t

P (t) = E

(t, t0 ) (x(t0 ) m0 ) +
t0

(t, )G()dv()
t T

(t, t0 ) (x(t0 ) m0 ) +
t0

(t, )G()dv()

149

3. Systmes stochastiques Soit : P (t) = (t, t0 )P (t0 ) T (t, t0 )+


t

E
t0

(t, )G()dv()
t0

(t, )G()dv()

Le deuxime terme se dveloppe comme le montre la deuxime propit de lintgrale stochastique gnralise au cas vectoriel : E
t0 t T

(t, )G()dv()
t0

(t, )G()dv()

(t, )G()QGT ()T (t, )d.


t0

On obtient nalement :
t

P (t) = (t, t0 )P (t0 ) T (t, t0 ) +


t0

(t, )G()QGT ()T (t, )d.

Si on drive lexpression prcdente, on obtient : dP (t) = A(t)(t, t0 )P (t0 ) T (t, t0 )+ dt (t, t0 )P (t0 ) T (t, t0 )AT (t) + G(t)QGT (t)+
t

A(t)
t0 t

(t, )G()QGT ()T (t, )d + (t, )G()QGT ()T (t, )d AT (t).

t0

Il vient :
dP (t) dt

= A(t)P (t) + P (t)AT (t) + G(t)QGT (t). A(t) = A

Dans le cas stationnaire : et G(t) = G. Il est facile dtablir : (t, t0 ) = eA(tt0 ) . E [x(t)] = eA(tt0 ) E [x (t0 )] . 150

3.11. Problmes et exercices pour lIngnieur P (t) = eA(tt0 ) P (t0 ) eA


dP (t) dt
T (tt ) 0

t t0

eA(t) GQGT eA

T (t)

d.

= AP (t) + P (t)AT + GQGT .

Remarque : Si A est stable (valeurs propres parties relles ngatives),alors : la moyenne m(t) tend vers zro si t et la matrice de covariance P (t) converge vers une valeur constante P solution de lquation : AP + P AT + GQGT = 0.

151

EDO non-linaire

Wilfrid Perruquetti1
1 LAGIS

& INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve dAscq cedex, France. E-mail : Wilfrid.Perruquetti@ec-lille.fr

4.1

Introduction

Le calcul innitsimal (direntiel) a tout naturellement conduit les scientiques noncer certaines lois de la physique en termes de relations entre, dune part, des variables dpendantes dune autre variable indpendante (en gnral le temps) et, dautre part, leurs drives : il sagit l dquations direntielles ordinaires (en abrg, EDO). Lun des prcurseurs dans ce domaine fut Isaac Newton (1642-1727) qui, dans son mmoire de 1687 intitul Philosophiae naturalis principiae mathematica (les lois mathmatiques de la physique) crit : Data aequatione quotcunque uentes quantitae involvente uxiones invenire et vice versa (en langage moderne, il parle dquations diffrentielles). Ds lors, de nombreux modles de la physique ont ts noncs par lintermdiaire dEDO (dont, au XVIIe sicle, les quations dEuler-Lagrange pour les sytmes mcaniques). Nous donnons ci-dessous une liste non exhaustive de modles par des EDO tirs de divers domaines des sciences pour lingnieur.

Biologie
Une bote de Petri contient des bactries qui se dveloppent sur un substrat nutritif. En notant x le nombre de bactries, un modle simpli, dit modle logistique, est donn par : dx = ax(xmax x), (4.1) dt o a est une constante strictement positive et xmax est le nombre maximal de bactries pouvant survivre dans la bote de dimension donne. En eet, lorsquil 153

4. EDO non-linaire y a peu de bactries : x ax (croissance exponentielle) et, lorsque x est proche de xmax , la croissance est fortement ralentie puisque x 0. Une autre exemple clbre, le modle proie-prdateur de Volterra-Lotka, sera voqu lexercice 4.6.12.

Chimie
Les dirents bilans (de matire, thermodynamique) peuvent, sous leur forme simplie, sexprimer par des EDO. On considre par exemple une cuve alimente en produits chimiques A et B de concentrations respectives cA et cB par lintermdiaire de deux pompes de dbits volumiques respectifs u1 et u2 . Dans cette cuve, un mlangeur homognise les deux produits, qui ragissent selon la raction : nA A + nB B
k1

nC C,

k2

o nA , nB et nC sont les coecients stochiomtriques de chacun des composants. Le mlange est sous-tir par un orice de section s la base de cette cuve de section S = 1 m2 . Le bilan de matire conduit, en utilisant la relation de Bernouilli, : dh S = u1 + u2 2sgh, dt o h est la hauteur du mlange dans la cuve et g, lacclration de la pesanteur (9.81 ms2 ). Les lois de la cintique donnent la relation (sous lhypothse dune cintique de second ordre) : vcin = k1 cA cB + k2 c2 . C Ainsi, les conservations de chacun des composants donnent : d(hcA ) = u1 cA0 2sghcA nA vcin h, dt d(hcB ) = u2 cB0 2sghcB nB vcin h, dt d(hcC ) = 2sghcC + nC vcin h, dt avec cA0 = cA (entrant) et cB0 = cB (entrant) . En notant x = (h, hcA , hcB , hcC )T le vecteur dtat, on obtient le modle : x1 = u1 + u2 2sg x1 , 2 x2 = u1 cA0 2sg x2 nA (k1 x2 x3 +k2 x4 ) , x1 x1 (4.2) x = u c 2sg x n (k1 x2 x3 +k2 x2 ) , 4 3 2 B0 B x1 3 x1 x = 2sg x + n (k1 x2 x3 +k2 x2 ) . 4 4 C x1 4 x1 154

4.1. Introduction

Electricit
On considre un systme lectrique constitu dune rsistance R, dune inductance L et dune capacit C montes en triangle. On note respectivement iX et vX le courant et la tension dans la branche comportant llment X. On suppose que les lments L et C sont parfaitement linaires et que llment rsistif R obit la loi dOhm gnralise (vR = f (iR )). Les lois de Kircho permettent dobtenir : L diL = vL = vC f (iL ), dt C dvC = i = i . C L dt

(4.3)

Si dans cette EDO, dite quation de Linard, on considre le cas particulier o f (x) = (x3 2x), on abouti lquation de Van der Pol .

Electronique
Le montage PI (proportionnel-plus-intgral ) suivant :

Fig. 4.1: Montage PI avec amplicateurs oprationnels. a pour modle, sous des hypothses simplicatrices de linarit : Ti dus due = k(ue + Ti ), dt dt R4 R3 R1 C R6 Ti = , k= . R5 R2 R4 R1 C

Electrotechnique
Pour un moteur pas--pas ayant au rotor n dents de polarit Nord et autant de polarit Sud, les dirents bilans lectromagntiques (dans le repre dq dit 155

4. EDO non-linaire de Park) donnent : Ld did = vd Rid + nLq iq , dt diq Lq = vq Riq nLd id nmir , dt Cem = n(Ld Lq )id iq + nmir iq + Kd sin(n),

o m et ir sont linductance et le courant ctif du rotor, gnrant le ux (constant) mir d laimantation permanente ; id , iq , vd , vq sont les courants et tensions du stator [9]. Le bilan mcanique scrit : d = , dt d = Cem Ccharge . J dt

Mcanique
Si un systme mcanique est constitu de n lments relis entre eux par des liaisons parfaites (sans frottement), on aura la position du systme qui dpendra de n paramtres indpendants (coordonnes gnralises notes q1 , . . . , qn ). Pour crire les quations dEuler-Lagrange, il faut dterminer le lagrangien (dirence entre lnergie cintique et lnergie potentielle) : L = Ec E p , (4.4)

le travail lmentaire de chaque force interne et externe Di , ainsi que le travail des forces de frottement : D dqi , qi donnant lieu lnergie dissipe D. On obtient alors le systme dquations dEuler-Lagrange : d L L D ( ) + = Di . (4.5) dt qi qi qi
1 Notons que lnergie cintique Ec = 2 q T M (q)q, o M (q) est une matrice n n symtrique dnie positive, dpend des qi et de leurs drives qi , alors que lenergie potentielle Ep ne dpend que des qi . Pour un pendule pesant dangle 1 avec la verticale, on a L = 2 ml2 2 mgl(1cos()). Si on nglige les frottements, ceci conduit : g = sin(). (4.6) l Si de plus on tient compte dun frottement sec, on peut voir apparatre une discontinuit sur (qui peut ne pas tre dnie vitesse nulle). Aussi, pour ce type de modle, on est amen prciser la notion de solution et donner des conditions susantes dexistence et/ou dunicit de solution : ceci sera lobjet de

156

4.2. Equations direntielles ordinaires sous forme implicite la section 4.3, qui dveloppera plus particulirement les EDO du premier ordre. Les EDO sous forme implicite seront abordes la section 4.2. Au del des conditions dexistence, il est important pour lautomaticien de pouvoir caractriser les comportements asymptotiques de ces solutions et de disposer doutils danalyse permettant de les localiser et de caractriser lvolution temporelle des solutions vers ces ensembles. Enn, de nombreux systmes physiques font intervenir, dans la description de leurs dynamiques au moyen des EDO, des paramtres dont les variations peuvent conduire des modications qualitatives des solutions (bifurcations et, parfois, catastrophes ).

4.2

Equations direntielles ordinaires sous forme implicite

Dnitions
Une EDO sous forme implicite est une relation : F t, y, dy dk y ,..., k dt dt = 0, y Rm , (4.7)

o la fonction F est dnie sur un ouvert de R Rm(k+1) valeur dans Rm . Lordre de lEDO est lentier k correspondant la drive dordre le plus lev apparaissant dans (4.7). Notons que (4.1), (4.2) et (4.6) sont des EDO dordres respectifs 1, 1 et 2. Le thorme de la fonction implicite garantit que ce systme (4.7) de m quations peut se mettre (localement) sous forme explicite : dk y dy dk1 y = G t, y, , . . . , k1 , (4.8) dt dtk dt condition que : det (JF ) = 0, o JF est la matrice jacobienne de F cest--dire la matrice constitue des li ments aij = Fx , (i, j) {1, . . . , m}2 . dk

j dtk

En particulier, soit F est une fonction de classe C 1 par rapport chacune de ses variables, telle que F (t, x, z) = 0 admette p racines en la variable z. Si det( F (t0 ,x0 ) ) = 0, alors il existera p solutions locales dites rgulires, solutions z de F (t, x, x) = 0, x(t0 ) = x0 . Par contre si det( F (t0 ,x0 ) ) = 0, alors on ne z peut rien armer sans faire une tude approfondie et toute solution sera dite singulire. Par exemple y : t t2 /4, est une solution singulire de lquation . y 2 ty +y = 0 au voisinage de (y, y) = (0, 0). Par ailleurs, y : t sin(arcsinh(t)) est une solution rgulire de (1 + t2 )y 2 + (1 + y 2 ) = 0 au voisinage de (0, 0). 157

4. EDO non-linaire

Quelques quations particulires


Equations de Lagrange et de Clairaut Une EDO de la forme : x + tf dx dt +g dx dt = 0, (4.9)

est dite de Lagrange. Lorsque f = Id, elle sera dite de Clairaut. De faon rsoudre ce type dquations, on cherche une reprsentation paramtre des solutions : pour cela, on pose dx = m et x = x(m), t = t(m), ce qui ramne la dt rsolution de (4.9) celle de : (m + f (m)) dt + f (m)t = g (m), dm

qui est linaire du premier ordre en t. Exemple 4.2.1. La rsolution de lquation x + 2tx + x3 = 0 se ramne celle 8 3 1 3( m) +8C1 dt . Les solutions de 3m dm +2t = 3m2 , qui a pour solution t (m) = 8 2 ( 3 m) paramtres de la premire quation sont donc : 1 x(m) = m3 2 3 mC1 , 4 Equation de Bernouilli Une EDO de la forme : dx + f (t)x + g(t)xr = 0, dt (4.10) t (m) = 8 1 3 ( 3 m) + 8C1 . 2 8 ( 3 m)

est dite de Bernouilli. Les cas r = 0 ou r = 1 sont triviaux. Dans le cas gnral, on utilise le changement de variable y = x1r , conduisant la rsolution de lEDO : 1 dy + f (t)y + g(t) = 0, 1 r dt qui est linaire du premier ordre en y. Exemple 4.2.2. La rsolution de lquation dx + sin(t)x + sin(t)x4 = 0, en dt 1 posant y = x3 , se ramne celle de 3 dy + sin(t)y + sin(t) = 0, qui admet dt pour solution y (t) = e3 cos t + C1 e3 cos t . 158

4.3. Equations direntielles du premier ordre Equation de Riccati Certaines quations ne sont pas intgrables (cest--dire que lon ne peut exprimer les solutions de faon explicite avec des fonctions de lanalyse). Par exemple lquation de Riccati : dx + f (t)x + g(t)x2 + h(t) = 0, dt nest pas intgrable si f, g, h (fonctions continues) ne satisfont pas certaines relations particulires.

4.3

Equations direntielles du premier ordre

Notons que, lorsque la variable y de lquation implicite (4.7) appartient un ensemble plus gnral quun produit cartsien douvert de R, alors en posant
y x = y, dy , . . . , d k1 dt dt
k1

, lquation explicite (4.8) peut se mettre sous la forme : dx = f (t, x), dt

t I,

x X.

(4.11)

Dans cette quation : t I R reprsente la variable temporelle, X est lespace dtat1 . En pratique, lespace dtat peut tre born : il rete les caractristiques physiques du systme (bornitude des performances). De faon gnrale, lespace dtat est une varit direntiable . Lorsque le vecteur x sexprime laide dune variable et de ses drives successives, X est aussi appel espace de phase. Cependant, certains auteurs ([1] p. 11) emploient indiremment les deux dnominations. Le vecteur x X correspondant est le vecteur dtat de (4.11) (ou de phase par abus de langage). En pratique, il est construit partir des variables dont lvolution rgit celle du processus physique. x(t) est ltat instantan linstant t. f : I X T X (espace tangent), (t, x) f (t, x), reprsente le champ de vecteurs. An de simplier la suite de lexpos, on se placera dans le cas o I X est un ouvert de Rn+1 et T X est Rn .

Notion de solution
Lorsquon parle de solution, il faut prciser le problme associ : ici, pour les EDO, il existe le problme aux conditions limites ou frontires2 et le problme
vocabulaire de lautomatique. nonc similaire au problme de Cauchy, mais pour lequel la condition initiale est remplace par la donne de n valeurs (i) (ti ) aux instants ti donns, i N = {1, . . . , n}, : N N.
2 1

159

4. EDO non-linaire aux conditions initiales (dit de Cauchy , en abrg PC) : existe-t-il une fonction : : I R X Rn , (PC) : t (t), satisfaisant (4.11) et la condition initiale suivante : (t ) = x ? 0 0 On cherche une fonction du temps : t (t), qui soit susamment rgulire et dont la drive soit gale presque tout instant3 la valeur du champ cet instant et en ce point x = (t). Si f (u, (u)) est mesurable4 , alors on peut exprimer (t) sous la forme :
t

(t) = (t0 ) +
t0

f (v, (v))dv,

(4.12)

lintgration tant prise au sens de Lebesgue [27] et ce, mme si t f (t, .) nest pas continue en t (cas intressant en automatique, car pour x = g(t, x, u) un retour u = u(t) discontinu peut tre envisag). Ainsi, on cherchera des fonctions au moins absolument continues5 par rapport au temps. Solutions, portrait de phase Dnition 4.3.1. On appelle solution de (4.11) passant par x0 t0 , toute fonction absolument continue dnie sur un intervalle non vide I(t0 , x0 ) I R contenant t0 : : I(t0 , x0 ) I R X Rn , t (t; t0 , x0 ), note plus simplement (t), satisfaisant (4.12) pour tout t I(t0 , x0 ) (ou, de faon quivalente : = f (t, (t)) presque partout sur I(t0 , x0 )) et telle que (t0 ) = x0 . Exemple 4.3.1. En sparant ses variables, lquation du modle logistique (4.1) devient : dx = dt, ax(xmax x)
cest--dire pour tous les temps t T \ M, M tant un ensemble de mesure nulle, avec la notation ensembliste T \ M = {x T : x M}. / 4 cette condition est vrie si, pour x x, t f (t, x) est mesurable et pour t x, x f (t, x) est continue [27]. 5 : [, ] Rn est absolument continue si > 0, () > 0 : {]i , i [}i{1..n} , ]i , i [ [, ], n (i i ) () n i=1 i=1 (i ) (i ) . est absolument continue si et seulement si il existe une fonction (Lebesgue intgrable) qui soit presque partout gale la drive de .
3

160

4.3. Equations direntielles du premier ordre qui permet de construire la solution au PC (4.1), x(0) = x0 : : R R, t (t; 0, x0 ) = x0 + x0 xmax axmax t (x e max x0 ) . (4.13)

Dnition 4.3.2. La solution de (4.11) peut tre reprsente dans deux espaces : soit dans lespace dtat tendu I X ou espace du mouvement, dans ce cas, on parle de mouvement ou de trajectoire , soit dans lespace dtat X , dans ce cas, on parle dorbite. On appelle portrait de phase lensemble de toutes les orbites munies de leurs sens de parcours temporel. Bien souvent, par commodit on ne reprsente que les ensembles de points daccumulation vers lesquels les orbites convergent pour des temps trs grands (positifs ou ngatifs). Par exemple, pour le systme : 2 x2 1 dx 1 x1 2 x, t R, x R2 , = (4.14) dt 2 x2 1 1x
1 2

les lments importants du portrait de phase sont lorigine et le cercle unit C1 : si la condition initiale est dirente de lorigine, les orbites convergent vers C1 ; sinon, ltat reste g lorigine.
2

Fig. 4.2: Cercle unit : simulation de (4.14).

Existence Le problme de Cauchy (PC) na pas forcment de solution et, parfois, peut en avoir plusieurs. En eet, le systme :
1 dx = |x| 2 , dt x(0) = 0,

x R,

(4.15)

161

4. EDO non-linaire admet une innit de solutions dnies par : R+ , : R R, 0 (tt0 )2 t (t) = 4 (tt0 +)2 4

si si si

t0 t t0 + , t0 + t, t t0 . (4.16)

Fig. 4.3: Innit de solutions au PC (4.15). Ainsi, il se pose le problme de donner des conditions assurant lexistence dune ou de plusieurs solutions au problme de Cauchy. Selon la rgularit de la fonction f on distingue les cinq cas A, B, C, D, E qui suivent. Cas A) Si la fonction f est continue en x et ventuellement discontinue en t (mais mesurable), alors il y a existence de solutions absolument continues. Thorme 4.3.1 (de Carathodory, 1918). [11] Supposons que : A1) f soit dnie pour presque tout t sur un tonneau : T = {(t, x) I X : |t t0 | a, x x0 b} , (4.17)

A2) f soit mesurable en t pour tout x x, continue en x pour t x et telle que, sur T , on ait f (t, x) m(t), o m est une fonction positive Lebesgueintgrable sur |t t0 | a. Alors, il existe au moins une solution (absolument continue) au problme de Cauchy dnie sur au moins un intervalle [t0 , t0 + ], a. On peut mme montrer lexistence de deux solutions, lune dite suprieure et lautre, infrieure, telles que tout autre solution soit comprise entre ces deux solutions [23] [11]. 162

4.3. Equations direntielles du premier ordre Cas B) Si la fonction f est continue en (t, x), solutions de classe C 1 . alors il y a existence de

Thorme 4.3.2 (de Peano, v.1886). [8] Supposons que : B1) f soit dnie pour tout t sur un tonneau T dni par (4.17), B2) f soit continue sur T dni par (4.17). Alors il existe au moins une solution au problme de Cauchy de classe C 1 dnie sur au moins un intervalle [t0 , t0 + ], = min(a, maxT bf (t,x) ).

x +b
x
0

Fig. 4.4: Approximation dEuler.

La preuve est base sur les approximations dEuler. Ce sont les lignes polygonales (voir la gure 4.4) dnies par : 0 = x0 ,

(t) = n (ti1 ) + f (ti1 , n (ti1 ))(t ti1 ), ti1 < t ti , n t = t + i , i = {0, . . . , n}, i 0 n dont on montre quelles constituent une famille quicontinue de fonctions dnies sur [t0 , t0 + ], convergente, dont on peut extraire une sous-suite n uniformment convergente vers une fonction continue (lemme dAscoli-Arzela [27]) qui vrie :
t

(t) = lim n (t) = x0 +


n+ t

t0 n+

lim f (v, n (v))dv

+ lim

n+ t 0

dn (v) f (v, n (v))dv. dt


dn dt (v)

est donc solution de (4.12) puisque limn+

f (v, n (v)) = 0. 163

) x,t( f T

xam

+ 0t

x b

uaennot
0

t +a

4. EDO non-linaire Prolongement de solution, unicit, solution globale Evidement, pour lexemple (4.15), il y a existence de solution (f : x |x| est continue) mais pas unicit. Pour garantir lunicit, il faut donc que la fonction f soit plus que continue : par exemple il sut quelle soit localement lipschitzienne en la seconde variable x, comme suit. Dnition 4.3.3. f est dite localement lipschitzienne sur X si : x0 X , > 0 et k(t) intgrable : (x, y) B (x0 ) f (t, x) f (t, y) k(t) x y . f est dite globalement lipschitzienne sur X si : k(t) intgrable : (x, y) X 2 , f (t, x) f (t, y) k(t) x y . Ces proprits sont dites uniformes si k ne dpend pas de t. Proposition 4.3.1. Toute fonction C 1 (I X ) dont la norme de la jacobienne est borne par une fonction intgrable, est localement lipschitzienne. De plus, si X est compact (ferm, born), elle est globalement lipschitzienne. Sous lhypothse f localement lipschitzienne en x, il se peut quune solution dnie sur I1 puisse tre prolonge sur un intervalle I2 I1 , dnissant ainsi une fonction dnie sur I2 I1 et telle que | I1 = . Aussi, an de ne pas alourdir les notations, I(t0 , x0 ) =](t0 , x0 ), (t0 , x0 )[ dsignera par la suite le plus grand intervalle sur lequel on peut dnir une solution passant t0 par x0 et qui ne puisse tre prolonge : la solution sera dite maximale . Cas C) Si la fonction f est localement lipschitzienne en x et ventuellement discontinue en t (mais mesurable), alors il y a existence et unicit de solution (maximale) absolument continue. Thorme 4.3.3. Si dans le thorme 4.3.1, lhypothse de continuit dans A2) est remplace par f localement lipschitzienne sur x x0 b , alors il existe une unique solution (absolument continue) au problme de Cauchy dnie sur I(t0 , x0 ) {t I : |t t0 | } . De mme, si f est continue en (t, x) et localement lipschitzienne en x, alors il existe une unique solution au problme de Cauchy de classe C 1 . Les preuves de ces rsultats sont bases sur les approximations de PicardLindelf : 0 = x0 , t (t) = x0 + t0 f (v, n (v))dv, n+1 t [t , t + ], = min(a, b ),
0 0 maxT f (t,x)

164

4.3. Equations direntielles du premier ordre dont on montre quelles convergent uniformment vers une solution. Lunicit de la solution se dmontre ensuite par contradiction. Cas D) Si la fonction f est borne en norme par une fonction ane, cest--dire que (t, x) (I X ) : f (t, x) c1 x + c2 (ventuellement presque partout), alors en utilisant le lemme de Gronwall [27], on peut conclure que toute solution au PC est dnie sur I. Cas E) Si le systme possde une proprit de dissipativit et si f est localement lipschitzienne, alors le PC admet une solution maximale unique dnie pour tout t t0 (I = R, X = Rn ). La proprit de dissipativit peut tre exprime sous la forme : il existe 0, 0, v Rn tels que pour tout t R et tout x Rn : < xv, f (t, x) > x 2 ou bien, laide de fonctions de Liapounov6 , sous la forme il existe V et W : Rn R+ continues, dnie positives sur un compact A (cest-dire : V (x) = 0 x A), telles que pour tout t R et tout x Rn \A7 : < V , f (t, x) > W (x). x Dpendance des conditions initiales Thorme 4.3.4. Sous les hypothses du thorme 4.3.3, la solution au problme de Cauchy t (t; t0 , x0 ) dnie sur I(t0 , x0 ) est continue par rapport chacun de ses arguments. En particulier, si t est susamment proche de t0 , alors (t; t0 , x0 ) est proche de x0 . Cette proximit peut tre tudie pour des instants trs grands : cest la question de la stabilit (voir paragraphe 4.5).

Classication
Dnition 4.3.4. Lquation (4.11) est dite autonome si la variable temporelle napparat pas explicitement dans lEDO : dx = g(x), dt t I, x X.

Dans le cas contraire, elle est dite non autonome. Si on connat les solutions dune EDO autonome passant un instant t donn par un point x donn, alors on obtient toutes les solutions passant par ce mme
Alexander Mikhalovich Liapounov, mathmaticien et physicien russe. Aprs des tudes lUniversit de Saint-Ptersbourg (o il est lve de P.L. Tchebychev), il est assistant puis professeur lUniversit de Kharkov. En 1902, il est nomm professeur lUniversit de SaintPtersbourg. 7 La notation A\B correspond la dirence ensembliste de A et B : A\B = {x A : x / B}.
6

165

4. EDO non-linaire point dautres instants par simple translation temporelle des premires. Donc, une EDO autonome ne peut servir qu modliser des phnomnes physiques indpendants du temps initial (chute dun corps, etc.). Notons au passage que la longueur de I(t0 , x0 ) ne dpend pas de linstant initial. Dnition 4.3.5. On dit quun champ de vecteurs non linaire non autonome f (t, x) est T priodique sil existe un rel T > 0 tel que pour tout t et pour tout x : f (t + T, x) = f (t, x). Dans ce cas, si on connat les solutions pour un intervalle de longueur T , on aura toutes les autres par translation temporelle. Cas linaire autonome Lorsque (4.11) est de la forme : dx = Ax + b, dt on dit quil sagit dune EDO linaire autonome. Il existe alors une solution unique au PC (puisque Ax + b est globalement uniformment lipschitzienne) de la forme :
t

x(t) = eA(tt0 ) x0 + eAt


t0

eAv dv b,

ou encore x(t) = r ei t pi (t) + c, avec i les valeurs propres de A et pi (t) i=1 des vecteurs de polynmes de degrs plus petits que lordre de multiplicit de la valeur propre correspondante i . Ce type de modle caractrise des phnomnes pour lesquels : 1. linstant initial na pas dinuence sur lvolution temporelle du vecteur tat (EDO autonome) ; 2. si b = 0 (respectivement, b = 0), alors une combinaison linaire (respectivement, convexe) dvolutions est encore une volution possible : ceci traduit la linarit du systme. Pour de tels systmes, on peut noter que, au bout dun temps inni, les direntes variables dnissant le vecteur x : 1. soit convergent vers un vecteur (le vecteur x voluant vers un vecteur xe dit point dquilibre ), 2. soit divergent (la norme de x devient inniment grande), 3. soit ont un comportement oscillatoire : lorsquon observe leurs volutions les unes en fonction des autres, elles voluent sur une courbe ferme (comme le cercle) : cest ce quon appelle un cycle ferm (exemples : cycle conomique, population cyclique, masse attache un ressort, etc.). 166

4.3. Equations direntielles du premier ordre Enn, si A et b dpendent du temps, le systme est dit linaire non autonome (ou non stationnaire) : en plus des comportements prcits on retrouve la dpendance des solutions linstant initial . Notons que lorsque A(t) est une fonction T priodique continue sur R, on peut tudier formellement les solutions grace la thorie de Floquet [17] : il existe alors une transformation bijective P (t) T priodique et continue, z(t) = P (t)x(t), telle que z = M z +c(t), avec M une matrice constante vriant M = P (t) + P (t)A(t)P (t)1 et c(t) = P (t)b(t). Cas non linaire autonome Lorsque (4.11) est de la forme : dx = g(x), (4.18) dt on dit quil sagit dune EDO non linaire autonome. On ne peut lui donner de solution explicite, sauf dans des cas trs particuliers. Outre les comportements prcits dans le cas linaire autonome, on peut mentionner : 1. Cycles limites : il sagit de courbes fermes de X vers ou partir desquelles les trajectoires du systme se dirigent. 2. Phnomne de chaos : ces comportements, rgis par des EDO (dterministes), sont en apparence alatoires. Une des caractristiques est la sensibilit aux conditions initiales : deux conditions initiales trs proches donneront naissance deux volutions compltement direntes. 3. Attracteur trange : il sagit en gnral dun ensemble de dimension non entire, ce qui traduit une certaine rugosit de lobjet. Par exemple, une surface est de dimension 2, un volume est de dimension 3, alors quun ocon de neige ayant une innit de ramications est de dimension non entire comprise entre 2 et 3. Lorsque les trajectoires se dirigent vers (respectivement sloignent de) cet ensemble, il est dit attracteur (respectivement rpulseur) trange . Souvent la prsence dattracteurs ou rpulseurs tranges est un signe du chaos, cependant dans certains cas le phnomne chaotique nest que transitoire et disparat au bout dun temps susamment long.

Notion de ot
Dans cette partie, on suppose lexistence et lunicit de la solution (maximale) au PC associ (4.18), que lon notera (t; t0 , x0 ). Si le champ est complet, cest--dire I(x0 ) = R, et si on connat une solution pour un couple (t0 , x0 ), alors on aura toutes les autres (pour x0 x) par translation temporelle. Considrons lapplication qui, toute condition initiale, associe sa solution maximale linstant t : t : X X , g x0 (t; 0, x0 ). 167

4. EDO non-linaire Dnition 4.3.6. Si le champ de vecteurs g de lEDO (4.18) permet de gnrer une solution maximale unique pour tout (t0 , x0 ) de R X , dnie sur I(x0 ) = R (respectivement sur [, [, sur [, ] avec et nis), alors lapplication gnratrice t est appele un ot (respectivement un semi-ot, un ot local). g Daprs les hypothses, t est bijective, donc on a au moins un ot local. g La justication du choix de la notation t devient vidente lorsquon calcule le g ot dune EDO linaire autonome homogne : x = Ax, t = eAt . Dans le cas g k (respectivement C , analytique), le ot associ t est un o g est de classe C g diomorphisme local de classe C k (respectivement C , analytique) pour tout instant t o il est dni. En particulier, si le ot t est dni pour tout t R, g alors il dnit un groupe un paramtre de diomorphismes locaux de classe C k (respectivement C , analytique) (voir [1] p. 55 63) : t : x0 t (x0 ) est de classe C , g g t s = t+s , g g g 0 g = Id. (4.19) (4.20) (4.21)

On en dduit, t R, x0 X : t (x0 ) = t (x0 ), g g t t = tt = Id, g g g (t )1 g = t g = t . g (4.22) (4.23) (4.24)

La dualit caractrise par (4.24) est importante puisque, si on connat le portrait de phase du systme dynamique (4.18) pour les temps positifs, son dual pour les temps ngatifs sobtient tout simplement en renversant le sens de parcours des orbites : cette proprit est utilise dans la mthode du renversement des trajectoires ( trajectory-reversing method ) permettant, en dimension deux (et parfois trois), de dterminer prcisment la plupart des portraits de phase en alliant ltude qualitative du champ de vecteurs non linaire des simulations (pour plus de dtails, voir [5, 6, 13, 12, 25]). Le crochet de Lie (ou commutateur, voir chapitre 4) dni par : [g1 , g2 ] = g2 g1 g1 g2 , x x

permet de calculer la condition de commutativit de deux ots t 1 et s2 . g g Thorme 4.3.5. Soient g1 et g2 des champs de vecteurs C complets, dnis sur X (par exemple Rn ). Alors : t, s, 168 t 1 s2 = s2 t 1 [g1 , g2 ] = 0. g g g g

4.3. Equations direntielles du premier ordre Dmonstration : soient x0 Rn et t, s > 0 donns. Pour un champ de vecteurs analytique X, on a t (y) = y + tX(y) + R(t, y), o R(t, y) reprsente X un reste sannulant pour t 0. On obtient donc : t 1 s2 (x0 ) = x0 + (sg2 (x0 ) + tg1 (x0 )) + st g g s 2 g et donc : t 1 s2 (x0 ) s2 t 1 (x0 ) = st[g2 , g1 ](x0 ) + R3 (t, s, x0 ). g g g g Prenons t = s, alors limplication dcoule immdiatement. Pour la rciproque,
g1 [g1 , g2 ] = 0 x0 Rn : limt0 ( 2 g1 g2t ) = 0. Soit la trajectoire t s t (x ), alors x(t) = 0, donc t s t = s . x(t) = g2 g1 g2 0 g2 g1 g2 g1 En automatique, la non-commutativit des champs a une application trs importante puisquelle permet de caractriser latteignabilit (version locale de la commandabilit) dun systme command du type x = g1 (x) + g2 (x)u (voir chapitre 4 et [20]). t g s t (x0 )s (x0 )

g1 g2 (x0 ) + R1 (t, s, x0 ), x g2 t 1 (x0 ) = x0 + (sg2 (x0 ) + tg1 (x0 )) + st g1 (x0 ) + R2 (t, s, x0 ), g x

Comparaison de solutions, ingalits direntielles


Dans cette partie, les ingalits vectorielles seront comprendre composante composante et D est un oprateur de drivation (dit de Dini ) : Dx(t) = (Dx1 (t), . . . , Dxn (t)), o les drives Dxi (t) sont toutes dnies par lune des quatre limites suivantes : D+ xi (t) = lim inf
0+

xi (t + ) xi (t) xi (t + ) xi (t) , D+ xi (t) = lim sup , + 0

D xi (t) et D xi (t) dnies de faon similaire pour les limites par valeurs infrieures ( 0 ). Soit S I un ensemble de mesure nulle. On considre les relations direntielles suivantes : Dx(t) f (t, x), dz = f (t, z), dt t I\S, x X , t I\S, z X . (4.25) (4.26)

On se pose le problme de savoir sous quelles conditions les solutions de (4.26) majorent celles de (4.25). Dans ce cas, (4.26) constituera un systme majorant de (4.25), dont lutilisation est intressante pour lanalyse des comportements des solutions dune EDO (voir paragraphe 4.5). La contribution de Waewski [30] (prcde de [21] et complte par celle de Lakshmikantham et Leela [23]) 169

4. EDO non-linaire est certainement lune des plus importantes puisquelle donne des conditions ncessaires et susantes pour que les solutions du problme de Cauchy associ (4.25) avec x0 donn t0 , soient majores par la solution suprieure de (4.26) dmarrant de z0 x0 linstant t0 . Dnition 4.3.7. La fonction f : I X X Rn , (t, x) f (t, x) est quasi-monotone non-dcroissante en x si : t I, (x, x ) X 2 , i {1, . . . , n}, (xi = xi ) et (x x ) fi (t, x) fi (t, x ). (4.27)

Thorme 4.3.6. Supposons que : 1) f (t, x) vrie les hypothses (A1-A2) du thorme 4.3.1 dexistence de solution, 2) f (t, x) est quasi-monotone non-dcroissante en x presque partout en t (t I\S). Alors, pour tout x0 X , les solutions du problme de Cauchy associ (4.26) vrient : x(t) zsup (t), (4.28) pour tout instant o les quantits x(t) et zsup (t) ont un sens, avec zsup (t) la solution suprieure de (4.25) dmarrant de z0 X , avec x0 z0 .

4.4

EDO Linaire : des comportements simplistes

Un peu de vocabulaire
Soit x(t) un vecteur. Partant dun systme de n quations direntielles linaires du premier ordre, on se ramne une EDO de la forme dx = A(t)x + b(t). dt (4.29)

Elle sera dite linaire non autonome non homogne lorsque les fonctions A(t), b(t) dpendent explicitement du temps (respectivement constantes) et linaire non autonome homogne lorsque b = 0. Notons que toute quation linaire dordre quelconque peut se mettre sous cette forme. En eet a0 (t)y + a1 (t)y + . . . + an (t)y (n) = b0 (t),
b0 se met sous la forme (4.29) en posant x = (y, . . . , y (n1) )T , b = (0, . . . , an(t) )T (t) et 0 1 0 0 . .. .. . . . . 0 . A(t) = 0 0 1 a0 an(t) (t) a1 an(t) (t)

an1 (t) an (t)

170

4.4. EDO Linaire : des comportements simplistes Si on regarde lquation homogne alors lensemble des solutions constituent un espace vectoriel : toute combinaison de solutions est solution. Ainsi le problme se ramne la recherche dune base de solutions fondamentales. Les solutions de lquation non homogne se dduisent alors facilement. Par contre, en xant une condition initiale le problme de Cauchy (PC) na quune et une seule solution : Thorme 4.4.1. Si b et A sont continues sur leur intervalle commun de dnition (not I) alors le PC admet une solution unique, cest--dire tant donn t0 I et x0 il nexiste quune seule fonction x(t) vriant lquation (4.29) et telle que x(t0 ) = x0 . Lorsque lEDO est de la forme dx = Ax + b, dt (4.30)

on dit quil sagit dune EDO linaire autonome non homogne. Il existe une solution unique au PC (utiliser thorme 4.4.1 ou alors cf. preuve directe qui suit). Cette solution est de la forme
t

x(t) = exp(A(t t0 ))x0 +


t0

exp(A (t v))dv b,

(4.31)

ou encore x(t) = r exp(i t)pi (t) + c, avec i les valeurs propres de A et pi (t) i=1 des vecteurs de polynmes de degr plus petit que lordre de multiplicit de la valeur propre correspondante i . Notons que (4.31) peut sobtenir facilement en utilisant la formule de la variation de la constante et peut tre tendue au cas b(t). Dmonstration. Existence : driver (4.31). Unicit : si x(t) et y(t) sont deux solutions (de classe C 1 ) alors z = x y est solution de z = Az, z(t0 ) = 0. Si z(t) nest pas identiquement nulle alors il existe un temps T tel que z(t) = 0, t < T et z(T ) = 0. Notons i lindex dune des composantes du vecteur z qui devient non T nulle t = T alors zi (T ) = zi (T ) + T [Az(v)]i dv = 0 (contradiction).

Les comportements linaires


La solution au PC associ x = Ax, x Rn . (x(t0 ) = x0 ) peut sexprimer sous la forme x(t) = exp(A(t t0 ))x0 . Ce type de modle caractrise les phnomnes suivants : 171 (4.33) (4.32)

4. EDO non-linaire 1. linstant initial na pas dinuence sur lvolution temporelle du vecteur tat (EDO autonome) : si x1 (t) et x2 (t) sont des solutions de (4.32) telles que x1 (t1 ) = x0 et x2 (t2 ) = x0 alors x1 (t t1 ) = x2 (t t2 ). 2. une combinaison linaire dvolutions est encore une volution possible : ceci traduit la linarit du systme. Pour de tels systmes, on peut noter que, au bout dun temps inni, le vecteur x(t) : 1. soit converge vers un vecteur xe dit point dquilibre, 2. soit diverge (au moins une des composantes de x(t) devient inniment grande), 3. soit les composantes de x(t) ont un comportement oscillatoire : lorsquon observe leurs volutions les unes en fonction des autres, elles voluent sur une courbe ferme (comme le cercle) : cest ce quon appelle un cycle ferm (exemples : cycle conomique, population cyclique, masse attache un ressort, etc...).

4.5

EDO Non linaire

Un peu de vocabulaire
Dans cette partie, on sintresse des EDO de la forme dx = g(x), dt x X. (4.34)

Dans cette quation : t R, reprsente la variable temporelle, X est lespace dtat8 . En pratique lespace dtat peut tre born : il rete les caractristiques physiques du systme (bornitude des performances). Lorsque le vecteur dtat sexprime laide dune variable et de ses drives successives, lespace dtat sappelle aussi espace de phase. Cependant, certains auteurs ([1] p. 11) emploient indiremment les deux dnominations. x X , reprsente le vecteur dtat (ou de phase par abus de langage) construit partir des variables dont lvolution rgit celle du processus physique. x(t) le vecteur dtat instantan linstant t. g : X T X (espace tangent), x g(x), reprsente le champ de vecteurs. Condition 4.5.1. An de clarier la suite de lexpos, on se placera dans le cadre o X est un ouvert de Rn et T X est Rn . Lorsquon parle de solution, il faut prciser le problme associ : ici pour les EDO il existe le problme aux conditions limites ou frontires9 et le problme
vocabulaire de lautomatique. nonc similaire au problme de Cauchy pour lequel la condition initiale est remplace par la donne de n valeurs (i) (ti ) aux instants ti donns (i N = {1, . . . , n}, : N N ).
9 8

172

4.5. EDO Non linaire aux conditions initiales (dit Problme de Cauchy abrg PC) : existe-t-il une fonction : I R X Rn , t (t), satisfaisant (4.34) et la condition initiale suivante : (t0 ) = x0 ? On cherche une fonction du temps : t (t), qui soit susamment rgulire (par exemple de classe C 1 ) telle que sa drive soit gale la valeur du champ cet instant et au point x = (t). Si g est intgrable, on peut alors exprimer (t) sous la forme
t

(t) = (t0 ) +
t0

g((v))dv.

(4.35)

De nombreux rsultats permettent de statuer quant lexistence de solution (g continue) et lunicit (g Lipschitzienne). On rappelle que le portrait de phase est lensemble de toutes les orbites munies de leur sens de parcours temporel. Bien souvent, par commodit on ne reprsente que les ensembles de points daccumulation vers lesquels les orbites convergent pour des temps trs grand ou trs petit. Par exemple pour le systme 2 x2 1 dx 1 x1 2 x, t R, x R2 , = (4.36) dt 2 x2 1 1x
1 2

les lments importants du portrait de phase sont lorigine et le cercle unit : si la condition initiale est dirente de lorigine les orbites convergent vers le cercle unit sinon ltat reste g lorigine (cf. gure 4.5).
2

Fig. 4.5: Cercle unit : simulation de (4.36).

Equilibre
Pour certaines conditions initiales, le systme reste gel, cest--dire quil nvolue plus : on parlera alors de points dquilibre. 173

4. EDO non-linaire Dnition 4.5.1. xe X est un point dquilibre pour le systme (4.34) si les solutions (t; 0, xe ) de (4.34) sont dnies sur [0, +[ et vrient : (t; 0, xe ) = xe , t [0, +[. Exemple 4.5.1. La solution au PC (4.1) x(0) = x0 est donne par :RR t (t; 0, x0 ) = x0 + x0 xmax at (x e max x0 ) . (4.38) (4.37)

Il est facile de vrier que x = 0 ((t; 0, x0 = 0) = 0) et x = xmax ((t; 0, xmax ) = xmax ) sont des points dquilibres. Si xe est un point dquilibre, alors pour que le systme reste en ce point il faut que la vitesse soit nulle, cest--dire que g(xe ) = 0. Cependant, cette condition seule nest pas susante comme le montre ltude de
1 dx = |x| 2 , x R, (4.39) dt on a bien xe = 0 solution de x = 0 mais il existe une innit de solutions qui quittent ce point :

Fig. 4.6: Innit de solutions de (4.39).

R+ , : R R, 0 (tt0 )2 t (t) = 4 (tt0 +)2 4 Pour lever ce problme

si si si

t0 t t0 + t0 + t t t0 . (4.40)

Thorme 4.5.1. Si g(xe ) = 0 et g est localement Lipschitzienne en xe alors xe est un point dquilibre pour le systme (4.34). 174

4.5. EDO Non linaire Par la suite, on considrera que le point dquilibre est lorigine : en eet, ltude de (4.34) au voisinage dun point dquilibre xe se ramne, par changement de coordonnes y = x xe , ltude de y = g(y + xe ), ayant pour quilibre (y = 0). Dnition 4.5.2. Dans la littrature, on classe les points dquilibre de (4.34) en deux catgories : 1. les points hyperboliques (ou non dgnrs) : ce sont les points dquilibres (xe ) pour lesquels la Jacobienne10 correspondante (Jg (xe )) ne comporte aucune valeur propre partie relle nulle. 2. les points non hyperboliques : ce sont les points dquilibres (xe ) pour lesquels la Jacobienne correspondante (Jg (xe )) possde au moins une valeur propre partie relle nulle.

Orbite priodique
Ltude des systmes non linaires a mis en vidence des orbites particulires : 1. les orbites fermes qui sont une extension des points xes puisque si on laisse voluer un systme partir dune condition initiale appartenant cette orbite, alors il continuera voluer sur cette orbite, (par exemple le cercle unit pour (4.36) cf. gure 4.5), 2. les orbites homocliniques et htrocliniques qui relient des points dquilibres (nous ne parlerons pas de ces dernires pour plus de dtails voir [15]) Les dnitions suivantes sont inspires de [28] p. 8788, [29] p. 8, [18] p. 113117 et de [15]. Dnition 4.5.3. La solution (t; t0 , x0 ) est T -priodique (priodique de priode T ), si la solution est dnie sur R et sil existe un rel positif , tel que pour tout rel t on ait (t + ; t0 , x0 ) = (t; t0 , x0 ). Le plus petit rel positif not T sappelle la priode de la solution. Dans ce cas lorbite correspondante est une orbite priodique de priode T (ou orbite T -priodique). Dnition 4.5.4. est une orbite ferme si est une orbite qui soit une courbe de Jordan, cest--dire homomorphe11 un cercle. Toute orbite image dune solution T -priodique non triviale (non identique un point dquilibre) est une orbite ferme.
10 gi (x) xj 11

Si g est un champ de vecteurs sur Rn alors sa Jacobienne au point x est la matrice .

Un homomorphisme est un morphisme bijectif bicontinue. Ainsi, une courbe de Jordan cest une courbe obtenue par transformation bijective bicontinue partir du cercle.

175

4. EDO non-linaire Exemple 4.5.2. Si on reprend lquation de Van der Pol (4.3) avec f (x) = (x3 2x) en posant iL = x2 , vC = x1 , L = C = 1, (4.3) devient : dx1 = x2 , dt dx2 = 2x2 x3 x1 , 2 dt

(4.41)

ainsi, pour > 0, on peut montrer (cf. [19] p. 211227) lexistence dune orbite priodique reprsente sur la gure suivante
2 1

Fig. 4.7: Orbite ferme priodique pour loscillateur de Van der Pol (4.41).

Exemple 4.5.3. Le systme de Volterra-Lotka est un modle simple de lutte de deux espces. En 1917, donc pendant la guerre, le biologiste Umberto dAncona constata une augmentation du nombre de slaciens (requins) dans la partie nord de la mer Adriatique. An dexpliquer ce phnomne, il t appel son beaupre, le mathmaticien Vito Volterra, qui expliqua ce phnomne de la faon suivante. Soit un volume deau inni (mer Adriatique par exemple), peupl par deux espces : lune, carnivore (C : slaciens), dvorant lautre, herbivore (H : crevettes). Notons x et y les nombres respectifs dindividus des espces (H) et (C). Si lespce (H) peuplait seule la mer, elle se dvelopperait de faon exponentielle12 et la vitesse de croissance de lespce (H) serait : dx = x, avec dt > 0. Par contre, lespce (C) ne peut assurer seule son dveloppement, ni mme sa survie, donc sa vitesse de variation serait : dy = y, avec > 0. Lorsque dt les deux espces cohabitent, les carnivores (C) dvorent les herbivores (H). En faisant lhypothse qu chaque rencontre dun carnivore avec un herbivore, ce dernier est dvor et que le nombre de rencontres est proportionnel au produit des densits volumiques des deux espces (donc, aussi xy), on peut conclure
12 On fait ici lhypothse son dveloppement nest limit ni par lespace ni par la quantit de nourriture.

176

4.5. EDO Non linaire que lvolution des deux espces est rgie par le systme direntiel : dx = x xy (herbivores), dt dy = y + xy (carnivores), dt

(4.42)

avec , , , des rels positifs. Dans ce cas, les variables dtat sintroduisent de faon naturelle : x, y. On peut a priori supposer que lespace dtat est le quart de plan R2 . Le thorme 4.3.3 permet de garantir lexistence et lunicit + dy dx des solutions. En sparant les variables selon : x(y) = y(+x) , on peut monter que H(x, y) = [ ln(y) y] + [ ln(x) x] est une fonction constante le long des solutions de (4.42). On montre ainsi que, pour toute condition initiale strictement incluse dans le quart de plan strictement positif, les orbites du systme sont fermes. De plus les solutions sont dnies sur R : on obtient un ot dont le portrait de phase est reprsent sur la gure 4.8 (simulation pour = = = = 1).

Fig. 4.8: Cycle pour (4.42).

Les orbites sont centres autour du point dequilibre ( , ). Avant la guerre, lactivit de la pche tait plus importante (on tient compte des prlvements de la pche qx x et qy y dans (4.42), avec qx , qy positifs) : cest--dire que le couple de paramtres (, ) est remplac par ( qx , qy ), donc le point +q dequilibre ( , ) est remplac par ( y , qx ). Ce qui explique un dplacement du cycle vers le haut pendant la guerre, donc une augmentation du nombre de claciens.

Concepts de Stabilit et dAttractivit


Dans cette section on se place dans le cadre dune EDO dx = f (t, x), dt x X, t R. (4.43) 177

4. EDO non-linaire Stabilit au sens de Liapunov dun quilibre Les ensembles remarquables (quilibres, orbites priodiques, etc. . .) peuvent caractriser des congurations nergie minimale pour un systme physique. Ces systmes peuvent avoir tendance rechercher une position de repos plutt quune autre : cest ce que les concepts de stabilit traduisent dune certaine faon. Par exemple, un pendule pesant (voir introduction quation (4.6)), possde deux quilibres verticaux : lun au dessus de lhorizontale, lautre en dessous. Il est bien connu que la masse a naturellement tendance se positionner en bas plutt quen haut. La position dquilibre basse est stable, lautre instable. Par la suite nous ne prsenterons que les concepts lmentaires pour les points dquilibre et uniquement pour des EDO du type (4.34). Dnition 4.5.5. Lquilibre xe est stable au sens de Liapunov si : > 0, (t0 , ) > 0 tel que : x0 X : (x0 , xe ) (t0 , ) ((t; t0 , x0 ), xe ) , t t0 . (4.44) Lorsque (t0 , ) = () est indpendant de t0 la proprit de stabilit sera dite uniforme . ( est une distance sur Rn ). Cela revient dire que pour tout voisinage V(xe ) de xe , il existe un voisinage W(xe ) de xe tel que : x0 W(xe ) (t; t0 , x0 ) V(xe ), t t0 (voir [3] p. 58). Exemple 4.5.4. Lorigine x = 0 est un quilibre uniformment stable (par la suite, on omettra au sens de Liapunov) pour lEDO x = x, x R : en eet x0 R, (t; t0 , x0 ) = exp (t t0 ) x0 donc |(t; t0 , x0 )| |x0 | , t t0 , en prenant |x0 | ( = dans la dnition 4.5.5). Par contre, il nest que stable 1+t2 2t 0 pour lEDO x = 1+t2 x, x R : en eet : x0 R, (t; t0 , x0 ) = 1+t2 x0 donc |(t; t0 , x0 )| 1 + t2 |x0 | , t t0 , en prenant |x0 | = 1+t2 . 0
0

Attractivit Alors que la proprit de stabilit traduit le non-loignement de solutions dun ensemble de rfrence (par exemple un quilibre), la proprit dattractivit elle traduit le rapprochement des solutions de cet ensemble et ce malgr dventuelles excursions pendant le rgime transitoire. Dnition 4.5.6. Lquilibre xe est attractif si : > 0 tel que x0 X : (x0 , xe ) lim (t; t0 , x0 ) = xe .
t

(4.45)

Le second membre de limplication scrit aussi > 0, T (x0 , ) > 0, ((t; t0 , x0 ), xe ) , t t0 + T (t0 , x0 , ). Lorsque T (, x0 ) = T () est indpendant de x0 , la proprit dattractivit sera dite uniforme. De mme que pour la notion de stabilit, cette notion peut tre formule en termes de voisinages. 178

4.5. EDO Non linaire Stabilit asymptotique La notion dattractivit dun ensemble assure que ltat va converger vers cet ensemble, mais il se peut que pendant le rgime transitoire il y ait de grosses excursions des solutions ce qui peut tre dommageable pour le systme physique. Aussi, la stabilit limitant ces excursions on combine les deux notions prcdentes pour donner naissance la notion de stabilit asymptotique. Il est important de noter quun ensemble peut tre attractif sans tre stable comme le montre lexemple suivant Exemple 4.5.5. Soit lEDO dx =x 1 dt dy =y 1 dt x2 + y 2 x2 + y 2 + y 2 x 2 1 1 x x2 + y 2 x x2 + y2 , ,

lorigine est un quilibre instable (pour le montrer, on pourra utiliser les rsultats de la section 4.5) et lquilibre (1, 0) est attractif mais instable : le portrait de phase est donn Figure 4.9.

Fig. 4.9: Equilibre (1, 0) attractif et instable.

Exemple 4.5.6. La solution au PC (4.1) x(0) = x0 est donne par (4.38), il est facile de vrier que lquilibre x = 0 nest pas attractif (limt (t; 0, x0 ) = limt x0 +eaxx0 xmaxmax x0 ) = xmax ) et que lquilibre x = xmax est asymptomax t (x tiquement stable. En eet, il est attractif (limt (t; 0, x0 ) = xmax ) et stable axmax t max x )e puisque (t; 0, x0 )xmax = xmax (xmax x00)eaxmax t donc pour > 0, si |x0 xmax | < x0 +(x , |(t; 0, x0 ) xmax | < xmax
(xmax x0 ) x0 +(xmax x0 )

< . 179

4. EDO non-linaire Pour cet exemple nous avons pu tudier la stabilit asymptotique partir de lexpression analytique des solutions. Cependant, pour une EDO (4.34) dont en gnral on ne peut exprimer les solutions de faon explicite, il serait important de disposer de critres permettant dtudier la question de la stabilit sans avoir calculer les solutions : ce sont les rsultats de la section 4.5 qui le permettent : premire mthode de Liapunov et seconde mthode de Liapunov (Thorme 4.5.8) .

Stabilit dquilibres : Rsultats lmentaires


Les premiers travaux sur la stabilit ne retenaient des EDO que leur approximation linaire du premier ordre. Il fallut attendre quelques annes pour que H. Poincar et A.M. Liapunov justient et tendent les proprits locales dduites du modle linaris. Lun des rsultats principaux est la premire mthode de Liapunov (voir Thorme 4.5.10) : si lorigine est uniformment asymptotiquement stable pour le linaris alors il est localement uniformment asymptotiquement stable pour le systme non linaire. Cependant elle ne donne aucun renseignement quantitatif sur le domaine de conditions initiales conduisant la stabilit asymptotique. Cette lacune ft contourne par lintroduction des clbres fonctions de Liapunov : cest la seconde mthode de Liapunov. Dune part, les fonctions de Liapunov sont analogues des distances entre ltat du systme le long de sa trajectoire et lensemble ou la trajectoire tudie (point dquilibre, etc... qui traduit une conguration dnergie minimale). Dautre part, ces fonctions ont une relation directe avec la physique des systmes puisque trs souvent elles ne sont rien de plus que lexpression de lnergie totale du systme qui, sil est dissipatif, dcrot au cours du temps an que le systme rejoigne une conguration nergie minimale (sil ny a pas dapport dnergie). Par exemple, le pendule pesant dont un modle est donn par g = 2 sin(), ml l (4.46)

(l, m, g, positifs), a deux quilibres : la position haute et basse. Il est bien connue que seule la position basse est stable : elle correspond une conguration nergie minimale (Energie potentielle nulle si on prend cette position basse comme rfrence). En eet, lnergie totale du systme est : 1 V (, ) = ml2 2 + mgl(1 cos()), 2 (4.47)

(notons que V ( = 0, = 0) = 0 et que V (, ) > 0 pour (, ) = (0, 0)) ; ce qui conduit dV g = ml2 ( 2 sin()) + mgl sin() = 2 0, dt ml l (4.48)

ce qui montre que lnergie du systme dcrot au cours du temps : le systme tend rejoindre une conguration nergie minimale. 180

4.5. EDO Non linaire Rsultat de stabilit pour un systme linaire Pour un modle linaire (4.32), les solutions sont donnes par (4.33), ainsi le comportement des trajectoires est entirement conditionn par les dilatations et contractions engendres par lexponentielle de la matrice A ; on en dduit : Thorme 4.5.2. Soit A Mn (R), de spectre (A) = {i C, i = 1, . . . , r n : det(i Id A) = 0 et i = j pour i = j} et (i ) le plus petit entier tel que ker (i Id A)(i )+1 = ker(i Id A)(i ) , (i = 1, . . . , r) : 1. i (A) : Re(i ) > 0 alors limt+ exp(At) = + et lorigine de (4.32) est instable, 2. i (A) : Re(i ) = 0 et (i ) > 1 alors limt+ exp(At) = + et lorigine de (4.32) est instable, 3. Re(i ) < 0, i = 1, . . . , (r 1) et Re(r ) = 0 avec (i ) = 1 alors exp(At) < + et lorigine de (4.32) est stable mais pas attractive, 4. i (A) : Re(i ) < 0 alors limt+ exp(At) = 0 et lorigine de (4.32) est asympttiquement stable. Dmonstration. Cela dcoule de la dcomposition sous forme de Jordan de la matrice A : il existe une matrice rgulire P telle que 1 A = P JP , J = diag(J(i )), J(i ) = i 0 . . . 0 1 .. . .. . 0 .. . .. . 0 0

0 , 1 i

(4.49)

do exp(At) = P exp(Jt)P 1 avec exp(Jt) = diag(exp(J(i )t)) et exp(J(i )t) = exp(i t) 1 t ..


t2 2! t(k1) (k1)! t2 2!

. 0 . .. . . . 0

.. ..

. .

(4.50)

t 1

les dirents rsultats en dcoulent tout naturellement. On en dduit la condition ncessaire et susante pour que lorigine soit asymptotiquement stable pour un systme linaire autonome : Corollaire 4.5.1. Lorigine de (4.32) est asymptotiquement stable i (A) : Re(i ) < 0. 181

4. EDO non-linaire Corollaire 4.5.2. Si le polynme caractristique de A est de la forme A (x) = xn + n1 ai xi , alors une condition ncessaire de stabilit de lorigine de (4.32) i=0 est que les ai soient tous positifs. Dmonstration. Si un ai < 0, cela signie quau moins un produit de valeurs propres est ngatif donc quau moins deux valeurs propres sont de signes contraires. Structure locale des solutions au voisinage dun point dquilibre Pour les points dquilibre hyperboliques, les rsultats suivants permettent dclaircir le comportement local des solutions de (4.34). Thorme 4.5.3 (de Hartman-Grobman, 1964). Si la jacobienne Jg (xe ) = A au point dquilibre xe na pas de valeur propre purement imaginaire ou nulle (c (A) = ), alors il existe un homomorphisme h dni dans un voisinage V(xe ) de xe , envoyant localement les orbites du ot linaire vers celles du ot non linaire t de (4.34). De plus, h prserve le sens de parcours des orbites et g peut tre choisi de faon prserver la paramtrisation du temps. A partir du voisinage V(xe ) o h est dni, on construit les varits locales stable et instable : Wloc s (xe ) = {x V(xe ) : lim t (x) = xe et t (x) V(xe ), t > 0}, g g
t+ t

Wloc i (xe ) = {x V(xe ) : lim t (x) = xe et t (x) V(xe ), t > 0}, g g partir desquelles on dnit les varits stable et instable (relatives xe ) : Ws (xe ) = t0 t (Wloc s (xe )), g Wi (xe ) = t0 t (Wloc i (xe )). g Ces notions de varits stable et instable exhibent donc des solutions de (4.34) qui sont respectivement contractantes et dilatantes . Les varits Ws (xe ), Wi (xe ) sont les images par h des sous-espaces correspondants sur le linaris : Ws (xe ) = h[Es (Jg (xe ))], Wi (xe ) = h[Ei (Jg (xe ))]. Thorme 4.5.4 (de la varit stable). Si (4.34) a un point dquilibre hyperbolique xe , alors il existe Ws (xe ) et Wi (xe ) : 1. de dimension ns et ni identiques celles des espaces Es (Jg (xe )) et Ei (Jg (xe )) du systme linaris (avec A = Jg (xe )), 2. tangentes Es (Jg (xe )) et Ei (Jg (xe )) en xe , 3. invariantes par le ot t . g De plus, Ws (xe ) et Wi (xe ) sont des varits aussi rgulires que g (de mme classe r que g C r (Rn )). 182

4.5. EDO Non linaire Dans le cas, dit critique, de points non hyperboliques (dgnrs), il a t montr le rsultat suivant (voir [15] p. 127). Thorme 4.5.5 (de la varit centre). (Kalley, 1967) Soit g un champ de vecteurs de classe C r (Rn ), admettant un point dquilibre dgnr xe . Soit A = Jg (xe ). Alors, il existe : 1. Ws (xe ) et Wi (xe ) des varits invariantes dites respectivement stable et instable de classe C r , tangentes Es (Jg (xe )) et Ei (Jg (xe )) en xe ; 2. Wc (xe ) une varit centre de classe C (r1) tangente Ec (Jg (xe )) en xe . Les varits Ws (xe ), Wi (xe ) et Wc (xe ) sont toutes invariantes par le ot t g et de mme dimension que les sous-espaces correspondants du systme linaris (Es (Jg (xe )), Ei (Jg (xe )) et Ec (Jg (xe ))). Les varits stable Ws (xe ) et instable Wi (xe ) sont uniques, alors que Wc (xe ) ne lest pas forcment. Cependant, de faon pratique, il est dlicat dobtenir ces varits, mme de faon numrique : souvent, le seul recours pour la dtermination dune varit centre est de faire un dveloppement en srie de Taylor de Wc (xe ) au voisinage du point dgnr xe : cette mthode est connue depuis longtemps puisque A.M. Liapounov la utilise en 1892 pour tudier les cas critiques [24]. Pour des raisons de simplication, on eectue un changement de coordonnes sur le systme initial (4.34) pour se ramener au cas o le point dquilibre est lorigine. On va regarder ce qui se passe dans le cas le plus intressant en pratique, cest--dire Wi (0) vide. Le thorme de la varit centre nous dit que le systme initial (4.34) est topologiquement quivalent : dxc = Ac xc + g1 (x), dt dxs = A x + g (x),
dt s s 2

avec Ac de dimension nc correspondant Ec (Jg (0)) et qui a donc toutes ses valeurs propres partie relle nulle. As est de dimension ns correspondant Es (Jg (0)), donc asymptotiquement stable. On peut exprimer Wc (0) sous la forme dune hypersurface : Wc (0) = {(xc , xs ) Rnc Rns : xs = k(xc )}. De plus, on sait que Wc (0) contient 0 (donc k(0) = 0) et, en ce point, est tangent Ec (Jg (0)) (donc Jk (0) = 0). On a : xs = k(xc ) donc : As xs + g2 (xc , k(xc )) = Jk (xc ) (Ac xc + g1 (xc , k(xc ))) , k(0) = 0, Jk (0) = 0. (4.51) (4.52) 183 dxs dxc = Jk (xc ) , dt dt

4. EDO non-linaire On tudie la projection du champ de vecteurs de xs = k(xc ) sur Ec (Jg (0)) : dxc = Ac xc + g1 (xc , k(xc )), dt (4.53)

en tenant compte de (4.51) et de (4.52). Ce qui nous conduit au thorme suivant (voir [15] p. 131). Thorme 4.5.6 (de Henry et Carr, 1981). Si : 1. Wi (0) est vide, 2. lquilibre xec = 0 de (4.53) est localement asymptotiquement stable (respectivement instable), alors lquilibre xe de (4.34) est asymptotiquement stable (respectivement instable). La rsolution de (4.53) tant en gnral impossible, le thorme suivant [15] permet dtudier la stabilit locale de lquilibre xec = 0 par approximation de k. Thorme 4.5.7 (de Henry et Carr, 1981). Sil existe : Rnc Rns avec (0) = 0 et J (0) = 0, telle que, lorsque x 0 : J (xc )[Ac xc + g1 (xc , (xc ))] As (xc ) g2 (xc , (xc )) = o(xr ), r > 1, (4.54) alors h(xc ) = (xc ) + o(xr ), lorsque x 0. Cette technique permet, dans beaucoup de cas, de conclure sur la stabilit asymptotique dun quilibre dgnr. Exemple 4.5.7. Soit le systme direntiel (x, y) R2 : dx = x2 + xy, dt dy = y + x2 . dt On a : Jg (x, y) = 2x + y 2x x 1 , (4.55)

et le systme prsente deux points dquilibre : 0 0 0 , ze1 = , dgnr, Jg (ze1 ) = 0 0 1 1 1 1 . ze2 = , instable, Jg (ze2 ) = 1 2 1 184

4.5. EDO Non linaire Pour lorigine, les valeurs propres associes la jacobienne sont 0 et 1 (on a Ac = 0, As = 1). On cherche alors la varit centre associe ce point dquilibre par son dveloppement lordre 3 : k(x) = ax2 + bx3 + o(x3 ), puisque k(0) = Jk (0) = 0. Ce dveloppement doit vrier (4.54), donc : [2ax + 3bx2 + o(x2 )][x2 + (ax3 + bx4 + o(x4 ))] = [(1 a)x2 bx3 + o(x3 )], et, en galant les termes de mme degrs, on obtient a = 1, b = 2, soit : k(x) = x2 + 2x3 + o(x3 ). Donc (4.53) devient x = x2 + x3 + o(x3 ) et le thorme 4.5.6 permet de conclure linstabilit lorigine. Remarquons que le mme rsultat peut tre obtenu plus intuitivement et sans trop de calcul, en notant que la seconde ligne (en y) de (4.55) converge beaucoup plus vite (exponentiellement) que la premire (en x) : on peut donc considrer quaprs un transitoire, dy = dt 0 = y + x2 , soit y = x2 : on retrouve la varit centre k(x) = x2 + o(x2 ). Exemple 4.5.8. Soit le systme direntiel : dx = xy, dt dy = y x2 , dt avec (x, y) R2 . Lorigine est le seul point dquilibre. Les valeurs propres associes la jacobienne sont 0 et 1. Un dveloppement lordre 3 de k(x) est x2 + o(x3 ). Le thorme 4.5.6 nous permet de conclure que lorigine est asymptotiquement stable (mais non exponentiellement stable). Remarque 4.5.1. Il existe une faon rapide de traiter ces deux exemples : au voisinage de lorigine, y converge exponentiellement, donc innement plus rapidement que x ne le ferait. On en dduit que dy sannule inniement dt plus vite que dx soit, pour lexemple 4.5.7, y = x2 , qui report dans dx = x2 +y dt dt donne bien lquation approche dx = x2 + x3 . De mme, lexemple 4.5.8 dt conduit, quand t , avoir y x2 , donc dx = x3 . dt Mthodes de Liapunov Comme nous lavons vu en introduction dans cette section, les fonctions de Liapunov permettent de suivre lvolution temporelle de ltat du systme. Dnition 4.5.7. Une fonction V : O Rn R+ o O est un ouvert de Rn contenant lquilibre xqu , est dite de Liapunov pour un quilibre xqu ssi elle est continue, dnie positive (i.e. V (x) = 0 x = xqu et V (O) R+ ) et possde une drive. Une fonction de Liapunov est dite radialement non borne si lim x + V (x) = +. Par exemple, pour le pendule pesant (4.6), la fonction dnie par (4.47) est bien une fonction de Liapunov radialement non borne pour lorigine. 185

4. EDO non-linaire Il est alors concevable den conclure que si V dcrot le long des trajectoires alors V va rejoindre un minimum qui correspond ce que ltat ait rejoint lquilibre : cest ce que traduisent les rsultats qui suivent. Thorme 4.5.8. Soit lEDO (4.34), O un ouvert de Rn contenant lorigine, V : O R+ de classe C 1 telle que V (x) = 0 x = 0 et les conditions suivantes C1) dV (4.34) = V g(x) 0, x O, C2) V g(x) = 0 x = 0 Si dt x x C1) est vraie alors lorigine de (4.34) est localement stable. Si C1 et C2) sont vraies alors lorigine de (4.34) est localement asymptotiquement stable. Si dans les deux rsultats prcdents, O = Rn et V est radialement non borne alors les conclusions sont globales, en particulier pour le second rsultat on pourra conclure que lorigine de (4.34) est globalement asymptotiquement stable. Dmonstration. Soit O O un ouvert de lorigine et C un compact O (contenant O) alors C (O\O) est compact et V tant continue elle y atteint un minimum min : Vmin O, V = {x O : V (x) }. De plus dV (x(t)) 0 donc dt si x0 V : (t; t0 , x0 ) V : lorigine est donc stable. Sur Vmin O compact, V (t) est dcroissante minore par 0, donc elle admet une limite l min . Si l > 0 et > 0 alors V+l est compact ( O pour susamment petit) donc V tant continue elle admet un maximum m. Soit x0 V+l , (t; t0 , x0 ) V+l
t

lim V ((t; t0 , x0 )) = l = V (x0 ) +


0

V (t)dt V (x0 ) m lim (t) < 0. (4.56)


t

Do la contradiction. Le dernier point en dcoule. Exemple 4.5.9. Si on considre (4.36) dans laquelle le second membre de lEDO 1 est remplac par son oppos, alors en prenant V (x) = 2 (x2 + x2 ) on obtient 1 2 V = (x2 + x2 1)(x2 + x2 ), on en conclut que lorigine est localement asympto1 2 1 2 tiquement stable. Pour un systme linaire (4.32), on dduit du Thorme 4.5.8 et dun autre rsultat permettant de montrer sous certaines conditions (ici vries) la rciproque du Thorme 4.5.8, le rsultat suivant Thorme 4.5.9. Soit Q une matrice symtrique dnie positive quelconque. Lorigine de x = Ax, x Rn , est globalement asymptotiquement stable ssi il existe P une matrice symtrique dnie positive solution de lquation de Liapunov P A + AT P = Q. (4.57) Dans ce cas, V = xT P x est une fonction de Liapunov radialement non borne analytique telle que dV (4.32) = V Ax est dnie ngative. dt x A partir duquel on dduit : 186

4.5. EDO Non linaire Thorme 4.5.10. Soit le systme (4.34) tel que g(0) = 0, en notant A = Jg (0) : sil existe P une matrice symtrique dnie positive solution de (4.57) pour Q une matrice symtrique dnie positive donne, alors lorigine de (4.34) est localement asymptotiquement stable. Cela signie que si lorigine est asymptotiquement stable (respectivement instable) pour le systme x = Jg (0)x (dit linaris) alors il en est de mme pour le systme initial (4.34). Dmonstration. Soit V = xT P x, puisque g(x) = Ax + o( x ) on en dduit 2 V T x g(x) = x Qx+o( x ). Pour < min (Q) donn, on peut trouver une boule de centre lorigine telle que o( x 2 ) x 2 donc sur cette boule V g(x) x ( min (Q)) x 2 0. Le Thorme 4.5.8 permet de conclure. Exemple 4.5.10. Soit le systme x = y, y = x x3 + xy 2y. Lorigine est un quilibre, A = Jg (0) = 0 1 , A (x) = (x + 1)2 , (4.58)

1 2 3 1 1 . P A + AT P = I, P = 2 1 1

On en dduit que lorigine de (4.58) est asymptotiquement stable.

Principe dinvariance La Salle


Pour un pendule pesant amorti (4.46), la fonction (4.47) a pour drive (4.48), permettant seulement de conclure que lorigine est globalement stable. Cependant, nous savons que la position basse est aussi attractive : le pendule tend rejoindre cette position sous leet dune dissipation dnergie par frottement. Pour le prouver mathmatiquement, il nous faut une nouvelle fonction de Liapounov : cest le principe dinvariance de La Salle qui nous permettra (sans changer de fonction de Liapounov) daboutir au rsultat. Avant de donner ce rsultat, examinons de plus prs lexemple du pendule pesant amorti. En posant x = (x1 , x2 )T = (, )T , (4.46) devient : x1 = x2 , x = x g sin(x ),
2 ml2 2 l 1

et (4.47) donne dV = x2 . Or, nous savons que V dcrot sauf lorsque x2 reste 2 dt identiquement nulle (car V 0). Mais, dans ce cas, x2 (t) reste identiquement 187

4. EDO non-linaire

Fig. 4.10: Mthodologie

nulle, ce qui implique que sin(x1 ) aussi. Ainsi V (t) ne peut rejoindre sa valeur de repos (lorsque V 0) que si le pendule est au repos en position basse x = 0 (si on dmarre dune position dans lensemble C = {x : V (x) 2mgl} qui est positivement invariant et qui contient le segment {x2 = 0, |x1 | < }). Ce raisonnement, qui consiste ne retenir, parmi les tats annulant V , que ceux qui sont invariants, est formalis dans le thorme suivant. Thorme 4.5.11 (Principe dinvariance de La Salle). Soit lEDO (4.34), C Rn un ensemble compact positivement invariant et V : C Rn R (non 188

4.5. EDO Non linaire ncessairement dnie positive) de classe C 1 telle que x C : V (x) 0 (ngative mais non ncessairement dnie). Alors toute solution initialise dans C converge asymptotiquement vers I le plus grand ensemble invariant inclus dans {x : V (x) = 0}. Dmonstration : soit x0 C. Il faut montrer que g (x0 ) I (I {x C : (x) = 0} C). C tant invariant, g (x0 ) C (car t : t (x) C). V (x) 0 V g sur C donc V dcroissante minore (V tant continue et C compact elle admet un maximum et un minimum voir [27] chapitre 1) donc convergente vers une limite l : limt V (t (x0 )) = l, do x g (x0 ) : V (x) = l, donc V (t (x)) = g g t+ti (x )) = l. On a ainsi V = 0, do (x ) {x C : V (x) = 0}. limti V (g 0 g 0 De plus, cet ensemble est invariant, donc g (x0 ) I. Finalement, t (x0 ) tant g borne, t (x0 ) converge vers g (x0 ) I. g Corollaire 4.5.3. Si, dans (4.34), g est analytique, alors I = {0} {Lk V (x) = g 0, k N} = {0} (I tant dni dans le thorme 4.5.11).

Thormes rciproques
Nous venons de donner des conditions susantes de stabilit (asymptotique ou non, globale ou locale) : il reste savoir sil existe des conditions ncessaires. Les thormes rciproques suivants donnent des rponses partielles. Thorme 4.5.12. [22] Soit lEDO (4.11), avec f de classe C 1 et de jacobienne borne uniformement en t sur un compact contenant lorigine. Si lorigine est un point dquilibre localement (respectivement globalement) exponentiellement stable, alors il existe un ouvert O de Rn contenant lorigine (respectivement O = Rn ), une fonction V : [t0 , [O R+ de classe C 1 et quatre constantes wi > 0 (i {1, ..., 4}) telles que pour tout (t, x) [t0 , [O : w1 x dV dt
2

V (t, x) w2 x =

,
2

(4.34)

V V f (t, x) + w3 x x t

V x

w4 x .

De mme, il existe i quatre Kfonctions telles que pour tout (t, x) [t0 , [O : 1 ( x ) V (t, x) 2 ( x ) , dV dt =
(4.34)

V V f (t, x) + 3 ( x ) , x t

V x

4 ( x ) .

Si f est autonome (cest--dire si on considre une EDO du type (4.34)), alors V peut tre choisie indpendante du temps (V = V (x)). 189

4. EDO non-linaire Thorme 4.5.13. [16, 17] Soit lEDO (4.11), avec f de classe C 1 . Si lorigine est un point dquilibre uniformment asymptotiquement stable, alors il existe un ouvert O de Rn contenant lorigine et une fonction V : [t0 , [O R+ de classe C 1 , dnie positive, convergeant uniformment en t vers zro avec la norme de x et telle que sa drive soit dnie ngative. Si f est autonome (cest--dire si on considre une EDO du type (4.34)), alors V peut tre choisie indpendante du temps (V = V (x)).

Thormes dinstabilit
Il existe de nombreux rsultats donant des conditions susantes dinstabilit [16, 17]. Thorme 4.5.14 (de Liapounov). Soit lEDO (4.11), admettant lorigine pour quilibre. Sil existe un ouvert O de Rn contenant lorigine et une fonction V : [t0 , [O R, (t, x) V (t, x), continue et convergeant uniformment en t vers zro avec la norme de x et sil existe un domaine non vide D contenant lorigine et sur lequel on a V (t, x) < 0 et V (t, x) 0, alors lorigine est instable. Exemple 4.5.11. Reprenons le modle de Van der Pol (4.41) : lquilibre x = 0 est instable pour > 0. En eet, en prenant V (x) = 1 (x2 + x2 ), on obtient 2 2 1 V = 2x2 ( x2 ) et le thorme 4.5.14 permet de conclure. 2 2 Corollaire 4.5.4 (de Liapounov). Soit lEDO (4.34), admettant lorigine pour quilibre. Sil existe une fonction V continue dont la drive est dnie ngative et si V (x) est dnie ngative ou indnie en signe, alors lorigine est instable. Exemple 4.5.12. Reprenons (4.1) : lquilibre x = 0 est instable. En eet, en prenant V (x) = x2 , on obtient V = 2ax2 (xmax x) < 0 si x = 0. Le corollaire 4.5.4 permet de conclure. Un rsultat plus gnral est d N.G. Chetaev. Thorme 4.5.15 (de Chetaev). Soit lEDO (4.11), admettant lorigine pour quilibre. Sil existe un ouvert O de Rn contenant lorigine et une fonction V : [t0 , [O R, (t, x) V (t, x) de classe C 1 telle que : 1. > 0, x B (0) : V (t, x) 0, t t0 (on note U lensemble des points x pour lesquels V (t, x) 0, t t0 ), 2. V (t, x) est minore sur U un sous-domaine de U, 3. sur U , que
dV (t,x) < 0 (en particulier, dt (4.11) dV (t,x) (|V (t, x)|) < 0), dt (4.11)

il existe une Kfonction telle

alors lorigine est instable. 190

4.5. EDO Non linaire Exemple 4.5.13. Soit lEDO : x = x3 + y 3 , y = xy 2 + y 3 . Lorigine est un point dquilbre instable. En eet, prenons V (x, y) = 1 (x2 y 2 ) 2 et le domaine U dni par U = {(x, y) R2 : y x y ou y x y} 2 (V (x) 0). En dnissant U = U B (0), V est minore par 2 et V = 4 y 4 ) < 0 sur U . Le thorme 4.5.15 permet alors de conclure linstabilit de (x lorigine. Notons enn quen ce point, la jacobienne est nulle, ainsi les thormes 4.5.4 et 4.5.5 ne nous permettent pas de conclure. Remarque 4.5.2. Ces rsultats peuvent tre facilement adapts la stabilit dun ensemble A. Enn, on peut noncer ces rsultats de faon duale en remplaant dnie ngative par dnie positive et rciproquement.

Extensions vectorielles
Plus le systme est complexe et de grande dimension et plus la construction de fonctions de Liapounov devient dlicate . Face ce genre de dicult, il est dusage : R1) daccepter de perdre un peu dinformation pour se ramener un problme connexe plus simple (cest sur ce principe quest bas la premire mthode de Liapounov, dite du linaris local) ; R2) de dcomposer le problme pour en comprendre plus facilement les parties constituantes, puis le re-composer (prceptes de Descartes). Pour analyser un modle de grande dimension, on peut ainsi tenter de le dcomposer en plusieurs sous-systmes de complexit et de dimension moindres. Les procds R1 et R2 sont illustrs respectivement par les exemples 4.5.14 et 4.5.15. Exemple 4.5.14. Soit le modle : dx = 2x(2 + sin(t) + x), dt t R, x R. (4.59)

En introduisant la variable z = sign(x)x, on obtient13 : dz = 2z(2 + sin(t) + x), si x = 0, dt dz 2z(1 + z), dt z0 0 z(t) , z0 + (1 z0 ) exp(2(t t0 ))
13

(4.60) (4.61) (4.62)

Etant donn que la drive de la fonction signe au point x = 0 nest pas dnie au sens classique, nous exclurons ce cas pour la suite (x = 0). En fait, en utilisant une notion plus gnrale du gradient ou de la drive (voir [7, 27]), nous pourrions obtenir directement un rsultat similaire celui qui suit.

191

4. EDO non-linaire et il est alors vident que lquilibre x = 0 de (4.59) est exponentiellement stable. Une estimation de Dse (0) est ] , 1[. Par ailleurs, (4.62) reste valable pour x = 0. Dans cet exemple 4.5.14, nous avons utilis de faon implicite la notion de systme majorant (SM) : en eet, les solutions de (4.61) sont majores par celles de lEDO : dy = 2y(1 + y) (pour des conditions initiales identiques). De dt tels systmes majorants prsentent les proprits suivantes : leurs solutions permettent dobtenir une estimation des comportements du systme initial ; ils peuvent infrer une proprit qualitative P pour le systme initial et, dans ce cas, le SM sera dit systme de comparaison (SC) pour la proprit P : cest le cas dans lexemple 4.5.14 o dy = 2y(1 + y) est un dt SC pour la proprit P de stabilit exponentielle pour le systme (4.61) ; ils peuvent ne plus dpendre du temps ni dventuelles perturbations affectant le systme initial, ce qui permet de simplier ltude de leurs solutions ; ils peuvent tre de dimension rduite par rapport celle du systme initial (voir exemple 4.5.15). An de formuler les concepts de SM et de SC, considrons les systmes : x = f (t, x), z = g(t, z), nous avons alors les dnitions suivantes. Dnition 4.5.8. (4.64) est un systme majorant (SM) de (4.63) sur O Rn si : (x01 , x02 ) O2 : I = I(4.63) (t0 , x01 ) I(4.64) (t0 , x02 ) = {t0 }, x Rn , zR ,
n

(4.63) (4.64)

x02 x01 = z(t; t0 , x02 ) x(t; t0 , x01 ), t I. De ce concept, nous pouvons dduire certaines proprits qualitatives pour les solutions positives. Par exemple si z(t; t0 , x02 ) x(t; t0 , x01 ) 0 et si les solutions z(t; t0 , x02 ) (pas forcment uniques) convergent vers lorigine, alors il en est de mme pour les solutions x(t; t0 , x01 ). Dnition 4.5.9. (4.64) est un systme de comparaison (SC) de (4.63) pour la proprit P si [P vraie pour (4.64) P vraie pour (4.63)]. Exemple 4.5.15. Pour le systme : 1 2 2) sin t dx 2 + sin t + 4 (x1 + x2 x, t R, x R2 , = 1 2 dt 2) sin t 2 + sin t + (x + x
4 1 2

(4.65) 192

4.5. EDO Non linaire la variable v = 1 (x2 + x2 ), est solution de : 2 4 1 dv = 2v(2 + sin t + v), dt t R, v R+ .

Ainsi, laide de lexemple 4.5.14, nous pouvons conclure que lorigine de (4.65) est exponentiellement stable et quune estimation de son domaine de stabilit exponentielle est {x R2 : (x2 + x2 ) < 4}. 1 2 Lanalyse de lexemple 4.5.15 nous permet de constater que lutilisation de la fonction de Liapounov v permet de rduire la dimension de lEDO tudie, tout en conduisant des conclusions signicatives quant aux comportements des solutions de lEDO initiale. Cette rduction de dimension entrane une perte dinformation sur les comportements lis au systme initial. Il semble donc intressant de rduire cette perte en utilisant non pas une seule fonction candidate Liapounov, mais plusieurs fonctions regroupes dans un vecteur qui conduira une fonction vectorielle de Liapounov (FVL), en esprant que chacune delle apportera des informations provenant de direntes parties du systme initial. Dnition 4.5.10. V est une fonction vectorielle Liapounov (FVCL) si : V : Rn Rk , x V (x) = [v1 (x), . . . , vk (x)]T , o les fonctions vi (x) sont continues, semi-dnies positives et telles que [V (x) = 0 x = 0]. Exemple 4.5.16. V : R3 R2 , x V (x) = [x2 + x2 , (x2 x3 )2 + x2 ]T est + 1 2 3 une FVCL, alors que V : x [(x1 + x2 )2 , (x2 x3 )2 ]T nen est pas une. Les normes vectorielles [2, 4, 14, 25, 26] consituent un cas particulier de FVCL, prsentant lavantage de permettre une construction systmatique du systme majorant. En particulier, en dcomposant Rn en une somme directe :
k

Rn =
i=1

Ei ,

(4.66)

avec Ei sous-espace de Rn , dim(Ei ) = ni (isomorphe Rni ), on construit des normes au sens usuel pi (x[i] ) sur Ei avec x[i] = Pri (x) la projection de x sur Ei . Ces direntes normes, regroupes dans un vecteur, permettent de dnir une norme vectorielle rgulire 14 : P : Rn Rk , + x P (x) = [p1 (x[i] ), . . . , pk (x[k] )]T .
14

si la somme dans (4.66) nest pas directe, alors P est une norme vectorielle non rgulire

193

4. EDO non-linaire Ainsi, en dcomposant (de faon non unique) le champ de vecteurs f suivant : f (t, x, d) = A(t, x, d)x + b(t, x, d), avec d un vecteur traduisant des incertitudes de modle ou des perturbations, on obtient : D+ P (x) M (.)P (x) + q(.), (4.67) avec (.) = (t, x, d), M (.) = {mij (.)} une matrice (k k) et q(.) = [q1 (.), . . . , qk (.)]T un k-vecteur, dnis par : mij (.) = sup grad pi (u[i] )T Pri A(.) Prj u[j] pj (u[j] ) , (4.68) (4.69)

uRn

qi (.) = (grad pi (x[i] ))T Pri b(.) .

Pour certaines normes de Hlder , les expressions formelles de (4.68) et (4.69) peuvent aisment tre obtenues [4, 14, 25, 26]. Par exemple, si P (x) = [|x1 | , . . . , |xn |]T , alors M est la matrice A dont les lments hors-diagonaux sont remplacs par leur valeur absolue (soit mij (.) = |aij | si i = j et mii (.) = aii ) et q = [|b1 | , . . . , |bn |]T . La fonction M (.)z + q(.)15 est quasi-monotone non dcroissante en z. De plus, on peut toujours trouver g(z) = M (z)z+q(z) M (.)z+q(.), qui soit quasi-monotone non dcroissante en z (au moins localement). Ainsi, le thorme 4.3.6 permet de conclure que : z = M (z)z + q(z), (4.70)

est un SM de (4.67). Ce qui conduit divers rsultats [25, 26], en particulier le suivant. Thorme 4.5.16. Considrons une des proprits P dnies aux paragraphes 4.5, 4.5, 4.5, par exemple : stabilit, attractivit, stabilit asymptotique, etc. Sous les hypothses conduisant la construction de (4.70), pour lequel ze est un point dquilibre positif de proprit P et ayant un domaine non vide associ DP (ze ), alors A = {x Rn : P (x) ze } a la proprit P, de domaine DP (A) = {x Rn : P (x) DP (ze )}. Exemple 4.5.17. Soit le modle : x1 = (1 x2 x2 )x1 + d12 (t)x2 , 1 2 x = (1 x2 x2 )x2 + d21 (t)x1 , 1 2 2 |d (t)| 1, t R,
ij
15

(4.71)

ainsi que M z + q, avec la matrice M (respectivement le vecteur q) constitue des suprema sur (t, x, d) des coecients de la matrice M (.) dnie par (4.68) (respectivement du vecteur q(.) dni par (4.69))

194

4.6. Exercices o les fonctions dij sont continues par morceaux. Pour la norme vectorielle rgulire P (x) = [|x1 | , |x2 |]T , on obtient : (1 p2 (x) p2 (x)) 1 1 2 P (x), Dt P (x) 1 (1 p2 (x) p2 (x)) 1 2 auquel on associe le SM suivant : z(t) = g(z) =
2 1 z1

1
2 1 z2

z(t),

(g est quasi-monotone non dcroissante) ayant pour point dquilibre positif : 1 ze = 2 , (4.72) 1 1 permettant de conclure que A = x Rn : P (x) 2 est globale 1 ment asymptotiquement stable. Enn, notons que cette dmarche peut tre tendue au cas de matrices de fonctions de Liapounov [10].

4.6

Exercices

Comportements linaires
Exercice 4.6.1. Dterminer le comportement des solutions des EDO suivantes : x = x, x Rn , x = 2x, x R ,
n

(4.73) (4.74)

, (x, y) R2 , y = 2x y x = x + y, , (x, y) R2 , y = x 2y x = x + 2y, , (x, y) R2 , y = x + y

x = y,

(4.75)

(4.76)

(4.77)

195

4. EDO non-linaire 1 2 0 x = 2 0 1 x, x R3 , (nota 1 est valeur propre) 4 2 1 0 1 0 3 x= 0 0 1 x, x R , (nota 1 est valeur propre) 6 11 6

(4.78)

(4.79)

Solution 4.6.1. Pour ces quations x = Ax, si A est inversible il ny a quun seul point dquilibre qui est lorigine sinon tout vecteur du noyau de A {y Rn tq Ay = 0} est un quilibre. Enn le comportement (cf. Thorme du cours) est entirement dtermin par les parties relles des valeurs propres de la matrice A. Pour (4.73), A = Id donc il ny a quun seul quilibre instable puisque 1 est une valeur propre positive (elle est dordre n). Pour (4.74), A = 2Id donc il ny a quun seul quilibre asympttiquement stable puisque toute les valeurs propres sont gales 2 donc parties relles ngatives. Pour (4.75), 2 1 il ny a quun seul quilibre asympttiquement stable puisque les valeur propres 1 1 , dont les vasont parties relles ngatives. Pour (4.76), A = 1 2 1 leurs propres sont 2 5 1 , 1 1 5 donc il ny a quun seul quilibre instable 2 2 2 1 2 , puisque une des valeurs propres est positive. Pour (4.77), A = 1 1 dont les valeurs propres sont i, i donc il ny a quun seul quilibre stable (les espaces propres associ aux valeurs propres parties relles nulles sont tous les deux dimension un). En fait, les solutions sont des ellipses. Pour (4.78), de 1 2 0 A = 2 0 1 , dont les valeurs propres sont 1, 1 + 1 i 7, 1 1 i 7 2 2 2 2 4 2 1 0 1 0 donc il ny a quun seul quilibre instable. Pour (4.79), A = 0 0 1 , 6 11 6 dont les valeurs propres sont 1, 2, 3 donc il ny a quun seul quilibre asympttiquement stable. 196 A= 0 1 , dont les valeurs propres sont 1 + 1 i 7, 1 1 i 7 donc 2 2 2 2

4.6. Exercices

Equilibres
Exercice 4.6.2. Un pendule est constitu dun l de longueur l comportant une masse m en son extrmit : d2 x g + sin(x) = 0, x R. dt2 l (4.80)

Discuter de lexistence des solutions. Dterminer les points dquilibre et leur nature. Solution 4.6.2. On pose x1 = x, x2 = x, le systme devient : x1 = x2 , , x = g sin(x )
2 l 1

(4.81)

Le second membre tant Lipchitzien, il y a bien existence et unicit de solution au PC (au moins localement). Donc les quilibres sont donns par x2 = 0, x 0 mod()
1

Pour chacun de ces quilibres on peut tudier le comportement local des solutions au voisinage de ces quilibres (x1 = k, x2 = 0) laide du systme (dit linaris : z = Az, A tant la Jacobienne du second membre de (4.81)) z1 = z2 , z = (1)k+1 g z
2 l 1

Il sut de dterminer les valeurs propres de la matrice A =

0 (1)k+1 g l

1 0

dont le polynme caractristique est (A) = 2 + (1)k g donc si k est impair l les valeurs propres sont g : une des valeurs propres tant positive lquilibre l correspondant est intable (position haute). En ce qui concerne le cas k pair les valeurs propres sont parties relle nulles : on ne peut pas conclure directement mais en utilisant la fonction V (x) = 1 mx2 + mgl(1 cos(x)) (Energie totale) 2 sa drive est nulle le long des solutions de (4.81). Au voisinages des quilibres considrs V est dnie positive et V nulle en utilisant le thorme 4.5.8 on conclut la stabilit (mais pas asympttique).

Etude de proprits qualitatives des solutions dEDO


Exercice 4.6.3. Dterminer et classer les points dquilibres (point hyperbolique ou non) pour les systmes dcrits par les quations suivantes. Si le point est 197

4. EDO non-linaire hyperbolique on spciera sil est asympttiquement stable, stable ou instable selon les valeurs des paramtres () qui interviennent. dx = |x| , x R. dt dx = x3 (x 1), x R. dt d2 x dx + x + xn = 0, x R. 2 dt dt d2 x dx 2 + + sin(x) = 0, x R. dt2 dt d2 x dx + (x2 1) + x = 0, x R. 2 dt dt dx = x(x 1), x R. dt dx = x(y 1)
dt dy dt

(4.82) (4.83) (4.84) (4.85) (4.86)

(4.87) . (4.88)

= y(x + 1) . (4.89)

dx dt = x(x 1) dy dt = x + y dx dt dy dt

= x + y = 2x 2y

(4.90)

Solution 4.6.3. Les rsultats sont dcrits dans le tableau suivant :

198

4.6. Exercices

EDO (4.82) (4.83)

Unicit des sol. ? (pas Lipschitz) oui (Lipschitz)

quilibre 0 0 1

Hyp. ? non non ! non ! oui oui oui non oui non non

Val. Pr. ? 0 1
i 42 2 2 4(1n) 2

Stab. As. non oui non ! non ! oui non non ?? non non Stab.

(4.84) (4.85) (4.86) (4.87)

oui (Lipschitz) oui (Lipschitz) oui (Lipschitz) oui (Lipschitz)

(x = 0, x = 0) (x = 1, x = 0) x=
k 2 ,x

=0

(0, 0)
i 42 2

(x = 0, x = 0) 0 1

1 1 (1, 1) (i, i) (1, 1) (1, 1) (0, 3)

(4.88)

oui (Lipschitz)

(x = 0, y = 0) (x = 1, y = 1)

(4.89) (4.90)

oui (Lipschitz) oui (Lipschitz)

(x = 0, y = 0) (x = 1, y = 1) (x = 0, y = 0)

Exercice 4.6.4. Une masse m attache lextrmit verticale dun ressort dont le coecient de rappel k(x + x3 ) est non linaire : d2 x k + (x + x3 ) = 0, x R. 2 dt m (4.91)

Discuter de lexistence des solutions. Dterminer les points dquilibres et leur natures. Solution 4.6.4. En posant x = x1 , x = x2 , cette EDO devient x1 = x2 , k x2 = (1 + x2 )x1 1 m On en dduit lexistence et lunicit des solutions au PC (le second membre tant C 1 ). Du fait de lunicit, les points dquilibres sont les solutions de x1 = x2 = 0 k x2 = (1 + x2 )x1 = 0 1 m 199

4. EDO non-linaire il y a un seul point dquilibre (x = x1 = x = x2 = 0) qui est dgnr (non hyperbolique) car 0 1 Jf = k m 0
k 1 k k mais stable : V = 1 x2 + 2m (x2 + 2 x4 ), V = m x1 x2 1 + x2 + m x1 x2 1 + x2 = 1 1 1 1 2 2 0.

Exercice 4.6.5. Monter que le champ de vecteur associ lquation direntielle donne ci-dessous est bien valeurs dans lespace tangent au cercle.
dx dt dy dt

= (x2 + y 2 1)x = (x2 + y 2 1)y +

2x2 y x2 +y 2 2x3 x2 +y 2

, (x, y) cercle unit,

(4.92)

Y-a-t-il existence et unicit des solutions (discuter) ? Dterminer, pour t0 , x0 et y0 donns, lintervalle de dnition I(t0 , x0 , y0 ) des solutions passant par (x0 , y0 ) t0 . Expliciter les solutions. Indication : utiliser les coordonnes polaires. Exercice 4.6.6. On considre x = A(t)x. (4.93)

1. Montrer que les solutions forment une espace linaire et que toute solution dpend linairement de la condition initiale x(t0 ) = x0 . En dduire lexistence dune matrice dite rsolvante R(t, t0 ) telle que x(t, t0 , x0 ) = R(t, t0 )x0 . Montrer quelle vrie les proprits suivantes : dR = A(t)R, dt R(t0 , t0 ) = Id, R(t3 , t1 ) = R(t3 , t2 )R(t2 , t1 ) R est inversible et R1 (t, t0 ) = R(t0 , t). 2. Montrer que si A(t) = A0 + A1 (t) avec A0 ayant toute ses valeurs propres parties relles strictement ngatives et limt A1 (t) = 0, alors lorigine de (4.93) est asympttiquement stable. 3. On suppose cette fois que A(t) est continue. Montrer que si A(t) et lintt grale t0 A(u)du ne commutent pas alors la rsolvante R(t, t0 ) vrie
t

R(t, t0 ) = exp
t0

A(u)du .

200

4.6. Exercices Application : quen est-il pour A(t) = A(t) = cos(t) sin(t) sin(t) cos(t) . puis pour

t 1 0 1

Exercice 4.6.7. Pour une machine vapeur, la vitesse de rotation est lie d = k cos( + ) F, dt d2 d = 2 sin cos g sin b , 2 dt dt avec b, g, k, F > 0. Pour = 0 dterminer le comportement de solutions. Solution 4.6.5. Pour = 0, les quilibres vrient (si F < k) cos = F , k F k + 2n, a = 1

a = a arccos n 2 = gk , F

Si on regarde une approximation au premier ordre cos( + ) = cos = a 1


F 2 ( k

F k

n ), sin = a 1

F 2 k

F k (

n )

d = a k 2 F 2 ( n ), dt d2 gF d = ( n ) b , 2 dt k dt En posant x1 =
gk F , x2

= n , x3 =

d dt

x1 = a k 2 F 2 x2 , x2 = x3 , gF x3 = x2 bx3 , k Soit en posant x = (x1 , x2 , x3 )T : 0 a k 2 F 2 0 x= 0 0 1 0 gF b k

201

4. EDO non-linaire
1 les valeur propres sont 0, 2

b2 4 gF k

, en rsum les quilibres a = n

arccos

F k

+ 2n sont stables (pas attractifs).

Exercice 4.6.8. Etudier les quilibres de x = xy 2 2y y = x x2 y (4.94)

Montrer que lorigine est stable (Indication on utilisera la fonction V = ax2 + by 2 , a > 0, b > 0 et on choisira a, b pour que V soit dnie ngative ou nulle) Solution 4.6.6. Il ny a quun seul quilibre : lorigine (x = y = 0) V = 2(axy(2 + xy) + bxy(1 xy)) On a un choix trivial 2a + b = 0 et a > 0 alors V > 0 et V = 6ax2 y 2 0 le second thorme de Liapunov permet de conclure. Exercice 4.6.9. On considre le systme x = y + x( (x2 + y 2 )) y = x + y( (x2 + y 2 )) (4.95)

1. Dterminer les points dquilibres et leur nature (hyperbolicit, stabilit ?) 2. En utilisant la fonction V (x) = 1 (x2 +y 2 ), montrer que lorigine est asymp2 ttiquement stable pour < 0. Que se passe t-il pour = 0 ? 3. Pour > 0 : quadvient-il du comportement des solutions. 4. Retrouver ces rsultats en intgrant cette quation (Indication : utiliser les coordonnes polaires). Exercice 4.6.10. On considre le systme suivant dx = x + y + f (x, y) dt . dy = x y + g(x, y)
dt

(4.96)

1. On suppose dans cette question que f (x, y) = g(x, y) = 0. Dterminer les points dquilibre. 2. Pour chacun de ces points dquilibre, dterminer sil est hyperbolique ou non, sil est asymptotiquement stable, stable ou instable. 202

4.6. Exercices 3. On supose dans cette question que f (x, y) = x2x y2 , g(x, y) = 2 +y
1 2
2

2x3 . x2 +y 2

On

considre la fonction V : (x, y) + , valuer (x(t), y(t)), pour x(t) et y(t) solution de (4.96). Montrer que, pour tout couple (x0 , y0 ) de conditions initiales de (4.96), la fonction V value le long de trajectoires solutions de (4.96) cest--dire pour des couples de points (x(t), y(t)) solution de (4.96) dcroit exponentiellement vers 0. 4. En dduire le comportement qualitatif de (4.96) (cest--dire comment se comportent les solutions au bout dun temps inniment grand et ce pour tout couple (x0 , y0 ) de conditions initiales). Solution 4.6.7. On considre le systme suivant
dx dt dy dt

x2

y2

d dt V

= x + y + f (x, y) = x y + g(x, y)

(4.97)

1. On suppose dans cette question que f (x, y) = g(x, y) = 0. Dterminer les points dquilibre. Rponse : Puisquil y a unicit des solutions (second membre loc. Lipschitz), on doit rsoudre 0 = x + y (4.98) 0 = x y 1 1 A(x, y)T = 0, A = 1 1 det(A) = 2, La matrice A tant non singulire, lunique solution de (4.98) est : x = 0, y = 0. 2.Pour chacun de ces points dquilibre, dterminer sil est hyperbolique ou non, sil est asymptotiquement stable, stable ou instable. Rponse : Il faut calculer les valeurs propres de A : 1 i on en conclu quil sagit dun quilibre hyperbolique asympttiquement stable (cf. cours). 2 2x3 3. On supose dans cette question que f (x, y) = x2x y2 , g(x, y) = x2 +y2 . On 2 +y
1 d considre la fonction V : (x, y) 2 x2 + y 2 , valuer dt V (x(t), y(t)), pour x(t) et y(t) solution de (4.96). Montrer que, pour tout couple (x0 , y0 ) de conditions initiales de (4.96), la fonction V value le long de trajectoires solutions de (4.96) cest--dire pour des couples de points (x(t), y(t)) solution de (4.96) dcroit exponentiellement vers 0.

203

4. EDO non-linaire Rponse : d V dx V dy V (x(t), y(t)) = + dt x dt y dt = xx + y y = x x + y 2x2 y x2 + y 2 + y x y + 2x3 x2 + y 2

= 2V + xy 1 1 = 2V

2x2 2x2 + 2 x2 + y 2 x + y 2

donc V (x(t), y(t)) = exp(2t)V (x0 , y0 ). On en dduit que x2 (t) + y 2 (t) dcroit exponentiellement vers 0 : les solutions dcroissent exponentiellement vers 0 : lorigine est asymptotiquement stable (en fait on dit quil est exponentiellement stable). 4. En dduire le comportement qualitatif de (4.96) (cest--dire comment se comportent les solutions au bout dun temps inniment grand et ce pour tout couple (x0 , y0 ) de conditions initiales). Exercice 4.6.11. On considre le systme x = y(1 + x2 + y 2 ) + x( (x2 + y 2 )) y = x(1 + x2 + y 2 ) + y( (x2 + y 2 )) (4.99)

1. Dterminer les points dquilibre et leur nature (hyperbolicit, stabilit ?)


1 2. En utilisant la fonction V (x) = 2 (x2 +y 2 ), montrer que lorigine est asympttiquement stable pour < 0. Que se passe t-il pour = 0 ?

3. Pour

> 0 : quadvient-il du comportement des solutions.

Solution 4.6.8. Quelques lments de rponse : 1. Le second membre tant polynomiale on a bien existence et unicit locale des solutions. Les quilibre rpondent y(x2 + y 2 ) = x( (x2 + y 2 )) et x(x2 +y 2 ) = y( (x2 +y 2 )) lunique solution est donc lorigine x = y = 0. La Jacobienne en ce point vaut 1 , J = (4.100) 1 Les valeurs propres tant i + , i + , on en dduit que lorigine est : Si < 0 : Hyperbolique et asympttiquement stable, Si > 0 : Hyperbolique et instable, Si = 0 : Non Hyperbolique (pour la stabilit il faut une tude plus pouss : le 1er thorme de Liapunov ne permet pas de conclure). 204

4.6. Exercices 2. La fonction est bien dnie positive : d V (x(t), y(t)) = xx + y y dt = (x2 + y 2 )( (x2 + y 2 )) = 2V ( 2V )) Si < 0 alors V est dnie ngative le 2nd thorme de Liapunov permet de conclure. Pour = 0 : V = 4V 2 est aussi dnie ngative on en conclut que lorigine est asympttiquement stable en utilisant le second thorme de Liapunov (nota : le premier thorme de Liapunov ne nous avait pas permis de conclure). 3. Il est clair que lorsque > 0, V est localement dnie positive : lorigine est instable. Mais, Si on regarde lEDO V = 2V ( 2V ) elle comporte deux quilibres V = 0 et V = 2 : le premier tant instable et le second stable. Les solutions convergent donc vers lensemble V = 2 cest--dire le cercle de rayon centr en lorigine. Exercice 4.6.12. Systme de Volterra Lotka : modle de lutte de deux espces. En 1917 (durant la premire guerre mondiale), Umberto DAncona (biologiste) constata une augmentation du nombre de slaciens (requins) dans la partie nord de la mer Adriatique. An dexpliquer ce phnomne, il t appel son beaupre Vito Volterra mathmaticien de profession qui expliqua ce phnomne de la faon suivante. Soit un volume deau inni (mer Adriatique par exemple), peupl par deux espces : lune carnivore (C : slaciens) dvorant lautre herbivore (H : crevettes). Notons x et y le nombre dindividus respectivement de lespce (H) et (C). Si lespce (H) peuplait seule la mer : elle se dvelopperait de faon exponentielle (si lon fait lhypothse que le dveloppement de cette espce nest pas limit par lespace et la quantit de nourriture). Donc dans ce cas, la vitesse de variation de lespce (H) serait : dx = ax, avec a qui est un dt rel positif. Par contre, lespce (C) ne peut assurer seule ni son dveloppement ni mme sa survie, donc sa vitesse de variation serait : dy = by, avec b qui est dt un rel positif. Cependant, lorsque les deux espces cohabitent, les carnivores dvorent les individus de lespce (H) : cest leur fonction naturelle. En faisant lhypothse qu chaque rencontre dun carnivore avec un herbivore, ce dernier est dvor et que le nombre de rencontres est proportionnel au produit des densits volumiques des deux espces (donc xy), on peut conclure que les vitesses de variation des deux espces sont rgies par le systme direntiel : dx = ax cxy dt , (4.101) dy = by + dxy
dt

avec a, b, c, d qui sont des rels positifs. Le problme pourrait se rsumer la question suivante : 205

4. EDO non-linaire

Fig. 4.11: Volterra-Lotka

Aprs avoir expliqu le phnomne observ par Umberto dAcona, quelle(s) politique(s) de pche permet(tent) dassurer un bon quilibre tout en maintenant une population de slaciens susante ? A ces ns, on pourra rpondre aux questions suivantes : A) Reprendre ltude dune population unique : 1) Vrier que pour une population modlise par y = y (loi de reproduction normale), celle-ci double en un temps indpendant de la population initiale. 2) Discuter des solutions de lquation logistique. B) Analyse du modle dit de Volterra-Lotka : 1) Le problme de Cauchy associ admet il une ou plusieurs solutions ? Montrer que les solutions sont dnies sur R ? 2) Le quart de plan positif est-il positivement invariant ? (interprtations). 3) Dterminer les points dquilibres ainsi que le comportement des solutions au voisinage de ces points ? 4) Peut-on utiliser la mthode de sparation des variables ? 5) Montrer quil existe une fonction H(x, y) constante le long des solutions de (4.101) : dH(x, y) H(x, y) H(x, y) =0= (ax cxy) + (by + dxy) . dt x y 6) Montrer que les solutions non nulles de (4.101) rendent extremum la fonctionnelle suivante
t1

J(x, y, x, y) =
t0

L(t, x(t), y(t), x(t), y(t))dt, 1 (x ln x y (y ln y x) 2xy

L = H +

C) Analyse du problme En 1917 (guerre oblige), lactivit de pche est fortement ralentie, proposer un modle tenant compte dune certaine forme dactivit de pche avant 1917. 206

4.7. Bibliographie Reprendre les questions de la partie B). Comparer alors les dirents comportements. Conclusions. D) Analyse dans un cadre plus gnral Reprendre lanalyse dans un cadre plus gnral, quelles modications doit-on apporter au modle. Indication : la mer Adriatique est nie (loi Logistique).

4.7

Bibliographie

[1] ARNOLD, V.I.: Equations Direntielles Ordinaires. MIR, Moscou, 1988. 4me dition traduit du russe. [2] BELLMAN, R.: Vector Lyapunov Functions. 1(1) :3134., 1962. J. SIAM Control, ser A,

[3] BHATIA, N.P. et G.P. SZEG: Stability Theory of Dynamical Systems. Springer Verlag Berlin, 1970. [4] BORNE, P.: Contribution lEtude Des Sytsmes Discrets Non-Linaires de Grande Dimension. Application Aux Systmes Interconnects. Thse de doctorat, Universit de Lille, 1976. [5] CHIANG, H. D., M.W. HIRSCH et F.F. WU: Stability Regions Of Nonlinear Autonomous Dynamical Systems. IEEE Trans. Auto. Control., 33(1) :1627, Janvier 1988. [6] CHIANG, H.D. et J.S. THORP: Stability Regions of Nonlinear Dynamical Systems : A Constructive Methodology. IEEE Trans. Auto. Control, 34(12) :12291241, Dcembre 1989. [7] CLARKE, Frank. H.: Optimization and Nonsmooth Analysis. Interscience Publication, 1983. Wiley-

[8] CODDINGTON, E. et N. LEVINSON: Theory of Ordinary Dirential Equations. Mc Graw-Hill, 1955. [9] CORRIEU, P.L.: Commande En Boucle Ferme Dun Actionneur Pas-Pas. Mmoire de matrise, DEA dAutomatique, Universit des Sciences et Technologies de Lille, 1999. [10] DJORDJEVIC, M.Z.: Stability Analysis of Nonlinear Systems by Matrix Lyapunov Method. Dans IMACS-IFACS, Modelling and Simulation for Control of Lumped and Distributed Parameter Systems, pages 209212, I.D.N 59 650 Villeneuve dASCQ (France), 36 Juin 1986. [11] FILIPPOV, A. F.: Dierential Equations with Discontinuous Righthand Sides. Kluwer Academic Publishers, 1988. [12] GENESIO, R., M. TARTAGLIA et A. VICINO: On Estimation of Asymptotic Stability Regions : State of Art and New Proposals. IEEE Trans. Auto. Control, AC-30(8) :747755, Aot 1985. 207

Bibliographie [13] GENESIO, R. et A. VICINO: New Techniques for Constructing Asymptotic Stability Regions for Nonlinear Systems. IEEE Trans. Circuits and Sys., CAS-31(6) :574581, Juin 1984. [14] GRUJI, Lj.T., J.C. GENTINA et P. BORNE: "General Aggregation of Large-Scale Systems by Vector Lyapunov Functions and Vector Norms. Int. J. Control,, 24(4) :529550, 1977. [15] GUCKENHEIMER, J. et P. HOLMES: Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer Verlag, 1983. [16] HAHN, W.: Theory and Application of Liapunovs Direct Method. PrenticeHall, Englewood Clis, N.J., 1963. [17] HAHN, W.: Stability of Motion. Springer-Verlag N.Y., 1967. [18] HALE, J. et H. KOAK: Dynamics and Bifurcations, tome 3 de Text in Apllied Mathematics. Springer-Verlag N.Y., 1991. [19] HIRSH, M.W. et S. SMALE: Dierential Equations, Dynamical Systems, and Linear Algabra. Academic Press, 1974. [20] ISIDORI, A.: Nonlinear Control Systems, tome 1. Springer, 1989. 3e dition. [21] KAMKE, E.: Zur Theorie Gewhnlicher Dierentialgleichung II. Acta Mathematica, 58 :5787, 1932. [22] KHALIL, H.K.: Nonlinear Systems. Prentice-Hall, 1996. [23] LAKSHMIKANTHAM, V. et S. LEELA: Dierential and Integral Inequalities, tome 1. Academic Press, New York, 1969. [24] LIAPOUNOV, A.M.: Stability of Motion : General Problem. Int. J. Control, 55(3), Mars 1892 (1992). Lyapunov Centenary Issue. [25] PERRUQUETTI, W.: Sur la Stabilit et lEstimation Des Comportements Non Linaires, Non Stationnaires, Perturbs. Thse de doctorat, University of Sciences and Technology of Lille, France, 1994. [26] PERRUQUETTI, W., J.P. RICHARD et P. BORNE: Vector Lyapunov Functions : Recent Developments for Stability, Robustness, Practical Stability and Constrained Control. Nonlinear Times & Digest, 2 :227258, 1995. [27] RICHARD, Jean Pierre: Mathmatiques Pour Les Systmes Continus : Tome un. Hermes, 2000. [28] ROUCHE, N. et J. MAWHIN: Equations Direntielles Ordinaires, Tome 1 : Thorie Gnrale. Masson et Cie, Paris, 1973. [29] ROUCHE, N. et J. MAWHIN: Equations Direntielles Ordinaires, Tome 2 : Stabilit et Solutions Priodiques. Masson et Cie, Paris, 1973. [30] WAZEWSKI, T.: Systmes Des Equations et Des Ingalits Direntielles Ordinaires Aux Seconds Membres Monotones et Leurs Applications. Ann. Soc. Polon. Math., 23 :112166, 1950. 208

Calcul des variations

Wilfrid Perruquetti1
1 LAGIS

& INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve dAscq cedex, France. E-mail : Wilfrid.Perruquetti@ec-lille.fr

5.1

Quelques exemples introductifs

De nombreux problmes doptimisation comportent un critre faisant intervenir une fonction que lon cherche. Citons quelques exemples : 1. Soient A et B deux points donns du plan. Dterminer la courbe rectiable de longueur minimale reliant les deux points. Si on munit le plan dun repre (Espace ane identi R2 ) dont lorigine est le point A, une courbe reliant ces deux points est la donne dune fonction y = f (x) (telle que f (0) = 0 et f (xB ) = yB ). Si la courbe est rectiable la longueur est donne par
xB

J1 (f ) =
0

1 + (f (x))2 dx,

(5.1)

(intuitivement on sent bien quil faut f (x) = 0 : cest--dire le segment de droite reliant A B est la rponse notre problme). 2. On ne peut viter lexemple du brachistochrone (o = le plus court, oo = temps) qui ft le premier problme connu de ce genre. En juin 1696 dans un numro dACTA ERUDITORUM Johann Bernouilli proposa le challenge suivant (report ici en termes modernes) : Soient deux points donns A, B dans un plan vertical. Quel est lensemble des trajectoires obtenues lorsquun point M part de A et arrive en B en un temps minimum sous lunique inuence de son poids. ...An dviter les conclusions farfelues, on peut remarquer que la ligne droite est videmment la courbe de plus courte distance joignant les points A et B, mais ce nest certes pas celle qui donne un temps de parcours minimum. Cependant, la courbe solution de ce problme - que je divulguerais si dici la n de cette 209

5. Calcul des variations anne personne ne la trouve- est fort bien connue des gomtres. Mise en quation du problme : prenons un repre (z, x) (avec laxe des z orient vers le bas) dorigine A. Une courbe reliant les deux points A et B est la donne dune fonction x = f (z) (telle que f (0) = 0 et f (zB ) = xB ). La 2 2 vitesse du point de masse unit sexprime par dz + dx = 2gz donc dt dt dz 1+(f )2 dt = . Le temps mis pour aller de A B est donc 2gz
zB

T = J2 (f ) =
0

1 + (f )2 dz. 2gz

(5.2)

On est donc amen dterminer une fonction f qui minimise T = J2 (f ). 3. Problme de lisoprimtre (Euler) : Dterminer la courbe embrassant laire maximale parmi lensemble des courbes fermes de classe C 1 et de longueur donne l. On peut sans perte de gnralit, considrer que ces courbes sont issues de lorigine et que lautre extrmit a pour abscisse xB . La longueur est donc l = 0 B tion cest J3 (f ) = 2
0 x

1 + (f (x))2 dx, quand laire de rvoluxB

f (x)

1 + (f (x))2 dx.

(5.3)

Ce problme est un peu plus complexe puisquil faut minimiser un critre sous une contrainte (la longueur doit tre de l). 4. Parmi tous les arcs de courbes de classe C 1 joignant A et B, deux points donns du plan, et de longueur donne l, dterminer celui qui dlimite avec le segment AB une aire maximum. On peut sans perte de gnralit, considrer que ces courbes sont issues de lorigine et que lautre extrmit a pour abscisse xB . La longueur est donc l = 0 B 1 + (f (x))2 dx, quant laire dlimite par la courbe et laxe des abscisses cest
xB x

J4 (f ) =
0

f (x)dx.

(5.4)

Ce problme ft pos et rsolu (de faon intuitive) par la reine Dido de Carthage en 850 AV-JC. On retrouve un problme similaire celui prsent en 3 (minimum sous contrainte). Une formulation plus gnrale consiste dterminer la courbe qui dnie la surface la plus grande parmi toutes les courbes fermes de primtre donn (ce qui dnit une contrainte).

5.2
Soit

Formulation du Problme
q : [a, b] R Rn t q(t), (5.5)

210

5.2. Formulation du Problme les critres prcdents (J1 J4 ) se mettent sous la forme
b

J(q) =
a

L(t, q(t), q(t))dt,

(5.6)

avec L (appel Lagrangien ) : L : [a, b] R Rn Rn R (x, y, z) L(x, y, z) Problme : trouver toutes les fonctions q qui minimisent ou maximalisent J(q) et satisfassent q(a) = qa , q(b) = qb avec qa , qb donns. J(q) est une fonctionnelle : cest une application qui une fonction valeur dans un espace vectoriel associe un lment dun espace vectoriel. Donc on doit rsoudre un problme doptimisation sur un espace fonctionnel. Si on impose que les fonctions cherches soient continment direntiables, on travaillera avec lespace fonctionnel E = C 1 ([a, b], Rn ). (5.7) Gnralement on muni E de la distance de Chebychev dC (f, g) = max f (t) g(t) + sup 1
t[a,b] t[a,b]

f (t) g (t) ,

induisant la norme nC . Le sup tant atteint si on travaille sur E (on le remplace 1 par un max), mais si on travaille sur Es lensemble des fonctions C 1 par morceaux (la drive peut tre discontinue en un nombre ni de points) on conserve cette distance. Si on note Ea,b = {q E : q(a) = qa , q(b) = qb }, on peut donner la dnition suivante Dnition 5.2.1. q0 est un minimum (respectivement un maximum ) relatif pour J(q) dans lensemble Ea,b muni de la norme nC si 1 J(q) J(q0 ) 0, (respectivement 0) (5.8)

pour toute fonction q Ea,b telle que nC (qq0 ) < , pour un donn strictement 1 positif. Intuitivement, lextremum doit annuler une drive. Ce quil faut bien noter cest que J est une fonctionnelle : il faut adapter la notion de drive. Dnition 5.2.2. J(q) est direntiable en q0 (dans lespace E muni de la norme nC ) sil existe une fonctionnelle linaire continue1 Jq0 L(E; R) telle 1 que J(q0 + h) = J(q0 ) + Jq0 (h) + (h) (5.9) avec limnC (h)0 (h) = 0.
1

Evidemment, linaire signie : (, ) R2 , (q1 , q2 ) E 2 : Jq0 (q1 + q2 ) = Jq0 (q1 ) + b Jq0 (q2 ). Par exemple, la fonctionnelle q a (q + q)dt est linaire.

211

5. Calcul des variations Pour notre fonctionnelle J(q) = a L(t, q, q)dt, en supposant que L soit C 1 par rapport chacun de ses arguments : Thorme 5.2.1. La fonction relle J : q J(q) = a L(t, q, q)dt (avec L C 1 par rapport chacun de ses arguments), est continment drivable et sa drive Jq0 L(E; R) en q0 est donne par
b b b

q Jq0 (q) =
b

L (t, q0 (t), q0 (t))(0, q, q )dt


a

=
a

L L (t, q0 (t), q0 (t))q + (t, q0 (t), q0 (t))q q q

dt

Dmonstration. Il sut dcrire la variation de lintgrale


b

J =
a

Ldt,

L = L(t, q0 (t) + q, q0 (t) + q ) L(t, q0 (t), q0 (t))

or la formule des accroissements nis donne L = L L (t, q0 (t), q0 (t))q + (t, q0 (t), q0 (t))q q q + R(t) (5.10)

avec la majoration suivante du reste sur lintervalle [a, b] : |R(t)| M max M= sup
x q x q

sup
t[a,b]

q(t) , sup
t[a,b]

q (t)

L (t, q0 (t) + x, q0 (t) + x ) L (t, q0 (t), q0 (t))

Ce qui nous sauve cest la compacit de [a, b] et la continuit de L : en eet sur le compact [a, b] L est donc uniformment continue donc > 0, > 0 : (t, x, x ) < L (t, q0 (t) + x, q0 (t) + x ) L (t, q0 (t), q0 (t)) <
b b

. |b a|

Ainsi J = J (q0 )q + a R(t)dt. Si nC (q) < : a R(t)dt < nC (q). Clai1 1 rement, J est continue par rapport q. Ainsi J est direntiable, de drive q Jq0 (q). Montrons que cette application est continue. Soit q0 et q1 dans E: Jq0 (q) Jq1 (q) =
b

L (t, q0 (t), q0 (t)) L (t, q1 (t), q1 (t)) (0, q, q )dt


a

212

5.3. Condition Ncessaire : quations dEuler or (5.10) implique que dc (q0 , q1 ) < = Jq0 (q) Jq1 (q) < nC (q) donc 1 J (q0 )q J (q1 ) = sup
nC (q)=1 1

J (q0 )q J (q1 )q < .

5.3

Condition Ncessaire : quations dEuler

La fonction cherche qui rend extremum (5.6) doit annuler la drive de J : Thorme 5.3.1. Pour que J (direntiable) possde un extremum en q0 , il est ncessaire que Jq0 = 0. (5.11) Dmonstration. Supposons que ce soit un maximum alors pour > 0 susamment petit : J(q0 + h) J(q0 ) = Jq0 (h) + (h) et ce pour tout h : nC (h) < . 1 Sil existe h tel que Jq0 (h) < 0, en prenant h, R susamment petit, on obtient Jq0 (h) + (h) > 0 ce qui contredit J(q0 + h) J(q0 ) 0 (maximum en q0 ). Lautre ventualit se traitant de la mme faon. Si on applique ce rsultat notre problme : il est ncessaire que q0 vrie
b

Jq0 (q) = =0

L L (t, q0 (t), q0 (t))q + (t, q0 (t), q0 (t))q q q

dt

et ce pour tout q C 1 ([a, b], Rn ). Supposons que lon cherche des solutions de d classe C 2 (dans ce cas dt L existe et on peut faire une intgration par parties) q :
b a

L (t, q0 (t), q0 (t))q q

dt =

L (t, q0 (t), q0 (t))q q


b a b

d dt d dt

L q L q

(t, q0 (t), q0 (t))qdt (t, q0 (t), q0 (t))qdt

=
a b

Jq0 (q) =

d L L (t, q0 (t), q0 (t))qdt q dt q a L d L 0= (t, q0 (t), q0 (t)) q dt q

Pour obtenir cette condition ncessaire sans supposer a priori que la solution cherche est C 2 , nous avons besoin du lemme suivant (gnralisation du lemme de Haar cf. lemme 5.5.2, en annexe) : 213

5. Calcul des variations Lemme 5.3.1. Soit E un espace vectoriel. Si f est une fonction continue sur un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction h C p ([a, b], E) (donc valeur dans E) telle que les (p 1)me drives successives sannulent aux deux extrmits de [a, b] (h(a) = h(b) = h (a) = h (b) = . . . = h(p1) (a) = h(p1) (b) = 0) on a
b

f (t), h(p) (t) dt = 0


a

alors

f (p)

est identiquement nulle sur [a, b].


x L a q (t, q0 (t), q0 (t))dt,

Remarque 5.3.1. En posant (x) = Jq0 (q) = [(x)q]b + a


b a

on obtient (5.12)

L (t, q0 (t), q0 (t)) (t) q dt, q

comme q(a) = q(b) = 0, en utilisant le lemme 5.3.1 : L (t, q0 (t), q0 (t)) (t) = C, q J (q0 ) = [(x)q]b + [Cq]b . a a Ainsi en utilisant le lemme suivant Lemme 5.3.2. Soient f et g deux fonctions continues sur un intervalle [a, b] valeur dans Rn et si pour toute fonction h continment direntiable sannulant aux deux extrmits de [a, b] (h(a) = h(b) = 0) on a
b

(5.13) (5.14)

f (t), h(t) + g(t), h (t) dt = 0


a

alors g est direntiable sur [a, b] et g (t) = f (t). Dmonstration. On pose F (t) = 0 f (x)dx, donc a f (t), h(t) = [F (t)h(t)]t=b t=a b b F (t), h (t) dt = a F (t), h (t) dt, ce qui conduit la condition a
b t b

g(t) F (t), h (t) dt = 0


a

donc en utilisant le lemme 5.3.1 [g(t) F (t)] = 0 cest--dire g (t) = f (t). On en dduit : Thorme 5.3.2. Soient [a, b] un segment de R et lensemble des fonctions q continment drivables telles que q(a) = qa , q(b) = qb . Pour que q0 C 2 ([a, b], E) rende extremum le critre (intgrale J stationnaire), il est ncessaire que q0 soit solution de lquation dEuler d dt L q = L q , (5.15)

214

5.3. Condition Ncessaire : quations dEuler Quelques cas simple dintgration des quations dEuler d L 1) L indpendant de q alors dt L = 0 donc qi = cte E si E = R : q
L q

= c R, i = 1..n) 2) L indpendant de t (application la mcanique) : on obtient 2L L qi qi t L qi


m i=1 m j=1 m j=1

2L qj qi qj 2L qj qi qj qj qi

m j=1 m

2L qj = 0, i = 1, . . . , m qi qj 2L qj = 0, qi qj qj qi = 0, L qj = 0, qj L qj = cte qj (5.16)

L qi qi

m i,j=1

2L qi qj

j=1 m 2L

i,j=1

qi qj
m

d L dt

j=1

L
j=1

3) J fait intervenir lintgrale dune fonction f (x, y) par rapport une abscisse curviligne
b

J(q) =
a

f (x, q) 1 + q 2 dx, 1 1+q


2

d dx

L q

L q

f q

f x

q f

q 1+q2

(5.17)

Condition ncessaire et susante.


Lapplication directe du lemme de Dubois-Reymond (cf. Annexe Lemme 5.5.1) : Thorme 5.3.3. Si on cherche q0 parmi les fonctions C 2 ([a, b], R) qui rende extremum le critre J et vriant les conditions aux limites donnes, alors lquation dEuler et les conditions aux limites sont des CNS. Exemple 5.3.1. Si on reprend le problme 1 : la fonctionnelle minimiser est J1 (f ) =
L f 1 0

1 + (f (x))2 dx avec f (0) = 0, f (1) = 0 : (5.15) scrit

d dx

L f

, soit f (x) = 0, les solutions sont les droites !

Condition du second ordre pour un minimum : la Hessienne doit tre dnie positive 215

5. Calcul des variations

cas scalaire q R : cas vectoriel q Rn :

2L (t, q, q) 0 q2 2L (t, q, q) 0 qi qj

Applications
Brachistochrone La fonctionnelle minimiser est (5.2) : L =
d dz L f 2gz

avec
L f

1+(f )2 . 2gz

La CN dEuler scrit

=
f

L f

f , L 2gz 1+(f )2 f

= 0. Il faut chercher f (z) telle

que

1+(f )2

= cte =

1 4gc

(c constante arbitraire non nulle sinon f = 0,

f = cte le point B est la verticale du point A et dans ce cas le problme est z trivial). Lquation devient (avec le signe +)f 2 = 2c 1 + f 2 , cest--dire : f = z (2c z) (5.18)

en posant z = c(1 cos(u)) (dz = c sin(u)du), (5.18) devient df = c sin(u) du 1 cos(u) = c(1 cos(u)) 1 + cos(u)

les solutions sont les courbes paramtres : f = cte c(u sin(u)) z = c(1 cos(u)) cest une cyclode. Equations dEuler-Lagrange en mcanique Si un systme mcanique est constitu de n lments relis entre eux par des liaisons parfaites (sans frottement), on aura la position du systme qui dpendra de n paramtres indpendants (coordonnes gnralises notes q1 , . . . , qn ). Ainsi, Ec lnergie cintique est une forme quadratique en les qi et Ep lnergie potentielle est une fonction des paramtres q1 , . . . , qn . Principe dHamilton (dit encore de moindre action)2 : La trajectoire (cest--dire le vecteur form des fonctions t qi (t)) est donne par les fonctions qui minimisent
b

J(q) =
a
2

L(q(t), q(t))dt,

(5.19)

En fait, ce principe nest vri que pour des temps susamment courts, cependant on peut le remplacer par le principe de stationnarit : La trajectoire est donne par les fonctions qui rendent stationnaire J(q) cest--dire telles que J (q0 ) = 0.

216

5.4. Que faire dans dautres cadres avec L(q, q) = Ec Ep . Pour crire les quations dEuler-Lagrange il faut dtermi ner L le Lagrangien, le travail lmentaire de chaque forces interne et externe Di , ainsi que le travail des forces de frottements ( D dqi ) donnant lieu lnergie qi dissipe D. On obtient alors le systme dquations dEuler-Lagrange : d dt L qi L D + = Di . qi qi (5.20)

Remarque 5.3.2. Ec dpend des qi et de leurs drives qi alors que Ep ne dpend que des qi . Remarque 5.3.3. Ec = 1 q T M (q)q, o M (q) est une matrice n n symtrique 2 dnie positive. Exemple 5.3.2. Une masse m est attache un pivot sans frottement laide dun l non pesant de longueur l. 1 L = m2 mgl cos(), D = 0. 2 En appliquant directement (5.20), on obtient : (m)( + gl sin()) = 0. (5.22) (5.21)

5.4

Que faire dans dautres cadres

Parmi les problmes mentionns, certains font intervenir 1) des conditions terminales pouvant voluer sur une contrainte, 2) des solutions C 1 par morceaux, 3) des drives dordre suprieur et enn 4) des contraintes diverses (galit, ingalit, intgrale etc...). Nous allons complter la CN dEuler dans chacun de ces cas en donnant lide principale de la preuve. 1) Si q(a) et q(b) ne sont pas xes : en utilisant (5.13) on obtient les conditions frontires (a) = 0 = (b) = L (a, q0 (a), q0 (a)) C, q

L (b, q0 (b), q0 (b)) C, q

et la condition J (q0 ) = 0 (5.14) devient L (b, q0 (b), q0 (b)) q(b) q L (a, q0 (a), q0 (a)) q(a) = 0 q

ce qui nous donne les conditions frontires suivantes (faire q(a) = 0 et q(b) quelconque puis permuter) 217

5. Calcul des variations

L (a, q0 (a), q0 (a)) = 0, q L (b, q0 (b), q0 (b)) = 0. q

(5.23) (5.24)

Dans un cadre plus gnral, si les conditions aux frontires doivent vrier des contraintes q(a) = 1 (a), q(b) = 2 (b), les fonctions i dnissant des surfaces (y = i (x)) auxquelles les points de dpart et darrive de la solution doivent appartenir ; on doit vrier les conditions de transversalits suivantes L L + 1 (t) q(t) (t, q(t), q(t)) q L (t, q(t), q(t)) L + 2 (t) q(t) q

= 0,
t=a

(5.25) (5.26)

= 0.
t=b

2) Aux points de discontinuit les conditions de coins dites de WeierstrassErdmann doivent tre vries (si t = c est un point de 1re espce) : L (t, q(t), q(t)) q L L q(t) (t, q(t), q(t)) q 3) On cherche minimiser
b

t=c

t=c

L (t, q(t), q(t)) , q t=c+ L = L q(t) (t, q(t), q(t)) q =

(5.27) .
t=c+

(5.28)

J(q) =
a

L(t, q(t), q(t), . . . ,

dn q (t))dt. dtn
n1

q avec des conditions initiales et nales adquates (q(a), q(a), . . . , d n1 (a) et q(b), dt q q(b), . . . , d n1 (b) xes). On travaille sur En = C n ([a, b], R) muni de dt n
n1

dn (f, g) =
i=0

max
t[a,b]

if ti

ig xi

.
t

On obtient
b n i=0

Jq0 (q) =

L dn q0 (t, q0 (t), . . . , n (t))q (i) dt q (i)

dt.

En utilisant le lemme 5.5.3, on en dduit la condition dEuler


n

(1)i
i=0

di L dti q (i)

t, q0 (t), . . . ,

dn q0 (t) dtn

=0

(5.29)

218

5.5. Quelques rsultats annexes 4) On considre le problme parmi lensemble des fonctions continment direntiables q1 , . . . , qn qui satisfont les contraintes gj (t, q1 , . . . , qn , q1 , . . . , qn ) = 0, j {1, . . . , m}, m < n,
a b qi (a) = qi , qi (b) = qi , i {1, . . . , n},

trouver celles qui rendent extremum le critre


b

J(q1 , . . . , qn ) =
a g

L(t, q(t), q1 , . . . , qn , q1 , . . . , qn )dt.

Si, rang qj = m, alors les qi sont solutions des quations dEuler en i remplaant L par H(t, q(t), q1 , . . . , qn , q1 , . . . , qn ) = L(t, q(t), q1 , . . . , qn , q1 , . . . , qn )+
m

(5.30)

i (t)gi (t, q1 , . . . , qn , q1 , . . . , qn ). (5.31)


i=1

5.5

Quelques rsultats annexes

Lemme 5.5.1 (Dubois-Reymond). Si f est une fonction continue sur un intervalle [a, b] valeur dans Rn et si pour toute fonction h continue sannulant aux deux extrmits de [a, b] (h(a) = h(b) = 0) on a
b

f (t), h(t) dt = 0
a

alors f est identiquement nulle sur [a, b]. Ce rsultat est un cas particulier du suivant : Lemme 5.5.2 (Haar). Soit E un espace vectoriel. Si f est une fonction continue sur un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction h C p ([a, b], E) (donc valeur dans E) sannulant aux deux extrmits de [a, b] (h(a) = h(b) = 0) on a
b

f (t), h(t) dt = 0
a

alors f est identiquement nulle sur [a, b]. Dmonstration. Supposons que f ne soit pas identiquement nulle alors il existe un t0 de [a, b] tel que f (t0 ) = 0. Alors dans V =]t0 , t0 + [ un voisinage de 219

5. Calcul des variations ce point et par continuit de f (t), v : on a f (t), v > 0 (si ngatif prendre loppos). En utilisant 0 si x V / (t) = (2 (t t )2 )p+1 si x V 0 on a a f (t), (t)v dt = t00 f (t), (t)v dt > 0 et (t)v vrie les hypothses du lemme (contradiction). Lemme 5.5.3. Soit E un espace vectoriel. Si les p fonctions fi sont continue sur un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction h C p ([a, b], E) (donc valeur dans E) telle que les (p 1)me drives successives sannulent aux deux extrmits de [a, b] (h(a) = h(b) = h (a) = h (b) = . . . = h(p1) (a) = h(p1) (b) = 0), on a
b p b t +

fi (t), h(i) (t) dt = 0


a i=0

alors

p i di fi i=0 (1) dti

est identiquement nulle sur [a, b].

5.6

Exercices

Fonctionnelles
Exercice 5.6.1. Etudier la continuit de la fonctionnelle J : C 0 ([a, b], Rn ) Rn
b

f J(f ) =
a

(f (x))2 dx

on prcisera la topologie utilise. Solution 5.6.1. On considre lespace E = C 0 ([a, b], Rn ). muni de la topologie induite par la distance d0 (f, g) = sup
t[a,b]

(5.32)

f (t) g(t) ,

dite distance de Whitney (au sens C 0 ) induisant la norme n0 (f ) = sup


t[a,b]

f (t)

220

5.6. Exercices La continuit de J dcoulera de celle de la fonctionnelle f composition), or


b a b 2 a (f (x)) dx

(par

(f (x))2 dx
a

(g(x))2 dx =
a

(f g)(f + g) dx

(b a)d0 (f, g)n0 (f )n0 (g) donc si on se xe > 0 pour avoir a (f (x))2 dx de prendre d0 (f, g) avec = (ba)n0 )n0 (g) (ni). (f Exercice 5.6.2. Soit C p ([a, b], Rn ) muni de la norme f = max
i{0,...,p} b b 2 a (g(x)) dx

< il sut

Cp

sup
t[a,b]

f (t) , sup
t[a,b]

f (t) . . . , sup
t[a,b]

f (p) (t)

ou de la norme
p

Cp

sup
i=0 t[a,b]

f (i) (t)

Montrer que la continuit dune fonctionnelle pour la topologie induite par la premire norme est quivalente la continuit pour la topologie induite par la seconde norme. Solution 5.6.2. Cela vient du fait que ces deux normes sont quivalentes : f
Cp

Cp

p f

Cp

Exercice 5.6.3. Soit J(q) une fonctionnelle direntiable, montrer que H(q) = J(q)2 est direntiable calculer sa drive. Gnraliser : soit g : R R drivable, montrer que g(J(q)) est une fonctionnelle direntiable telle que [g(J(q))] = g (J(q))Jq Solution 5.6.3. H(q + h) H(q) = J(q + h)2 J(q)2 = (J(q + h) J(q)) (J(q + h) + J(q)) (en eet J(q + h) est un rel). Par la direntiabilit de J on obtient : H(q + h) H(q) = J (q)h + (h) 2J(q) + Jq (h) + (h) ,
2

= 2J(q)Jq (h) + E(h), E(h) = (h) 2Jq (h) + 2J(q) + (h) + Jq (h)
nC (h)0 1

lim

E(h) = 0 puisque

nC (h)0 1

lim

(h) = 0

221

5. Calcul des variations De faon plus gnrale g(J(q + h)) g(J(q)) = g J(q) + Jq (h) + (h) g(J(q)), = g (J(q))Jq (h) + R(h) R(h) = (h) g (J(q) + Jq (h)) + r(Jq (h) + (h)),
nC (h)0 1

lim

R(h) = 0 puisque

nC (h)0 1

lim

(h) = 0 et lim r(x) = 0


x0

Problmes variationnels simples


Exercice 5.6.4. Analyser les problmes variationnels suivants
1

a)
0 1

(f (x))2 dx,

b)
0 1

f (x)dx, f (x)f (x)dx,


0 1

c) d)
0

xf (x)f (x)dx

avec les conditions frontires f (0) = 0, f (1) = 1. Solution 5.6.4. a) idem


1 2 0 (f (x)) dx L L = f 2 , f

pas de solution puisque la CN dEu-

d L ler ( dx f = L avec = 0, L = 2f ) scrit 0 = 2f donc f f f = 0 qui nest pas compatible avec les conditions aux limites (il se peut que des solutions discontinues existent !). b) de solutions puisque la CN dEuler d L L ( dx f = L avec L = f , f = 1, L = 0) scrit 0 = 0 elle est vrie (ref f

marque :
d ( dx L f

1 0 f

(x)dx = f (1)f (0) = 1). c) de solutions puisque la CN dEuler

(remarque : CN dEuler

L L avec L = f f , f = f, L = f ) scrit f = f elle est vrie f f 1 1 2 2 (0)) = 1) d) pas de solution puisque la 0 f f (x)dx = 2 (f (1) f d L L ( dx f = L avec L = xf (x)f (x), f = xf (x), L = xf (x)) f f

scrit f (x) + xf (x) = xf (x) donc f = 0 qui nest pas compatible avec les conditions aux limites. (mais il se peut que des solutions discontinues existent) Exercice 5.6.5. Dterminer les extremum des fonctionnelles suivantes
b

a)
a b

f (x)2 + f (x)2 2f (x) sin(x) dx, f (x)2 + f (x)2 + 2f (x) exp(x) dx,
a

b)

222

5.6. Exercices Solution 5.6.5. a) La CN dEuler scrit f (x) = f (x) sin(x) donc f (x) = 1 sin(x) + exp(x) + exp(x) 2

qui est analytique donc on peut utiliser le second rsultat et conclure que se sont les seules fonctions C 1 . b) La CN dEuler scrit f (x) = f (x) + exp(x) donc f (x) = 1 sin(x) + exp(x) + exp(x) 2

qui est analytique donc on peut utiliser le second rsultat et conclure que se sont les seules fonctions C 1 . Exercice 5.6.6. On suppose que q C 1 ([a, b], Rn ) et quelle vrie lquation dEuler suivante d L L = dt q q Montrer que si L est C 2 par rapport chacun de ses arguments et que alors q est C2.
2L q2

=0

Solution 5.6.6. Si q existe on a d dt L q = q= t 1


2L q2

L q

+ L q

L L q+ q q q L L t q q q

q, q ,

le membre de droite existe et est continue do le rsultat (pour faire plus propre former les ratios adquates). Exercice 5.6.7. Parmi toutes les courbes joignant deux points (xa , ya ) et (xb , yb ), dterminer celle, qui par rotation autour de laxe des x, engendre la surface dair minimum. Solution 5.6.7. Par rotation autour de laxe des x, la courbe y(x) engendre une surface dair
xb

A = 2
xa

y(x) 1 + y 2 (x)dx, 223

5. Calcul des variations en utilisant le rsultat du cours pour des fonctionelles faisant intervenir labscisse curviligne on obtient 1 yy = 0, 1+y2 2y y y , = 2 y 1+y2 y2 = C 2 1 + y 2 , Cdy = dx, y2 C 2 x+D = ln C y+ (y 2 C 2 ) C x+D C . ,

y = C cosh

Exercice 5.6.8. En utilisant les quations dEuler, dterminer les extremum de la fonctionnelle suivante :
t1 t0

1 mx2 R(x) dt, 2

(5.33)

lorsque grad R(x) = kx, puis grad R(x) = kx(1 x3 ). Interprtations ? Solution 5.6.8. On obtient m = grad R(x) x Cest un ressort : dans le premier cas avec une raideur linaire puis non linaire. Exercice 5.6.9. En utilisant les quations dEuler, dterminer les extremum de la fonctionnelle suivante :
1

J(x) =
0

t2 + x(t)2

1 + x(t)2 dt,

(5.34)

Indication : utiliser le changement de variables t = r cos() x = r sin() Exercice 5.6.10. Quelle courbe minimise lintgrale
1 0

1 2 f (x) + f (x)f (x) + f (x) + f (x) dx, 2

avec les conditions frontires f (0) = 0, f (1) = 1. 224

5.6. Exercices Exercice 5.6.11. Quelle courbe minimise lintgrale


1

f (x) + f (x)
0

dx,

avec les conditions frontires f (0) = 0, f (1) = 1. Solution 5.6.9. Rponse : La CN dEuler donne L = f 2 + 2f f + f d dx L f L f L f L f f = L f
2

= 2f + 2f = 2f + 2f = 2f + 2f =f

d dx

f (x) = a exp(x) + b exp(x) f (0) = 0 = a + b b f (1) = 1 = ae + e e b = a = 1 e2

Problmes variationnels complmentaires


Exercice 5.6.12. Dterminer lextremum de
1

J(q) =
0

(1 + q 2 )dt,

(5.35)

compatible avec les conditions q(0) = 0, q(0) = 1, q(1) = 1, q(1) = 2.


d L Solution 5.6.10. On doit avoir 2 (1)i dti q(i) t, q0 (t), . . . , ddtq0 (t) n i=0 cest--dire L d L d2 L + 2 =0 q dt q dt q
i n

= 0,

or

L q

L q

= 0 donc

d2 L dt2 q

= 2q (4) = 0. On en dduit

q(t) = a0 + a1 t + a2 t2 + a3 t3 , q(0) = a0 = 0, q(0) = a1 = 1, q(1) = a0 + a1 + a2 + a3 = 1, q(1) = a1 + 2a2 + 3a3 = 2, 225

5. Calcul des variations nalement q(t) = tt2 +t3 . Attention, on peut tre tent de poser Q = q, et alors 1 1 L d L on obtient 0 (1+2 )dt = 0 (1+Q2 )dt : Q = dt Q , Q = 0 : q(t) = a0 +a1 t+a2 t2 . q Que se passe-t-il ? Exercice 5.6.13. Reprendre lexercice prcdent avec une extrmit libre q(1) non xe. Solution 5.6.11. En reprenant la preuve du thorme
b

Jq0 (q) = En posant (x) =

L L L q + q + q dt. q q q =
x a L q

x L a q dt, (x)

(t) , on obtient
b a

Jq0 (q) = [(x)q]b + [(x) q]b + a a Euler devient L (t, q0 (t), q0 (t)) (t) = C, q

L (x) q dt q

(5.36) (5.37)

a a Jq0 (q) = 0 = [(x)q]b + [(t) q]b + [C q]b , a la condition frontire est donc L (1, q0 (1), q0 (1)) = 0, q q (1) = 0 = 2a2 + 6a3 , q(0) = a0 = 0, q(0) = a1 = 1, q(1) = a0 + a1 + a2 + a3 = 1, nalement q(t) = t.

Exercice 5.6.14. Dterminer les courbes qui rendent extremum la fonctionnelle J(q) = 1 2
1

(q 2 + q 2 )dt,
0

(5.38)

avec q(0) = 0 et le point terminal se trouvant : 1. sur la droite t = 1, 2. sur la courbe y = t2 . Solution 5.6.12. On se trouve dans un problme avec conditions frontires non xes. Lquation dEuler scrit q = q, q (t) = C sinh(t), q(t) = C cosh(t) 226

5.6. Exercices 1. Il faut L (1, q(1), q(1)) = q(1) = 0, donc C = 0 : q(t) = 0. (intuitivement q a colle : J = 0 !). 2. Cette fois la condition supplmentaire est L + (2t q(t)) soit (q 2 q 2 ) = 4q, C(sinh(1)2 cosh(1)2 ) = 4 cosh(1), C = 4 cosh(1), q(t) = 4 cosh(1) sinh(t) Exercice 5.6.15. Dterminer les courbes qui rendent extremum la fonctionnelle
x2

L (t, q(t), q(t)) q

t=1

1 = (q 2 + q 2 ) + q (2 q) = 0, 2

J(y) =
0

1+y2 dx, y

(5.39)

avec y(0) = 0 et le point terminal se trouvant : 1. sur la droite y = x + 1, 2. sur le cercle (x 4)2 + y 2 = 4. On commencera par examiner les conditions de transversalits du cours pour des fonctionnelles du type
x2

f (x, y)
x1

1 + y 2 dx,

Exercice 5.6.16. On cherche le ou les extremum(s) de


b

J(q) =
a b

L(t, q, q)dt

(5.40)

tel que q(a) = qa , q(b) = qb et a C(t, q, q)dt = c. Soit q0 un telle fonction, montrer quil existe une constante telle que q0 soit un extremum de la fonctionnelle suivante
b

JH (q) =
a

H(t, q, q)dt,

H(t, q, q) = L(t, q, q) + C(t, q, q). Indication : poser y(t) = a C(t, q, q)dt, on cherche un extremum de J sous la contrainte y = C(t, q, q), avec y(b) = c. Application : rsoudre les problmes 3 et 4 du cours : 3. Problme de lisoprimtre (Euler) : Dterminer la courbe embrassant lair maximale parmi lensemble des courbes fermes de classe C 1 227
t

5. Calcul des variations et de longueur donne l. On peut sans perte de gnralit, considrer que ces courbes sont issues de lorigine et que lautre extrmit a pour abscisse xB . La longueur est donc l =
xB 0

1 + (f (x))2 dx, quand lair de rvolution cest


xB

J3 (f ) = 2
0

f (x) 1 + (f (x))2 dx.

(5.41)

Ce problme est un peu plus complexe puisquil faut minimiser un critre sous une contrainte (la longueur doit tre de l). 4. Parmi tous les arcs de courbes de classe C 1 joignant A et B deux points donns du plan et de longueur donne l, dterminer celui qui dlimite avec le segment AB une aire maximum. On peut sans perte de gnralit, considrer que ces courbes sont issues de lorigine et que lautre extrmit a pour abscisse xB . La longueur est donc l = 0 B 1 + (f (x))2 dx, quand lair dlimite par la courbe et laxe des abscisses cest x
B

J4 (f ) =
0

f (x)dx.

(5.42)

Ce problme ft pos et rsolut (de faon intuitive) par la reine Dido de Carthage en 850 AV-JC. On retrouve un problme similaire celui prsent en 3 (minimum sous contrainte). Une formulation plus gnrale consiste dterminer la courbe qui dnie la surface la plus grande parmi toutes les courbes fermes de primtre donn (ce qui dnit une contrainte). Exercice 5.6.17. Un nageur partant de lorigine traverse une rivire de largeur b vitesse constante c2 , la berge de dpart concide avec laxe des y, le courant de la rivire est v(x) (v 2 < c2 ). Dterminer la trajectoire que doit avoir le nageur pour rejoindre lautre berge en un temps minimum. Application : b = 1, v = c2 x(1 x). Solution 5.6.13. Le nageur ne peut dnir sa trajectoire quen jouant sur langle dattaque ( : langle que fait le nageur avec laxe des x). On a x = c cos , y = c sin + v, Donc le temps mis par le nageur pour traverser est :
b

t=
0

dx = x

b 0

dx c cos

Il ne reste plus qu exprimer cos() en fonction de y, y : cy cos = v c cy cos v 228


2

1 cos2 ,

= c2 1 cos2

5.6. Exercices c2 y 2 + 1 cos2 2vcy cos + v 2 c2 = 0 vy


b

cos() = t=

c2 y 2 (v 2 c2 ) , c (y 2 + 1) y2+1 c2 y 2 (v 2 c2 ) y2+1 c2 y 2 (v 2 c2 )

0 b

vy vy
b

dx dx

=
0

=
0

vy +

c2 y 2 (v 2 c2 ) dx (c2 v 2 )
L y

Or L(x, y ) donc Euler Lagrange scrit : est


L y y=1

= C de plus la condition frontire

= 0, on en dduit 1 v + (c2 v 2 ) c2 y v c2 y c2 y 2 (v 2 c2 )

=0

c2 y 2 (v 2 c2 ) = 0 cy = v

Application b = 1, v = x(1 x) y= Nota t =


1 y 0 v

1 c

x2 x3 2 3

dx = 1 . c

Exercice 5.6.18. James Bond la poursuite de sa James Bond girl en voilier : (Tir de Principes variationnels et Mcanique analytique par Jean-Louis Basdevant et Christoph Kopper, presse de lX). Un voilier volu sur un plan deau une vitesse vb faisant un angle not avec la vitesse du vent note w. La vitesse du bateau vb est proportionnelle celle du vent et dpend de langle dorientation du bateau (angle choisi par le capitaine du bateau). Cette vitesse est de la forme vb () = w , cos()h(tan()) 1 1 avec h(u) = (u + ), 2 u (5.43)

On sintresse la stratgie de remonte au vent du bateau, cest--dire pour , comme on le reprsente sur la gure (5.1). La vitesse vb du bateau le long 2 de laxe Ox est oppose celle du vent, et sa coordonne x augmente toujours en fonction du temps. On suppose une cte rectiligne cest--dire que la terre est le demi-plan y < 0 alors que la mer est le demi-plan y > 0. On suppose que le 229

5. Calcul des variations vent est parallle la cte, de direction oppose laxe Ox, et que la norme de sa vitesse w(y) ne dpend que de lloignement la cte y. La vitesse du vent a la forme : y0 w(y) = w0 w1 , (5.44) y + y0 o w0 est la vitesse du vent loin de la cte, qui est suprieure la vitesse ((w0 w1 ) 0) au bord de la cte y = 0.

y vb w

(xf , yf )

x Terre

Fig. 5.1: Course de bateau 1. On note : x =


dx dt , y

dy dt

montrer que y =

dy dx

= tan().

2. On suppose dabord le vent uniforme w = w0 (w1 = 0). Ecrire la vitesse du bateau suivant laxe du vent vbx = x en fonction de w et h(tan()). Pour quelle valeur de et de y cette vitesse est-elle maximum ? Quelle est alors sa valeur ? 3. On suppose maintenant que w1 = 0. Le bateau va du point de dpart, lorigine (x = 0, y = 0), un point darrive au large (x = xf , y = yf ). dy On suppose que dx = y 0 pour tout t (cest--dire que le bateau ne vire jamais de bord). On veut dterminer la trajectoire y(x) la plus rapide. Ecrire la valeur du temps total T pour aller du dpart larrive. En dduire lquation qui dtermine la trajectoire optimale. Montrer que linvariance du problme par translation suivant Ox entrane h (y )y h(y ) = A, w(y) o A est une constante. 230 (5.45)

5.6. Exercices 4. Utiliser le rsultat prcdent pour calculer la trajectoire sous la forme dune fonction x(y) (et non pas dune fonction y(x)). Fixer la valeur de A. dy 5. Calculer la valeur de dx = y en fonction de y. On suppose que xf >> yf et yf << y0 . Pensez-vous que le rsultat obtenu corresponde eectivement la meilleure stratgie ? Sinon, quelle modication doit-on apporter ? 6. Mister Bond (James de son prnom) part de lorigine avec son voilier. Il veut intercepter sa James Bond girl favorite. Celle-ci quitte le rivage bord dun bateau moteur. Son point de dpart est situ une distance L de lorigine. Enn, le bateau moteur se dplace une vitesse constante c en direction du large (selon laxe des y). A quelles conditions James pourra retrouver sa belle ? Exercice 5.6.1. On considre une pompe qui alimente un rcipient dont le fond est quip dune vanne de fuite (cf. gure 5.2).

Fig. 5.2: Dipositif tudi Partie I Etude du rcipient Pour construire le rcipient, on dispose dune tle de surface S donne et on faonne la tle de sorte que le rcipient ait une contenance maximale et sa forme soit un cne (cf. gure 5.3). On rappelle que, pour un cne, le volume est V = hr2 et la surface est 3 S = r h2 + r2 . Question a)Formuler ce problme. Donner le critre optimiser et les contraintes ventuelles. Question b) Donner les conditions ncessaires que doivent satisfaire les inconnues du problme. Question c)Dterminer (r, h) en fonction de la surface de tle S. Partie II Etude de la vidange du rcipient Dans cette partie, le rcipient est constitu dun socle (disque de rayon r0 ) et dune tle de surface S (donne). Le prol de la tle est engendr par rotation 231

5. Calcul des variations

Fig. 5.3: Rcipient conique de la courbe r(z) (qui est suppose C 1 ) autour de laxe orthogonal au socle et passant par le centre du socle (cf. gure 5.2). Si on note z(t) la hauteur du liquide dans le rcipient, le volume est
z(t)

v(t) =
0

r2 (z)dz.

(5.46)

Le bilan de matire donne dv(t) = vin vout , dt le dbit dentre (vin ) est constant (dlivr par une pompe) et celui de sortie (vout ) est de la forme : vout = c P Pa . Enn lquation de Bernouilli est P = gz +Pa , avec la masse volumique du liquide et g la constante gravitationnelle. Question a) (1 point) Montrer que lquation direntielle ordinaire que satisfait la hauteur z(t) est : vin c g z(t) dz(t) = dt r2 (z(t)) Question b)On cherche les extremums de
b

J(r) =
a

L(z, r, r )dz
b

(5.47)

dr avec r = dz et tel que z(a) = za , z(b) = zb et a C(z, r, r )dz = c. Soit r0 une telle fonction, montrer quil existe une constante telle que r0 soit un extremum de la fonctionnelle suivante b

JH (r) =
a

H(z, r, r )dz,

H(z, r, r ) = L(z, r, r ) + C(z, r, r ).

232

5.6. Exercices Indication : poser y(z) = a C(z, r, r )dz, on cherche un extremum de J sous la contrainte y = dy = C(z, r, r ), avec y(b) = c. dz Question c)Pour une hauteur donne h, laire est
h z

A = 2
0

r(z)

1 + r 2 dz,

(5.48)

dr avec r = dz . On coupe lalimentation de la pompe (vin = 0). En partant dune hauteur h donne, le rcipient se vide. Dterminer lquation direntielle que doit satisfaire r(z), le prol du rcipient, pour que le temps de vidange du rcipient soit le plus petit possible sous la contrainte que laire est xe. Question d)Dterminer en fonction du dbit dentre constant, lquilibre atteint not zeq . Discuter de sa nature et de sa stabilit. Partie III Etude de la dynamique au voisinage dun point de fonctionnement Dans cette partie, on considre le rcipient conique de la gure 2. On a la relation r = z tan(cne ), le volume (5.46) est donc z(t)

v(t) =
0

r2 (z)dz

tan2 (cne ) 3 = z (t) 3 On considre un fonctionnement nominal autour duquel la pompe fonctionne (vin = vin_nominal + vin , u = unominal + u avec vin_nominal et unominal constants). Dans ce cas, la dynamique de la pompe est de la forme : d(vin ) + vin = au dt
v2

z En posant z = znominal + z, avec znominal = in_nominal , on approximera z 2 . c2 g Question a)Donner la dynamique linarise correspondante pour la variation de hauteur du liquide. Question b)On applique un dbit vin = kz, dterminer k tel que lquilibre soit asymptotiquement stable. 2 Question c)On applique la pompe une tension u = 3 kz. On pose dx x = (vin , z)T . Mettre le systme sous la forme dt = Ax. Montrer que, pour les 3 2 valeurs numriques suivantes : = 1, a = 2 , cne = 45 , znominal = 1, c = 3 , = 0.1, g = 10, on obtient

A=

1
1

1 3

Question d)Pour les valeurs numriques prcdentes (Question c), calculer exp(At) par la mthode des matrices constituantes. En dduire les solutions du systme dx = Ax. Comment choisir k pour que lquilibre soit asymptotiquement dt stable ? 233

Systmes retard

J.P. Richard1 , M. Ksouri2 & INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve dAscq cedex, France. E-mail : Jean-Pierre.Richard@ec-lille.fr 2 ENIT, BP 37, Le Belvdre 1002, Tunis, Tunisie. E-mail : Mekki.Ksouri@insat.rnu.tn
1 LAGIS

Cours rdig par Jean-Pierre Richard

6.1

Introduction

Les systmes retards sont aussi appels systmes hrditaires, systmes post-eet, quations argument dir1 ou, encore, quations direntielles aux dirences. Ils appartiennent la classe des quations direntielles fonctionnelles (EDF) qui sont de dimension innie, par opposition aux quations diffrentielles ordinaires (EDO, voir [118]). Ce chapitre ne peut dtailler le grand nombre douvrages ddis aux systmes retards (plus de 30 monographies en anglais depuis 1963) mais le lecteur pourra se rfrer, par exemple, aux articles de synthse [18, 60, 67, 82, 92, 103, 108, 116, 119, 138, 143], ou aux numros spciaux [23, 33, 84, 102, 122]. Quelles peuvent tre les motivations dune recherche si active et dun intrt si continu ? Les points suivants nous semblent donner quelques lments de rponse.

1 Traduction de langlais deviating argument en lien avec lappellation dierential-dierence equation.

235

6. Systmes retard

Un problme appliqu
Le retard est un phnomne physique qui se retyrouve dans une multitude dapplications : nombreux sont les systmes rels dont lvolution temporelle, contrairement celle des systmes ordinaires , nest pas dnie partir dun simple vecteur dtat (exprim au prsent), mais dpend irrductiblement de lhistoire du systme. Cette situation se rencontre dans les cas nombreux o un transport de matire, dnergie ou dinformation engendre un temps mort dans la raction : en technologies de linformation et de la communication (rseaux de communication haut-dbit [2, 10, 15, 56, 89, 95, 114, 130], contrle des systmes en rseau [15, 106, 120, 128], qualit de service dans les transmissions vido MPEG [91], systmes tl-oprs [63, 79, 104, 105], calcul parallle [1], calcul temps rel en robotique [5, 131]... ), en dynamique des populations et en pidmiologie (temps de gestation ou dincubation), en mcanique (viscolasticit)...2 Mme si le processus ne contient pas intrinsquement de post-eet, sa chane de commande peut introduire des retards (par exemple si les capteurs demandent un temps dacquisition/transmission non ngligeable). Pour ces raisons, il semble raisonnable de considrer le retard comme une caractristique universelle de linteraction entre lhomme et la nature (donc, des sciences pour lingnieur), au mme titre que la non-linarit, par exemple.

Un problme ancien mais encore ouvert


Les quations direntielles fonctionnelles (EDF) constituent un outil mathmatique appropri ltude du phnomne dhrdit, gnralisant les quations direntielles ordinaires (EDO). Comme pour tous les systmes dynamiques, leur investigation thorique inclut des sujets comme lexistence et lunicit des solutions, leur priodicit, lanalyse des bifurcations, les problmes aux limites, la commande et lestimation, la caractrisation des comportements asymptotiques (stabilit, bornitude, moyennage, etc.), pour nen citer que quelquesunes. Les premires EDF ont t considres par J. Bernoulli, L. Euler, J.L. Lagrange, P. Laplace, S. Poisson et dautres, en lien avec certains problmes gomtriques poss au XVIIIe sicle. Au dbut du XXe sicle, dimportantes applications en furent faites par V. Volterra [141]. La situation changea dans les annes 30, avec lapparition dun grand nombre de problmes techniques et scientiques. La rgulation sur base de modles linaires et stationnaires avec retard fut considre par Y. Zypkin en 1941. Les bases de la thorie moderne des EDF furent probablement poses par A.D. Myshkis en 1949 [97, 98]. En particulier, il fut le premier formuler lnonc du problme de Cauchy pour des quations retard arbitraire (ponctuel ou
2

Des exemples plus dtaills pourront tre trouvs dans [17, 66, 100].

236

6.1. Introduction distribu, ni ou inni). Les annes suivantes3 ont vu une explosion de la thorie des EDF et de leurs applications (voir par exemple [25, 66, 69, 72, 84, 99, 100, 116, 122] et les nombreuses rfrences incluses). Dans ce chapitre, laccent sera mis sur les grandes lignes de la thorie des quations direntielles retards, permettant ainsi laccs aux mthodes et rsultats concrets qui en dcoulent. Malgr le grand nombre doutils danalyse disponibles, la commande des systmes retards pose encore plusieurs problmes ouverts [119]. On pourrait penser que les techniques de contrle classiques (en dimension nie) seraient applicables aprs avoir remplac les oprateurs de retard par des approximations rationnelles (fonction de transfert sans retard)4 . Appliques au calcul de lois de commande, de telles approximations peuvent donner des rsultats probants dans le cas de systmes linaires retards constants et connus. Cependant, elles trouvent rapidement leur limite, notamment parce quelles conduisent des systmes dordre lev5 dont la rgulation nest nalement pas plus simple que celle du modle initial. En eet, dans ce cas des systmes linaires retards constants et connus, plusieurs mthodes de synthse de contrleurs en boucle ferme donnent des rsultats probants. Ces mthodes (placement de spectre, approches de type Lyapunov...) sont gnralement bases sur un principe de prdicteur6 . Le contrleur intgre alors une anticipation des comportements futurs, possible si lon dispose dun bon modle. Notons toutefois que, si la partie linaire non retarde du modle est dordre suprieur 3 ou 4, le dveloppement numrique et systmatique de tels contrleurs peut tre dicile : en eet, ds que lordre et le nombre de paramtres de rglage augmentent, la phase danalyse de stabilit doit tre mene par lintermdiaire de conditions susantes mais non ncessaires (nous verrons par la suite certaines de ces mthodes, de type Liapounov). La situation saggrave encore dans le cas des retards variables7 ou
En 1962, N.N. Krasovskii [74] publie une construction analytique de contrle optimal en prsence de retards, puis une gnralisation de la seconde mthode de Liapounov [75]. 4 On pense ici aux approximations du type : ehs p(hs) , p(hs) (6.1)
3

o p R [hs] est un polynme dont les zros sont tous dans le demi-plan complexe gauche Re s < 0. Les approximants rsultants sont ceux, classiques, de Pad au premier ordre p(hs) = 2 2 hs hs (1 hs ), mais aussi de Laguerre-Fourier p(hs) = (1 2n )n , de Kautz p(hs) = (1 2n + h s2 )n , de 2 8n
hs h s Pad au second ordre p(hs) = (1 2n + 12n2 )n de Pad diagonal pn (hs) = n (2nk)!(hs) , k=0 k!(nk)! n 3. 5 Une argumentation plus complte peut tre trouve dans [119]. 6 Le premier usage dun prdicteur fut introduit par Smith [133] la n des annes 1950. Il concernait des systmes asymptotiquement stables en boucle ouverte et prsentant un retard sur lentre. 7 Mme en dimension nie, on connat les dicults danalyse rencontres en non stationnaire : dans ce cas, la stabilit du modle considr comme stationnaire chaque instant na aucun lien avec celle du systme variant. Cette dicult se transporte dans le cas retard. Ainsi, lquilibre x = 0 du systme retard variable, considr dans [49] :
2 2 k

x(t) = ax(t) + bx(t h(t)),

h(t) = t k

t ]k, (k + 1)] , k N (do 0 h(t) 1), (6.2)

237

6. Systmes retard mal connus. Les particularits des systmes retards peuvent aussi tre surprenantes : plusieurs tudes ont montr que lintroduction volontaire de retard peut amliorer la stabilisation dquations ordinaires : amortissement et stabilisation [3, 121], rsonateurs retards [57], rejet de perturbation [58, 147], contrle de cycle limite non linaire [4], temps ni [143]... Exercice 6.1.1. Simuler le systme scalaire retard (6.3) pour direntes conditions initiales. Montrer que x(t) = 1 est un quilibre et observer le comportement chaotique obtenu pour la condition initiale x(t) = 2 t [1, 0] . x(t) = 5x(t) + 10 x(t 1) . 1 + x(t 1)8 (6.3)

Pour un systme dordre 1 sans retard, les phnomnes observs (chaos, trajectoire interceptant le point dquilibre) auraient-ils t possibles ?

Un outil de modlisation
Au del des eets physiques de post-eet, lutilisation dun oprateur de retard peut tre intressante dans la phase de modlisation. Ainsi, pour des systmes dordre lev (ou inni), on connat le classique modle de Strej (voir par exemple [12]), trs pris en gnie des procds, o le phnomne (de diusion, par exemple) est volontairement reprsent par un transfert de ple multiple (dordre n en gnral restreint 1 ou 2) et un retard h: eht F (s) = k . (6.4) (1 + s)n Cest que, malgr leur complexit, les systmes retards constituent une classe de modles en dimension innie relativement simples lorsquon les compare la classe des systmes dquations aux drives partielles (EDP). Citons ici [65] : It is usually not dicult to show that the appearance of delay in a dierential equation results of some essential simplication of the model. Les EDP hyperboliques peuvent tre localement crites en tant que systmes retards de type neutre [48, 69] grace la transformation de dAlembert. Dautres relations avec les quations drives dordre fractionnaire ont aussi t tablies [50]. Inversement, tout eet de retard y(t) = u(t h) peut tre reprsent par une classique quation de transport sur une distance l et vitesse c = lh1 :
h t x(z, t) + z x(z, t)

= 0,

z [0, l],

(6.5)

x(0, t) = u(t),

y(t) = x(l, t).

est-il instable pour a = 3.5 et b = 4 alors que les valeurs propres du systme considr chaque instant ont toutes des parties relles ngatives. Pour a = 1, b = 1.5, il est asymptotiquement stable, alors que les conditions de stabilit ne seraient pas vries si le retard tait constant entre 0 et 1. Dautres contre-exemples sont donns dans [86].

238

6.2. Classes dquations dierentielles fonctionnelles Signalons aussi que le retard permet de modliser les eets de discrtisation temporelle tout en restant dans le domaine des quations direntielles en temps continu [30, 31]. En eet, une loi de commande u(t) discrtise des instants {tk } (mme sans priodicit de lchantillonnage, cest--dire pour tk+1 tk = constante) peut tre reprsente par un eet de retard variable : ud (t) = u(tk ) = u(t(ttk )) = u(t (t)), tk t < tk+1 , (t) = ttk , (6.6) o ud est le signal chantillonn et bloqu partir du signal u(t). Le retard variable (t) = t tk est alors continu par morceaux, variant linairement de 0 (tk+1 tk ) sur lintervalle [tk , tk+1 [ et, ainsi, de drive (t) = 1 pour t = tk et, en thorie, (tk ) = . Cette criture permet par exemple de considrer de faon homogne une situation de commande en rseau avec chantillonnage, retards de transmission et pertes de paquets [129].

6.2

Classes dquations dierentielles fonctionnelles

De nombreuses classes de modles ont t proposes pour ltude des systmes retards. La rfrence [119] en donne un tableau rsum et [116], un aperu plus dtaill. Dans cet ouvrage, nous prsenterons principalement la notation fonctionnelle, trs gnrale, mais rappellerons ensuite quelques autres reprsentations ddies aux systmes linaires (section 6.7). Les quations dierentielles fonctionnelles peuvent tre considres comme une combinaison dquations direntielles ordinaires et dquations fonctionnelles. Les valeurs de largument peuvent y tre discrtes, continues ou mixtes : en correspondance, on dnira les notions dquations direntielles aux dirences, dquations intgrodirentielles, ou mixtes8 . Une EDF est dite autonome (ou stationnaire) si elle est invariante vis-vis de tout changement de variable t t + T (pour tout T R). Lordre dune EDF est celui de la plus haute drive de la fonction inconnue rgie par lquation. Ainsi, les quations fonctionnelles peuvent tre considres comme des EDF dordre zro et la notion dEDF gnralise les quations de lanalyse mathmatique des fonctions dun argument continu.

Equations retards ponctuels


Considrons une EDF retards ponctuels, de la forme : z (m) (t) = f0 t, z (m1 ) (t h1 (t)) , ..., z (mk ) (t hk (t)) ,
m

(6.7)

d dans laquelle z (t) Rq , z (m) (t) = dtm z (t) , k et mi N, hi (t) R+ . Le membre de droite f0 et les retards hi sont donns et z est une fonction inconnue
8 Plus particulirement, dans le cas des quations direntielles retardes (EDR) qui sera dvelopp par la suite, on parlera de retards ponctuels, distribus ou mixtes.

239

6. Systmes retard de t. La proprit hi (t) R+ (signiant que toutes les dviations dargument sont positives ou nulles) est cruciale pour la causalit de (6.7). Cette quation (6.7) est dite : quation direntielle fonctionnelle de type retard, ou EDF retarde (en abrg, EDR) , si : m > max {m1 , ..., mk } ; (6.8)

quation direntielle fonctionnelle de type neutre, ou EDF neutre (en abrg, EDN ), si : m = max {m1 , ..., mk } ; (6.9)

quation direntielle fonctionnelle de type avanc, ou EDF avance (en abrg, EDA), si : m < max {m1 , ..., mk } . (6.10)

Une EDR est ainsi caractrise par le fait que la valeur de la drive dordre le plus lev est dnie, pour chaque valeur de largument t, par les valeurs des drives dordre plus faible prises en des arguments infrieurs ou gaux t. La pratique de la modlisation montre qu la quasi-unanimit, seules les quations de type retard (6.8) ou neutre (6.9) sont utilises pour reprsenter des processus rels. Comme dans le cas des quations direntielles ordinaires, lquation (6.7) peut tre rcrite sous la forme dune quation direntielle du . premier ordre (impliquant la drive x = dx ) portant sur un vecteur x Rn de dt dimension plus grande (n = (m 1) q) en prenant comme nouvelles inconnues les drives successives de y. On aboutit ainsi aux EDR et EDN suivantes : x(t) = f (t, x (t h1 (t)) , ..., x (t hk (t))) ,
. . . .

(6.11)

x(t) = f t, x (t h1 (t)) , ..., x (t hk (t)) , x (t gk (t)) , ..., x (t gl (t)) . (6.12) Comme nous lavons remarqu, toute EDF est une combinaison dquations ordinaires et fonctionnelles et lquation de type neutre (6.12) est quivalente au systme 2-D, ou hybride, suivant : . x(t) = y(t), y(t) = f (t, x (t h (t)) , ..., x (t h (t)) , y (t g (t)) , ..., y (t g (t))) . 1 k k l Dans certains phnomnes, le retard peut dpendre dune solution inconnue, cest--dire avoir la forme hi (t, x (t)) . De tels retards sont quelquefois dits autorglants. Leur analyse est assez dicile [139]. Le retard peut aussi dpendre de lentre de commande et, dans ce cas, les techniques de contrle sont rares [22, 109, 110]. 240

6.2. Classes dquations dierentielles fonctionnelles

Equations retardes gnrales, retards distribus


Une quation direntielle retarde gnrale ( retards non ncessairement ponctuels) se reprsente sous la forme : x(t) = f (t, xt ) , o, pour un certain t, x (t) Rn et ltat xt est une fonction dnie par : xt : Jt Rn , xt () x (t + ) , J ], 0] , J .
t t .

(6.13)

Dans ce cas, Jt peut tre un intervalle donn [h(t), g(t)] ou ], g(t)]. La fonction xt peut tre interprte comme un fragment de la solution x droite du point t, observ depuis ce point. Le membre de droite de (6.13) est une fonction de t et xt : ainsi, toute fonction : Jt Rn dune certaine famille de fonctions, correspond un vecteur f (t, ) Rn . Remarquons que lquation retards ponctuels (6.11) est un cas particulier de (6.13)9 . Si un des intervalles Jt nest pas de mesure nulle, lquation direntielle fonctionnelle (6.13) est dite retarde, retards distribus. On peut dnir de la mme faon une quation direntielle fonctionnelle neutre, retards distribus comme suit : x(t) = f t, xt , xt ,
. . . .

(6.14)

o la notation xt correspond de faon similaire xt : Jt Rn , avec Jt de mesure . . non nulle et xt () x (t + ) .

Notations complmentaires
On utilisera par la suite les notations suivantes : Jt = [h(t), g(t)] ], 0] , J = [, ] R ; C (Jt ) ensemble des fonctions continues de Jt Rn ; C 1 (Jt )) ensemble des fonctions drivables de Jt Rn ; xt C (Jt ) : Jt Rn , xt () x (t + ) ; D = [t0 , +[ C [h, 0] , (t, ) D ; . norme scalaire de vecteur : Rn R+ , x x ; . C norme de fonction, C [h, 0] R+ , C sup[h,0] { () } ; B C [h, 0] boule fonctionnelle, B { C [h, 0] ; C < } ; R[ ] lanneau (commutatif) des polynmes en coecients rels ; R( ) le corps des fractions rationelles en coecients rels ; Rn [ ] le module10 de dimension n sur R[ ] ;
9 10

Dans (6.11), lensemble Jt est de mesure nulle [117], rduit un nombre ni de points. Equivalent dun espace vectoriel mais sur un anneau, voir [117].

241

6. Systmes retard max (Q) la plus grande valeur propre dune matrice symtrique Q Rnn ; pour toute matrice relle M (t) = [mij (t)] , on dnit |M (t)| = [ |mij (t)| ] |mij (t)| si i = j, et M + (t) = m+ (t) , m+ (t) = ij ij m (t) si i = j. ii

6.3

Le problme de Cauchy pour les EDR

Le problme de Cauchy consiste montrer lexistence (et, si possible, lunicit) de la solution de lquation (6.13) correspondant une certaine fonction initiale et une certaine valeur initiale. Considrons lquation direntielle retarde (6.13) et supposons que pour un certain t0 R, la fonction f : (t, x) f (t, x) est dnie pour tout t [t0 , +[ et x C (Jt ) , Jt = [h(t), g(t)] . Le point t0 est appel point initial 11 pour la solution. Nous supposerons galement que t0 inf tt0 {t h (t)} > . La fonction initiale de lquation (6.13) pour un point initial t0 est prescrite sur lintervalle initial t0 , t0 . Si t0 = t0 , alors cet intervalle initial est vide et on retrouve le problme de Cauchy classique pour les EDO (sans hrdit, sans fonction initiale). Cependant, dans tous les cas, la valeur initiale x (t0 ) de la solution doit tre prescrite. Gnralement (bien que cela ne soit pas ncessaire) la valeur initiale de la solution x (t0 ) fait partie de la fonction initiale, cest--dire que cette dernire est prescrite sur lintervalle ferm t0 , t0 avec (t0 ) = x (t0 ) . Soulignons que la solution x (t) doit tre construite dans le sens des t croissants, cest--dire sur un intervalle J ayant comme extrmit gauche le point t0 J. Ceci implique que x est interprter comme tant le prolongement de la fonction initiale, x (t + ) (t + ) pour t + > t0 . Nous considrerons ici le problme de Cauchy pour des EDR retard ni, et supposons que la solution appartient C 1 (cest--dire, est une fonction continment direntiable de t). Le problme tudi est donc : x(t) = f (t, xt ) , xt0 = .
.

xt () = x (t + ) [h, 0] ,

(6.15) (6.16)

Ici, h 0 est une constante (nie), x (t) Rn , t0 R, et : [h, 0] Rn . La solution t x (t) (t 0) du problme (6.15) (6.16) est le prolongement de la fonction intiale t x (t) (t0 h t t0 ). Dnition 6.3.1. Soit un intervalle J ayant t0 comme borne gauche (incluse). Une fonction x C 1 (J) est une solution du problme de Cauchy (6.15) (6.16) sur cet intervalle J si elle vrie lquation (6.15) avec les conditions initiales x (t0 ) = (t0 ) et (6.16) en tous les points de J (cest--dire, xt (t + ) = (t + t0 ) t < t0 ).
11

Ou instant initial si t reprsente le temps.

242

6.3. Le problme de Cauchy pour les EDR Thorme 6.3.1. Soient C [h, 0] et une fonction vectorielle f : D Rn , continue et vriant dans le voisinage de tout couple (t, ) D une condition de Lipschitz par rapport son deuxime argument (la constante de Lispchitz correspondante dpendant, en gnral, de ce couple). Alors il existe un point t , t0 < t + dpendant de , t0 , f, tel que : (a) il existe une solution x du problme (6.15)(6.16) sur J = [t0 , t [ ; (b) sur tout intervalle [t0 , t1 ] [t0 , t [ , cette solution est unique ; (c) si t < + alors x (t) na pas de limite nie quand t t ; (d) la solution x dpend continment de f et . La dernire proposition (d) signie que : t1 [t0 , t ] et > 0, > 0 tel que si, dans (6.15) (6.16), f et sont remplaces par f et vriant les mmes proprits et avec :
C

< et

f (t, ) f (t, ) < pour t [t0 , t1 ] ,

(6.17)

alors la solution x du problme transform vrie : x (t) x (t) < pour t [t0 , t1 ] . (6.18)

Par ailleurs, en prenant t t0 comme nouvelle variable indpendante, il est possible dtudier de la mme faon la dpendance de la solution envers le point initial t0 de la mme faon que sa dpendance envers f . Dmonstration : [points (a) et (b)] en intgrant les deux membres de lquation (6.15), on constate que le problme (6.15)(6.16) est quivalent lexistence dune solution continue pour lquation intgro-direntielle :
t

x (t) = (0) +
t0

f (, x ) d,

t Jx .

(6.19)

Considrons le membre de droite de cette quation en tant quoprateur dans lespace mtrique {x C ([t0 , t0 + ] , [ (0) , (0) + ]) , x (t0 ) = (0)}, o , > 0 sont des constantes susamment petites. Le theorme de Banach (principe dapplication contractante [117]) garantit lexistence et lunicit de la solution pour tout intervalle [t0 , t0 + ] susamment petit. On en dduit lunicit de la solution pour tout intervalle dexistence : en eet, sil existe deux solutions x1 et x2 , alors en dcalant le point initial de t0 inf t > t0 : x1 (t) = x2 (t) , nous obtenons une contradiction. En eectuant lunion de tous les intervalles [t0 , t1 ] , {t0 < t1 < +} sur lesquels la solution existe, nous obtenons lintervalle maximal dexistence. Cet intervalle, de type [t0 , t [, est ouvert droite (t0 < t +). Ainsi, (a) et (b) sont dmontres. [point (c)] Supposons que t < + et quil existe x (t ) = limtt [x (t)].

Alors, la fonction x complte par x (t ) est continue sur [t0 , t ] . Puisque f 243

6. Systmes retard est continue, lquation (6.19) est galement valable pour t = t , et la solution existe donc sur [t0 , t ] . Or ceci contredit la dnition de t . La limite nie x (t ) ne peut donc exister, ce qui prouve (c). [point (d )] Supposons que t ]t0 , t [ et > 0 sont xs, avec assez petit pour que la fonction (t, ) f (t, ) soit borne et lipschitzienne en dans la bande t0 < t < t1 , xt C < (un tel existe daprs les hypothses sur f ). Nous constatons alors que si lquation (6.17) est vrie pour un > 0 susamment faible alors lgalit x (t) x (t) = est impossible pour t [t0 , t1 ] . Il sen suit que x (t) est born et, daprs (c), que lquation (6.18) est vrie. Inversement, supposons quil nexiste pas > 0 vriant (6.17). Alors, il doit exister des suites k 0 (k (0, )), f k et k vriant pour chaque k la proprit correspondante (6.17) et telles que pour des points tk ]t0 , t1 ] les solutions xk du problme correspondant (6.15) (6.16) satisfassent : x (t) xk (t) < (t0 t < tk ) , x (tk ) xk (tk ) = . (6.20)

Lensemble des fonctions xk : [t0 , tk ] Rn tant uniformment born et quicontinu, le lemme dAscoli-Arzela [117] permet le passage des sous-suites (uniformment convergentes sur chaque intervalle t0 , t t0 , t ), tk t > t0 , xk x pour k +. La fonction x est uniformment continue sur t0 , t et peut donc tre prolonge sur t0 , t avec x t x t = lim x (tk ) xk (tk ) = . La fonction xk est la solution du problme :
t

xk (t) = k (0) +
t0

f k (, xk ) d,

t [t0 , tk ] ,

xk (t) = k (t t0 ) ,

t [t0 h, t0 ] .

Eectuons le passage la limite k + sur tout intervalle ci-dessus t0 , t en utilisant la majoration suivante :
t t

f k (, xk ) d
t0 t t0

f (, x ) d
t

t0

f k (, xk ) f (, x ) d
t0

f (, xk ) f (, x ) d.

Les deux termes du membre de droite tendent vers 0 pour k + : le premier par la convergence uniforme de f k vers f dans la bande t0 < t < t1 , xt < ; le second cause des proprits de Lipschitz de f en (dans la mme bande). Donc, x vrie (6.19) sur t0 , t avec la condition initiale (6.16). Daprs (c), x (t) = x (t) , t t0 , t . Ceci tant vrai pour tout t t0 , t , il vient x t = x t , ce qui est impossible. Il doit donc exister > 0 vriant (6.17), ce qui termine la preuve du point (d ). 244

6.4. Mthode pas pas

6.4

Mthode pas pas

Il est rare de pouvoir obtenir lexpression analytique de la solution dune quation direntielle fonctionnelle gnrale. Cependant, dans le cas dquations retardes retards ponctuels, il est quelquefois possible dutiliser la mthode dite pas pas. Nous la prsenterons ici dans le cas scalaire : x(t) = f (t, x (t) , x (t h)) , t t0 , h > 0 constant.
.

(6.21)

La fonction f : [t0 h, +[ R2 R est continue, lipschitzienne en son second argument. La fonction initiale (t) de lquation (6.21) est continue, donne sur lintervalle [t0 h, t0 ] . Le premier pas correspond lintervalle t [t0 , t0 + h]. Pour ces valeurs de t, lquation (6.21) devient une quation direntielle ordinaire : x(t) = f (t, x (t) , (t h)) ,
.

t [t0 , t0 + h] ,

qui peut gnralement tre rsolue pour la condition initiale x (t0 ) = (t0 ), puisque nous sommes dans le cas scalaire. Le rsultat donne la solution sur [t0 , t0 + h], qui son tour conduit au deuxime pas de rsolution pour t [t0 + h, t0 + 2h] , dans lequel la fonction x (t h) est connue, issue du pas prcdent. Cette EDO est son tour rsolue pour la condition initiale x (t0 + h) , et ainsi de suite. Considrons par exemple le systme suivant, o est une constante : x(t) = x (t h) , (t) 0 (constante) t [t0 h, t0 ] , pour lequel la mthode pas pas nous donne la solution, pour t [t0 , +[ :
+ .

(6.22)

x (t) = 0
k=0

k [t t0 (k 1) h]k (t t0 (k 1) h) , k!

(6.23)

avec la notation () 1 + signe() . 2 La rgularit de la solution crot donc avec le temps. Cette proprit de lissage est par ailleurs une caractristique gnrale des quations direntielles de type retard (voir [65] page 37 et [100] page 24). La gure 6.1 en donne une illustration pour = 1 et h = 1. Pour une condition initiale constante sur [h, 0], la solution sur le premier intervalle [0, h] est une droite (intgrale dune constante). Sur [h, 2h] cest une parabole, puis 1 une cubique sur [2h, 3h], puis un polynme en k tk sur [kh, (k +1)h]... La solution x(t) est ainsi non drivable en t = 0, drivable une fois sur ]0, +[, deux fois sur ]h, +[ et k fois sur ]kh, +[. Pour une condition initiale polynomiale dordre 1, la technique pas pas donne la solution reprsente en pointill sur cette mme gure. 245

6. Systmes retard
  

Fig. 6.1: x(t) = x(t1), fonctions initiales 1 (plein) et = 0.5t (pointill).

6.5

Stabilit des systmes retards

Le problme de la stabilit des EDR se pose trs concrtement lors de la synthse des asservissements, puisque la prsence dun retard dans un systme boucl conduit le plus souvent des oscillations, voire des instabilits. Si la nature mathmatique du phnomne de retard nest pas prise en compte, la seule alternative de synthse est de prvoir des marges de robustesse excessives, rduisant dnitivement les performances dynamiques. Il est donc important de disposer doutils spciques. Diverses mthodes sont disponibles (voir des bilans dans [19, 25, 69, 99]) : approches frquentielles [9, 39, 135], mthodes de type Liapounov [14, 65, 69, 72] ou Popov [46], thormes de comparaison [78, 121], approches mtriques [24, 26, 48], thorie des oprateurs [21], faisceaux matriciels [99], systmes stochastiques [66, 72], etc. Nous ne prsenterons ici que quelques uns de ces rsultats : ils servent en gnral de base commune toutes les mthodes dinvestigation de la stabilit.

Notion dquilibre pour une EDR


Considrons nouveau le systme (6.15)-(6.16), soit : x(t) = f (t, xt ) , xt0 = , C [h, 0] .
.

Nous supposerons que f (t, ) est continue, borne pour borne, localement lipschitzienne en . La solution de (6.24) est note x (t, t0 , ) . Dnition 6.5.1. La fonction e C [h, 0] est un tat dquilibre de (6.24) si pour tout t0 R, la solution x (t, t0 , e ) existe et vrie x (t, t0 , e ) = e . Thorme 6.5.1. [19] La fonction e C [h, 0] est un tat dquilibre de (6.24) si, et seulement si, les trois conditions suivantes sont vries : 246

 !



 '( #

 ' & % "

$ #"  

(6.24)

6.5. Stabilit des systmes retards (i) t0 R, x (t, t0 , e ) existe et est unique ; (ii) t R, f (t, e ) = 0 ; (iii) e est une fonction constante de C [h, 0] : [h, 0] , e () = xe . On parlera donc indiremment dtat dquilibre (e ) ou de point dquilibre (xe ).

Dnitions relatives la stabilit des EDR


Nous faisons ici lhypothse que le systme (6.24) possde un quilibre, plac lorigine sans rduction de gnralit, et donc que f (t, 0) 0. Dnition 6.5.2. Lquilibre x = 0 du systme (6.24) est dit : 1. stable si > 0, t0 , = (t0 , ) > 0, B x (t, t0 , ) B ; 2. uniformment stable par rapport t0 si la proprit prcdente est vrie avec = () (donc indpendant de t0 ) ; 3. asymptotiquement stable sil est stable et sil existe = (t0 ) > 0 tel que [ B ] [limt x (t, t0 , ) = 0] ; 4. uniformment asymptotiquement stable sil est uniformment stable et si la limite de la proprit prcdente est uniforme, cest--dire si > 0 : > 0, T () > 0 : [ B et t T ()] [x (t, t0 , ) B ] t0 ; 5. globalement (uniformment) asymptotiquement stable sil est (uniformment) asymptotiquement stable avec = +; 6. globalement exponentiellement stable sil existe deux nombres strictement positifs (appel taux de convergence exponentielle) et k tels que : |x (t, t0 , )| k
C

e(tt0 ) .

(6.25)

Stabilit des systmes retards linaires stationnaires


Dans cette section, on parlera indiremment de la stabilit asymptotique de lquilibre ou du systme : en eet dans le cas linaire stationnaire, un point dquilibre, sil est asymptotiquement stable, est forcment unique (la proprit est globale et uniforme). La stabilit dun systme linaire stationnaire retard est dtermine par la position des racines de son quation caractristique par rapport laxe imaginaire. Thorme 6.5.2. Un systme linaire stationnaire de type retard est globalement asymptotiquement stable si, et seulement si, toutes ses racines caractriqtiques sont dans le demi-plan complexe gauche (laxe imaginaire tant exclu). 247

6. Systmes retard On retrouve ici la mme proprit que dans le cas des quations ordinaires : par contre, lquation caractristique tant ici un quasi-polynme (fonction polynomiale en s et en es , voir [117]), des tests simples de cette proprit (comme le critre de Routh-Hurwitz) ne sont plus disponibles. Considrons lquation gnrale12 suivante retard quelconque (ni ou inni, ponctuel ou distribu) :
0 .

x (t) =

[dK ()] x (t + ) , ], 0] ,

x (t) Rn , t 0,

(6.26)

x () = ()

o lintgrale est dnie au sens de Stieljes [117], avec K () une matrice n n dont les coecients kij sont des fonctions de ], 0] et variations bornes. La transformation de Laplace applique (6.26) conduit : sI K (s) x (s) = (0) + F (s) ,
t

s C,
0

avec F (t) =
0

[dK ()] (t + ) ,

F (s) =
0

es F () d,

K (s) =

e dK () ,

x (s) =

es x () d.

Lquation caractristique correspondante est : (s) = det sI K (s) = 0. (6.27)

Elle a gnralement un nombre inni de solutions dans le plan complexe : dans le cas contraire (nombre ni de racines) on parle dEDR dgnre. Thorme 6.5.3. Le systme (6.26) est asymptotiquement stable si les racines de (6.27) sont dans le demi-plan gauche strict ( Rel(s) < 0) et si toutes les fonctions kij (i,j=1,...,n) vrient :
0

|| |dkij ()| < +.

De nombreuses mthodes ont t labores pour localiser les racines de (6.27) (voir par exemple [19, 69] ainsi que le Chapitre 10 de [117]). Le problme nest pas simple ds linstant o lordre n grandit, ou bien lorsque quelques paramtres de rglage (notamment le retard) sont conservs formellement.
12 Le thorme de Riesz [117] assure lexistence de la fonction (dite canonique) K implique dans (6.26) pour toute fonctionnelle linaire continue g(xt ).

248

6.5. Stabilit des systmes retards Exemple 6.5.1. Considrons lquation x (t) = x (t 1) . Son quation caractristique est s + es = 0, dont les solutions s = j sont en nombre inni. Le systme nest donc pas dgnr. Ici, s = 0.318 1.337j est une estimation de la paire de racines de plus grande partie relle : il y a donc stabilit asymptotique13 . Par contre, le cas suivant est dgnr et instable : 0 1 0 0 1 0 . x (t) = 1 0 1 x (t) + 0 0 1 x (t h) , 2 0 1 0 0 0 0 2 (s) = s s2 1 . Exemple 6.5.2. Considrons le systme (6.26) dans sa forme scalaire :
0 .

x (t) =

x (t + ) dk () ,

et supposons que le noyau k(s) est une fonction non croissante (dk () 0), constante sur lintervalle h < 0 (par consquent, leet de retard linstant t est limit aux instants [t h, t]) :
0

x (t) =
h

x (t + ) dk () .

(6.28)

Alors, (6.28) est asymptotiquement stable si :


0 0

0 =
h

dk () < 0 et 1 =
h

|dk ()| <

. 2h

Dmonstration : pour s = + j, lquation (6.27) scrit :


0

Im (s) =
h 0

e sin dk () = 0,

(6.29)

Re (s) =
h

e cos dk () = 0.

(6.30)

Or, ces deux quations ne peuvent tre simultanment vries pour 0 : si || <
13

2h ,

alors (6.30) na pas de racine puisque


h

e cos dk ()

On a en fait ]0.3181, 0.3182[ . Les racines sont situes lintersection des courbes = e (1 2 e2 ) et = arccos (e ) .

249

6. Systmes retard
0

e cos dk () 0 eh cos h > 0 ; si || >


0

2h ,

alors (6.29) na pas

de racine puisque
h

e sin dk ()

dk () <
h

2h .

Premire mthode de Liapounov


Lapproximation au premier ordre (ou approximation des petits mouvements, ou systme linaris tangent), bien connue pour les EDO, est encore valable dans le cas des systmes retards. Considrons :
k

x(t) =
i=0

Ai x(t hi ) + q(t, xt )

(6.31)

q(t, xt ) = q(t, x(t), x(t 1 (t)), ..., x(t k (t)), h0 = 0, hi = constantes, j (t) [0, i ] continues, ui q(t, u0 , ..., uk ) ( u0 + ... + uk ), avec = constante pour donn, uniformment dcroissante vers 0 quand 0. Lapproximation au premier ordre est dnie par : z(t) =
i=0 . k

Ai z(t hi ).

(6.32)

Thorme 6.5.4. [26] Si le systme linaris (6.32) est asymptotiquement stable, alors z = 0 lest aussi pour (6.31). Si (6.32) a au moins une racine caractristique partie relle positive, alors z = 0 est instable pour (6.31).

Cas des retards faibles


Le rsultat prcdent peut tre utilement complt par une approximation des petits retards, rsultat de nature qualitative obtenu par continuit des racines caractristiques de (6.32) vis--vis des retards hi .
k Thorme 6.5.5. [26] Si A = i=0 Ai est de Hurwitz (respectivement, instable), alors pour des valeurs susamment faibles des retards hi , la solution nulle z = 0 est asymptotiquement stable (respectivement, instable) pour (6.32) et donc (6.31). Si, sur les n valeurs propres de A, n 1 ont des parties relles strictement ngatives et la nime est nulle, alors, pour des valeurs susamment faibles des hi , z = 0 est stable pour (6.32) et donc pour (6.31).

Dans le cas dun retard unique, une estimation quantitative des petits retards conservant la stabilit est donne par le thorme suivant. Nous considrons ici le systme linaire retard constant : dz(t) = A0 z(t) + A1 z(t h), dt 250 (6.33)

6.5. Stabilit des systmes retards qui, pour un retard nul, devient : dz(t) = (A0 + A1 ) z(t). dt (6.34)

Thorme 6.5.6. [40] Si le systme retard nul (6.34) est asymptotiquement stable et si P est la matrice solution de lquation de Liapounov (o Q est une matrice relle dnie positive [117]) : (A0 + A1 )T P + P (A0 + A1 ) = QT Q, alors (6.33) est asymptotiquement stable pour tout retard h [0, hmax ] : 1 1 (6.36) max (B T B) 2 , avec B = QT AT P (A0 + A1 ) Q1 . 1 2 Dmonstration : le principe de la dmonstration sera donn dans la section suivante (exemple 4). hmax = (6.35)

Mthode directe de Liapounov


La mthode directe de Liapounov est un outil majeur pour tudier la stabilit des quations retards. Comme en dimension nie, elle conduit gnralement des conditions seulement susantes. Par contre, vu la dicult du calcul des racines caractristiques, son emploi se justie trs souvent, mme dans le cas linaire. Dnition 6.5.3. Une fonction scalaire : [0, +[ [0, +[ est dite dnie positive si elle est continue et vrie (r) > 0 pour r > 0, et (0) = 0. Une matrice carre relle Q est dnie positive si (x) = xT Qx lest (donc si, et seulement si, ses valeurs propres i vrienti > 0). Dnition 6.5.4. Soit V une fonctionnelle vriant les proprits suivantes : (a) V : R Bh R (h > 0) est continue, avec V (t, 0) = 0 pour tout t. (b) il existe des fonctions scalaires 1 , 2 dnies positives, non dcroissantes, telles que : 1 ( (0)) V (t, ) 2 ( C ) t. (6.37) La drive totale de la fonctionnelle V (t, ) le long des solutions de (6.24) est alors dnie par :
.

V (t, )

0+

lim sup

1 [V (t + , x (t + , t, )) V (t, )] .

Thorme 6.5.7. Sil existe une fonctionnelle V (t, ) vriant les proprits (a) et (b) ci-dessus et, pour tout t0 et tout t t0 : V (t, ) 3 ( (0)) ,
.

(6.38)

o 3 est dnie positive, non dcroissante, alors lquilibre x = 0 de lEDR (6.24) est uniformment asymptotiquement stable. 251

6. Systmes retard Dmonstration : soient > 0 et h choisi tel que 2 () 1 (). Alors, pour toute fonction initiale B , on a 1 ( x (t, t0 , ) ) V (t, xt ) V (t, ) 2 ( C ) 1 (). Ainsi, x (t, t0 , ) t t0 , prouvant la stabilit uniforme. Montrons maintenant que limt+ x (t) = 0 pour toute fonction initiale B o vrie 0 < h et 2 () 1 (h). Comme pour la preuve de sta. bilit, on dduit x (t, t0 , ) h B . Donc x (t, t0 , ) c < . Supposons que pour une condition initiale B la solution x (t, t0 , ) ne tende pas vers 0 quand t +. Alors, il doit exister > 0 et une suite {ti } , limi+ ti . + tels que x (ti , t0 , ) . Or, x (t, t0 , ) c < et donc ti+1 ti 2, = 2c , et x (ti + , t0 , ) 2 pour tout tel que | | . Pour ces instants , (6.38) implique que pour un > 0, V (ti + , xti + ) . Notons V (t) = V (t, xt ) et N (t) le nombre de points ti tels que t0 + ti t . Alors, V (t) V (t0 ) t0 +ti t [V (ti + ) V (ti )] 2N (t) . Comme N (t) + pour t +, on en dduit que V (t) pour t +, ce qui est impossible car V (t) 0. Exemple 6.5.3. Considrons lquation scalaire x (t) = ax (t) +
0 . + .

x (t ) dk () ,

t 0,

(6.39)

o a est une constante positive et k (t) est une fonction variation borne sur [0, +[ . Considrons la fonctionnelle de Liapounov suivante :
+ t

V (t, xt ) = x2 (t) +
0

|dk ()|
t

x2 ( ) d.

(6.40)

La drive de (6.40) le long de (6.39) est : V (t, xt ) = 2x (t) ax (t) +


0 + + . +

x (t ) dk () x2 (t ) |dk ()| .
0 + +

+ x2 (t)
0

|dk ()|

Remarquons que :
+

2 x (t)
0

x (t-) dk () x2 (t)
0

|dk ()| +
0

x2 (t-) |dk ()| .

Lquilibre x = 0 est donc asymptotiquement stable pour (6.39) si :


+ +

a>
0

|dk ()| ,
0

|dk ()| < +,

puisque sous ces deux conditions les hypothses (6.37) (6.38) sont valides. Exemple 6.5.4. La dmonstration du thorme 6 utilise la fonctionnelle de t Liapounov V = V1 + V2 , V1 = y(t)T P y(t), y(t) = z(t) + t A1 z()d , V2 =
t t t T T z (v)Q Qz(v)dv .

d. En remarquant que y(t) = (A0 + A1 ) z(t),

on vriera que la drive V est ngative sous la condition (6.36). 252

6.5. Stabilit des systmes retards

Quelques fonctionnelles de Liapounov-Krasovskii


Les extensions fonctionnelles des fonctions de Liapounov quadratiques ont t trs largement tudies dans le cadre des systmes linaires retards. Ainsi, depuis une vingtaine dannes, diverses mthodes de construction de fonctionnelles de Liapounov-Krasovskii pour des quations particulires ont t proposes (voir par exemple [25, 65, 69, 99] et les rfrences incluses). Ces travaux ont t soutenus par les progrs numriques de loptimisation convexe : loutil LMI (acronyme anglais de ingalit matricielle linaire) est aujourdhui intgr dans tous les logiciels ddis lautomatique. Ainsi, pour le systme simple : x(t) = A0 x(t) + A1 x(t h), et la fonctionnelle :
0

(6.41)

V (xt ) = x(t)T P x(t) +


h

x(t + )T Sx(t + )d,

(6.42)

on obtient des conditions susantes sous forme dquations de Riccati : (6.41) est asymptotiquement stable pour tout h 0 sil existe des matrices P, S, R positives et symtriques telles que : AT P + P A0 + P A1 S 1 AT P + S + R = 0. 0 1 Cette quation (6.43) est quivalente la LMI suivante : TP + PA + S PA A 0 1 < 0. 0 TP A1 S (6.43)

(6.44)

Bien sr, pour A1 = 0, (6.43) se rduit lquation de Liapounov AT P + 0 P A0 < 0, CNS classique dans le cas ordinaire. Pourtant, dans le cas retard, la condition susante (6.43)-(6.44) est loin dtre ncessaire. Cest pourquoi de trs nombreuses gnralisations de la fonctionnelle (6.42) ont t publies dans les quinze dernires annes. Elles mettent en jeu les termes varis suivants : V1 (x(t)) = xT (t)P x(t),
0

(6.45)

V2 (xt ) = xT (t)
hi 0

Qi x(t + )d,

V3 (xt ) =
hi 0

xT (t + )Si x(t + )d,


t

V4 (xt ) =
i t+ 0

xT ()Ri x()d ds, Pi ()x(t + )d,


hi 0

V5 (xt ) = x(t)T
0

V6 (xt ) =
hi hi

x(t + )T Pi (, )x(t + ) d d.

253

6. Systmes retard Pour faire simple, V2 , V3 visent montrer une stabilit indpendante du retard dans le cas de retards ponctuels ; V4 , la stabilit dpendante du retard discret ou aux retards distribus. Par exemple, pour le systme (6.41), V (xt ) = V1 (x(t))+V4 (xt )+V4 (xth ) constitue une application particulire de [68] qui conduit la condition suivante (dpendant du retard), o A = A0 + A1 , R1 pour V4 (xt ) et R2 pour V4 (xth ) : AT P + P A + hR1 + hR2 hP A1 A0 hP A2 1 (6.46) hP AT AT hR1 0 < 0. 0 1 hA2T P 0 hR2 1 V5 et V6 apparaissent, sous forme gnrale, dans des combinaisons visant des conditions ncessaires et susantes : [53] en linaire pour le cas de retards ponctuels, [51] pour le cas distribu, [85] pour des retards variables. Cependant, pour gnraliser ces techniques des conditions de stabilit robuste, on se heurte au prolme du calcul de V5 et V6 . Pour viter ces limitation calculatoires, des formes plus particulires de V5 , V6 ont t introduites [42, 43], mettant en jeu des fonctions constantes par morceaux Pi (.) et conduisant des fonctionnelles discrtises. On peut alors choisir un compromis entre la rduction du conservatisme et leort de calcul. Un bon rsum de ces techniques est donn dans [100]. [62] a galement propos une faon dviter le calcul gnrique des matrices Pi () et Pi (, ), en passant par les proprits de la matrice fondamentale. Dautres faons de rgler le choix des fonctionnelles Vi reposent la reformulation pralable du modle. Elles seront prsentes dans la partie 6.8.

Stabilit et quations de Riccati


Les thormes qui suivent sont une application du thorme 7 aux systmes linaires, permettant de formuler des conditions de stabilit en terme dexistence dune solution positive dnie certaines quations de Riccati (voir le chapitre 9 de [117]) auxiliaires. Pour ne pas alourdir la prsentation, nous traiterons ici les seuls systmes retards ponctuels :
m

x(t) =
i=1

Ai x(t hi ).

(6.47)

Un cas plus gnral, incluant les modles retards distribus, est trait dans [70] [73]. De mme, les conditions peuvent plus gnralement concerner la stabilit dpendante de certains retards et indpendante des autres [68]. Notons que les quations de Riccati obtenues conduisent, leur tour, des conditions de type LMIs (voir [117] chapitre 12). Nous utiliserons les notations suivantes :
m m

A=
i=1

Ai ,

Aij = Ai Aj ,

hij = hi + hj ,

h=
i=1

hi .

(6.48)

254

6.5. Stabilit des systmes retards Thorme 6.5.8. Le systme (6.47) est asymptotiquement stable si, pour deux matrices symtriques et dnies positives R, Q, il existe une matrice dnie positive P solution de lquation de Riccati :
m

A P + P A + mRh + P
i,j=1

hi Aij R1 AT P = Q. ij

(6.49)

Dmonstration : on choisit la fonctionnelle V = V1 + V2 , V1 = xT (t)P x(t), . hij t m T T V2 = i,j=1 hj ds ts x ( )Rx( )d , conduisant V = x (t) Qx (t)
thij m i,j=1 thj [Rx ()

+ AT P x (t)]R1 [Rx () + AT P x (t)]T d. ij ij

Thorme 6.5.9. Le systme (6.47) est asymptotiquement stable si lquation t x(t) + m Ai thi x(s)ds = 0 lest et si, pour des matrices symtriques et di=1 nies positives Ri [i{1,...,m}] , Q, il existe une matrice dnie positive P solution de lquation de Riccati :
m m

A P + PA +
i=1

Ri hi +
i,j=1

1 AT P Ai Ri AT P Ahi = Q. i

(6.50)

Dmonstration : base sur la fonctionnelle V (t, xt ) = V1 + V2 , V1 = [x(t) + t t m m T i=1 Ai thi x(s)ds], i=1 Ai thi x(s)ds] P [x(t) + V2 =
hi m i=1 0

ds

t T ts x ( )Ri x( )d .

Thorme 6.5.10. Le systme (6.47) est asymptotiquement stable si, pour deux matrices symtriques et dnies positives R, Q, il existe une matrice dnie positive P solution de lquation de Riccati :
m

A P + PA +
i=1

T (hi P Ai R1 Bi P + mhAT RAi ) = Q. i

(6.51)

Dmonstration : la preuve est base sur la fonctionnelle V (t, xt ) = V1 + V2 + V3 , h t V1 = xT (t)P x(t), V2 = m 0 i ds ts xT ( )Rx( )d , i=1 t m V3 = mh i=1 thi xT (s)AT RAi x(s)ds. i Remarque 6.5.1. Nous laissons au lecteur le soin de construire les trois fonctionnelles V (t, xt ) des dmonstrations ci-dessus en utilisant les trois transformations de la partie 6.8. Remarque 6.5.2. Si dans les trois thormes prcdents, les retards hi sont tous nuls, les trois quations de Riccati concident avec lquation de Liapounov du systme linaire ordinaire x = Ax et les conditions susantes prsentes sont galement ncessaires. Ceci donne penser que ces conditions sont peu conservatives pour des retards faibles. 255

6. Systmes retard Exemple 6.5.5. Considrons le systme du second ordre avec un nombre quelconque m de retards hi 0 (et , deux constantes) : m . x(t) = B x(t hi ), B = i=1 Les trois thormes donnent la mme condition (susante) : 0 h <
. 2 + 2

Exemple 6.5.6. Considrons le systme (6.47) avec m = 2 : 2 2 1 1 x(t h2 ). x(t h1 ) + x(t) = 2 2 1 1


2 2 En posant 2 = i + i i (i=1,2) ,

les quations (6.49) et (6.51) conduisent : (1 + 2 )2 , 2 2 + 2 1 2

(h1 + h2 ) h1 2 + h2 2 < 1 2

alors que (6.50) donne une condition moins contraignante, obtenue en choisissant R1 = |1 | I, R2 = |2 | I : (h1 + h2 ) h1 2 + h2 2 < 1 2 (1 + 2 )2 . 2 2 + 2 1 2

Ce dernier exemple montre que les conditions issues des trois quations de Riccati (6.49), (6.50) et (6.51) ne sont pas quivalentes.

Principe de comparaison
Le principe gnral de cette approche est de comparer les solutions des quations dorigine avec celles dun systme auxiliaire (sens tre plus simple) appel systme de comparaison. Celui-ci est en gnral obtenu partir dingalits diffrentielles [78] vries par le systme dorigine. Le principe de comparaison sapplique une classe trs large de systmes14 , ordinaires comme fonctionnels, et dans cette partie nous lillustrerons principalement dans le cas linaire non stationnaire : x(t) = A (t) x (t) + B (t) x (t h (t)) , x (t0 + ) = () , 0. t t0 , (6.52) (6.53)

Les coecients des matrices A (t) = (aij (t)) et B (t) = (bij (t)) , ainsi que le retard h (t) 0, sont supposs continus. Nous emploierons les notations A+ (t) et |B (t)| , |x (t)| dnies page 241.
14 Voir des articles de synthse comme [11, 121] qui concernent des cas prsentant des nonlinarits, discontinuits, retards multiples, systmes neutres, etc.

256

6.5. Stabilit des systmes retards Considrons une fonction de comparaison z (t) Rn vriant lingalit diffrentielle : z(t) A+ (t) z (t) + |B (t)| z (t h (t)) , |z (t0 + )| | ()| , 0.
.

t t0 ,

(6.54) (6.55)

Thorme 6.5.11. Pour toute fonction z (t) satisfaisant (6.54) (6.55), on a : z (t) |x (t)| 0 t R,

o x (t) est la solution du systme (6.52) (6.53). Dmonstration : montrons tout dabord que si = 0, alors z (t) 0, t t0 15 . Daprs (6.55), ceci est vrai pour t = t0 . Par contradiction, notons > t0 le premier point o une composante de z sannule, zj ( ) = 0. En ce point, daprs . (6.54), z j ( ) 0 et zj (t) ne peut donc devenir ngative. Soit maintenant ]0, 1] , et x (t) la solution du problme de Cauchy : x (t) = [A (t) I] x (t) + B (t) x (t-h (t)) , t t0 , x (t0 + ) = (1 ) () , Montrons que : |x (t)| < z (t) , t t0 . (6.58) Daprs (6.55) et (6.57), (6.58) est vraie pour t = t0 . Par contradiction, notons > t0 le premier point o lingalit stricte (6.58) devient une galit pour une de ses composantes, x ( ) = zj ( ) . Considrons tout dabord le cas x ( ) > 0. j j Daprs (6.56) (6.55), xj ( ) z j ( ) x ( ) + A ( ) x ( ) A+ ( ) z ( ) j + B ( ) x ( h ( )) |B ( )| z ( h ( )) x ( ) + A+ ( ) [|x ( )| z ( )] j + |B ( )| [|x ( h ( ))| z ( h ( ))] x ( ) < 0. j Ceci contredit la dnition de . Le cas x ( ) < 0 se traite de mme, conduisant j . . xj ( ) z j ( ) x ( ) < 0. La preuve est obtenue en passant la limite, j en notant que lim0 x (t) = x (t). Plusieurs rsultats ont t obtenus partir de lutilisation du systme de comparaison correspondant lgalit dans (6.54) et (6.55), soit : z(t) = sup A+ (t) z (t) + sup [|B (t)|] z (t h (t)) ,
t t . . . .

(6.56) (6.57)

0.

t t0 ,

ainsi que du lemme suivant permettant de conclure la stabilit des systmes linaires stationnaires obtenus par majoration.
15 on peut plus strictement montrer z (t) > 0 en utilisant un passage la limite analogue celui de la deuxime partie de cette dmonstration.

257

6. Systmes retard Lemme 6.5.1. [41] Soient A, B1 et B2 des matrices n n relles, h1 et h2 des constantes positives ou nulles, et soit le systme (t 0) : z(t) = A+ z(t) + |B1 | sup z(t ) + |B2 | sup z(t ).
0h1 0h2 .

(6.59)

Si (A+ + |B1 | + |B2 |) est de Hurwitz16 , alors la solution z = 0 est asymptotiquement stable pour (6.59). Thorme 6.5.12. [41] Lquilibre x = 0 du systme linaire perturb : x(t) = Ax(t) + Bx(t h(t)) + f (x(t), t) + g(x(t h(t), t) |f (x, t)| F |x| , |g(x, t)| G |x| , B =B +B , 0 h(t) hmax , est asymptotiquement stable si la matrice (A + B )+ + B est de Hurwitz. Si B est choisie nulle, on obtient le corollaire suivant. Corollaire 6.5.1. Lquilibre x = 0 de (6.52) est asymptotiquement stable si A+ + |B| est une matrice de Hurwitz, avec A+ = supt [A+ (t)] < et |B| = supt [|B (t)|] < . Cette deuxime condition est indpendante du retard, mais ncessite que A+ soit une matrice de Hurwitz. Elle ne permet donc pas dtudier un ventuel eet stabilisant de la partie retarde B (t). Par contre, la prcdente, qui dpend de la valeur maximale du retard hmax , ncessite la stabilit asymptotique de (A + B )+ mais non celle de A. + F + G + hmax B A + B B + B (F + G)

Exemple dapplication
Les modles retards sont souvent proposs en biologie pour dcrire la lutte des espces et leur dynamique de croissance. Considrons le modle logistique suivant, correspondant au cas o une ressource en nourriture est limite mais se renouvelle de faon autonome : x(t) = 1 x(t h) x(t). k (6.60)

x(t) est le nombre dindividus dans la population, le retard h est le temps de reproduction de la nourriture (le retard est quelquefois interprt comme lge
16

Elle est alors loppose dune M-matrice (ou matrice de Metzler, voir [117], chapitre 8).

258

6.6. Cas des systmes de type neutre moyen des reproducteurs). La constante est le coecient de Malthus de croissance linaire. La constante k est la population moyenne (dquilibre) et est lie la capacit de lenvironnement nourrir la population. Le systme (6.60) a deux points dquilbre : x = 0 (mort de lespce) et x = k (population moyenne). Pour tudier ce second quilibre, on introduit le changement de variable x (t) = k [1 + y (t)] , qui conduit au systme dquilibre y = 0 suivant : . y (t) = y (t h) [1 + y (t)] . (6.61) Nous tudierons la stabilit de y = 0 sur le systme linaris y (t) = y (t h) (thorme 4), qui est un cas particulier de lintgrale de Stieljes (6.28) avec : 0 si < h, k () = si h. Daprs lexemple 2, la stabilit asymptotique (locale) de x = k pour (6.61) est garantie si 0 < < 2h .
.

6.6

Cas des systmes de type neutre

Nous avons dj prsent cette classe de systmes dans le cas de retards ponctuels (6.7)(6.9) et distribus (6.14). Dans le cas gnral, un systme de type neutre scrit : . x(t) = f xt , t, xt , ut , (6.62) Ainsi, dans un systme de type neutre, le plus haut degr de drivation touche la fois certaines composantes de x(t) et certaines de leurs valeurs passes. Ces systmes, dont la complexit est un peu suprieure celle des systmes de type retard, sont traits en dtail dans [48, 69]. Ici, nous signalerons seulement certaines de leurs caractristiques en termes de solutions, puis de stabilit. On reprsente gnralement les systmes neutres sous la forme de Hale [48] :
.

F xt =

dF xt = f (xt , t , ut ) , dt

(6.63)

o F : C Rn est un oprateur rgulier (ce qui vite les systmes implicites) argument dir. Dans le cas linaire, stationnaire et retards ponctuels, un systme neutre scrit :
q k

x(t)
j=1

Dj x(t j ) =
i=0

[Ai x(t hi ) + Bi u(t hi )] ,

(6.64)

quation laquelle on associe lquation linaire aux dirences :


q

F zt = z(t)
j=1

Dj z(t j ) = 0,

Dj matrices constantes.

(6.65)

259

6. Systmes retard On notera que, dans les publications concernant les applications aux sciences pour lingnieur, le cas mono-retard est quasiment le seul reprsent, sous la forme particulire suivante :
k

x(t) Dx(t h1 ) = A0 x(t) +


i=1

[Ai x(t hi ) + Bi u(t hi )] ,

(6.66)

dont lquation aux dirences associe est : z(t) Dz(t h1 ) = 0. (6.67)

Nous avons vu que les solutions des systmes de type retard voient leur rgularit augmenter avec le temps (voir page 245). Cette proprit de lissage nest plus vrie pour les systmes de type neutre : cause de lquation aux dirences (6.65) impliquant x(t), la trajectoire peut rpliquer toute irrgu larit de la condition initiale (t) mme si, dans (6.63), f et F prsentent des proprits de rgularit trs fortes. Ceci peut poser des problmes dans lapplication des mthodes pas pas [8]. La prsence de ce mme oprateur aux dirences change galement les caractristiques de stabilit des systmes neutres. En eet, la dirence dun systme de type retard, un systme linaire neutre peut avoir une innit de ples instables et le Thorme 6.5.2 ne sapplique plus. Considrons le systme linaire (6.64). Son quation caractristique scrit :
q k

det sI s
j=1

Dj esj
i=0

Ai eshi = 0.

(6.68)

Dans le plan complexe, cause de la prsence du terme s q Dj esj dans le j=1 dterminant, on peut obtenir des branches innies de racines complexes tendant vers laxe imaginaire tout en conservant des parties relles strictement ngatives. Des conditions bases sur le seul signe de la partie relle doivent donc tre considres avec beaucoup de prcaution [65]. Par contre, si on fait lhypothse de la stabilit asymptotique de lquation aux dirences (6.65) (ce que lon nomme stabilit formelle du systme neutre [16]), alors le nombre de racines instables devient ni [26]. La stabilit formelle est galement appele f -stabilit dans le cas non linaire [69]. Rappelons que plusieurs conditions permettent danalyser la stabilit asymptotique (donc, exponentielle) du systme linaire stationnaire aux dirences (6.65) : Dans le cas mono-retard (6.67), une CNS (condition ncessaire et sufsante) est que D ait toutes ses valeurs propres dans le cercle unit (det(I D) = 0 || < 1) ou, autrement dit, que D < 1 (il sagit l de la condition de stabilit usuelle des systmes linaires en temps discret). Dans le cas mono-retard (6.67) et avec un retard ventuellement variable (h1 = h1 (t)), la condition prcdente est susante [16, 66]. 260

6.6. Cas des systmes de type neutre Dans le cas multi-retard (6.65), une CS est que q j=1 Dj < 1. Dans le cas scalaire multi-retard (Dj = dj R) et retards non commensurables17 , une CNS est que q |dj | < 1 (voir [47]). j=1 La stabilit formelle est une condition ncessaire pour la stabilit asymptotique du systme neutre (6.64). Par ailleurs, si lon veut montrer la stabilit exponentielle du systme neutre, il faut alors vrier la stabilit formelle exponentielle , cest dire appliquer les conditions ci-dessus en remplaant la valeur limite 1 par < 1, par exemple : D < 1. La stabilit formelle est galement une proprit cruciale pour ce qui est de la stabilisation : il a t montr rcemment que chercher stabiliser un systme neutre non formellement stable se heurte dimportants problmes de robustesse vis--vis des retards. Pour cel, un systme scalaire deux retards non commensurables 1 , 2 a t considr comme exemple dans [47] :

x(t) + d1 x(t 1 ) + d2 x(t 2 ) = u(t),

(6.69)

avec

|d1 | + |d2 | 1.

(6.70)

La condition (6.70) implique que (6.69) nest pas pas exponentiellement stable pour u = 0. Pour stabiliser le systme, on peut essayer la loi de commande u(t) = f1 x(t 1 ) f2 x(t 2 ), qui stabilise (6.69) si, et seulement si, |d1 + f1 | + |d2 + f2 | < 1. Cependant, si le bouclage est appliqu avec une trs lgre erreur 1 , 2 sur les retards, cest--dire si on applique la commande :

u(t) = f1 x(t 1

1)

f2 x(t 2

2 ),

(6.71)

alors il existe une suite ( j j ) tendant vers zro telle que (6.69) boucl par (6.71) 1, 2 soit exponentiellement instable, bien que le mme bouclage soit exponentiellement stable pour 1 = 2 = 0. Ceci se montre en utilisant la dernire condition nonce ci-dessus et le fait que |d1 | + |f1 | + |d2 | + |f2 | > 1. Ainsi, si lon veut stabiliser lquation aux dirences dun systme neutre non formellement stable, la moindre erreur sur les valeurs des retards de boucle peut tre fatale, ce qui est caractristique dun manque de robustesse.

17

Cest--dire en rapport irrationnel, voir page 263.

261

6. Systmes retard

6.7

Modles pour les systmes linaires stationnaires

Nous considrons dans cette partie le cas du systme suivant, linaire, retards et paramtres constants :
q

x(t) =
l=1 k

Dl x(t l ) (Ai x(t hi ) + Bi u(t hi ))


i=0 r t

(6.72)

+ +
j=1 k

(Gj () x() + Hj () u()) d,


tj r

y(t) =
i=0

Ci x(t hi ) +
j=1 tj

Nj ()x()d.

(6.73)

Ici, en posant h0 = 0, A0 Rnn (constante) represente la rtroaction instantane ; les matrices Ai Rnn , i > 0 (constantes), correspondent aux phnomnes de retards ponctuels ; la somme dintgrales correspond aux retards distribus, pondrs par les Gj sur les intervalles temporels [tj , t]; les matrices Di constituent la partie neutre ; Bi et Hj (s) sont les matrices dentre. Le retard maximal est h = maxi,j,l {hi , j , l }. Lquation (6.73), y(t) Rn , dnit lquation de sortie avec, de mme, des parties retardes de faon ponctuelle Ci et distribue Nj (). De nombreux systmes physiques [96] peuvent tre reprsents (aprs linarisation) par ce modle. Dans la plupart des cas, un seul retard sut pour la partie neutre (soit q = 1) correspondant dailleurs lun des retards de la partie retarde (1 = h1 ). On remarquera que, dans (6.72), Gj Gk pour un couple (j, k) permet de reprsenter un eet de retard ponctuel-plus-distribu t comme tjk Gj ()x()d. Par ailleurs, une approximation suplmentaire peut permettre de ramener les retards distribus une somme de retards ponctuels :
t

G() x()d
t

i G(
i=1

i i )x(t ), d d

avec des coecients constants i R. Cette simplication a motiv ltude du cas particulier des systmes retards ponctuels multiples :
k

x(t) =
i=0

Ai x(t hi ) + Bi u(t hi ),

(6.74)

h0 = 0 < h1 < ... < hk1 < hk , 262

6.7. Modles pour les systmes linaires stationnaires et, plus spcialement encore, des systmes retards commensurables (ou rationellement dpendants), pour lesquels les hi = i sont tous des multiples entiers dun mme retard constant , soit :

x(t) =
i=0 k

Ai x(t i) + Bi u(t i), Ci x(t i),


i=0

(6.75)

y(t) =

k = h.

(6.76)

Cette classe de modles, nalement assez large18 , peut tre reprsente par un systme sur anneau, qui permet dutiliser les outils de lalgbre [117]. Pour cel, on reprsente loprateur de retard : x(t) x(t ) (ou bien es en calcul oprationnele de Laplace) par la variable (lettre grecque nabla ). On dnit R[ ] comme lanneau (commutatif) des polynmes en coecients rels. Un lment M( ) de R[ ]mp est alors une matrice m p sur lanneau R[ ] dnie k i mp . Le systme (6.75, par M( ) i=0 Mi , o les matrices Mi sont dans R 6.76) peut alors scrire sous la forme suivante :

x(t) = A( )x(t) + B( )u(t), y(t) = C( )x(t), A( ) R


nn

(6.77) (6.78) [ ], C( ) R
pn

[ ],

B( ) R

nm

[ ].

Le formalisme oprationnel peut aussi tre employ. En considrant que toutes les variables sont nulles avant linstant initial t = 0, il conduit aussi une formulation entre-sortie classique base sur les oprateurs s et es . Ainsi, dans le cas plus gnral (6.72) (6.73) (retards distribus), et lorsque les noyaux (Gj , Hj , Nj ) sont des matrices constantes (hypothse que nous conserverons dans

Les deux principales restrictions sont celle de linarit et celle de retard constant. Elles sobtiennent respectivement par linarisation locale et moyennage des retards. Mme si elle prsente une importance en mathmatiques (vitement de chaos, par exemple), la commensurabilit reprsente une moindre contrainte pour des systmes de lingnieur, o la valeur numrique du retard provient dune identication et laisse une marge dapprciation. On peut ainsi choisir de prendre deux retards commensurables 1 et 1.4 plutt que 1 et 2.

18

263

6. Systmes retard toute la n de cette partie), on arrive : y(s) = C(s)(sIn A(s))1 B(s) u(s),
k r

(6.79)

C(s) =
i=0 q

Ci eshi +
j=1 sl

Nj
k

1 esj , s
r shi

A(s) =
l=0 k

Dl s e

+
i=0 r

Ai e

+
j=1

Gj

1 esj , s

B(s) =
i=0

Bi eshi + e

Hj

u (s) = L(u(t))
0

j=1 st

1 esj , s y (s) = L(y(t)),

u (t) dt,

Ce formalisme fait apparatre, comme en dimension nie, la notion de ples du systme, solutions de lquation caractristique (s) = 0 avec : (s) = det(sIn A(s)), (A) = {s C, (s) = 0}, (6.80) (6.81)

et qui conditionnent les solutions de (6.72) noyaux Gj constants. Lensemble des ples constitue le spectre (A). Bien sr, part dans le cas dit dgnr, lquation transcendentale (s) = 0 a une ininit de racines, autrement dit card (A) = . Le cas des systmes retards commensurables (hi = i, j = j, l = l), (6.79) peut tre reformul sous forme de matrice de transfert sur le corps R(s, es ) des fractions rationnelles en s et es , soit : M(s, es ) = C(s)(sIn A(s))1 B(s). (6.82)

Le cadre comportemental [146] fournit une alternative la thorie des transferts sur anneau. Un comportement B est dni comme B = kerR, o R est une matrice doprateurs direntiel et de retard (s, ) agissant sur lespace des fonctions. Si les deux approches sont voisines (comportement ker[D; N ] et transfert D1 N ), le cadre comportemental est cependant mieux adapt pour les questions de ralisation19 , puisquil intgre les ventuels modes non observables ou non contrlables [37]. Une autre formulation gnrale (et, dans ce cas, le retard peut tre inni) des systmes linaires (6.72) se base sur les intgrales de Stieltjes. Dans le cas
19

Nous commenterons cette notion dans la partie 6.9.

264

6.8. Quelques liens entre modlisation et stabilit retard (Dk = 0)20 , on a : x (t) =
n . 0

[dK ()] x (t + ) ,

(6.83)

x (t) R , t 0, x () = () ], 0] ,

o tous les coecients kij de la (n n)matrice canonique K () sont des fonctions variation borne. Avec quelques hypothses21 sur K () et , la transforme de Laplace existe et, pour des valeurs de Re s susamment leves, on a: sI K (s) x (s) = (0) + F (s) , s C, F (t) = K (s) =
-t - [dK ()] (t + 0 s dK () , - e

) , F (s) = x (s) =

-s 0 e F () d, -s 0 e x () d.

Lquation caracteristique (6.80) de (6.83) est : (s) = det sIn K (s) = 0. (6.84)

6.8

Quelques liens entre modlisation et stabilit

Puisque lanalyse de stabilit est le plus souvent mene au moyen de conditions susantes mais non ncessaires, le choix du modle de dpart peut inuencer les rsultats obtenus. Cette partie prsente donc quelques transformations de modles qui peuvent amliorer ltude de stabilit.

Formule de Leibniz-Newton
La plupart des rsultats de stabilit dpendant du retard ont t obtenue par une re-formulation du modle de dpart, faisant apparaitre le retard dans les gains du modle transform. Nous ferons tout dabord une constatation sur le systme simple suivant : x(t) = A1 x(t) + A2 x(t h), x Rn . (6.85)

La stabilit indpendante du retard requiert que A0 soit une matrice de Hurwitz (ce qui se retrouve de faon cohrente dans la condition LMI (6.44)) et que A1 +A2 le soit aussi (condition obtenue pour un retard nul, voir Thorme 6.5.5). A linverse, une condition assurant la stabilit pour un retard born h [0; hM [
20 0

Pour le cas neutre (Dk = 0), on ajoute


0

[dKN ()] x (t + ) droite de (6.83).


0

21

F (t) absolument convergente,

|| |dkij ()| < +, (0) + (

()

d) 2 < .

265

6. Systmes retard demande la stabilit de A1 + A2 (ce qui apparat dans la condition (6.46) mais pas, en gnral, celle de A1 . Plusieurs rsultats22 sur la stabilit dpendante du retard on t dvelopps t sur la base de la formule de Leibniz-Newton : th x(s)ds = x(t) x(t h). Ainsi, en posant : Ai x(t h) = [Ai Li ] x(t hi )
t

(6.86)

+ Li x(t)
thi

x(s)ds ,

on obtient la transformation du systme :


m

x(t) =
i=1

Ai x(t hi ) (avec, potentiellement, h1 = 0),

(6.87)

en un modle retard augment h = max(hi + hj ) :


m m

x(t) =
i=1 m

Li x(t) +
i=1 t

[Ai Li ] x(t hi ) (6.88)

+
i=1,j=1 thi

Li Aj x(s hj )ds.

De cette faon, mme si la partie non retarde [A1 ] de (6.85) est instable, elle peut tre remplace par une matrice stable, [L1 ] dans (6.88). Une telle dcomposition peut tre optimise par le biais dalgorithmes LMI, pour relcher les condiditons de stabilit. Il a cependant t remarqu dans [45] que cette transformation augmente le nombre de racines caractristiques.

Formes de Kolmanovski-Richard
Le principe prcdent peut tre gnralis dautres transformations et dautres systmes23 . En reprenant la notation (6.48), le systme retard (6.87) peut tre r-crit des trois faons qui suivent :
m thj

x(t) = Ax(t)
i,j=1 m

Aij
thij t

x(s)ds,

(6.89)

x(t) = Ax(t)
i=1

Ai
thi t

x(s)ds,

(6.90)

d x(t) + dt
22

Ai
i=1 thi

x(s)ds = Ax(t).

(6.91)

Les premiers travaux parus sont ceux de [41] dans le cas mono-retard, suivis de [101] pour des retards multiples. Les autres rfrences gurent dans [45]. 23 Les rsultats de cette partie sont issus de [71], o le cas des systmes distribus est galement considr.

266

6.8. Quelques liens entre modlisation et stabilit Par une procdure en deux temps (two-step procedure dcrite dans [64]), chacune de ces critures inspire ensuite des fonctions de Liapounov-Krasovskii adaptes, qui sont celles prsentes plus haut dans les trois dmonstrations de la partie 6.5. Comme dans le cas de la transformation de Leibniz-Newton, les proprits de stabilit du systme original et de ses transformes ne sont pas quivaklentes. Alors que celle de (6.89) implique celle de (6.87) [73], le problme rciproque a t tudi dans [61], qui montre que la stabilit des premier et deuxime systmes transforms nest pas ncessaire celle de linitial, car des dynamiques additionnelles [45] sont introduites par la transformation, dynamiques dont le ples sont absents du spectre initial24 . La stabilit du troisime systme est susante et devient ncessaire si on fait lhypothse que lquation aux dit rences x(t) + m Ai thi x(s)ds = 0 est asymptotiquement stable (proprit i=1 de stabilit formelle pour les systmes neutres, voir page 260).

La forme de Fridman (descripteur)


La forme descripteur (descriptor form en anglais) a t introduite par E. Fridman [29, 32]). Elle correspond un modle 2-D (voir page 240) et met en jeu la transformation (6.86), enrichie par des techniques lies aux systmes singuliers. On r-crit le systme linaire retard (6.72), ici considr en rgime libre (u(t) 0), sous la forme singulire suivante : x(t) = z(t),
q

(6.92) Dl z(t l )
l=1 r t

0 z(t) = z(t) +
k

+
i=0

Ai x(t hi ) +
j=1 tj

Gj () x()d,

puis on lui applique la transformation (6.86) avec Ai = Li . En dnissant le vecteur augment X T (t) = [xT (t), z T (t)], on peut alors mettre en oeuvre la
24

Ainsi, la transformation (6.89) applique au systme (6.85) donne :


t

x(t) = (A1 + A2) x(t) A2


th

[A1 x(s) + A2 x(s h)]ds,

dont les ples sont les zros de : det In

1esh A2 s

det sIn A1 A2 esh , alors que les > h1 , alors (6.89) est

ples de (6.85) sont les zros de det sIn A1 A2 esh . Si A2 instable mme si (6.85) est stable [44].

267

6. Systmes retard fonctionnelle de Liapounov-Krasovskii suivante : V (xt , zt ) = X T (t)EP X(t) + V3 (xt ) + V4 (zt ), In 0 P 0 T , P = 1 , P 1 = P1 . E= 0 0 P2 P3 (6.93) (6.94)

La notation V3 , V4 est celle de (6.45). Remarquons que, puisque la matrice E est singulire, la fonctionnelle est dgnre (cest--dire nest pas dnie positive), ce qui correspond aux techniques utilises pour les systmes singulirement pertubs. Une optimisation LMI permet de calculer les matrices dnissant les fonctionnelles V3 , V4 . Les rsultats concernent la fois les systmes de type retard et neutre, avec incertitudes polytopiques. Sans tre exhaustif, nous donnerons ici un rsultat T simple : le systme (6.41) est asymptotiquement stable sil existe P1 = P1 > 0, P2 , P3 , Q = QT , R = RT , telles que :
T AT P 2 + P 2 A T T P1 P2 + AT P3 hP2 A1 T P3 P3 + hR

T P1 P2 + P3 A hAT P2 1

hAT P3 1

T hP3 A1 < 0. hR

Techniques de rductions par prdicteur


Lappellation rduction dArtstein (Artstein model reduction en anglais) rfre un article de 1982 [6] mais le principe de cette technique peut aussi tre trouv dans des travaux antrieurs [76], [80] et [132]. Son usage est assez simple si on considre des systmes avec retard sur lentre seule : x(t) = Ax(t) + Bu(t h), x(t) Rn . (6.95) En introduisant le nouveau vecteur : :
t

z(t) = x(t) +
th

eA(th) Bu() d,

(6.96)

on rduit (6.95) un systme sans retard : z(t) = Az(t) + eAh Bu(t),


.

z(t) Rn .

(6.97)

On peut alors calculer facilement sur cette EDO un retour dtat classique, u(t) = K0 z(t), condition que la paire (A, B) soit stabilisable (ce qui garantit que la paire (A, eAh B) lest aussi). En revenant la notation du systme initial, le contrle rsultant intgre donc un eet de retard distribu : u(t) = K0 x(t) + t A(th) Bu() d. th K0 e 268

6.8. Quelques liens entre modlisation et stabilit Le problme est sensiblement plus compliqu si le systme prsente aussi un retard sur ltat. Le cas suivant a t considr par Fiagbedzi et Pearson [27] : x(t) = A0 x(t) + A0 x(t h) + B0 u(t) + B1 u(t ), qui aboutissent la transformation :
t

(6.98)

z(t) = x(t) +
th t

eA(th) A1 x() d eA(t ) B1 u() d. (6.99)

+
t

Le modle rduit est alors : z(t) = Az(t) + Bu(t), A = A0 + eAh A1 , B = B0 + eA B1 . Cependant, rsoudre lquation caractristique matricielle (6.100) devient beaucoup moins simple. Dans [27], il est propos de limiter le problme de calcul aux seuls vecteurs et valeurs propres instables (qui, pour un systme retard, sont en nombre ni). Une application (simule) au controle de ralenti dun moteur thermique est ptrsente dans [35]. Plus gnralelment encore, cette approche peut tre considre sur lquation (6.83), mais demande alors ltude de la structure 0 propre de lquation caratristique A = h eA dK(). Les contrleurs obtenus par ces techniques de rduction contiennent des termes intgraux comme ceux de (6.96) et (6.99). A ce titre, ils font partie des contrles de type prdicteur. Dans certains cas, ils peuvent donc savrer sensibles aux incertitudes paramtriques et, plus encore, aux erreurs didentication du retard. La rduction dArtstein constitue cependant un outil dutilisation simple et trs intressant dans le cas de retard sur lentre seule.
.

z(t) Rn , (6.100)

Forme exponentielle de Seuret


La transformation qui suit vise tudier la stabilit exponentielle dun systme retard variable. Elle a t initialement introduite dans [126], o la stabilisation exponentielle robuste tait considre (voir galement [125]). Nous nen exposerons ici que le principe, partir du cas simple suivant : x(t) = A0 x(t) + A1 x(t (t)), o (t) est un retard variable born, vriant les ingalits suivantes : 0 h1 (t) h2 , t 0, (6.102) (6.101)

Comme dni en (6.25), montrer la stabilit exponentielle taux signie de prouver lexistence de deux rels et k tels que : |x (t, t0 , )| k C e(tt0 ) . 269

6. Systmes retard Cel revient aussi montrer la convergence asymptotique du vecteur e(tt0 ) x(t, t0 , ) vers zro. En choissant, sans restriction pour la suite, linstant initial t0 = 0, il est donc naturel dintroduire la nouvelle variable vectorielle z = et x(t). Cette variable satisfait lquation transforme suivante : z(t) = (A0 + In )z(t) + e (t) A1 z(t (t)), (6.103)

dont la stabilit asymptotique pour un certain > 0 garantira la stabilit exponentielle de taux pour le systme initial (6.101). Cependant, une dicult apparat pour tudier le systme transform (6.103) : puisque (t) est variable, (6.103) est un systme non stationnaire. Pour surmonter cet obstacle, [126] a propos dexprimer (6.103) sous une forme polytopique, base sur lexistence de coecients variables 1 et 2 conduisant lexpression du terme e (t) sous forme dune somme convexe de ses bornes eh1 et eh2 : e (t) = 1 (t)eh1 + 2 (t)eh2 , 1 (t), 2 (t) 0 et 1 (t) + 2 (t) = 1. Par ce biais, le systme (6.103) est inclus dans la classe polytopique :
2

(6.104)

z(t) = A0 + In z(t) +
i=1

ehi i (t)A1 z(t (t)),

(6.105)

dont lanalyse est ensuite mene sous la forme descripteur : z(t) = y(t), 0 = y(t) + (A0 + In + A1 (t))z(t) A1 ou encore : E z (t) = 0 A0 + In + A1 (t) In In (t) z 0 A1
t t t

y(s)ds,
t

y(s)ds, (6.106)

avec E = diag{In , 0}, z (t) = col{z(t), y(t)} et A1 (t) = 2 ehi i (t)A1 . i=1 Des conditions sous forme LMI sont alors obtenues, gnralisables au cas de matrices perturbes [125, 126] et aux systmes de type neutre [127].

Techniques de pseudo-retard
Ces techniques se placent dans le cadre frquentiel et permettent de remplacer le retard par une fraction rationnelle. La stabilit du systme (6.85) dpend des racines de lquation caratristique : det(sI A1 A2 esh ) = d(s) + n(s)ehs = 0. 270 (6.107)

6.8. Quelques liens entre modlisation et stabilit Les valeurs critiques de h qui correspondent des bifurcations de stabilit correspondent aux racines imaginaires pures s = j de (6.107), vriant donc d(j) hj = 1. De l, lide gnrale des techniques de pseudo-retard est, n(j) = e
d(j) tout dabord, de chercher les ventuelles intersections de la courbe n(j) avec le cercle unit. Ceci dnit les frquences de croisement i . Dans cette technique frquentielle, le retard ehs peut tre, de faon quiva(sT ) lente, remplac par toute fonction de transfert pn(sT ) ayant un module unitaire. pd Les frquences de croisement i sont alors obtenues en rsolvant lquation : d(j)pn (jT ) + n(j)pd (jT ) = 0 pour des valeurs croissantes du paramtre T ]0, +[. Cette quation est simple (polynomiale) et lorsquune paire (i , Ti ) donne une solution, le ou les retards correspondants en sont dduits. Le paramtre T est appel le pseudo-retard. Z.V. Rekasius [115] a ainsi introduit la

transformation

pn (sT ) pd (sT )

(1sT ) (1+sT ) .

A. Thowsen [136], en utilisant

(1sT )2 , (1+sT )2

a obtenu

lquivalence suivante, correspondant au systme (6.75) en rgime libre. Thorme 6.8.1. s = j, 0, est une racine du quasi-polynme k is pour un > 0 si, et seulement si, cest aussi une racine de i=0 di (s)e k 2i 2(ki) pour un T 0. i=0 di (s) (1 sT ) (1 + sT ) Ainsi, bien que ces techniques rappellent les approximations rationnelles (6.1), nous constatons que les pseudo-retard ne sont pas une technique dapproximation (voir aussi [100] p.137). Ils sont plutt relis aux transformations 1z bilinaires du type : C C, z = ejh w = 1+z = j tan h , qui mettent 2 en correspondance le cercle unit et laxe imaginaire et sont bien connues en traitement du signal comme en commande numrique ( transforme homographique ou en w ). Parmi les techniques associes aux pseudo-retards, on retiendra le rsultat de K. Walton et J.E. Marshall [142], particulirement pratique pour les systmes mono-retard, cest--dire dont lquation caractristique est (6.107). Il utilise d(s) lquation d(j)d(j) n(j)n(j) = 0 et, donc, le choix pn = n(s) ). pd

Modlisation issue des techniques de robustesse


En amliorant une technique de [34] (voir aussi [100] page 154), plusieurs auteurs [52, 54, 59] ont dvelopp des approches inspires de direntes techniques de commande robuste : techniques IQC, synthse, approche de KalmanYakubovitch-Popov, thorie de Popov gnralise, etc. Nous dcrirons tout dabord ici les grandes lignes de lapproche de M. Jun et M.G. Safonov [59]. On considre le systme (6.41) pour h [0, hM ], en supposant que A = A0 +A1 est asymptotiquement stable (ce qui est la condition de stabilit asymptotique de (6.41) retard h nul). On associe ce systme un modle oprationnel constitu de deux blocs interconnects, dcrit Figure 6.2. Cette reprsentation se prte une r-criture des conditions de stabilit robuste sous forme de contrainte intgrale-quadratique (IQC en anglais, voir [90, 123]). 271

6. Systmes retard

Fig. 6.2: Deux blocs interconnects pour reformulation IQC.

Dans ce modle, loprateur reprend les caractristiques du retard. Sa hs transforme de Laplace est (s) = e hs1 et le systme correspondant au bloc G(s) est dni, dans le domaine temporel, comme suit : x(t) = Ax(t) + Bu(t), (6.108) y(t) = Cx(t) + Du(t), u(t) = (y(t)), avec : A = A0 + A1 , B = hH, A1 = HE, q n, C = EA, HR
nq

D = hEH, , E Rqn ,

H et E sont des matrices de rang plein.

[59] montrent que la stabilit asymptotique du systme (6.108) quivaut celle du systme (6.41). La preuve se fonde sur lquivalence suivante : (sI A0 A1 ehs )x = 0 (sI (I h(s)A1 )1 (A0 + A1 ))x = 0.

Ainsi, (6.41) est asymptotiquement stable si, et seulement si, la matrice gauche de lquivalence est rgulire dans le demi-plan droit Re s 0, cest--dire si, et seulement si, la matrice droite lest aussi. Cette dernire correspond (6.108). Le thorme IQC requiert quun certain oprateur satisfasse la contrainte intgrale-quadratique suivante pour tout dans [0, 1] : + y(t) dt 0. y T (t), (y(t)) (y(t)) On peut ainsi guarantir la stabilit asymptotique de (6.108) la condition que A soit une matrice de Hurwitz et que : G(j) I. > 0, R, GT (j), I I 272

6.8. Quelques liens entre modlisation et stabilit Cette condition, frquentielle, peut ensuite tre reformule de faon quivalente sous une forme LMI grce au lemme de Kalman-Yakubovich-Popov (lemme KYP, voir [145]). Le choix de : = Q S ST Q conduit au critre (susant) suivant :

Thorme 6.8.2. [59] Le systme (6.41) est asymptotiquement stable sil existe deux matrices symtriques dnes-positives P > 0, Q > 0 et une matrice antisymtrique S telles que la matrice suivante soit dnie-ngative : AT P + P A + C T QC P B + C T S + C T QD < 0.

B T P + S T C + DT QC Q + DT QC + S T D + DT S

Une classe plus gnrale de systmes a t considre dans [52], incluant des retards multiples hi dont, ventuellement, la borne infrieure pouvait tre non nulle25 : hi [him , hiM ]). Lapproche de robustesse est dirente (synthse, voir [137]). Pour traiter le cas him > 0, le sous-systme G(s) doit inclure des retards ehim s . Cependant, les conditions obtenues peuvent savrer assez conservatives. Parmi les techniques sinspirant de la commande robuste, citons galement lutilisation de la thorie de Popov gnralise [55] dans le cas largi des systmes retard sur ltat [54]. Ce rsultat (voir galement [100]) tudie des techniques de stabilisation par rtroaction et de commande H pour des systmes retards ponctuels ou distribus, formules en termes de triplets de Popov = (A, B; P ), P = Q S R de Kalman-Yakubovich-Popov en J (cest--dire uns systme non linaire matrices inconnues X, V, W ) doit tre rsolu : R = V T JV, L + XB = W T JV, Q + AT X + XA = W T JW. Avant de clore cette partie, mentionnons larticle [140] o direntes techniques de robustesse (lemme KYP, lemme Rel Strictement Born, stabilit absolue, passivit) ont t appliques ltude se stabilit des systmes linaires retards ponctuels et non-linairement pertubs.
Ce type de condition correspond, dans la littrature en anglais, lappellation nonsmall delay. En franais, on pourra parler de retard born si him = 0, par distinction du retard major si him = 0 et hiM < .
25

ST

R(n+m)(n+m) , pour lesquels un systme

273

6. Systmes retard

Approximation LPV
Dans [7], S.P. Banks considre le systme non linaire (ici, sans entre) : x(t) = A (x(t), x(t h)) x(t), x() = (), h 0, (6.109)

qui est remplac, comme suit, par une suite dapproximations linaires paramtres variants (LPV) : x[i] (t) = A x[i1] (t), x[i1] (t h) x[i] (t), x[i] () = (), h 0. (6.110)

Si A (., .) est localement lipschitzienne en ses deux variables, il est montr que la suite de fonctions x[i] () converge, dans C([0, T ]) pour un certain T ]0, h], vers la solution de (6.109). Ltude de stabilit fait intervenir une algbre de Lie nilpotente associe (6.110) et est mene grce une transformation de Liapounov particulire. La stabilisation est galement tudie.

6.9

Proprits structurelles

La commandabilit des systmes retards prsente trois principales dirences par rapport au cas ordinaire : 1. La premire dirence vient la nature fonctionnelle de ltat : la notion de contrlabilit (terme employ de prfrence commandabiilt lorsquon se place comme ici en dimension innie) reprsente le fait de pouvoir rallier un tat un certain instant t1 . Pour un systme retard, il sagit donc de rejoindre, t1 , une fonction xt de support [h, 0], ce qui demande de placer le vecteur x(t) depuis linstant t1 h jusqu t1 . Pour une EDO, la commandabilit demande de rallier un point x(t) un instant t1 . 2. La deuxime dirence (lie la premire) tient au temps ncessaire au contrle. Pour un systme linaire et sans retard dmarrant linstant t0 , tout point pouvant tre atteint linstant t1 > t0 peut aussi ltre linstant t0 +(t1 t0 ), > 0. Au contraire, la prsence dun retard entrane gnralement lexistence dun temps datteinte minimum. . Pour donner un . exemple, il est clair que le simple systme x(t) = x(t) + u(t 1) ne peut pas tre controll en moins dune seconde. Ainsi, en plus des notions de commandabilit usuelles (sous-espaces et indices de commandabilit), on devra ajouter un autre type dindex : la classe dun systme linaire retard correspond au nombre de fois le retard ncessaires pour atteindre lobjectif. 3. Enn, la nature de la ralisation du contrle appliquer, constitue un enjeu important. Pour un systme retard, lexpression gnrique dun retour 274

6.9. Proprits structurelles dtat est u(t) = g(xt ), ce qui signie que le contrleur est lui aussi de dimension innie (fonctionnel). Pour des raisons dimplantation numrique, on peut prfrer restreindre sa ralisation un retour instantann (en anglais, memoryless control) du type u(t) = g(x(t)) oui bien un retour retards ponctuels du type u(t) = g(x(t), x(t hi )). La suite de cette partie reprendra quelques dnitions relatives la contrlabilit des systmes retards. Des correspondances plus compltes, obtenues dans des contextes unicateurs, pourront tre trouves dans [28, 84] (contexte algbrique de la thorie des modules) ou [36] (approche comportementale). Dans le cas des systmes retards, les notions de contrlabilit peuvent tre transposes lobservabilit (voir [113] et les rfrences incluses). Cependant, pour eectuer cette transposition dans le cas des systmes neutres, lhypothse de stabilit formelle(voir page 260) est requise. Dans le cas contraire, le problme des observateurs asymptotiques est encore ouvert. Dnition 6.9.1. (Contrlabilit M2 , ou M2 approche [20]) On considre le systme (6.13). Ltat x0 est M2 -contrlable linstant t vers x1 M2 [h, 0]; Rn sil existe une suite de contrles {ui } dnis sur L2 ([0, t]; Rm ) telle que x(t; x0 , ui ) converge vers x1 (au sens dune norme sur M2 ). Le systme est M2 -contrlable t si tous les tats x0 sont M2 -contrlables t vers tout x1 M2 ([h, 0]; Rn ). Il est M2 -strictement contrlable si, dans la dnition prcdente, la suite {ui } est remplace par un contrle u. Dnition 6.9.2. (Contrlabilit absolue [107]) Le systme linaire retards sur lentre x(t) = A0 x(t) + k Bi u(t i) est absolument contrlable si, pour i=0 toute condition initiale x(0), u(t)t[k, 0] , il existe un temps t1 > 0 et un contrle born u(t) tels que x(t1 ) = 0 avec u() = 0 pour tout [t1 k, t1 ]. Une condition ncessaire et susante de contrlabilit absolue peut tre n1 exprime simplement : rang E, A0 E, ..., A0 E = n, avec E = k eiA0 Bi . i=0 Cependant, la dnition exige une n de mouvement en rgime libre (u() = 0 pour tout [t1 k, t1 ]), ce qui reprsente une condition trs forte. La dnition qui suit saranchit de cette contrainte. Dnition 6.9.3. ( (, Rn )-contrlabilit [107, 144]) Le systme linaire (6.75) est (, Rn )-contrlable (par rapport une fonction C) si, pour toute condition intitiale C, il existe un temps (ni) t1 > 0 et une loi de commande u(t) L2 ([0, t1 + h] , Rm ) tels que x (t; , u) = (t t1 h) pour tout t [t1 , t1 + h]. Pour des systmes mono-retard, la (0, Rn )-contrlabilit peut tre teste par des techniques de grammien [144]. Dnition 6.9.4. (Contrlabilit spectrale [88]) Le systme linaire (6.75), considr avec la notation (6.77), est spectralement contrlable si : rank sI A(es ), B(es ) = n, s C. (6.111) 275

6. Systmes retard La contrlabilit spectrale tablit des bases trs intressantes pour une mise en uvre eective de contrles. Il sagit bien l dune proprit fonctionnelle, mais qui ne concerne que le contrle (au sens du placement) du spectre (A) dni en (6.81) : il a t montr26 dans [13] et [36] que le systme (6.75) est stabilisable si et seulement si (6.111) est vrie pour tout s C, Re(s) 0. Par ailleurs, les proprits spectrales stendent facilement lensemble de lanalyse structurelle (stabilizabilit, dtectabilit...) : toute matrice de transfert causale de R(s, es ), comme par exemple lquation (6.82), admet une ralisation spectralement observable. Elle admet galement une ralisation dtectable et spectralement contrlable. Il a nanmoins t remarqu que la notion de ralisation minimale (au sens de la contrlabilit spectrale et de lobservabilit spectrale, comme au sens du nombre minimum doprateurs dintegration s1 et de retard 1+e2s es requis) ne fait pas toujours sens27 : la fonction de transfert s+es /2 a t donne comme exemple dans [81]. Dnition 6.9.5. (Contrlabilit euclidienne, ou Rn -contrlabilit, Rn -contrlabilit forte [77]) Le systme linaire (6.75) est Rn -contrlable si, pour toute condition initiale C et tout vecteur x1 Rn , il existe un temps t1 > 0 et une loi de commande u(t) L2 ([0, t1 ] , Rm ) tels que x (t1 ; , u) = x1 . Il est fortement Rn -contrlable si nimporte quel t1 > 0 peut tre pris. Si la proprit est restreinte x1 = 0, alors le systme est Rn -contrlable vers lorigine. La Rn -contrlabilit nest pas une proprit fonctionnelle, puisquelle concerne le vecteur x(t) et non ltat xt . On notera trois dirences avec le cas de la commandabilit dune EDO : La trajectoire peut ne pas rester en x1 aprs t1 . Sauf dans le cas rare de la contrlabilit forte, linstant t1 ne peut pas tre arbitrairement rduit. La Rn -contrlabilit nest pas quivalente la Rn -contrlabilit vers lorigine. Dnition 6.9.6. (Contrlabilit forte/faible, ou sur anneau/corps, ou R [ ]/ R( )-contrlabilit, voir [77]) Le systme linaire sur anneau (6.77) est contrlable sur lanneau R [ ] ou fortement contrlable, sil existe une loi de commande de type polynomial u(t) = f (x, x, 2 x, ...), permettant de rejoindre tout lment du module Rn [ ] depuis tout tat initial x0 Rn [ ]. Il est contrlable sur le corps R( ) ou faiblement contrlable, sil existe une loi de commande de type rationnel u(t) = f (x, x, 2 x, ..., 1 x, 2 x, ) permettant de rejoindre tout lment du module Rn [ ] depuis tout tat initial x0 Rn [ ]. La contrlabilit forte nest pas non plus de type fonctionnel. Elle met laccent sur la complexit de la commande appliquer. Une condition ncessaire
Il sagit dune preuve constructive base sur la proprit de domaine de Bzout. Comme cela a t montr dans [134], pour des systmes sur un anneau, mme des ralisations minimales peuvent ne pas tre isomorphes, de telle sorte quil nexiste pas forcment de forme canonique de ralisation, contrairement aux systmes sur un corps.
27 26

276

6.10. Complments bibliographiques et susante peut tre nonce partir du sous-module de contrlabilit associ la paire (A, B), i.e. A/ Im B = Im B + A2 Im B+... + An1 Im B ou, de faon quivalente, partir de la matrice de contrlabilit A/B = B, AB, A2 B, ..., An1 B . Larticle de synthse [77] donne, dans le cas du systme linaire invariant (6.74) avec retards commensurables, les implications suivantes (ainsi que dautres qui utilisent la notion de sous-module de torsion) : R [ ]-contrlabilit forte Contrlabilit absolue R( )-contrlabilit faible Rn -contrlabilit. Contrlabilit approche Contrlabilit spectrale R( )-contrlabilit faible. Cela signie que la R [ ]-contrlabilit forte est une proprit trs exigeante. Eectivement, elle demande que le systme soit contrlable comme sil ne comportait pas de retard. Comme nous lavons dj signal page 274, la notion usuelle dindice de contrlabilit a t tendue aux systmes retards [111], ajoutant, avec la notion de classe , la prise en compte du temps datteinte, temps minimum t1 ncessaire pour que les direntes composantes de ltat (sous-modules de contrlabilit) puissent atteindre les valeurs voulues x1 Rn .

6.10

Complments bibliographiques

Comme lattestent les trs nombreux travaux paraissant aujourdhui au niveau international, les systmes retards constituent un champ dtude important, pour lautomaticien comme pour lingnieur. En complment aux rfrences dj cites, mentionnons pour ce qui concerne dautres aspects fondamentaux de lautomatique : modlisation [84], proprits structurelles [84, 124], commande (par placement de spectre [84, 143], optimale [66, 72], par suivi de modle [83, 112], par platitude [94], par modes glissants [40], par linarisation [93]). Parmi les ouvrages incluant des domaines dapplication spciques, citons la commande en rseau [120], lcologie [38], la biologie [87], la robotique [135]. De nombreux exemples sont galement prsents dans [66, 84, 100, 122].

6.11
[1]

Bibliographie

Abdallah, C., J.D. Birdwell, J. Chiasson, V. Chupryna, Z. Tang et T. Wang: Load Balancing Instabilities Due to Time Delays in Parallel Computations. Dans 3rd IFAC Workshop on Time Delay Systems, Sante Fe, NM, Dec. 2001. 277

Bibliographie [2] Abdallah, C. et J. Chiasson: Stability of Communication Networks in the Presence of Delays. Dans 3rd IFAC Workshop on Time Delay Systems, Sante Fe, NM, Dec. 2001. Abdallah, G., P. Dorato, J. Benitez-Read et R. Byrne: Delayed Positive Feedback Can Stabilize Oscillatory Systems. Dans ACC93 (American Control Conf.), pages 31063107, 1993. Aernouts, W., D. Roose et R. Sepulchre: Delayed Control of a MooreGreitzer Axial Compressor Model. Int. J. of Bifurcation and Chaos, 10(2), 2000. Ailon, A. et M.I. Gil: Stability Analysis of a Rigid Robot with Output-Based Controller and Time-Delay. Syst. and Control Letters, 40(1) :3135, 2000. Artstein, Z.: Linear Systems with Delayed Controls : A Reduction. IEEE Trans. Aut. Control, 27(4) :869879, 1982. Banks, S.P.: Nonlinear Delay Systems, Lie Algebras and Lyapunov Transformations. IMA J. Math. Control Information, 19(1-2) :5972, 2002. Bellen, A. et M. Zennaro: A Free Step-Size Implementation of Second Order Stable Methods for Neutral Delay Dierential Equations. Dans 3rd IFAC Workshop on Time Delay Systems, Sante Fe, NM, Dec. 2001. Bellman, R. et K.L. Cooke: Dierential Dierence Equations. Academic Press, New York, 1963.

[3]

[4]

[5] [6] [7] [8]

[9]

[10] Biberovic, E., A. Iftar et H. Ozbay: A Solution to the Robust Flow Control Problem for Networks with Multiple Bottlenecks. Dans 40th IEEE CDC01 (Conf. on Dec. and Control), pages 23032308, Orlando, FL, Dec. 2001. [11] Borne, P., M. Dambrine, W. Perruquetti et J.P. Richard: Vector Lyapunov Functions : Nonlinear, Time-Varying, Ordinary and Functional Dierential Equations, chapitre 2, pages 4973. Stability and Control : Theory, Methods and Appl. Taylor and Francis, London, Martynyuk dition, 2002. [12] Borne, P., Dauphin Tanguy G., J.P. Richard et I. Rotella F., Zambettakis: Analyse et Rgulation Des Processus Industriels, tome 1 : rgulation continue de Collection Mthodes et Pratiques de lIngnieur, Srie Automatique. Technip, 1993. [13] Breth, D.: Contribution lEtude de la Stabilisation des Systmes Linaires Retards. (in French), IRCCyN, Univ. of Nantes, EC Nantes, France, Dec. 1997. [14] Burton, T.A.: Stability and Periodic Solutions of Ordinary and Functional Dierential Equations, tome 178. Academic Press, Orlando, 1985. [15] Bushnell, L.: Editorial : Networks and Control. IEEE Control Syst. Magazine, 21(1) :2299, Feb. 2001. Special section on Networks and Control. 278

Bibliographie [16] Byrnes, C.I., M.W. Spong et T.J. Tarn: A Several Complex Variables Approach to Feedback Stabilization of Linear Neutral Delay-Dierential Systems. Math. Systems Theory, 17 :97133, 1984. [17] Chiasson, J. et J.J. Loiseau: Applications of Time-delay Systems. Numro 352 dans Lecture Notes in Control and Inform. Sc. Springer Verlag, Berlin Heidelberg, 2007. [18] Conte, G. et A.M. Perdon: Systems over Rings : Theory and Applications. Dans 1rst IFAC Workshop on Linear Time Delay Systems, pages 223234, Grenoble, France, July 1998. Plenary lecture. [19] Dambrine, M.: Contribution Ltude de la Stabilit Des Systmes Retards. Thse de doctorat, Laboratoire dAutomatique et dInformatique Industrielle de Lille, EC Lille, Univ. of Lille, France, Oct. 1994. (in French). [20] Delfour, M. et S. Mitter: Controllability, Observability and Optimal Feedback Control of Ane, Hereditary, Dierential Systems. SIAM J. Contr. Optim., 10 :298328, 1972. [21] Diekmann, O., S.A. Von Gils, S.M. Verduyn-Lunel et H.O. Walther: Delay Equations, Functional, Complex and Nonlinear Analysis, tome 110 de Applied Math. Sciences. Springer, 1995. [22] Dieulot, J.Y. et J.P. Richard: Tracking Control of a Nonlinear System with Input-Dependent Delay. Dans 40th IEEE CDC01 (Conf. on Dec. and Control), Orlando, FL, Dec. 2001. [23] Dion, J.M., L. Dugard et S.I. Niculescu: Time Delay Systems. Special issue of Kybernetica, 37(3-4), 2001. [24] Driver, R.D.: Ordinary and Delay Dierential Equations. Applied Math. Sciences. Springer, 1997. [25] Dugard, L. et E.I. Verriest: Stability and control of time-delay systems. Numro 228 dans Lecture Notes in Control and Inform. Sc. Springer Verlag, 1997. [26] Elsgolts, L.E. et S.B. Norkin: Introduction to the Theory and Application of Dierential Equations with Deviating Arguments, tome 105 de Mathematics in Sc. and Eng. Academic Press, N.Y., 1973. [27] Fiagbedzi, Y.A. et A.E. Pearson: Feedback Stabilization of Linear Autonomous Time Lag Systems. IEEE Trans. Aut. Control, 31 :847855, 1986. [28] Fliess, M. et H. Mounier: Interpretation and Comparison of Various Types of Delay System Controllabilities. Dans IFAC Conf. System Structure and Control, pages 330335, Nantes, France, 1995. [29] Fridman, E.: New Lyapunov-Krasovskii Functionals for Stability of Linear Retarded and Neutral Type Systems. Syst. and Control Letters, 43(4) :309 319, July 2001. 279

Bibliographie [30] Fridman, E., A. Seuret et J.P. Richard: Robust Sampled-Data Stabilization of Linear Systems : An Input Delay Approach. Automatica, 40(8) :1441 1446, Aug. 2004. [31] Fridman, E., A. Seuret et J.P. Richard: Robust Sampled-Data Control An input delay approach, pages 315327. Numro 352 dans Lecture Notes in Control and Inform. Sc. Springer Verlag, Berlin Heidelberg, Chiasson and Loiseau dition, 2007. [32] Fridman, E. et U. Shaked: A Descriptor System Approach to H Control of Linear Time-Delay Systems. IEEE Trans. Aut. Control, 47(2) :253270, Feb. 2002. [33] Fridman, E. et U. Shaked: Delay Systems. Special issue of Int. J. Robust and Nonlinear Control, 13(9), July 2003. [34] Fu, M., H. Li et S.I. Niculescu: Robust Stability and Stabilization of TimeDelay Systems via Integral Quadratic Constraint Approach, tome 228 de LNCIS, chapitre 4, pages 101116. Springer, London, 1997. [35] Glielmo, L., S. Santini et I. Cascella: Stability of Linear Time-Delay Systems : A Delay-Dependent Criterion with a Tight Conservatism Bound. Dans ACC00 (American Control Conf.), pages 4549, Chicago, IL, June 2000. [36] Glsing-Leren, H.: A Behavioral Approach to Delay-Dierential Systems. SIAM J. Contr. Optim., 35(2) :480499, 1997. [37] Glsing-Leren, H.: Realization Behaviors Given by Delay-Dierential Equations. Dans ECC97 (4th European Control Conf.), Brussels, Belgium, July 1997. WE-M D6. [38] Gopalsamy, K.: Stability and Oscillations in Delay Dierential Equations of Population Dynamics, tome 74 de Mathematics and Applications. Kluwer Acad., 1992. [39] Gorecki, H., S. Fuksa, P. Grabowski et A. Korytowski: Analysis and Synthesis of Time Delay Systems. John Wiley and Sons, 1989. [40] Gouaisbaut, F., W. Perruquetti et J.P. Richard: Sliding mode control for systems with time delay, tome Sliding mode control in engineering de Control Eng. Series, chapitre 11. Marcel Dekker, Perruquetti and Barbot dition, 2002. [41] Goubet-Bartholomeus, A., M. Dambrine et J.P. Richard: Stability of Perturbed Systems with Time-Varying Delay. Systems and Control Letters, 31 :155163, 1997. [42] Gu, K.: A Generalized Discretization Scheme of Lyapunov Functional in the Stability Problem of Linear Uncertain Time-Delay Systems. Int. J. Robust and Nonlinear Control, 9 :114, 1999. 280

Bibliographie [43] Gu, K.: Discretization Schemes for Lyapunov-Krasovskii Functionals in Time Delay Systems. Kybernetica, 37(4) :479504, 2001. [44] Gu, K. et S.I. Niculescu: Additional Dynamics in Transformed Time-Delay Systems. Dans 38th IEEE CDC99 (Conf. on Dec. and Control), pages 4673 4677, Phoenix, AZ, Dec. 1999. [45] Gu, K. et S.I. Niculescu: Further Remarks on Additional Dynamics in Various Model Transformations of Linear Delay Systems. IEEE Trans. Aut. Control, 46(3) :497500, 2001. [46] Halanay, A.: Dierential Equations : Stability, Oscillations, Time Lags. Academic Press, New York, 1966. [47] Hale, J.K. et S. Verduyn-Lunel: Strong Stabilization of Neutral Functional Dierential Equations. IMA J. Math. Control Information, 19(1-2) :524, 2002. [48] Hale, J.K. et S.M. Verduyn-Lunel: Introduction to Functional Dierential Equations, tome 99 de Applied Math. Sciences. Springer, NY, 1993. [49] Hirai, K. et Y. Satoh: Stability of a System with Variable Time-Delay. IEEE Trans. Aut. Control, 25(3) :552554, 1980. [50] Hotzel, R. et M. Fliess: On Linear Systems with a Fractional Derivation : Introductory Theory and Examples. Math. and Computers in Simulation, 45(3-4) :385395, Feb. 1998. [51] Huang, W.: Generalization of Lyapunovs Theorem in a Linear Delay System. J. Math. Anal. Appl., 142 :8394, 1989. [52] Huang, Y.P. et K. Zhou: Robust Stability of Uncertain Time Delay Systems. IEEE Trans. Aut. Control, 45(11) :21692173, Nov. 2000. [53] Infante, E.F. et W.B. Castelan: A Lyapunov Functional for a Matrix Dierence-Dierential Equation. J. Di. Equations, 29 :439451, 1978. [54] Ionescu, V., S.I. Niculescu, J.M. Dion, L. Dugard et H. Li: Generalized Popov Theory Applied to State-Delayed Systems. Automatica, 37(1) :91 97, 2001. [55] Ionescu, V., C. Oara et M. Weiss: Generalized Riccati Theory. John Wiley and Sons, 1998. [56] Izmailov, R.: Analysis and Optimization of Feedback Control Algorithms for Data Transfers in High-Speed Networks. SIAM J. Contr. Optimiz., 34 :17671780, 1996. [57] Jalili, N. et N. Olgac: Optimum Delayed Feedback Vibration Absorber for MDOF Mechanical Structures. Dans 37th IEEE CDC98 (Conf. on Dec. and Control), pages 47344739, Tampa, FL, Dec. 1998. 281

Bibliographie [58] Jeong, H.S. et C.W. Lee: Time Delay Control with State Feedback for Azimuth Motion of the Frictionless Positioning Device. IEEE-ASME Trans. Mechatronics, 2(3), Sept. 1997. [59] Jun, M. et M.G. Safonov: Stability Analysis of a System with Time-Delayed States. Dans ACC00 (American Control Conf.), pages 949952, Chicago, IL, June 2000. [60] Kharitonov, V.: Robust Stability Analysis of Time Delay Systems : A Survey. Dans 4th . IFAC Conf. on System Structure and Control, pages 112, Nantes, France, July 8-10 1998. Penary lecture. [61] Kharitonov, V.L. et D. Melchior-Aguliar: On Delay-Dependent Stability Conditions. Syst. and Control Letters, 40(1) :7176, May 2000. [62] Kharitonov, V.L. et A.P. Zhabko: Lyapunov-Krasovski Approach to Robust Stability of Time Delay Systems. Dans 1rst IFAC/IEEE Symp. on System Structure and Control, Prague, Tch. Rep., Aug. 2001. [63] Kim, W.S., B. Hannaford et A.K. Bejczy: Force-Reection and Shared Compliant Control in Operating Telemanipulators with Time-Delay. IEEE Trans. Robotics and Automation, 8(2) :176185, April 1992. [64] Kolmanovskii, V.B.: Stability of some nonlinear functional dierential equations. J. Nonlinear Dierential Equations, 2 :185198, 1995. [65] Kolmanovskii, V.B. et A. Myshkis: Applied theory of functional dierential equations, tome 85 de Mathematics and Applications. Kluwer Acad., 1992. [66] Kolmanovskii, V.B. et A. Myshkis: Introduction to the theory and applications of functional dierential equations. Kluwer Acad., Dordrecht, 1999. [67] Kolmanovskii, V.B., S.I. Niculescu et K. Gu: Delay Eects on Stability : A Survey. Dans 38th IEEE CDC99 (Conf. on Dec. and Control), pages 19931998, Phoenix, AZ, Dec. 1999. [68] Kolmanovskii, V.B., S.I. Niculescu et J.P. Richard: On the LiapunovKrasovskii Functionals for Stability Analysis of Linear Delay Systems. Int. J. Control, 72(4) :374384, Feb. 1999. [69] Kolmanovskii, V.B. et V.R. Nosov: Stability of functional dierential equations. Academic Press, London, 1986. [70] Kolmanovskii, V.B. et J.P. Richard: Stability of some Linear Systems with Delay. IEEE Transactions on Automatic Control, 44(5) :984989, May 1999. [71] Kolmanovskii, V.B. et J.P. Richard: Stability of some linear systems with delay. IEEE Trans. Aut. Control, 44(5) :984989, May 1999. 282

Bibliographie [72] Kolmanovskii, V.B. et L.E. Shaikhet: Control of systems with aftereect, tome 157 de Transl. of Mathematical Monographs. American Math. Soc., 1996. [73] Kolmanovskii, V.B., P.A. Tchangani et J.P. Richard: Stability of linear systems with discrete-plus-distributed delay : application of some model transformations. Dans MTNS98 (13th Symp. Math. Theory of Networks and Systems), Padova, Italy, July 1998. [74] Krasovskii, N.N.: On the analytical construction of an optimal control in a system with time lags. Prikl. Math. Mec., 26 :3951, 1962. (English translation : J. Appl. Math. Mech. (1962), 50-67). [75] Krasovskii, N.N.: Stability of Motion. Stanford Univ. Press, 1963. (translation by J. Brenner). [76] Kwon, H.W. et A.E. Pearson: Feedback Stabilization of Linear Systems with Delayed Control. IEEE Trans. Aut. Control, 25(2) :266269, 1980. [77] Lafay, J.F., M. Fliess, H. Mounier et O. Sename: Sur la commandabilit des systmes linaires retards. Dans CNRS Conf. Analysis and Control of Systems with Delays, pages 1942, Nantes, France, 1996. (in French). [78] Lakshmikantham, V. et S. Leela: Dierential and Integral Inequalities, tome 2. Academic Press, New York, 1969. [79] Lelev, A., P. Fraisse et P. Dauchez: Telerobotics over IP Networks : Towards a Low Level Real Time Architecture. Dans IROS01 (Int. Conf. On Intelligent Robots and Systems), Maui, Hawaii, Oct. 2001. [80] Lewis, R.M.: Control-Delayed System Properties Via an Ordinary Model. Int. J. Control, 30(3) :477490, 1979. [81] Loiseau, J.J.: A 2-D Transfert Without Minimal Realization. Sprann94, IMACS, pages 97100, Lille, France, 1994. Dans

[82] Loiseau, J.J.: Algebraic tools for the control and stabilization of time-delay systems. Dans 1rst IFAC Workshop on Linear Time Delay Systems, pages 234249, Grenoble, France, July 1998. Plenary lecture. [83] Loiseau, J.J. et D. Breth: 2-D Exact Model Matching with Stability, the Structural Approach. Bulletin of the Polish Acad. of Sc. - Technical Sciences, 45(2) :309317, 1997. [84] Loiseau, J.J. et R. Rabah: Analysis and Control of Time-Delay Systems. Special issue of JESA, European J. of Aut. Systems, 31(6), 1997. [85] Louisell, J.: A stability analysis for a class of dierential-delay equations having time-varying delay, tome 1475 de Lecture Notes in Math., chapitre Delay dierential equations and dynamical systems, pages 225242. Springer, Busenberg and Martelli dition, 1991. 283

Bibliographie [86] Louisell, J.: Delay Dierential Systems with Time-Varying Delay : New Directions for Stability Theory. Kybernetika, 37(3) :239252, 2001. [87] MacDonald, N.: Time Lags in Biological Models, tome 27 de Lecture Notes in Biomath. Springer, 1978. [88] Manitius, A. et A.W. Olbrot: Finite spectrum assignment problem for systems with delays. IEEE Trans. Aut. Control, 24(4) :541553, 1979. [89] Mascolo, S.: Congestion Control in High Speed Communication Networks Using the Smith Principle. Automatica, 35 :19211935, 1999. [90] Megretski, A. et A. Rantzer: System Analysis Via Integral Quadratic Constraints. IEEE Trans. Aut. Control, 42(6) :819830, June 1997. [91] Mrigot, A. et H. Mounier: Quality of Service and MPEG4 Video Transmission. Dans MTNS00 (14th Symp. Math. Theory of Networks and Systems), Perpignan, France, June 2000. [92] Mirkin, L. et G. Tadmor: H Control of Systems with I/O Delay : A Review of some Problem-Oriented Methods. IMA J. Math. Control Information, 19(1-2) :185200, 2002. [93] Moog, C.H., R. Castro-Linares, M. Velasco-Villa et L.A. MarquezMartinez: The Disturbance Decoupling Problem for Time-Delay Nonlinear Systems. IEEE Trans. Aut. Control, 45(2) :305309, Feb. 2000. [94] Mounier, H. et Rudolph J.: Flatness Based Control of Nonlinear Delay Systems : A Chemical Reactor Example. Int. J. Control, 71 :871890, 1998. [95] Mounier, H., M. Mboup, N. Petit, Rouchon P. et Seret D.: High Speed Network Congestion Control with a Simplifed Time-Varying Delay Model. Dans IFAC Conf. System, Structure, Control, Nantes, France, 1998. [96] Mounier, H., P. Rouchon et J. Rudolph: Some examples of linear systems with delays. JESA, European J. of Aut. Systems, 31(6) :911926, Oct. 1997. [97] Myshkis, A.D.: General theory of dierential equations with delay. Uspehi Mat. Naut (N.S.), 4(33) :99141, 1949. (in Russian), English transl. in Transl. AMS, No. 55, p. 1-62, 1951. [98] Myshkis, A.D.: Lineare dierentialgleichungen mit nacheilendem argument Linear dierential equations with delay. VEB Deutsch. Verlag, Berlin, 1955. (original edition 1951, German transl. 1955, English transl. 1972 Nauka). [99] Niculescu, S.I.: Systmes retard : aspects qualitatifs sur la stabilit et la stabilisation. Nouveaux Essais. Diderot Multimedia, Paris, 1997. (in French). 284

Bibliographie [100] Niculescu, S.I.: Delay Eects on Stability, tome 269 de LNCIS. Springer, 2001. [101] Niculescu, S.I. et J. Chen: Frequency Sweeping Tests for Asymptotic Stability : A Model Transformation for Multiple Delays. Dans 38th IEEE CDC99 (Conf. on Dec. and Control), pages 46784683, Phoenix, USA, Dec. 1999. [102] Niculescu, S.I. et J.P. Richard: Analysis and design of delay and propagation systems. Special issue of IMA J. Math. Control Information, 19(12) :1227, 2002. [103] Niculescu, S.I., E.I. Verriest, L. Dugard et J.M. Dion: Stability and Robust Stability of Time-Delay Systems : A Guided Tour, tome 228 de LNCIS, chapitre 1, pages 171. Springer, London, 1997. [104] Niemeyer, G.: Using Wave Variables Intime Delayed Force Reecting Teleoperation. Thse de doctorat, MIT, Cambridge, MA, Sept. 1996. [105] Niemeyer, G. et J.J. Slotine: Towards Force-Reecting Teleoperation over the Internet. Dans IEEE Int. Conf. on Robotics and Automation, pages 19091915, Leuven, Belgium, May 1998. [106] Nilsson, J., B. Bernhardsson et B. Wittenmark: Stochastic Analysis and Control of Real-Time Systems with Random Delays. Automatica, 34(1) :5764, 1998. [107] Olbrot, A.W.: Algebraic Criteria of Controllability to Zero Function for Linear Constant Time-Lag Systems. Control and Cybernetics, 2(1/2), 1973. [108] Olbrot, A.W.: Finite spectrum property and predictors. Dans 1rst IFAC Workshop on Linear Time Delay Systems, pages 251260, Grenoble, France, July 1998. Plenary lecture. [109] Orlov, Y.V.: Optimal Delay Control - Part I. Automation and Remote Control, 49(12) :15911596, Dec. 1989. transl. from Avtomatika i Telemekhnika, No.12, 1988. [110] Petit, N.: Systmes Retards. Platitude en Gnie des Procds et Contrle de Certaines quations des Ondes. (in French), Ecole des Mines de Paris, May 2000. [111] Picard, P. et J.F. Lafay: Further Results on Controllability of Linear Systems with Delay. Dans ECC95 (3rd European Control Conf.), pages 3313 3318, 1995. [112] Picard, P., J.F. Lafay et V. Kucera: Model Matching for Linear Systems with Delays and 2-D Systems. Automatica,, 34(2), 1998. [113] Picard, P., O. Sename et J.F. Lafay: Observers and observability indices for linear systems with delays. Dans CESA96 (IEEE-IMACS Conf. on 285

Bibliographie Comp. Eng. In Syst. Applic.), pages 8186, Lille, France, July 1996. Vol. 1. [114] Quet, P., S. Ramakrishnan, H. Ozbay et S. Kalyanaraman: On the H Controller Design for Congestion Control in Communication Networks with a Capacity Predictor. Dans 40th IEEE CDC01 (Conf. on Dec. and Control), pages 598603, Orlando, FL, Dec. 2001. [115] Rekasius, Z.V.: A Stability Test for Systems with Delays. Dans Proc. Joint Automatic Control Conf., pages TP9A, San Francisco, CA, 1980. [116] Richard, J.P.: Some Trends and Tools for the Study of Time Delay Systems. Dans 2nd Conf. IMACS-IEEE CESA98, Computational Engineering in Systems Applications, pages 2743, Tunisia, April 1998. Plenary lecture. [117] Richard, J.P.: Algbre et analyse pour lautomatique. Trait IC2 : Information, Commande, Communication. Herms-Lavoisier, 2001. [118] Richard, J.P.: Mathmatiques pour les systmes dynamiques. Trait IC2 : Information, Commande, Communication. Herms-Lavoisier, 2002. [119] Richard, J.P.: Time Delay Systems : An Overview of some Recent Advances and Open Problems. Automatica, 39(10) :16671694, Oct. 2003. [120] Richard, J.P. et T. Divoux: Systmes commands en rseau. Trait IC2 : Information, Commande, Communication. Herms-Lavoisier, 2007. [121] Richard, J.P., A. Goubet, P.A. Tchangani et M. Dambrine: Nonlinear delay systems : tools for a quantitative approach to stabilization, tome 228 de Lecture Notes in Control and Inform. Sc., chapitre 10, pages 218240. Springer Verlag, London, Verriest and Niculescu dition, 1997. [122] Richard, J.P. et V. Kolmanovskii: Delay Systems. Special issue of Mathematics and Computers in Simulation, 45(3-4), Feb. 1998. [123] Safonov, M.G.: Stability and Robustness of Multivariable Feedback Systems. MIT Press, 1980. [124] Sename, O.: Sur la commandabilit et le dcouplage des systmes linaires retards. (in French), Laboratoire dAutomatique de Nantes, Univ. of Nantes and EC Nantes, France, Oct. 1994. [125] Seuret, A.: Commande et observation des syst retards variables : thorie et applications. Thse de doctorat, Ecole Centrale de Lille, LAGIS, Oct. 4th 2006. [126] Seuret, A., M. Dambrine et J.P. Richard: Robust exponential stabilization for systems with time-varying delays. Dans TDS04, 5th IFAC Workshop on Time Delay Systems, Leuven, Belgium, Sept. 2004. 286

Bibliographie [127] Seuret, A., E. Fridman et J.P. Richard: Sampled-data exponential stabilization of neutral systems with input and state delays. Dans IEEE MED 2005, 13th Mediterranean Conf. on Control and Automation, Cyprus, January 22-24 2005. [128] Seuret, A., F. Michaut, J.P. Richard et T. Divoux: Networked control using GPS synchronization. Dans ACC06, 25th IEEE American Control Conference, Mineapolis, Minnesota, USA, June 14-16 2006. [129] Seuret, A., M. Termens-Ballester, A. Toguyeni, S. El Khattabi et J.P. Richard: Implementation of an Internet-controlled system under variable delays. Dans ETFH06, 11th IEEE int. conf. on Emerging Technologies & Factory Automation, Prague, Czech Republic, Sept. 2006. Inv. Track NeCST, Networked Control Systems Tolerant to Faults. [130] Shakkottai, S., R.T. Srikant et S. Meyn: Boundedness of Utility Function Based Congestion Controllers in the Presence of Delay. Dans 40th IEEE CDC01 (Conf. on Dec. and Control), pages 616621, Orlando, FL, Dec. 2001. [131] Shin, K.G. et X. Cui: Computing Time Delay and its Eects on Real-Time Control Systems. IEEE Trans. Control Syst. Technol., 3(2) :218224, June 1995. [132] Slater, G. L. et W. R. Wells: On the Reduction of Optimal Time Delay Systems to Ordinary Ones. IEEE Trans. Aut. Control, 17 :154155, 1972. [133] Smith, O.J.M.: A Controller to Overcome Dead Time. ISA, J. Instrument Society of America, 6 :2833, 1959. [134] Sontag, E. D.: The Lattice of Minimal Realizations of Response Maps over Rings. Math. Systems Theory, 11 :169175, 1977. [135] Stpan, G.: Retarded Dynamical Systems : Stability and Characteristic Functions, tome 210 de Research Notes in Math. Series. John Wiley and Sons, 1987. [136] Thowsen, A.: An Analytical Stability Test for a Class of Linear Time-Delay Systems. IEEE Trans. Aut. Control, 25 :735736, 1981. [137] Tits, A.L. et V. Balakrishnan: Small- Theorem with Frequency-Dependent Uncertainty Bounds. Math. Contr., Signals, Syst., 11(3) :220243, 1998. [138] Tsoi, A.C.: Recent advances in the algebraic system theory of delay dierential equations, tome Recent theoretical developments in control, chapitre 5, pages 67127. Academic Press, Gregson dition, 1978. [139] Verriest, E.I.: Stability of Systems with State-Dependent and Random Delays. IMA J. Math. Control Information, 19(1-2) :103114, 2002. 287

Bibliographie [140] Verriest, E.I. et W. Aggoune: Stability of Nonlinear Dierential Delay Systems. Math. and Computers in Simulation, 45(3-4) :257268, Feb. 1998. [141] Volterra, V.: Sulle equazioni integrodienziali della teorie dell elasticita. Atti. Accad. Lincei, 18(295), 1909. [142] Walton, K. et J.E. Marshall: Direct Method for TDS Stability Analysis. IEE Proc., 134(part D) :101107, 1987. [143] Watanabe, K., E. Nobuyama et K. Kojima: Recent advances in control of time-delay systems A tutorial review. Dans 35th IEEE CDC96 (Conf. on Dec. and Control), pages 20832089, Kobe, Japan, Dec. 1996. [144] Weiss, L.: On the Controllability of Delay-Dierential Equations. SIAM J. Cont. Optim., 5(4) :575587, 1967. [145] Willems, J.: The Analysis of Feedback Systems. MIT Press, 1971. [146] Willems, J.: Paradigms and Puzzles in the Theory of Dynamical Systems. IEEE Trans. Aut. Control, 36 :259294, 1991. [147] Youcef-Toumi, K. et O. Ito: A time delay controller design for systems with unknown dynamics. ASME J. Dynamic Systems Measurement and Control, 112 :133142, 1990.

288

Thorie algbrique de la commande des EDPs

H. Mounier1 , J. Rudolph2 et F. Woittennek2 AXIS, Institut dlectronique Fondamentale, Bt. 220, Universit Paris-Sud, 91405 Orsay, France. E-mail : Hugues.Mounier@u-psud.fr 2 Institut fr Regelungs- und Steuerungstheorie, Technische Universitt Dresden, 01062 Dresden, Allemagne. E-mail : Joachim.Rudolph@tu-dresden.de, Frank.Woittennek@tu-dresden.de
1 Dpartement

7.1

Introduction

Une thorie algbrique pour la commande des systmes paramtres rpartis commands aux bords est prsente dans ce chapitre. Un systme y est reprsent par un module et les notions de commandabilits dveloppes tendent la notion de -libert dgage prcdemment pour les systmes retards [11]. Le point de vue ici adopt trouve ses origines dans lextension du cadre labor pour les systmes retards [14, 1, 12, 15, 16]. Des exposs dtaills se trouvent dans [42, 43]. Diverses voies possibles dextension au cas non linaire sont ralises en [26, 35, 42]. Une vue plus proche de lanalyse est dveloppe en [24, 25].

7.2

Motivations et mthodologie

Notre philosophie est guide par deux attentions majeures : la premire (attention pratique) est de dgager des proprits structurelles qui surviennent frquemment dans les applications. La deuxime (attention de simplicit), relie la premire, consiste en lobtention des proprits les plus simples pour chaque classe dapplications. Ceci nous a conduit la dcouverte dune nouvelle notion, 289

7. Commande algbrique des EDPs nomme -libert, qui permet de rsoudre le suivi dune trajectoire de rfrence selon le mme cheminement que celui emprunt pour les systmes non linaires de dimension nie direntiellement plats.

7.3

Notion de libert

Le lien entre la notion de libert des modules et la commandabilit a dabord t introduite pour les systmes linaires de dimension nie par Michel Fliess [10], puis nous lavons tendue aux systmes retards [30], [11], [31], [13], [34] et aux systmes paramtres rpartis [12], [32].

Critres classiques de commandabilit


La vision classique de la commandabilit correspond en gnral une accessibilit de lespace dtat. Considrons un systme de dimension nie donn sous forme dtat comme suit x(t) = Ax(t) + Bu(t) (7.1)

avec x(t) = (x1 (t), . . . , xn (t)) ltat, u(t) = (u1 (t), . . . , um (t)) la commande, A Rnn , B Rnm . La commandabilit du systme peut sexprimer de diverses manires toutes quivalentes. En voici quelques-unes : 1. Accessibilit de lespace dtat Pour tous tats initial xini et nal xn de Rn , et tous temps initial tini et nal tn , il existe une commande u Fu , dans lespace dit des commandes admissibles Fu , amenant le systme de ltat initial x(tini ) = xini ltat nal x(tn ) = xn . 2. Critre de Kalman La matrice de commandabilit C = (b, Ab, . . . , An1 b) est de rang plein : rgC = n 3. Critre de Hautus-Popov-Belevitch s C, rgC [sI A | b] = n

4. Forme canonique contrleur On se restreint dans cet alina au cas de systmes mono-entre. Il existe un changement dtat z = F x, F Rnn tel que la reprsentation de 290

7.3. Notion de libert devienne : z1 z2 = z2 = z3 . . . = 1 z1 + 2 z2 + + n zn + u

zn1 = zn zn

Si, au lieu de vouloir imposer que ltat z aille de z ini z n , nous voulons amener une sortie y dune valeur initiale une valeur nale (sachant que le nombre de commandes est en gnral bien moindre que celui des tats), nous pouvons avoir un bien meilleur contrle sur lvolution temporelle de y. Considrons z1 comme sortie de la forme canonique contrleur : z1 z 2 = z2 = z3 . . .

z n1 = zn zn = 1 z1 + 2 z2 + + n zn + u y = z1 Alors, connaissant y, toute autre variable est dtermine z1 = y z2 = z1 z3 = z1 . . . zn = z1 u=


(n1)

1 (n1) (n) 1 z1 + 2 z1 + + n z1 z1

Le modle est alors direntiellement paramtris par y. En particulier, si lon dsire suivre une trajectoire t yr (t) de y, la loi de commande en boucle ouverte assurant le suivi est donne par ur (t) = 1 (n1) (n) 1 yr (t) + + n yr (t) yr (t)

Remarques 7.3.1. 1. Lexpression donnant ur (de mme que celles donnant les autres variables) ne recquire aucune intgration dquation direntielle. 291

7. Commande algbrique des EDPs 2. Le concepteur de la commande est libre de choisir la trajectoire de rfrence quil souhaite, pour autant quelle soit direntiable jusqu lordre n. 3. Cette tape en boucle ouverte, faisant une conance aveugle en le modle, suppose ce dernier parfait et suppose galement que les conditions initiales soient parfaitement connues. Elle est en pratique complte par une tape de stabilisation. 4. La fonction de transfert correspondante a un numrateur constant : y = n n1 u s n s 1 Exemple 7.3.1. Le modle M y + Ky = u scrit sous forme canonique contrleur x1 = x2 1 x2 = (Kx1 + u) M y = x1 Nous avons donc : x1 = y x2 = y u = Ky + M y Et la commande en boucle ouverte assurant le suivi de t yr (t) est ur = Kyr + M yr

Systme sans retard libre


Nous allons gnraliser ici de manire dabord informelle, puis en termes prcis, la forme canonique contrleur prcdente. La notion obtenue, que nous nommerons libert, conserve cette essentielle proprit de paramtrisation. Un modle gnral tel que (7.1) de dimension nie muni dune entre indpendante u = (u1 , . . . , um ) est dit libre (voir [10] et lannexe 7.A pour une dnition prcise) sil existe = (1 , . . . , m ) que lon nomme base (ou sortie basique), telle que : 292

7.3. Notion de libert 1. Elle fait partie du systme (caractre endogne) : Les j , j = 0, . . . , m sexpriment comme combinaisons linaires des variables du systme (par ex. x, u) et de leurs drives :
d d i = Lx + N0 u + N1 dt u + + N dt u

L Rnn , Ni Rnm , i = 0, . . . , . 2. Ses composantes sont direntiellement indpendantes (indpendance) : Il nexiste aucune relation direntielle entre les j , j = 0, . . . , m :
d d m0 + m1 dt + + m dt = 0

mi = 0

mi R1m , i = 0, . . . , . 3. Elle fournit une paramtrisation complte du systme (forme canonique de suivi) :
d d x = P0 + P1 dt + . . . + P dt

(7.3) (7.4)

u = Q0 +

d Q1 dt

+ +

d Q dt

Pi Rnm , Qj Rmm , i = 0, . . . , , j = 0, . . . , , La dernire proprit, et plus spcialement lquation (7.4), fournit une solution simple et naturelle la ralisation du suivi en boucle ouverte dune trajectoire t (t). Remarque 7.3.1. Ces proprits (indpendance et paramtrisation du systme) sont en correspondance directe avec les proprits caractristiques dune base dun espace vectoriel (ensemble maximalement indpendant et minimalement gnrateur).

Exemple de systme libre


Considrons un modle du premier mode souple dun bras de robot un degr de libert, actionn par un moteur. Notons qr le dplacement rigide, qe le premier mode du dplacement lastique (par rapport au dplacement rigide) et u le couple moteur actionnant le bras. Le bilan des couples donne : Jrr Jre qr 0 u + = Jer Jee qe Ke qe 0 o Jxy sont des inerties quivalentes et Ke une raideur lastique. Les quations du systme sont : Jrr qr + Jre qe = u Jer qr + Jee qe = Ke qe (7.5a) (7.5b) 293

7. Commande algbrique des EDPs

qr

qe

Fig. 7.1: Premier mode souple dun bras de robot.

Ce systme est libre, de base = Jer qr + Jee qe En eet, le premier membre de lquation (7.5b) est la drive seconde de : = Ke qe puis, nous obtenons qr = Et, nalement qr = 1 + Jer 1 qe = Ke Jrr u= + Jer Jee Ke Jer (7.6a) (7.6b) 1 Ke Jrr Jee Jre (4) Jer (7.6c) 1 ( Jee qe ) Jer ou encore qe = 1 Ke

Se donnant une trajectoire de rfrence t r (t), la dernire formule nous fournit une loi en boucle ouverte assurant un suivi exact sous lhypothse dun modle parfait et de conditions initiales connues. Pour une trajectoire dsire dallure dcrite en gure 7.2 gauche, nous obtenons la loi en boucle ouverte illustre droite.

Les systmes linaires sont, dans notre approche, modliss par des structures linaires analogues aux espaces vectoriels : des modules (diverses notions dalgbre sont rappeles en annexe 7.A, p. 324). Les axiomes de dnition sont les mmes pour les deux structures, mais les scalaires dun espace vectoriel sont pris dans un corps, tel R ou C, alors que ceux dun module sont pris dans un anneau. Pour les systmes sans retards, cet anneau sera celui des polynmes direntiels d d R[ dt ] ; pour les systmes retards, lanneau sera R[ dt , ] o = (1 , . . . , r ), chaque i tant un oprateur retard tel que, pour tout f , (i f )(t) = f (t hi ), 294

7.3. Notion de libert

2 80 1.8 60 1.6 40 1.4 1.2 1 0.8 0.6 40 0.4 60 0.2 80 0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 20

20

Fig. 7.2: Trajectoire de rfrence t r (t) ( gauche) et commande en boucle ouverte ur ( droite).

o hi est un rel positif, lamplitude du retard ; pour des systmes modliss par des EDPs, les anneaux seront adapts au systme tudi. Cette augmentation du nombre dindtermines dans lanneau des oprateurs entrane une bien plus grande complexit des modules associs, ce qui se retrouve dans les proprits de commandabilit.

R-systme, entre
Dnitions 7.3.1. Soit R un anneau commutatif1 , unifre et sans diviseurs de zros. Un R-systme , ou un systme sur R est un R-module. Une R-dynamique, ou une dynamique sur R, est un R-systme quipp dune entre, c..d., un sous-ensemble u de tel que le R-module quotient /[u] est de torsion. Lentre u est indpendante si le R-module [u] est libre, de base u. Une sortie y est un sous ensemble de . Soit A une R-algbre et un R-systme. Le A-module A R est un A-systme, qui tend .
d Remarques 7.3.2. 1. Pour un systme de dimension nie, R = k[ dt ] avec d k = R ou C. Pour un systme retards, R = k[ dt , ], avec = (1 , . . . , r ), les i tant des oprateurs retards algbriquement indpendants (c..d. les amplitudes des dirents retards sont indpendantes sur Q). On parle galement dincommensurabilit dans la littrature.
1 On se restreint ici au cas commutatif. Pour le cas non commutatif, voir [9, 41] pour certaines extensions.

295

7. Commande algbrique des EDPs 2. En termes informels, un systme dquation ay = bu


d d o a, b R = R[ dt ] ou R[ dt , ] sera reprsent par une structure linaire forme de toutes les combinaisons linaires de y, u et de leurs drives, telles que la relation ci-dessus soit satisfaite

= p y + q u p, q R, a x = b u 3. Dans les mmes termes informels, une entre u = (u1 , . . . , um ) est telle que toute variable z du systme satisfait une relation de la forme :
m

pz =
i=1

qi ui

o p, qi R, p = 0.

Cas des systmes retards


d Dnition 7.3.1. Un systme linaire stationnaire retards est un k[ dt , ]module niment engendr.

Cette dnition appelle quelques commentaires. Tout dabord, un module d niment engendr sur k[ dt , ] est entirement dtermin par la donne de gnrateurs et dun ensemble de relations (ce dernier constituant lui-mme un module) vries par ces derniers. Le module est alors dit donn par gnrateurs et relations (voir lannexe 7.A, p. 325 ou [8, 0.3 p. 17] pour une dnition prcise). Nous disposons donc de gnrateurs, = [w1 , . . . , w ] = [w] et de relations, d P ( dt , ) w = 0
d o P k[ dt , ] et rg

P d k[ dt ,]

= .

Ici P se nomme une matrice de prsentation 2 de . Remarquons que cette matrice nest pas unique. Exemple 7.3.2. Prenons comme exemple le systme dquation y(t) y(t) = u(t 1)
d Soient [U, Y ] le k[ dt , ]-module libre engendr par U et Y et [E] = [Y Y U ] un sous-module libre de [U, Y ]. Posons alors [u, y] = [U, Y ]/[E] ; le systme considr est reprsent par le module

= [u, y]
2 T De manire rigoureuse, la matrice de prsentation est P . Nous conserverons dans la suite cet abus de langage commode.

296

7.4. Notions de commandabilit avec comme relation y y = u qui peut alors scrire : |
d dt

u 1 =0 y

avec comme matrice de prsentation


d P ( dt , ) = | d dt

7.4

Notions de commandabilit

Sans torsion, libert, projectivit


Explicitons une notion importante pour ltude de la commandabilit : celle de torsion (voir galement lannexe 7.A, p. 324). Considrons un systme linaire d (sans retards) , modlis par un module sur lanneau R[ dt ]. Un lment w de d est dit de torsion sil existe un polynme non nul p de R[ dt ] tel que
d p( dt ) w = 0

Notons que ce phnomne ne peut se produire de manire non triviale dans un espace vectoriel ; en eet une relation de la forme pw = 0 dans un espace vectoriel implique w = 0, puisque p est inversible en tant qulment dun corps. Un lment de torsion de satisfait une quation direntielle coecients dans R. Un module dont tous les lments sont de torsion est dit de torsion. A linverse, un module dont aucun lment nest de torsion est dit sans torsion. Labscence de torsion signie quil ny a pas de variable satisfaisant une quation (direntielle, direntielle aux dirences, . . . , selon lanneau R) autonome, c..d. non inuence par lentre. La libert, notion en gnral plus forte que la prcdente, signie quil existe m (o m dsigne le nombre dentres indpendantes) gnrateurs indpendants, fournissant une paramtrisation complte du systme. Une notion supplmentaire est celle de projectivit (voir lannexe 7.A, p. 324). Dnition 7.4.1. Un R-systme est dit R-commandable sans torsion (resp. R-commandable projectif, R-commandable libre) si le R-module est sans torsion (resp. projectif, libre). Quelques considrations classiques dalgbre homologique (voir, par exemple, [39]) conduisent au rsultat suivant. Proposition 7.4.1. La R-commandabilit libre (resp. R-commandabilit projective) implique la R-commandabilit projective (resp. R-commandabilit sans torsion). 297

7. Commande algbrique des EDPs


d Remarque 7.4.1. Pour des systmes de dimension nie (cas o R = k[ dt ], k = R ou C), les trois notions prcdentes concident. Ce nest plus le cas gnralement, sauf si R est un anneau principal (dans lequel tout idal est principal, d i.e. gnr par un unique lment ; cest le cas de k[ dt ]) ou sil est un anneau de Bzout (dans lequel tout idal niment engendr est principal).

Critres de libert et dabsence de torsion sur un anneau polynomial


Nous considrerons, tout au long de cette section un anneau R doprateurs qui est un anneau de polynmes du type k[] o = {1 , . . . , r } et k = R ou C. Critre de libert Notons que, sur k[], les deux notions de commandabilit projective et commandabilit libre concident ; ceci constitue lun des noncs de la rsolution de la conjecture de Serre ([36], [45]). Proposition 7.4.2 (Quillen, Suslin). Un k[]-systme est k[]-commandable libre si, et seulement sil est k[]-commandable projectif. Cette proposition permet dobtenir le critre suivant, o k dsigne la clture 3 de k : algbrique Proposition 7.4.3. Un k[]-systme est k[]-commandable libre si, et seulement si (s1 , . . . , sr ) k r , rgk P (s1 , . . . , sr ) = Ici dsigne le rang gnrique de la matrice de prsentation P , c..d. rgk[] P . Ce critre de rang quivaut labsence de zros communs dans k r des mineurs dordre de P . Dmonstration. Indiquons simplement comment dduire le prsent critre du rsultat de Quillen et Suslin (proposition prcdente). Il y a quivalence, pour le k[]-module , entre projectivit et galit k[] de lidal de Fitting I engendr par les mineurs dordre de P (voir [8, proposition 20.8 p. 495]) Daprs le Nullstellensatz de Hilbert (voir par exemple [27] ou [8, corollaire 1.7 p. 34]) I = k[] quivaut ne pas avoir de zros communs dans k entre les mineurs dordre de P , ou encore : (s1 , . . . , sr ) k r , rgk P (s1 , . . . , sr ) =

cest--dire aucune chute de rang de la matrice de prsentation, ce rang tant partout gal au rang gnrique rgk[] P .
3

Le corps contenant toutes les racines dquations polynomiales coecients dans k.

298

7.4. Notions de commandabilit Critre dabsence de torsion Nous allons maintenant noncer un critre de k[]-commandabilit sans torsion. Proposition 7.4.4. Un k[]-systme est k[]-commandable sans torsion si, et seulement si les mineurs de P sont premiers4 entre eux. Dmonstration. Ce critre dcoule directement dune proposition de [48]. Elle tablit que les mineurs de P sont premiers entre eux si, et seulement si pour tout i dans {0, . . . , r}, il existe des matrices Qi coecients dans k[] telles que : P Qi = i I o i est un polynme de k[] indpendant de la variable dindice i. Lquation P Q0 = 0 I exprime la libert de 0 k(2 , . . . , r )[1 ] k[] , lquation P Q1 = 1 I celle de 1 k(1 , 3 , . . . , r )[2 ]k[] et ainsi de suite jusqu P Qr = r I exprimant la libert de r k(1 , . . . , r1 )[r ] k[] . Tous les anneaux qui viennent dtre cits tant principaux, la libert des i quivaut leur caractre sans torsion. Et de manire vidente, est sans torsion si, et seulement si chacun des i lest. Plus prcisment, lorsquun lment w dun k[]-module est de torsion, il existe un polynme p de k[] non nul et non inversible (cest--dire non constant), tel que p() w = 0. Or p peut-tre considr comme un polynme en 1 coecients dans k[2 , . . . , r ], comme polynme en 2 coecients dans k[1 , 3 , . . . , r ] et ainsi de suite ; puisque p nest pas constant, il sera ncessairement non inversible dans lun des anneaux k(2 , . . . , r )[1 ], k(1 , 3 , . . . , r )[2 ], . . . , k(1 , . . . , r1 )[r ].

-libert
An de recouvrer les avantages de la libert pour un systme qui nest que sans torsion, nous disposons du rsultat suivant, qui dcoule directement dune proposition de [40]. Thorme et dnition 7.4.1. Soit R un anneau, M un R-module niment prsent et S une partie multiplicative de R. Supposons que S 1 M (le localis de M en S) soit un S 1 R-module libre. Alors il existe un dans S tel que R[ 1 ] R M est5 un R[ 1 ]-module libre avec une base de mme taille que celle de S 1 M sur S 1 R. Un tel R-systme est dit -libre (ou -commandable libre) et toute base du module R[ 1 ] R M est nomme une -base.
Premiers entre eux signiant que leur PGCD est un lment de k. La notation R[ 1 ] dsigne le localis de R en S = { i | i N}, qui se note de manire prcise S 1 R = { i | i N}1 R.
5 4

299

7. Commande algbrique des EDPs


d Exemples 7.4.1. 1. Le systme y = (1+)u nest pas R[ dt , ]-commandable d libre, mais il est (1 + )-libre. En eet, on a u = (1 + 1 ) dt y d 2. Le systme dquation y = u nest pas R[ dt , ]-commandable libre, mais il est -libre.

Cas des systmes retards


Lunicit de la commandabilit de Kalman en dimension nie est perdue dans le cas avec retards. De multiples gnralisations ont vu le jour dans la littrature, sans que les liens soient toujours explicites. Une explication possible de ce phnomne est la complexication de lanneau des oprateurs R. d Pour les systmes de dimension nie, c..d. sur R[ dt ], labsence de torsion et d la libert se confondent. Pour les systmes retards, c..d. sur R[ dt , ], la situation est plus complexe, la libert tant en particulier plus forte que le caractre sans torsion. Exemples 7.4.2. 1. Le systme x1 = x1 x2 = x1 + u
d nest pas R[ dt , ]-sans torsion, puisque x1 est un lment de torsion. 2. Un exemple moins trivial est le suivant :

x1 = x2 + u x2 = 2 x1 + u
d nest pas R[ dt , ]-sans torsion, puisque z = x1 x2 est un lment de torsion. Pour sen convaincre, il sut dappliquer loprateur de retard la premire quation et de retrancher ce rsultat de la deuxime (de faon liminer u). On obtien ainsi :

d (x1 x2 ) = (x2 x1 ) dt
d 3. Le systme y = (1 + )u est R[ dt , ]-commandable sans torsion, mais non d R[ dt , ]-commandable libre. d 4. Le systme y + y = u est R[ dt , ]-commandable libre, de base y.

7.5

Des systmes retards aux systmes paramtres rpartis

Exemple dune quation des ondes


Un exemple de systme rgi par une quation aux drives partielles est celui dune barre exible en torsion avec un couple appliqu lune de ses extrmits 300

7.5. Des systmes retards aux EDPs (voir [33]), et une charge J attache lautre. Les quations du modle suivent celles dune quation des ondes unidimensionnelle. La commande est le couple appliqu lune des extrmits, un couple de raction d la charge agissant lautre :
2 2 2 q(, z) = z q(, z)

(7.7a)
2 J q(, L)

z q(, 0) = u( ), q(0, z) = 0,

z q(, L) =

(7.7b) (7.7c)

q(0, z) = 0

Ici, q(, z) dsigne le dplacement angulaire de la position au repos au point z [0, L] et au temps 0 ; L est la longueur de la barre, est linverse de la vitesse de propagation des ondes, J le moment dinertie de la charge, u le couple de commande.

Modle retards
Il est bien connu (voir [6]), que la solution gnrale de (7.7a) peut scrire sous la forme dondes progressive et rtrograde q(, z) = ( + z) + ( z) o et dsignent des fonctions dune variable relle arbitraire. Posant = + z, = z, les conditions aux bords (7.7b) scrivent u( ) J ( + T ) ( T ) = ( + T ) ( T ) ( ) ( ) = o T = L. Lobjectif de commande sera dassigner une trajectoire y( ) = q(, L) (prescrite lavance) la position angulaire de la charge ; la sortie est donc y( ) = q(, L) Alors, considrant et comme des fonctions du temps , on obtient ( + T ) + ( T ) = y( ) 1 ( ) ( ) = u( ) J ( + T ) ( T ) = y ( ) Daprs (7.8a) il vient ( ) = y( T ) ( 2T ) ce qui conduit 1 y ( T ) ( ) ( 2T ) = u( ) J y ( ) 2 ( T ) = y ( ) 301 (7.8a) (7.8b) (7.8c)

7. Commande algbrique des EDPs


8 1 6

0.8

2 0.6 y2(t) u(t) 0.4 2 0.2 0 1 0.5 0 0.5 1 1.5 TIME t 2 2.5 3 3.5 4 8 1 0.5 0 0.5 1 1.5 TIME t 2 2.5 3 3.5 4 0

Fig. 7.3: Trajectoire de rfrence t yr (t) ( gauche) et commande en boucle ouverte ur .

Llimination de donne 2 J u( T ) = y ( ) + y ( 2T ) + y ( ) y ( 2T ) Oprant le changement de temps t = , avec constant, on obtient y ( ) = dy dy d ( ) = dt (t) = y(t) et 2 J u(t T ) = y (t) + y (t 2T ) + y(t) y(t 2T ) (7.9)

Puis, posant = /J et v(t) = (2/)u(t), on obtient le systme retards suivant : y (t) + y (t 2T ) + y(t) y(t 2T ) = v(t T ) (7.10) Nous voyons sur lquation ci-dessus quil sut dinverser loprateur de retard (cest--dire sautoriser des avances) pour obtenir un systme libre : v(t) = y (t + T ) + y (t T ) + y(t + T ) y(t T ) Ce systme est T -libre, de T -base y (o T , loprateur retard damplitude T est celui quon a invers). On crit ceci de la manire formelle suivante :
1 1 v = (T + T ) + (T T )y y

Pour une trajectoire de rfrence t yr (t) de la forme dcrite en gure 7.3 gauche, on obtient une loi de commande en boucle ouverte ur (t) reproduite en gure 7.3 droite. Il est intressant de remarquer que le dplacement des autres points de la barre sobtient par qr (z, t) = 302 1 [yr (t z + T ) + yr (t z + T ) + yr (t T + z) yr (t T + z)] 2

7.6. Exemple de lquation de la chaleur

1.5 1 q(z,t) 0.5 0 0.8 0.5 1 0 1 2 3 4 TIME t 0 0.2 ABSCISSA z 0.4 0.6

Fig. 7.4: Dplacements en boucle ouverte qr (z, t).

ou encore, formellement

qr =

1 [zT yr + zT yr + T z yr T z yr ] 2

Ces dplacements sont reproduits en gure 7.4.

7.6

Gnralisation de paramtrisation dautres systmes paramtres rpartis : exemple de lquation de la chaleur

Un systme paramtres rpartis est compos dune (ou plusieurs) quation(s) reliant les drives despace celle de temps, ainsi que diverses conditions aux bords, faisant gnralement intervenir les commandes. Nous verrons, comme dans le cas de la section prcdente, quil est bon dlargir la notion de paramtrisation relie la libert. Nous considrerons dabord lun des exemples mathmatiquement les plus simples, lquation de la chaleur unidimensionnelle, ce qui permettra de ne pas alourdir lexpos par des calculs fastidieux. 303

7. Commande algbrique des EDPs

Libert pour lquation de la chaleur


Considrons le systme dquations suivant :
2 x w(x, t) = t w(x, t), x [0, 1], t [0, +[

(7.11a) (7.11b) (7.11c)

x w(0, t) = 0 w(1, t) = u(t)

Ces quations dcrivent un processus de diusion de chaleur dans une barre de longueur unit, w(x, t) dsignant la temprature de la barre labscisse x et linstant t. La premire des conditions aux limites indique quil ny a pas de ux de chaleur en x = 0 ; la deuxime que la temprature est xe par la commande u(t) en x = 1. Deux cadres oprationnels sont notamment possibles, dvelopps respectivement par Mikusiski et par Komatsu. Mikusiski [29] utilise des anneaux de fonctions continues munis du produit de convolution ; Komatsu [22] se sert de transformes de Laplace dhyperfonctions et dultradistributions Gevrey. Ces cadres sont relis aux techniques de resommation dveloppes par calle [7], Ramis [37], Balser [3], [4], . . . Perspective symbolique Obtention de premires relations. Considrons la transforme de Laplace temporelle, ou bien lquation oprationnelle de Mikusiski associe lquation (7.11a) :
2 s w(x, s) = x w(x, s)

et considrons cette quation s x ; nous obtenons lquation direntielle ordinaire d2 w (x, s) s w(x, s) = 0 dx2 Lquation caractristique associe (7.12) scrit 2 s = 0, c..d. = s (7.12)

La solution gnrale de (7.11a) peut alors se mettre sous la forme w(x, s) = ex ou bien sinh(x s) 2 (s) w(x, s) = cosh(x s)1 (s) + s 304 (7.13)
s

1 (s) + ex

2 (s)

7.6. Exemple de lquation de la chaleur La deuxime forme est prfrable, les drives des solutions fondamentales tant relies de manire agrable. En eet, notant sinh(x s) Cx = cosh(x s), Sx = s nous disposons des relations, dsignant la drivation spatiale par un prime : x Cx = Cx = sSx x Sx = Sx = Cx Nous pouvons dduire de ce qui prcde les formes gnrales de la solution et de la premire drive spatiale w(x, s) = Cx 1 (s) + Sx 2 (s) x w(x, s) = sSx 1 (s) + Cx 2 (s) Les conditions aux limites (7.11b) et (7.11c) donnent alors successivement 2 (s) = 0 C1 1 (s) = u(s) et nous obtenons lquation cosh( s) w(x, s) = cosh(x s) u(s) ou encore C1 w(x) = Cx u Paramtrisation. Introduisant une nouvelle variable (t) = w(0, t) Et ayant w(x) = Cx 1 + Sx 2 Nous obtenons : 2 = 0 C1 1 = u 1 = et u = C1 w(x) = Cx (7.14a) (7.14b) (x w(0, s) = 0)

On recouvre une paramtrisation en termes de qui, dans le cadre de modules sur un anneau appropri, pourra correspondre la libert. 305

7. Commande algbrique des EDPs Expression dans le domaine temporel. crivons formellement cosh( s) =
i 0

si (2i)!

Nous obtenons, dans le domaine temporel : w(x, t) =


i 0

x2i (i) (t) (2i)! 1 (i) (t) (2i)!

u(t) =
i 0

Ces sries ont t crites dans lanneau des sries formelles k

d dt

d Remarque 7.6.1. Notons au passage que lanneau k dt est dot de trs agrables proprits algbriques : cest un anneau principal (tout idal y est principal, c..d. engendr par un unique lment ; sur la notion didal, le lecteur pourra se reporter lannexe 7.A, p. 325). Les notions dabsence de torsion (cf. annexe 7.A, p. 324), de projectivit (cf. annexe 7.A, p. 327) et de libert y d concident, tout comme sur k[ dt ] (anneau des systmes de dimension nie). Red d marquons galement que k[ dt ] dt est un corps. Ceci tant, rien ne garantit que les sries formelles mises en jeu soient convergentes. 1

Il est possible de donner un sens relativement gnral ces sries par des procds de resommation (voir lannexe 7.B, p. 329). Perspective temporelle Une vue lgrement dirente repose sur le thorme classique de CauchyKovaleski. Le systme
2 x w(x, t) = t w(x, t),

x [0, 1], t [0, [

(7.15a) (7.15b) (7.15c)

x w(0, t) = 0 w(0, t) = (t)

est eectivement sous forme de Cauchy-Kovaleski, nous permettant de chercher une solution formelle sous forme analytique w(x, t) =
i 0

ai (t)

xi i!

o les ai sont des fonctions indniment drivables. Une verication formelle, utilisant (7.15), mne ai+2 (t) = ai (t), a1 (t) = 0 a0 (t) = (t) 306 i 0

7.6. Exemple de lquation de la chaleur


0.5 0.45 0.6 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.1 0.05 0 0 0.3 0.5 0.7

0.4

0.2

5 Temps t

10

5 Temps t

10

Fig. 7.5: Trajectoire de rfrence t r (t) ( gauche) et commande en boucle ouverte u ( droite).

Do, pour i

0 a2i (t) = (i) (t) a2i+1 (t) = 0

de sorte que nous retrouvons w(x, t) =


i 0

x2i (i) (t) (2i)! (i) (t) (2i)!

(7.16a) (7.16b)

u(t) =
i 0

Sur la gure 7.5 sont reprsentes la trajectoire de rfrence t (t) et la commande en boucle ouverte u(t). Sur la gure 7.6 est reprsent w(x, t). Nous avons pris pour t (t) la trajectoire suivante : (t) = 0.25 1 + tanh(1.7 (t 5)

Paramtrisation pour dautres conditions aux limites


Considrons toujours lquation de la chaleur, mais avec cette fois des conditions aux limites de Dirichlet :
2 x w(x, t) = t w(x, t),

x [0, 1], t [0, +[

(7.17a) (7.17b) (7.17c) 307

w(0, t) = 0 w(1, t) = u(t)

7. Commande algbrique des EDPs

25 20 15 10 5 0 10 10 5 4 Temps t 0 2 0 Espace x 8 6

w(x,t)

Fig. 7.6: Valeurs de w(x, t).

La solution gnrale et sa drive spatiale sexpriment de la mme manire : w(x) = Cx 1 + Sx 2 x w(x) = sSx 1 + Cx 2 Seules les conditions aux limites se trouvent modies : 1 = 0 ( w(0) = 0) S1 2 = u et la solution gnrale sexprime comme w(x) = Sx 2 Ainsi 2 apparat comme le paramtre libre pouvant jouer le rle dune base. Remarquons que lon a x w(x) = sSx 1 + Cx 2 = Cx 2 ce qui permet dobtenir 2 = x w(0) Et x w(0) peut jouer le rle dune base dun module sur un anneau appropri. Le systme correspondant aux quations (7.17) doit alors contenir non seulement chacun des w(x) pour x [0, 1], mais galement toutes ses drives temporelles et spatiales. Les divers exemples examins nous ont men des structures linaires sur des anneaux. Nous allons maintenant discuter des structures danneaux appropris. 308

7.7. Calcul oprationnel utilis

7.7

Calcul oprationnel utilis

Nous utiliserons comme classe de fonctions gnralises servant de support un calcul oprationnel les ultradistributions ou leur transformation de Laplace. Commenons par rappeler quelques lments sur ces fonctions gnralises.

Bref panorama de classes de fonctions et doprateurs


Parmi les plus importantes classes de fonctions (gnralises ou non), on compte, du plus au moins rgulier : O A E () E {} D D() D{} S E Cn C Lp L1 M1 E S D{} D() D E {} E () B Fonctions holomorphes Fonctions analytiques relles Fonctions ultradirentiables Gevrey de Beurling Fonctions ultradirentiables Gevrey de Roumieu Fonctions indniment direntiables support compact Fonctions ultradirentiables Gevrey de Beurling support compact Fonctions ultradirentiables Gevrey de Roumieu support compact Fonctions indniment direntiables dcroissance rapide Fonctions indniment direntiables Fonctions n fois direntiables Fonctions continues Fonctions p fois sommables Fonctions sommables Mesures complexes Distributions support compact Distributions tempres Ultradistributions de Roumieu Ultradistributions de Beurling Distributions Ultradistributions de Roumieu support compact Ultradistributions de Beurling support compact Hyperfonctions 309

7. Commande algbrique des EDPs O Fonctionnelles analytiques

Parmi toutes ces classes, la plus gnrale est celle des fonctionnelles analytiques. Malheureusement, elle manque dun minimum de structure algbrique, en ce sens que O (), lensemble de telles fonctionnelles dnies sur un ouvert de Rn ne constitue pas un faisceau ; ce dernier fait interdit de dnir la notion de support pour ces fonctionnelles. Cest donc la classe des hyperfonctions, que lon peut identier au dual de A, qui est, au sens de la classication prcdente, la plus gnrale tout en conservant un minimum de proprits algbriques agrables (voir [21]).

Ultradistributions
tant donn un entier positif n, considrons le multi-indice = (1 , 2 , . . . , n ) dentiers positifs, on note || = 1 + 2 + + n et ! = 1 !2 ! n !. Pour une fonction valeurs complexe f indniment direntiable dnie sur un ouvert Rn , on note D f (x) = || x1 x2 xn n 1 2

o x = (x1 , . . . , xn ). Pour Rn ouvert considrons Mp (p = 0, 1, . . .) une suite de nombres positifs soumise aux conditions suivantes : (M.0) (Normalisation) M0 = M1 = 1 (M.1) (Convexit logarithmique)
2 Mp

Mp1 Mp+1 ,

p = 1, 2, . . .

(M.2) (Stabilit par oprateurs direntiels) G, H, tels que Mp+1 (M.3) (Non quasi-analycit)
p=1

GH p Mp ,

p = 0, 1, . . .

Mp1 < Mp

Dnition 7.7.1. Soit Mp une suite de nombres positifs et Rn un ouvert. Une fonction f E = C () est dite ultradirentiable de classe (Mp ) (resp. {Mp }) si pour tout compact K et pour tout h > 0, il existe une constante C (resp. pour tout compact K , il existe des constantes h et C) telle que sup |D (x)|
xK

Ch|| M||

pour tout

310

7.8. EDPs frontires comme systmes de convolution On dsigne par E () lensemble des fonctions ultradirentiables de classe sur (o = (Mp ) ou {Mp }) et par D () lensemble des fonctions de E () support compact dans . Notons que lon peut remplacer (M.3) par la condition de quasi-analycit suivante : (M.3) (i) Il existe des constantes strictement positives L et C telles que, pour tous p p! CLp Mp

(ii) La srie crite en (M.3) diverge


p=1

Mp1 = Mp

De plus, si une suite Mp satisfaisant (M.3) est telle que lim inf
p
p

p! >0 Mp

alors E {Mp } est la classe des fontions analytiques. Un autre exemple est celui fourni par Mp = (p !)d , auquel cas E {Mp } est la classe des fonctions Gevrey dordre d + 1. Dnition 7.7.2. Soit Mp une suite de nombres positifs satisfaisant (M.1) et (M.3). Pour tout ouvert Rn le dual D () (resp. E ()) de D () (resp. E ()) est lensemble des ultradistributions de classe (resp. des ultradistributions support compact de classe ) dnies sur o remplace {Mp } ou bien (Mp ). La transformation de Laplace dune ultradistribution f E est donne par f (s) = f (gs ) avec gs (t) = est . Lisomorphisme entre les anneaux de convolution dultradistributions support compact et leur transformation de Laplace est donn par un thorme de type Paley-Wiener gurant par exemple dans [20]. Le calcul oprationnel que nous utiliserons est celui naturellement associ la convolution des ultradistributions ou leur transformation de Laplace.

7.8

Problmes dEDPs frontires comme systmes de convolution

Classe de modles considrs


Par souci de simplicit dexposition, on se restreindra dans ce qui suit aux systmes admettant le modle suivant en les variables distribues w1 , . . . , wl 311

7. Commande algbrique des EDPs ainsi quen les variables concentres u = (u1 , . . . , um ) : x wi = Ai wi + Bi u, wi : i (D )p , u (D )m i {1, . . . , l} Ai (R[t ])pi pi , Bi (R[t ])pi m , (7.18a)

o D dsigne un espace dultradistributions. Les intervalles 1 , . . . , l sont donn par un voisinage ouvert de i = [xi,0 , xi,1 ]. On supposera, sans perte de gnralit, que xi,0 = 0. Nous ferons une hypothse cruciale pour notre tude. Les polynmes caractristiques des matrices A1 , . . . , Al peuvent sexprimer comme
pi

Pi () := det(1 Ai ) =
=0

ai, ,

ai, =
+pi

ai,, s

(7.18b)

o ai,, R, ai,pi ,0 = 1. De plus, les parties principales de ces polynmes, donnes par +=pi ai,, s sont hyperboliques relativement laxe temporel t, c..d. que les racines des polynmes +=pi ai,, j sont relles. Le modle est complt par les conditions aux frontires
l

Li wi (0) + Ri wi ( i ) + Du = 0
i=1

(7.18c)

o D (R[t

])qm

et Li , Ri (R[t ])qpi .

Solution du problme de Cauchy


Rappelons ici quelques proprits de la solution du problme de Cauchy de la forme (7.18a) avec les conditions initiales donnes par x = , c..d., x w = Aw + Bu, w() = w (7.19)

avec A (R[t ])pp , B (R[t ])pi q ayant les mmes proprits que Ai , Bi de la section prcdente. (Tout au long de cette section on utilisera la notation de la section prcdente en supprimant lindex i {1, . . . , l}). Pour ce faire, considrons le problme aux valeurs initiales : P (x )v(x) = 0,
j (x v)(0) = vj E (R),

j = 0, . . . , p 1

(7.20)

associ lquation caractristique (7.18b). Sous la hypothse la solution unique de (7.20) est donn par
p1

v(x) =
j=0 (R)

Cj (x)vj .

o C0 , . . . , Cp1 : E sont des fonctions indniment direntiables satisfaisant (k, j {0, . . . , p 1})
k x Cj (0) =

1, k = j 0, k = j.

(7.21)

312

7.8. EDPs frontires comme systmes de convolution et la juxtaposition dnote la convolution. De plus, on peut vrier les relations x Cj = x Cj1 aj Cp1 , j = 1, . . . , p 1, x C0 = a0 Cp1 . (7.22)

Lanneau E (resp. D ) est un espace appropri de fonctions ultradirentiables (resp. dultradistributions). Par ailleurs, E dsigne lespace dultradistributions support compact de mme ordre Gevrey. En conformit avec les rsultats donns en [19, Thrm. 12.5.6] ou [38, Thrm 2.5.2,Prop. 2.5.6] on peut choisir lespace E (p/(p1)) (resp. D (p/(p1)) ) qui correspond aux fonctions ultradirentiables (resp. aux ultradistributions) Gevrey de Beurling dordre p/(p 1). Exemple 7.8.1. Pour une quation de la chaleur, telle que (7.11) les expressions dans la domaine de Laplace sont sinh(x s) C0 (x) = cosh(x s), C1 (x) = . s Dans le domaine temporel, on obtient les expressions suivantes

C0 (x)v0 =
k=0

x2k k v0 , (2k)! t

C1 (x)v1 =
k=0

x2k+1 k v1 (2k + 1)! t


(2) ).

Pour tout x x, C0 (x), C1 (x) sont des ultradistributions (lments de E La solution unique x (x, ) du problme aux valeurs initiales x (x, ) = A(x, ), (, ) = 1

avec 1 dsignant lidentit de E (R)pp , est alors donne par


p1

(x, ) =
j=0

Aj Cj (x )

(7.23)

De lunicit de la solution, on dduit la formule de composition (x, )(, ) = (x, ). La solution du problme associ lquation inhomogne x (x, ) = A(x, ) + B (7.25) (7.24)

avec des conditions initiales homognes prescrites x = , sobtient par variation des constantes. Ceci donne
x

(x, ) =

(x, )dB

(7.26) 313

7. Commande algbrique des EDPs La solution gnrale du problme (7.19) est alors w(x) = (x, )w + (x, )u ou, de manire quivalente w(x) = W (x, )c, W (x, ) = (x, ) (x, ) , c = w u

Les composantes de la matrice (x, ) sont combinaisons linaires des C0 (x ), . . . , Cp1 (x ) sur C[t ]. Au contraire, daprs (7.26), les composantes de peuvent contenir des intgrales de C0 , . . . , Cp1 . Nous allons montrer que ces intgrales peuvent sexprimer comme combinaison linaire des fonctions C0 , . . . , Cp1 ayant des coecients dans C(t ). De telles reprsentations sont obtenues par lintgration des quations (7.22) et par lvaluation correspondante des conditions initiale(7.21). Pour obtenir les expressions gnrales, il faut supposer que les premiers coecients a0 , . . . , a1 sont gaux zro. Dans ce cas, les fonctions C0 , . . . , C1 correspondent aux polynmes Cj (x) = xj , j! j = 0, . . . , 1 (7.27a)

dont les intgrales en espace se dduisent facilement. Ensuite lquation x C (x) = donne
x

a0 Cp1 (x), =0 C1 (x) a Cp1 (x), > 0

Cp1 ()d =
0

1 a0 (C (x) C (0)) ,

=0
x !

a1

C (x) C (0)

, >0

(7.27b)

Finalement, des quations x Cj (x) = Cj1 (x) a Cp1 (x) on dduit


x x

Cj1 ()d = Cj (x) Cj (x) +


0 0

a Cp1 ()d,

j = + 1, . . . , p 2. (7.27c)

Module du systme
En utilisant les solutions du problme aux valeurs initiales dans les conditions aux bords, on obtient w(x) = W (x)c , 314 P c = 0 (7.28)

7.8. EDPs frontires comme systmes de convolution Ici, = (1 , . . . , n ) est arbitraire mais x, cT = (wT (1 ), . . . , wT (l ), uT ), 1 l (x, 1 ) 0 0 1 (x, 1 ) 1 . .. . W = , P = P,1 , . . . , P,l+1 . 0 0 . 0 l (x, l ) l (x, l ) avec P,i = Li i (0, i ) + Ri i ( i , i ),
l

i = 1, . . . , l

P,l+1 = D +
i=1

Li i (0, i ) + Ri i ( i , i )

Nous allons reprsenter le systme tudi par un module engendr par les c , u avec la prsentation donne en (7.28) [32, 12, 11, 30]. Lanneau des coecients doit contenir les composantes de W (x) et P , qui sont constitues de valeurs des fonctions Ci,j , (j = 1, . . . , pi , i = 1, . . . , l) de R dans E . De plus, les matrices peuvent galement contenir des valeurs des intgrales en espace de Ci,j . Un choix possible pour lanneau des coecients est alors RI = C[t , S, SI ] E avec S = {Ci,j (x)|x R; i = 1, . . . , l; j = 0, . . . , pi 1},
I SI = {Ci,j (x)|x R; i = 1, . . . , l; j = 0, . . . , pi 1}

et
I Ci,j (x) = 0

Ci,j ()d,

i = 1, . . . , l,

j = 0, . . . , pi 1.

Cet anneau est isomorphe un sous anneau de lanneau O des fonctions entires en s par transformation de Laplace. Dans le mme esprit quen [31, 5, 17], et an de simplier lanalyse des proprits des modules, on utilisera, au lieu de RI , un anneau un peu plus grand, donn par R = C(t )[S] O. (On identie lanneau C(t )[S] avec son image par la transformation Laplace). Dnition 7.8.1. Le systme de convolution associ au problme frontire (7.18) est le module engendr par c et u sur R avec P pour matrice de prsentation. On vrie aisment que ne dpend pas du choix de (cf. [47, Section 3.3] et [44, Remark 4]). Exemple 7.8.2. Nous allons considrer un exemple similaire celui donn par les quations (7.11). Modle. Le modle tudi est le suivant :
2 x w(x, t) = t w(x, t), x [0, ], t [0, +[

(7.29a) (7.29b) (7.29c) 315

x w(0, t) = 0 x w( , t) = u(t)

7. Commande algbrique des EDPs Ce modle peut se recrire w(x, t) 0 = x x w(x, t) t 1 w(x, t) 0 x w(x, t) (7.30a) 0 1 w(0, t) 0 0 w( , t) 0 + = u(t) 0 0 x w(0, t) 0 1 x w( , t) 1 (7.30b)

Solutions fondamentales. Les solutions du problme sans frontire, c..d. de lquation (7.30a) sont Cx Sx c w(x) = t Sx Cx Donc, nous avons w(x) = Cx c1 + Sx c2 ce qui exprime le fait que (Cx , Sx ) est une base de lespace vectoriel des solutions de (7.30a) considre comme une EDO par rapport la variable x. Conditions aux bords. Les conditions aux bords (7.30b) scrivent L(0, )c + R( , )c Du = 0 ou bien, en forme matricielle explicite 0 1 C S 0 c + 0 0 t S C 0 qui est quivalente t S

1 t S

0 c u = 0 C 1 S

t S En rsum, nous obtenons S C t t S C

c 0 1 u = 0 C c2 1 C

c1 0 c2 = 0, 1 u

w(x) =

Cx

Sx

t Sx Cx

c1 0 c2 0 u

316

7.9. Systmes du deuxime ordre que nous dsignerons par c P = 0, u avec les notations

c w(x) = W (x) u

P = t S

t S

C C

0 1

W =

Cx

Sx

t Sx Cx

7.9

Commandabilits des systmes paramtres rpartis du deuxime ordre

Dans cette section, le schma obtenu en section 7.9 est appliqu des systmes constitus de rseaux de systmes du second ordre coupls aux bords. Bien que ces systmes ne soient relativement particuliers, une grande classe de systmes physiques importants sont couverts. Par ailleurs, pour cette classe de systmes, les rsultats de commandabilit sont bien plus dtaills que dans le cas gnral.

Classe de modles considrs


Nous supposons que pi = 2, i = 1, . . . , l dans (7.18). De plus, toutes les matrices A1 , . . . , Al donnent lieu au mme polynme caractristique : Pi () = 2 , = as2 + bs + c = 0, a, b, c R, a 0 (7.31)

Par ailleurs, les intervalles 1 , . . . , l doivent avoir des longueurs rationnellement dpendantes. Plus prcisment, nous supposerons que i (i = 1, . . . , l) est donn par un voisinage ouvert de i = [0, qi ], qi Q, R. (7.32)

Pour la matrice , nous obtienons, en accord avec lquation (7.23), (x, ) = AS(x ) + 1C(x ) o 1 dsigne lidentit de E (R)22 . Nous remplaons C0 par C et C1 par S par souci de simplicit des notations. Le formule de composition (7.24) scrit dans le cas o A est la matrice compagnon du polynme caractristique, c..d., 0 1 C(x ) S(x ) , (x, ) = , A= (7.33) 0 S(x ) C(x ) 317

7. Commande algbrique des EDPs sous la forme C(x + y) S(x + y) C(y) S(y) C(x) S(x) . = S(x + y) C(x + y) S(y) C(y) S(x) C(x) Cela donne en particulier les formules de composition pour les sinus et cosinus hyperboliques C(x + y) = C(x)C(y) + S(x)S(y), S(x + y) = C(x)S(y) + S(x)C(y). (7.34)

Finalement, les intgrales de S et C sont obtenues partir de (7.27) avec a0 = , a1 = 0 :


x x

C()dx = S(x),
0 0

S()dx = (C(x) 1)/.

Le module de systme peut tre dni comme en section 7.8. Ici, lensemble S des gnrateurs de lanneau des coecients R consiste en les valeurs de S et de C uniquement. Pour lanalyse de la commandabilit, il est avantageux de spcier quelles valeurs des fonctions gnratrices devraient tre utilises comme lments de lanneau des coecients S. An de se servir de la dpendance Qlinaire des longueurs i de (7.32) il est utile de commencer avec un anneau engendr par les valeurs de C et S pris en des valeurs multiples rationnelles ou entires de . Ainsi, au lieu de R, nous utilisons les anneaux RN = C(t )[SN ]O et RQ = C(t )[SQ ] O, o pour tout X R, SX = {C(z ), S(z )|z X} An de distinguer les modules obtenus pour divers anneaux de coecients RN RQ R, la notation X est utilise. Dnition 7.9.1. Le systme de convolution = R associ au problme frontire (7.18) est le module engendr par c sur RR avec P pour matrice de prsentation. Par Q on dsigne le mme systme, mais vu comme module sur RQ .

Commandabilits des systmes paramtres rpartis commands aux bords


Une notion supplmentaire de commandabilit est ici introduite, celle de commandabilit spectrale, gnralisant le critre de Hautus des systmes de dimension nie. Dnition et proposition 7.9.1. Soit R un anneau isomorphe un sousanneau de lanneau O des fonctions entires. Notons par L lapplication R O de passage au domaine symbolique (la transformation de Laplace). Un Rsystme niment prsent de matrice de prsentation P est dit spectralement commandable si lune des deux conditions quivalentes suivantes est vrie : 318

7.9. Systmes du deuxime ordre (i) La matrice P = L (P ) coecients dans O satisfait la condition : k N : C : rkC P () = k. (ii) Le module O = O R est sans torsion. Dmonstration. Ce rsultat est une simple consquence du fait que la matrice P admet une forme normale de Smith. Proposition 7.9.1. Soit R un domaine de Bzout isomorphe un sous anneau de O et L : R O le passage au domaine symbolique. Alors les notions de commandabilit spectrale et de commandabilit sans torsion sont quivalentes si, et seulement si, L envoie les lments non inversibles de R sur les lments non inversibles de O. Dmonstration. Puisque R est un domaine de Bzout, le caractre sans torsion de implique sa libert. Par produit tensoriel avec le module libre O on obtient un autre module libre O , et, par la Dnition et Proposition 7.9.1, la commandabilit spectrale. nouveau parce que R est un domaine de Bzout, toute matrice de prsentation admet une forme normale de Hermite. Donc, le sous module de torsion t de peut tre prsent par une matrice carre triangulaire P t de rang plein. Si nest pas sans torsion, au moins une composante de la diagonale de cette matrice est non inversible dans R. Si cette composante est envoye sur un non inversible de O par L , elle admet un zro complexe 0 . Donc, L (P t ) a une chute de rang en = 0 . Inversement, sil existe un lment non inversible r R qui correspond un lment inversible r O, considrons [ ]/[r ]. De manire vidente, limage de dans O est zro. = Donc le module trivial O est sans torsion. Nous ne dtaillerons pas la preuve du rsultat suivant : Thorme 7.9.1. Lanneau RQ est un domaine de Bzout, c..d., tout idal niment engendr est principal. Dmonstration. (Esquisse de preuve). On montre que deux lments quelconques p, q RQ possdent un diviseur commun qui peut scrire comme combinaison linaire de p, q. Pour cela, on sappuie sur le fait que lanneau C(s)[SQ ] est galement un domaine de Bzout. Ceci provient du fait que ce type danneau se construit typiquement comme le quotient RX := k[Ca , Sa ; a X]/a avec lidal a engendr par Ca Cb Sa Sb Cab , Sa Cb Ca Sb Sab , C0 1, S0 , k, a, b X

Notant Ca et Sa les images canoniques de Ca et Sa dans RX , lon dduit les relations Ca Cb Sa Sb = Cab , C0 = 1, S0 = 0, Sa Cb Ca Sb = Sab Sa = Sa (7.35a) (7.35b) (7.35c) 319

Ca = Ca ,

2Ca Cb = Ca+b +Cab , 2Sa Sb = Ca+b Cab , 2Ca Sb = Sa+b Sab

Bibliographie De plus, tout lment de r RX peut scrire sous la forme


n

r=
i=0

ai Ci + bi Si ,

n N,

ai , bi k,

i X+

(7.36)

o X+ = {|| : X}. Sachant que C(s)[SQ ] est un domaine de Bzout, on peut trouver des lments a, b C[t , SQ ] tels que c = ap + bq C[t , SQ ] (7.37)

est le PGCD dans C(s)[SQ ]. Donc, p/c et q/c appartiennent C(s)[SQ ]. On en dduit un diviseur commun dans RQ . Voici le principal rsultat de cette section : Thorme 7.9.2. Le systme de convolution dni en 7.9.1 est libre, si et seulement sil est sans torsion. Plus gnralement = t /t, o t est de torsion et /t est libre. De plus, est spectralement commandable si, et seulement sil est sans torsion. Dmonstration. Rappelons que, selon la dnition 7.9.1, R RQ Q et RQ = est un domaine de Bzout par la proposition 7.9.1. Puisque la premire assertion est vraie pour les modules niment prsents sur tout domaine de Bzout, elle est vraie pour Q . La deuxime assertion dcoule le la proposition 7.9.1. (Le fait que la transforme de Laplace envoie tout lment non inversible de RQ sur un lment non inversible de O est vident). Clairement les deux rsultats sont galement valables pour , qui est obtenu par extension de scalaires.

7.10

Bibliographie

[1] Aoustin, Y., M. Fliess, H. Mounier, P. Rouchon et J. Rudolph: Theory and practice in the motion planning control of a exible robot arm using Mikusi`ski operators. Dans Proc. of 4th Symposium on Robotics and Control, n pages 287293, Nantes, 1997. [2] Balser, W.: From Divergent Power Series to Analytic Functions : Theory and Applications of Multisummable Power Series, tome 1582 de Lecture Notes in Mathematics. Springer Verlag, 1994. [3] Balser, W.: Summability of formal power series solutions of ordinary and partial dierential equations. Functional Di. Eq., 8 :1124, 2001. [4] Balser, W.: Multisummability of formal power series solutions of partial dierential equations with constant coecients. J. Di. Equations, 201 :63 74, 2004. 320

Bibliographie [5] Breth, D. et J.J. Loiseau: A result that could bear fruit for the control of delay-dierential systems. Dans Proc. IEEE MSCA96, Chania, Crete, 1996. [6] Courant, R. et D. Hilbert: Methoden der mathematischen Physik, tome 1. Julius Springer, Berlin, 1937. Traduction amricaine : Methods of mathematical physics. Interscience Publishers, New York, 1953. [7] calle, J.: Introduction aux fontions analysables et preuve constructive de la conjecture, de Dulac. Hermann, Paris, 1992. [8] Eisenbud, D.: Commutative Algebra with a view toward Algebraic Geometry. Numro 150 dans Graduate Texts in Mathematics. Springer-Verlag, New York, 1995. [9] Fliess, M.: Generalized linear systems with lumped or distributed parameters and dierential vector spaces. Internat. J. Control, 49 :19891999, 1989. [10] Fliess, M.: Some basic structural properties of generalized linear systems. Systems Control Lett., 15 :391396, 1990. [11] Fliess, M. et H. Mounier: Controllability and observability of linear delay systems : an algebraic approach. Control Optimization and Calculus of Variations, 3 :301314, 1998. [12] Fliess, M. et H. Mounier: Tracking Control and -Freeness of Innite Dimensional Linear Systems. Dans Picci, G. et D.S. Gilliam (rdacteurs) : Dynamical systems, Control, Coding and Computer Vision, tome 258, pages 4168. Birkhuser, Ble, 1999. [13] Fliess, M. et H. Mounier: On a class of linear delay systems often arising in practice. Kybernetica, 37 :295308, 2001. [14] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: Systmes linaires sur les oprateurs de Mikusi`ski et commande dune poutre exible. Dans ESAIM n Proc. lasticit, viscolasticit et contrle optimal, huitimes entretiens du centre Jacques Cartier, Lyon, 1996. [15] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: Controlling the transient of a chemical reactor : A distributed parameter approach. Dans Proc. of IEEE Conference on Computational Engineering in Systems Applications, Nabeul-Hammamet, Tunisie, 1998. [16] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: A distributed parameter approach to the control of a tubular reactor : a multi-variable case. Dans Proc. of 37th Conference on Decision and Control, pages 439442, Tampa, FL, tats-Unis, 1998. [17] Glsing-Leren, H.: A behavioral approach to delay dierential systems. SIAM J. Contr. Opt., 35 :480499, 1997. 321

Bibliographie [18] Grothendieck, A. et J.A. Dieudonn: Elments de gomtrie algbrique I. Numro 166 dans Grundlehren math. Wissensch. Springer-Verlag, Berlin, 1971. [19] Hrmander, L.: The Analysis of Linear Partial Dierential Operators II : Dierential Operators with Constant Coecients, tome 257 de Grundlehren der mathematischen Wissenschaften. Berlin, Heidelberg, New York, 2. dition, 1990. [20] Komatsu, H.: Ultradistributions II : The kernel theorems and ultra distributions with supports in a submanifold. J. Fac. Sci. Tokyo, 24 :607624, 1977. [21] Komatsu, H.: Operational Calculus and Semi-groups of Operators, tome 1540 de Lect. Notes Math., pages 213234. Springer, Berlin, 1991. [22] Komatsu, H.: Solution of dierential equations by means of Laplace hyperfunctions, pages 227252. World Sci. Publishing, River Edge, NJ, 1996. [23] Lafon, J.P.: Algbre commutative. Langages gomtrique et algbrique. Hermann, Paris, 1977. [24] Laroche, B.: Extension de la notion de platitude des systmes dcrits par des quations aux drives partielles linaires. Tse de doctorat, cole Nationale Suprieure des Mines de Paris, 2000. [25] Laroche, B., P. Martin et P. Rouchon: Motion planning for the heat equation. Int. J. Robust and Nonlinear Control, 10 :629643, 2000. [26] Lynch, A. et J. Rudolph: Flatness based boundary control of a nonlinear parabolic equation modelling a tubular reactor. Dans A. Isidori, F. LamnabhiLagarrigue, W. Respondek (rdacteur) : Nonlinear Control in the Year 2000, volume 2, numro 259 dans Lecture Notes in Control and Inform. Sci., pages 4554. Springer, Londres, 2000. [27] Matsumura, H.: Commutative Ring Theory. Cambridge university press, Cambridge, 1990. [28] McDonald, B.R.: Linear Algebra over Commutative Rings. Marcel Dekker, New York, 1984. [29] Mikusiski, J.: Operational Calculus. Pergamon Press, Oxford, 1959. [30] Mounier, H.: Proprits structurelles des systmes linaires retards : aspects thoriques et pratiques. Thse de doctorat, Universit Paris Sud, Orsay, 1995. [31] Mounier, H.: Algebraic interpretations of the spectral controllability of a linear delay system. Forum Math., 10 :3958, 1998. [32] Mounier, H. et M. Fliess: An algebraic framework for innite dimensional linear systems. e-sta, 1, 2004. URL : http ://www.e-sta.see.asso.fr. 322

Bibliographie [33] Mounier, H., P. Rouchon et J. Rudolph: Some examples of linear systems with delays. J. Europ. Syst. Autom., 31 :911925, 1997. [34] Mounier, H. et J. Rudolph: Time delay systems. Encyclopaedia of Life and Support Systems, 6.43.19.4, 2003. [35] Ollivier, F. et A. Sedoglavic: A generalization of atness to nonlinear systems of partial dierential equations. Application to the command of a exible rod. Dans IFAC Symposium NOnLinear COntrol Systems, pages 196200, Saint-Petersbourg, 2001. [36] Quillen, D.: Projective modules over polynomial rings. Inv. Math., 36 :167 171, 1976. [37] Ramis, J.P.: Sries divergentes et thories asymptotiques. France, Marseille, 1993. Soc. Math.

[38] Rodino, L.: Linear Partial Dierential Operators in Gevrey Spaces. World Scientic, Singapore, 1993. [39] Rotman, J.: An Introduction to Homological Algebra. Academic Press, Orlando, 1979. [40] Rowen, L.H.: Ring Theory. Student Edition. Academic Press, Boston, 1991. [41] Rudolph, J.: Beitrge zur achheitsbasierten Folgeregelung linearer und nichtlinearer Systeme endlicher und unendlicher Dimension. Shaker Verlag, 2003. ISBN 3-8322-1765-7. Thse dhabilitation. [42] Rudolph, J.: Flatness Based Control of Distributed Parameter Systems. Steuerungs- und Regelungstechnik. Shaker Verlag, Aachen, 2003. [43] Rudolph, J., J. Winkler et F. Woittennek: Flatness Based Control of Distributed Parameter Systems : Examples and Computer Exercices from Various Technological Domains. Steuerungs- und Regelungstechnik. Shaker Verlag, Aachen, 2003. [44] Rudolph, J. et F. Woittennek: Motion planning and open loop control design for linear distributed parameter systems with lumped controls. Int. J. Control, 81 :457474, 2008. [45] Suslin, A.A.: Projective modules over a polynomial ring are free (in russian). Dokl. Akad. Nauk. S.S.S.R., 229 :10631066, 1976. English translation : Soviet Math. Dokl., 17, p. 11601164. [46] Vidyasagar, M.: Control System Synthesis. A Factorization Approach. MIT Press, Cambridge, Massachusetts, tats-Unis, 1985. [47] Woittennek, F.: Beitrge zum Steuerungsentwurf fr lineare, rtlich verteilte Systeme mit konzentrierten Stelleingrien. Berichte aus der Steuerungsund Regelungstechnik. Shaker Verlag, Aachen, 2007. 323

Bibliographie [48] Youla, D.C. et G. Gnavi: Notes on n-Dimensional System Theory. IEEE Trans. Circuits Syst., 26 :105111, 1979.

7.A

Rappels dalgbre

Module, libert, torsion


On considre dans cette section un anneau R commutatif, unifre et sans diviseur de zro. Un Rmodule M est un groupe commutatif muni dune action sur R, cest-dire dune application R M M , crite (r, m) rm, telle que, pour tous r, s R et m, n M , lon ait : r(sm) = (rs)m r(m + n) = rm + rn (r + s)m = rm + sm 1m = m (distributivit) (identit) (associativit)

Notation 7.A.1. Le sous-module engendr par un sous ensemble S dun Rmodule M est not [S]R ou bien [S] sil ny a pas dambigut. Soit M un Rmodule, et S un sous-ensemble de M . Une combinaison linaire dlments de S est une somme am m
mS

o {am } est un ensemble dlments de R, presque tous nuls. Ces lments sont les coecients de la combinaison linaire. Lensemble N de toutes les combinaisons linaires dlments de S est un sous-module de M , le sous-module engendr par S et lon nomme S lensemble des gnrateurs de N . Un module est dit niment engendr, ou de type ni sil ne possde quun nombre ni de gnrateurs. Un sou-ensemble S dun Rmodule M est dit linairement indpendant (sur R) si, lorsque lon a une combinaison linaire de la forme am m
mS

qui est gale zro, alors am = 0 pour tout m S. Un sous-ensemble est dit linairement dpendant sil nest pas linairement indpendant. Un module est dit libre sil contient une base, c..d., un sous-ensemble indpendant et gnrateur. Un lment m non nul dun Rmodule M est dit de torsion sil existe a R, a = 0 tel que am = 0 324

7.A. Rappels dalgbre En dautres termes, lensemble {m} est linairement dpendant. Un module M est dit de torsion si tous ses lments le sont. Il est dit sans torsion si aucun de ses lments non nul ne lest.

Relations
Soit un R-systme. Il existe une suite exacte de R-modules [39] 0N F 0 (7.38)

o F est libre. Le R-module N , parfois nomm module des relations, peut tre envisag comme un systme dquations dnissant . Une prsentation libre de [39] est une suite exacte de R-modules F1 F0 0 o F0 et F1 sont libres. Le R-module est dit niment engendr, ou de type ni, sil existe une prsentation libre o toute base de F0 est nie. Il est dit niment prsent sil existe une prsentation libre o toute base de F0 et de F1 est nie. La matrice correspondant lapplication F1 F0 est dite matrice de prsentation de ; nous la noterons P . Remarquons que cette matrice dpend des relations de . Exemple 7.A.1. Dterminons le R-module correspondant au systme dquations R-linaires

a = 0,
=1

a A, = 1, . . . ,

o 1 , . . . , sont les inconnues. Soit F le R-module type engendr par f1 , . . . , f . Soit N F le module des relations, c..d., le sous-module engendr par les combinaisons a f , = 1, . . . , . Alors, = F/N . Les sont les rsidus =1 des f , c..d., les images canoniques des f . Considrons, par exemple, le systme considr la remarque 7.3.2. Le R[s]module libre F est celui engendr par X et U (c..d. lensemble {p(s) X +q(s) U | p, q R[s]} quip dune structure linaire). Le sous-module N des relations est engendr par llment a(s) X b(s) U (c..d. lensemble {r(s)(a(s) X b(s) U ) | r R[s]} quip dune structure linaire). Alors = F/N = [X, U ]/[a(s) X b(s) U ], avec x et u pour gnrateurs, les rsidus de X et U , et pour relation a(s) x = b(s) u.

Idal
Nous allons introduire un objet algbrique associ un module M qui regroupe les mineurs de la matrice de prsentation PM et qui, contrairement cette dernire, ne dpend que du module M . Pour la notion de matrice de prsentation, matrice des quations du systme, voir la sous-section 7.A, p. 325. 325

Bibliographie Un idal a de R est un sous-groupe additif de R tel que pour tout a et r R, r a. Cest donc un sous-ensemble de R qui est galement un Rmodule. tant donn un idal a de R, sil existe une famille dlments (i )iI (I N) de a tels que a= i pi | pi R
iI

lidal a est dit engendr par la famille (i )iI . Lorsque I est ni, a est dit niment engendr. Avec M donn par gnrateurs et relations comme dcrit en section 7.A, p. 325, lidal de Fitting dordre i associ M (voir [28] ou [8, dnition 20.4 p. 493]), not Ii , est dni comme lidal de R engendr par les dterminants M de toutes les sous-matrices de taille (i)(i) (les mineurs dordre i) de PM . Supposant que rgR PM = , nous noterons IM lidal de Fitting associ aux mineurs dordre PM . Cet idal admet C = !/(!( )!) gnrateurs. Dans le cas o R est un anneau de polynmes en r indtermines, nous considrerons en gnral par abus de notation les lments de IM comme des fonctions polynomiales de Cr .

Produit tensoriel
Le produit tensoriel est une technique qui permet, entre autres, dtendre formellement lanneau des scalaires agissant sur un module. Soit R un anneau, M et N deux R-modules. Notons F le groupe des combinaisons R-linaires de toutes les paires ordonnes (m, n). Soit L le sous-groupe de F engendr par tous les lments de la forme (m + m , n) (m, n) (m , n), (am, n) a(m, n) (m, n + n ) (m, n) (m, n ), (m, an) a(m, n)

o m, m M , n, n N et a R. On pose alors M R N = F/L ; il sagit dun R-module que lon nomme produit tensoriel des modules M et N . Les lments de M R N scrivent nie mi R nj (ou nie mi nj lorsquil ny a pas de risque de confusion) et ce de manire non unique en gnral. Un des avantages de cette construction est de pouvoir rduire des applications bilinaires sur M N des applications linaires sur M R N .

Exemple de changement danneau de base : extension des scalaires


Nous allons donner, dans cette section et la suivante, deux exemples dune opration dsormais classique en algbre commutative et gomtrie algbrique (voir [18] et par exemple [23]) : celle du changement danneau de base. Elle permet notamment de changer le point de vue que lon a sur un objet algbrique. Un premier exemple est lextension des scalaires. Soient R et S deux anneaux 326

7.A. Rappels dalgbre avec R S, S tant un R-module et M un R-module. Alors on dit que le S-module S R M est obtenu partir de M par extension des scalaires.

Exemple de changement danneau de base : localisation


Un deuxime exemple de changement danneau de base est fourni par le procd de localisation. Soit S un sous-ensemble multiplicativement clos de R (cest--dire pour tous 1 , 2 S, 1 2 S et 1 S). Le localis en S de R est un anneau, not S 1 R, muni dun morphisme : R S 1 R tel que (i) pour tout S, () est inversible dans S 1 R ; (ii) pour tout q S 1 R, il existe des p R et S tels que q = (p)()1 . On note gnralement llment q prcdent par p/.

Projectivit
Dnition Une caractrisation de la commandabilit des systmes linaires de dimension nie est la libert du module sous-jacent (voir [10]), qui repose sur lquivalence d entre la libert et labsence de torsion pour un module sur lanneau6 R[ dt ]. Dans le cas des systmes paramtres rpartis, cette caractrisation nest plus valable, la libert dun R-module M tant une notion plus forte que le fait dtre sans torsion (limplication inverse de la suivante est fausse) : M libre = M sans torsion Il faut en fait distinguer deux proprits : la libert et la projectivit. Cette dernire recouvre la notion de sous-espace dun module libre. Dune part, un sous-module M dun module libre N peut-tre libre mais pas ncessairement un terme en somme directe de N . Dautre part, il peut y avoir des termes en somme directe de N qui ne sont pas libres. Cest ce dernier concept qui fournit une gnralisation naturelle de la notion de sous-espace. Un module M sur un anneau commutatif R est donc dit projectif, si N = M M o N est un module libre (voir par exemple [28] ou [8, A3.2 p. 615]) ; M est alors galement projectif pour la mme raison. Critres de projectivit Nous avons le rsultat suivant, sur un anneau commutatif R, intgre et sans diviseurs de zros : Proposition 7.A.1. Un R-module M est projectif si, et seulement si son idal de Fitting IM est gal R.
6 d Ceci est d au caractre principal de lanneau R[ dt ].

327

Bibliographie Nous avons galement le critre local suivant (voir [28, thorme IV.32 p. 295] et [8, thorme 19.2 p. 471, thorme A3.2 p. 616 et exercices 4.11 et 4.12 p. 136]) : Proposition 7.A.2 (Critre local de projectivit). Soit M un module niment prsent sur un anneau commutatif R. Alors M est projectif si, et seulement sil existe une famille nie dlments x1 , . . . , xr de R qui gnrent lidal unit de R, telle que M [x1 ] soit libre sur R[x1 ] pour tout i. i i Dans le cas o R est un anneau de fonctions entires dune variable complexe, et si le Nullstellensatz est vrai sur R, nous avons galement Proposition 7.A.3. Pour un R-module M , IM = R si, et seulement si les gnrateurs de IM nont pas de zro commun dans C. Une caractrisation de la projectivit est alors la suivante : M est projectif si une matrice de prsentation PM (PM R , rgR PM = ) est inversible droite (sil existe Q R tel que PM Q = I ). Notons que cette caractrisation est directement lie aux quations de Bzout matricielles. Si lon prend une dynamique dquations x = F x + Gu avec F et G des matrices coecients dans R de tailles appropries, la projectivit de revient lexistence de matrices F et G coecients dans R telles que d In F F + GG = In . dt Ce type dquation peut servir des ns de stabilisation par retour dtat dynamique (voir [46]).

Projectivit et libert
Rappelons ici le clbre thorme de Quillen et Suslin rsolvant en 1976 une conjecture mise par Serre dans les annes cinquante. Thorme 7.A.1. Tout module projectif sur un anneau de polynmes (k[X1 , . . . , Xn ] o k est un corps) est libre. Dnition 7.A.1. Un module est stablement libre sil devient libre aprs ajout dun module libre. Proposition 7.A.4. Tout module stablement libre nest pas ncessairement libre ; un contre exemple classique est sur k[X, Y, Z]/(1 X 2 Y 2 Z 2 ). 328

7.B. Rappels sur les fonctions Gevrey

7.B

Rappels sur les sries divergentes et les fonctions Gevrey

Sommabilit et multi-sommabilit
Voir par exemple [37], [2], [3], [4]. Considrons une srie formelle en x w(x, ) =
i 0

i ( ) xi

coecients des fonctions ai ( ), holomorphes dans un disque D = { C | | | < } Cette srie est lment de C (C)[[x]]. Lorsque ces sries seront utilises avec des ai (t) fonctions du temps, les coecients seront des fonctions analytiques relles. Sommabilit Dnition 7.B.1. On dira que la srie w(x, ) est k-sommable dans la direction d (k > 0, d R) sil est possible de trouver un rayon de convergence r ]0, [ tel que les deux proprits suivantes soient satisfaites : La transforme de Borel en x dordre k, c..d. la srie w(z, ) = Bk (w(x, )) =
i 0

ai ( )

zi (1 + i/k)

(7.39)

converge absolument pour | | r et |z| < R, avec R dpendant de r mais indpendant de . Il existe tel que, pour tout Dr , la fonction w(z, ) peut tre prolonge analytiquement en x dans le secteur Sd, = {x : |d arg z| < }, prolongement que lon note CSd, ( w)(z, ). Ce prolongement est de plus born par une exponentielle dordre k dans un tout sous secteur : pour tout 1 < , il existe des constantes C, K > 0 telles que x Sd,1 ,
| | r

sup |CSd, ( w)(z, )|

C exp K|z|k

Dans ce cas, la transforme de Laplace Lk dordre k de CSd, ( w)(z, ), c..d. la fonction Sk,d (w(x, )) = Lk (CSd, (Bk (w(x, )) = xk
0 ()

w(, )e(/x) d

intgrant le long du rayon arg = avec |d | < est nomme k-somme de la srie formelle w(x, ), et note w(x, ) = Sk,d w(x, ) 329

Bibliographie Le procd de k-sommation est donc ralis en trois tapes : Sk,d = Lk CSd, Bk Remarque 7.B.1. Notons que la transforme de Laplace dordre 1 de z n est L1 (z n ) = x1
0 ()

n e/x d = n!xn

qui apparat donc comme un oprateur acclrant la divergence dune srie formelle. linverse, la transforme de Borel acclre la convergence de cette mme srie formelle. Le procd de sommation de Borel consiste donc acclrer la convergence, ce qui permet dobtenir une fonction analytique, dont on peut construire un prolongement analytique. La transforme de Borel inverse, c..d. la transforme de Laplace, permet de revenir dans le domaine initial. Exemple 7.B.1. Ce procd permet de sommer des sries de la forme i!xi . 0 La transforme de Borel correspondante est 1/(1 z) qui possde les proprits requises dans toutes les directions d, sauf laxe rel positif. Cette srie est donc 1-sommable dans toute direction d 0 modulo 2. Multi-sommabilit Pour les solutions de certaines EDOs et de certaines EDPs (comme (t 2 3 z )(t z )), le procd de sommabilit ci-dessus ne sut pas. La premire des conditions de la dnition prcdente peut tre relaxe en imposant que la transforme de Borel (7.39) ne soit plus convergente, mais sommable en un certain sens. Nous utiliserons les notations suivantes : soit q 2 un entier naturel ; un q-uple = (1 , . . . , q ) o les i sont des rels positifs sera nomm un type de multisommabilit ; le q-uple d = (d1 , . . . , dq ) o les di sont des rels sera nomm une multidirection admissible si 2j |dj dj1 | , 2 j q

On itre donc la dnition prcdente de la manire suivante : Dnition 7.B.2. Donnons nous un type de multisommabilit = (1 , . . . , q ) et une multidirection admissible d = (d1 , . . . , dq ) et considrons une srie formelle w(x, ) = i 0 i ( ) xi . On dira que w(x, ) est -sommable dans la multidirection d si : La srie ai ( )
i 0

zi (1 + i/1 )

est (2 , . . . , q )-sommable dans la multidirection (d2 , . . . , dq ) et lon notera w(z, ) sa somme. 330

7.C. Reprsentation des oprateurs S(x) et C(x) Il existe tel que, pour tout Dr , la fonction w(z, ) peut tre prolonge analytiquement en x dans le secteur |d1 arg z| < , et vrie pour des constantes C, K > 0 susamment grandes | w(z, )| pour tout z comme ci-dessus. Dans ce cas, la fonction x1
0 ()

C exp K|z|k

w(, )e(/x) d

est nomme -somme de la srie formelle w(x, ), dans la multidirection d et note w(x, ) = S,d w(x, )

Fonctions Gevrey
Voir par exemple [37], [2], [3], [4]. Une fonction de classe C f (t) de [0, T ] dans R est dite Gevrey dindice d si elle vrie les estimes suivantes sup |f (i) (t)|
t[0,T ]

CK i (1 + (d + 1)i),

avec des constantes C et K > 0. De manire analogue, on dira quune srie formelle F (x, s) =
i 0

si fi (x) , i!

x [0, r)

est Gevrey dordre d sil existe des constantes [0, r), C, K > 0 telles que |fi (x)|(t) CK i (1 + (d + 1)i), i 0, |x| <

7.C

Reprsentation des oprateurs S(x) et C(x)

Si a > 0 dans lquation (7.18b) on peut rcrire comme b b2 c , = . 2 2a 4a a Loprateur S(x) correspond la fonction support compact = 2 (s + )2 2 , = a, = et J0 ( 2 x2 t2 ), 2 o J0 dsigne la fonction de Bessel dordre zro et H la distribution de Heaviside. Par contre, si a = 0 dans (7.18b), S(x) peut scrire S(x, t) = (H(t + x ) H(t x )

S(x) =
k=0

(bs + c)k x2k+1 . (2k + 1)!

331

Platitude direntielle et commande de systmes non linaires : une introduction lapproche par lalgbre direntielle

J. Rudolph1 fr Regelungs- und Steuerungstheorie, Technische Universitt Dresden, 01062 Dresden, Allemagne. E-mail : Joachim.Rudolph@tu-dresden.de
1 Institut

La platitude direntielle des systmes non linaires est caractrise par la possibilit de paramtrer la solution par un ensemble ni de trajectoires indpendantes, pour la sortie plate [26, 40, 25]. Il en rsulte des mthodes simples et ecaces pour la planication de trajectoires et pour leur stabilisation. On parle aussi de poursuite dans ce dernier cas. (Pour une introduction on peut aussi consulter [26, 40, 25, 52, 53, 45, 46, 47, 50, 57], par exemple.) Le cadre algbrique de la thorie des corps direntiels se prte trs bien ltude des systmes non linaires (de dimension nie, algbriques) et en particulier celle des systmes plats. Ces systmes sont dcrits par des systmes dquations direntielles ordinaires, explicites ou non. Le cadre algbrique permet de les traiter sans introduction explicite de coordonnes, en les comprenant comme extensions de corps direntiels (ordinaires). Lemploi de cette approche aux systmes non linaires fut introduit en thorie du contrle par M. Fliess au milieu des annes 1980 (voir par ex. [16, 21]). La base mathmatique est fournie par lalgbre direntielle au sens de J. F. Ritt [44] voir aussi [38, 36, 56, 1] par exemple. 333

8. Platitude et algbre diffrentielle

8.1

Systmes plats

Le point de dpart de nos considrations est un systme (implicite) dquations direntielles ordinaires (.d.o.). On les supposera algbriques, cest--dire polynmiales (voir toutefois la remarque la page 335 ce sujet). Si le systme comprend s variables, w1 , . . . , ws , ces quations scrivent donc
() Pi (w1 , w2 , . . . , ws , w1 , . . . , wj , . . . , ws ) = 0, (l)

i = 1, . . . , q,

ou bien, plus brivement, Pi w, . . . , w() = 0, i = 1, . . . , q. (8.1)

Ici les expressions Pi , i = 1, . . . , q, sont des polynmes en wi , i = 1, . . . , s, et leurs drives (ordinaires) ; les coecients appartiennent un corps direntiel appropri, k. Ces polynmes sont donc des lments dun anneau direntiel k{w} engendr sur k par la famille w = (w1 , . . . , ws ) (voir #1). Pour simplier on suppose que le corps de base k soit un corps de constantes comprenant Q. Systme : Un systme algbrique (continu et de dimension nie) est une extension de corps direntielle, de type ni, /k. On observera que cette dnition ne ncessite lintroduction ni de variables (ou coordonnes) ni dquations. Toutefois, comme il sagit dune extension de corps direntielle de type ni (voir #14), on sait que des quations algbriques (donc polynmiales) en un nombre ni de variables existent. Autrement dit, on peut choisir dans un nombre ni de variables du systme, w1 , . . . , ws , de faon pouvoir reprsenter tous les lments de comme expressions rationnelles en les wi , i = 1, . . . , s, et leurs drives ( coecients appartenant au corps de base k). On peut alors faire appel explicitement aux lments choisis, quon collectera dans la famille w = (w1 , . . . , ws ) (une famille gnratrice (direntielle) de /k (#14)), et crire = k w . Remarque 8.1.1. Pour prciser la nature des coecients, il convient parfois de parler de k-systme (algbrique) [10]. Comment construire lextension /k partir dun systme d.d.o. (8.1) ? Une premire approche consiste considrer le corps direntiel = k w , et supposer quil soit dni de telle faon ce que les relations entre les wi , i = 1, . . . , s, soient juste donnes par les quations en considration. Ces relations existent dans le corps si les lments appropris sont nuls. Les lments de tant des expressions rationnelles en wi , i = 1, . . . , s, et leurs drives ( coecients dans k) on obtient (par multiplications par les polynmes dnominateurs) les quations de la forme (8.1). Un tel corps direntiel ne peut tre associ tout systme d.d.o. polynmial, une condition supplmentaire tant requise : tant un corps il ne 334

8.1. Systmes plats peut contenir des diviseurs de zro, une condition de primalit en rsulte. Pour construire le systme k w /k supposons donn des quations de la forme (8.1), et prenons une famille W = (W1 , . . . , Ws ) (de cardinal gal celui de w) et lanneau direntiel k{W } (libre, cest--dire sans relations non triviales) engendr sur k par W . Les lments de k{W } sont les polynmes en les indtermines Wi , i = 1, . . . , s, et leurs drives, coecients dans k. (Les indtermines sont direntiellement algbriquement indpendantes sur k (#17).) Soient alors Pj , j = 1, . . . , q, les polynmes de lanneau direntiel k{W } que lon obtient en remplaant dans les membres gauches des .d.o. (8.1) les variables du systme, wi , i = 1, . . . , s, par les indtermines Wi . Si, et seulement si, lidal direntiel I dans k{W } engendr par les Pj , j = 1, . . . , q est premier, lanneau des fractions de lanneau quotient (des classes de rsidus) k{W }/I ne contient aucun diviseur de zro, et forme donc un corps direntiel, extension de k (comparer #16 et voir aussi la remarque la page 337). Or, comme les images canoniques wi rsultent des Wi en localisant, on a = k w ; et les quations satisfaites par les lments de correspondent (8.1). On se rend compte par cette construction que lextension de corps direntielle /k est indpendante du choix des gnrateurs w et de celui des quations de dpart. Ce qui est important, cest lidal direntiel I, et non pas ses gnrateurs. Exemple 8.1.1. La construction de lextension de corps direntielle dun modle de grue sera dtaille dans 8.12 (p. 357). Exemple 8.1.2. Loscillation dun pendule mathmatique est dcrite par l.d.o. + sin = 0. Au lieu de cette reprsentation non algbrique (explicite) on peut aussi utiliser une reprsentation en coordonnes cartsiennes, qui elle est algbrique (mais implicite). Avec x = sin et y = cos il vient (pour y = 0, donc = /2) : y 2 x + xy 3 + xx2 = 0 x2 + y 2 1 = 0. Finalement on peut aussi (pour = ) introduire z = tan(/2), et obtenir la reprsentation algbrique (implicite) (1 + z 2 ) 2z z 2 + (1 + z 2 )z = 0. z

Remarque 8.1.2. Comme les systmes (algbriques) direntiels continus discuts ici, on peut aussi dnir les systmes (algbriques) discrets, dcrits par des systmes (polynmiaux) dquations aux dirences (ordinaires) [17, 19, 20]. On se sert alors des anneaux et corps aux dirences. 335

8. Platitude et algbre diffrentielle

8.2

Platitude direntielle

Soit /k un systme algbrique. Platitude direntielle : Un systme /k est dit (direntiellement) plat, si une clture algbrique (non direntielle) prs, est un corps dextension purement transcendant de k (#17). Autrement dit, /k est (direntiellement) plat sil existe une base de transcendance direntielle y = (y1 , . . . , ym ) de /k, pour laquelle = k y . Une telle famille1 y est appele sortie plate de /k. Ici, dsigne la clture algbrique (#5) de , et k y celle de k y . Le nombre, m, des composantes dune sortie plate est (visiblement) gal au degr de transcendance direntiel de lextension /k. Considrons les relations entre les variables du systme et la sortie plate y soit = k w cette n. On dduit alors de la dnition de y : 1. Les composantes yi , i = 1, . . . , m, dune sortie plate y satisfont des relations de la forme Qi (yi , w, w, . . . , w(i ) ) = 0, i = 1, . . . , m,

avec Qi k{w}[yi ] des polynmes, quon peut rsoudre (localement)2 par rapport aux yi : yi = i (w, w, . . . , w(i ) ), i = 1, . . . , m.

Ceci dcoule directement de yi k w , i = 1, . . . , m. 2. Il nexiste aucune relation (non triviale) de la forme R(y, . . . , y () ) = 0, o R est un polynme de lanneau direntiel k{y}. Ceci quivaut deg tr di k y /k = m. 3. Toute variable du systme, z , sexprime en fonction de y et ses drives, car z = k y implique S(z, y, . . . , y () ) = 0, avec un polynme S k{w}[z], do la relation locale z = (y, . . . , y () ).
On observera que y joue un rle analogue celui dune base dun module libre (correspondant un systme commandable dans la thorie de [18, 52]). Un nom plus appropri pour y serait peut-tre paramtre fondamental pour ne pas parler de base dans ce contexte non linaire, mais le nom sortie plate (et le symbole y) sont bien tablis dans la littrature. 2 Comprendre le terme locale ici (et dans la suite) dans le sens que Qi /yi = 0, de sorte que lon peut appliquer le thorme des fonctions implicites dans un contexte mathmatique adapt.
1

336

8.2. Platitude direntielle Par la seconde de ces proprits, il est garanti que les trajectoires des composantes de la sortie plate y peuvent tre choisies indpendamment et librement (dans le sens quils ne doivent satisfaire aucune quation direntielle particulire). La troisime proprit implique la possibilit de calculer les trajectoires de toutes les variables partir de celles de y, sans tre oblig dintgrer une quation direntielle ; il sut de les driver. On peut donc rsumer : Un systme (diffrentiellement) plat est compltement, niment et librement direntiellement paramtrisable. Exemple 8.2.1. La platitude du modle dune grue sera discut en section 8.12 (p. 358). Cet exemple illustrera aussi lutilit de la clture algbrique dans la dnition de la platitude (voir la remarque la page 359). Remarques 8.2.1. 1. Observons que la dnition de la platitude est base directement sur le corps , sans en distinguer les gnrateurs : en termes de thorie du contrle, elle ne fait pas appel au concepts dentre ou dtat. 2. Il convient parfois de gnraliser la dnition en considrant un autre corps de base. On dnit ainsi la D-platitude [10] en demandant ce que D y = , avec D un sous-corps direntiel de . 3. On peut gnraliser le concept de platitude en admettant une transformation du temps, qui peut dpendre des variables du systme ; on parle alors de systmes orbitalement plats [24]. 4. Une autre possibilit de gnraliser la dnition discute ci-dessus consiste lever la restriction aux fonctions algbriques, une approche par la gomtrie direntielle est alors adapte [25] (ou aussi [43]). 5. Esquissons une explication pour lemploi du terme plat . Pour ceci, supposons (sans perte de gnralit) que les composantes yi , i = 1, . . . , m, de la sortie plate soient les m premires composantes de la famille w des variables du systme, et supposons donn q = s m quations indpendantes Pi (w, w, . . . , w() ) = 0, i = 1, . . . , q. Introduisons un espace de dimension innie (j) de coordonnes zi , i = 1, . . . , s, j 0, et considrons (localement autour de points rguliers ) les transformations entre les variables du systme, w, et de leurs drives et des variables zi , i = 1, . . . , m + q donnes par z i = y i = wi , zi = Pim (w, w, . . . , w
()

i = 1, . . . , m ), i = m + 1, . . . , s.

Alors on obtient les quations des drives des zi , i = 1, . . . , m+q, par drivation. La transformation dnie ainsi peut tre inverse sans intgration [30] ; car des relations wi = i (y, y, . . . , y (i ) ), i = 1, . . . , s, pour les sorties plates on dduit z = (z1 , . . . , zm ) wi = i (, z , . . . , z (i ) ), z i = 1, . . . , s. 337

8. Platitude et algbre diffrentielle Or, les q dernires composantes de z (et toutes leurs drives) sont gales zro (par les quations du systme). En revanche, les m premires composantes et leurs drives, cest--dire les composantes de z et leurs drives eux sont indpendantes. Ainsi les quations du systme reprsentent un sous-espace (li(j) naire, de dimension innie), avec les coordonnes zi , i = 1, . . . , m, j 0, de lespace en considration. Cet espace (linaire) peut tre interprt comme un hyper-plan, il est donc plat. Les quations dun systme direntiellement plat peuvent toujours tre donnes dans la forme particulire Si (wi , y, . . . , y (i ) ) = 0, i = 1, . . . , s. Il en dcoule une consquence intressante pour la construction de son extension de corps partir de lidal direntiel [S]. tant donn un systme de s quations de ce type, les membres gauches des quations (algbriques) Si = 0 peuvent tre vus comme des polynmes non direntiels en les wi , i = 1, . . . , s, avec des coecients appartenant au corps direntiel k y . Ceci simplie lanalyse de lidal direntiel engendr par les polynmes S = (S1 , . . . , Ss ) correspondants, mais en les indtermines W = (W1 , . . . , Ws ). En particulier, si Sj est de degr 1 en (l) wj , dans lanneau direntiel localis k y {W1 , . . . , Ws }/[S] on a wj k y , l 0, avec wj limage de Wj dans cet anneau. De mme on a wj k y , l 0, si Sj peut scrire dans la forme Sj = Wj2 + c2 , avec un c k y , ou dans la forme Sj = Wj2 d, avec d k y , qui ne peut tre reprsent comme d = e2 avec e k y . Si tous les membres gauches des quations du systme peuvent tre reprsents dans une de ces formes, il est clair que lanneau des rsidus ne comprend aucun diviseur de zro, et lidal [S] est donc premier (#3). Des simplications similaires peuvent tre discutes pour les polynmes de degr suprieur, lanalyse tant rduite la discussion de polynmes non direntiels en une seule indtermine. Exemple 8.2.2. On discutera la construction de lextension des corps partir dun idal direntiel pour lexemple de la grue dans la section 8.12 (p. 357).
(l)

338

8.3. Entres et dynamiques

8.3

Entres et dynamiques

Soit /k un systme algbrique. Entre : Une famille u = (u1 , . . . , um ) dlments de est appele une entre si lextension de corps direntielle /k u est direntiellement algbrique (#17). Une entre u est dite indpendante si elle forme une base de transcendance diffrentielle (#20) de k u /k. De manire quivalente, et peut-tre plus lgante, on peut dire : Une entre indpendante est une base de transcendance direntielle de /k ; alors on a m = deg tr di /k (voir #20), o m = card u. Si u est une entre de /k, alors pour tout lment de , cest--dire pour toute variable z du systme, il existe une quation direntielle de la forme Q(z, . . . , z () ) = 0, o Q est un polynme de k u {z}, cest--dire un polynme en z et ses drives, coecients dans k u . Ceci quivaut lexistence dune relation R(z, . . . , z () , u, . . . , u() ) = 0, avec R k{z, u} un polynme (direntiel) coecients dans k. Rciproquement, la famille u doit former une base de transcendance direntielle pour que de telles relations existent sans quil ny ait une relation (non triviale) du type R(u, . . . , u() ) = 0, avec R k{u}. Remarques 8.3.1. 1. Souvent les entres correspondent aux variables de commande du processus dont le systme est un modle, qui en gnral sont libres (ne doivent satisfaire aucune contrainte direntielle (.d.o.) particulire). Ainsi il convient souvent de les supposer indpendantes. 2. Lexistence dquations R = 0 (ou Q = 0) montre que, une fois une trajectoire pour u xe, celles des autres variables sen suivent par la solution d.d.o. 3. Le degr de transcendance direntiel deg tr di /k, et ainsi le nombre de composantes de toute entre, correspond au degr dindtermination du systme d.d.o. Il correspond la dirence entre le nombre de variables indpendantes et des quations (direntielles) indpendantes. Dynamique : Une extension de corps direntielle /k u , o u forme une entre de /k, est appele une dynamique dentre u. Une dynamique /k u est donc une extension de corps qui est direntiellement algbrique. Ainsi, le degr de transcendance direntiel de /k u est nul. 339

8. Platitude et algbre diffrentielle Ceci est quivalent ce que le degr de transcendance non direntiel (#12) de lextension de corps /k u , que lon dsigne par deg tr /k u , est ni (#22). On peut sen servir pour vrier si une famille u particulire forme une entre. Un cas spcial est donn si deg tr /k u nest pas seulement ni, mais gal zro : Dynamique triviale : Une dynamique /k u est dite triviale, si son degr de transcendance direntiel est gal zro : deg tr /k u = 0. Exemple 8.3.1. Une entre pour le systme de la grue sera choisie dans la section 8.12 (p. 357).

8.4

Systmes entre-sortie

Soit /k un systme algbrique. Sortie : Une sortie y = (y1 , . . . , yp ) est une famille dlments de . Systme entre-sortie : Si = k u, y et u est une entre, alors on appelle /k un systme entre-sortie, avec sortie y. Si k u, y , on appelle k u, y /k un sous-systme entre-sortie de /k. Le systme entre-sortie k u, y /k avec lentre u peut alors tre reprsent par p .d.o. de la forme Rj (yj , . . . , yj
(j )

, u, . . . , u(j ) ) = 0,

j = 1, . . . , p,

avec Rj , j = 1, . . . , p, des polynmes coecients dans k.

Inversion
On dnit des notions dinversibilit, qui dpendent du choix du corps k y (on parle dinversibilit et dinversion en analogie au linaire) mais non de celui dune entre u. Soit pour ceci /k un systme, avec deg tr di /k = m, et soit y = (y1 , . . . , yp ) une sortie. Rang de sortie : Le degr de transcendance direntiel de k y /k est appel le rang (direntiel) de sortie du systme /k (par rapport k y /k, ou y), que lon note y = deg tr di k y /k. Inversibilit : Le systme /k avec la sortie y est dit inversible droite si le rang de sortie est gal au nombre de composantes de la sortie : y = p. Il est dit inversible gauche si le rang de sortie est gal au nombre de composantes indpendantes dune entre : y = m = deg tr di /k. Le systme est dit inversible sil est inversible droite et gauche. 340

8.4. Systmes entre-sortie Remarque 8.4.1. De faon plus exacte, mais encombrante, on parlerait dinversibilit par rapport un sous-corps k y de (ou par rapport une sortie y). Si le systme /k est inversible droite par rapport une sortie y, alors les composantes de y sont dcouples : il nexiste aucune relation (non triviale) E(y, . . . , y () ) = 0, avec E k{y}, entre ses composantes. Si /k est inversible gauche par rapport une sortie y, alors lextension /k y est direntiellement algbrique. De mme on a lassertion rciproque, car avec deg tr di /k = deg tr di /k y + deg tr di k y /k (voir #27) le degr de transcendance direntiel deg tr di /k y est gal zro si, et seulement si, deg tr di k y /k = deg tr di /k = m. Il sensuit que dans un systme inversible gauche la sortie y peut jouer le rle dune entre (non ncessairement indpendante, car y min(m, p)). On observe quun systme inversible est quadratique : p = m. Soit = k u, y , et soit u une entre de /k. Le systme entre-sortie avec lentre y et la sortie u est alors le systme (entre-sortie) inverse (de celui dentre u et de sortie y). Remarque 8.4.2. On trouvera une formule pour le rang de sortie et un algorithme pour son calcul dans [15]. Dynamique inverse : Soit y la sortie dun systme inversible gauche /k, cest--dire y = deg tr di k y /k = deg tr di /k = m. Alors /k y forme une dynamique, avec entre y. On parle de dynamique inverse. Lentre y de la dynamique inverse est indpendante si /k est inversible (y = p = m).

Inversion et platitude
Un systme plat est inversible par rapport toute sortie plate y, car = k y , et ainsi deg tr di /k y = 0. Et, qui plus est, le degr de transcendance non direntiel deg tr /k y = 0 : La dynamique /k y est triviale (dans le sens de la section 8.3). Ceci permet de donner une autre caractrisation de la proprit de platitude : Sortie plate comme entre : Un systme /k est plat si, et seulement si, il existe une entre indpendante y du systme tendu /k, tel que la dynamique correspondante est triviale (cest--dire deg tr /k y = 0). Interprtant y comme une sortie (plate), on a /k y pour la dynamique inverse par rapport y associe /k, et cette dernire est triviale. Pour lentre dun systme plat on a donc 0 = Ai (ui , y, y, . . . , y () ), i = 1, . . . , m, 341

8. Platitude et algbre diffrentielle avec Ai , i = 1, . . . , m, des polynmes coecients dans k. Il en dcoule que le calcul de u partir dune sortie plate y et ses drives peut se faire sans rsoudre une .d.o. : le systme inverse na pas de dynamique, elle est triviale . En partant de cette caractrisation de la platitude, on peut classier les systmes par rapport leur dfaut (par rapport la platitude) [26] : Dfaut : Soit un sur-corps direntiel de k, tel que, une clture algbrique prs, lextension /k soit direntiellement purement transcendante et le degr de transcendance (non direntiel) deg tr / soit minimal (entre ces extensions). Alors on appelle deg tr / le dfaut du systme /k. Le dfaut est gal zro si, et seulement si, le systme /k est plat. Il est toujours ni, car pour nimporte quelle base de transcendance direntielle v de /k lextension /k v est direntiellement algbrique. Remarque 8.4.3. Si z est une base de transcendance direntielle de /k, le dfaut est gal la dimension dtat (voir la section 8.5) de la dynamique inverse par rapport z. Pour une paramtrisation complte du systme on doit spcier, en plus des m trajectoires pour une sortie plate, au maximum deg tr / trajectoires supplmentaires. Toutefois, une telle paramtrisation nest pas libre ! Une condition ncessaire pour la platitude peut tre donne en remplaant dans les quations du systme les drives par des variables non direntielles indpendantes entre elles [26, 48]. Condition ncessaire de platitude (Critre des surfaces rgles) : Soit = k w , avec w = (w1 , . . . , wm ) et les quations Pi (w, . . . , w() ) = 0, i = 1, . . . , q,

o Pi , i = 1, . . . , q, polynmes coecients dans k. Alors, si le systme /k est plat, il existe une famille a = (a1 , . . . , as ), ai k(0 , . . . , 1 ), i = 1, . . . , s, a = 0, telle que, pour des paramtres k arbitraires on a Pi (0 , . . . , 1 , + a) = 0, i = 1, . . . , q.

On peut interprter la solution de cette quation comme une surface dans le k-espace avec les coordonnes i , i = 0, . . . , . La condition signie alors que (dans des point rguliers) il existe une droite en direction des qui appartient la surface. Autrement dit, la projection de la surface dnie par S = 0 sur le sous-espace avec les coordonnes est une surface rgle, cest--dire engendre par des droites. Dmonstration (voir [26]) : Si /k est plat, et y est une sortie plate, alors il existe un nombre entier 0 tel que les drives w(i) , i = 0, . . . , 1, dpendent de 342

8.4. Systmes entre-sortie drives de y jusqu un certain ordre , que nous pouvons supposer minimal (tel que 1 ne sut pas) : w(j) = Sj (y, y, . . . , y () ), j = 0, . . . , 1.

En remplaant les w(j) , j = 0, . . . , , dans lquation P = 0 on obtient, cause de S1 () w = y (i+1) =: A(Y ) + B(Y ) y (+1) , y (i) (y,y,...,y() ) i=0 une quation que lon peut rcrire comme P (Y , A(Y ) + B(Y ) y (+1) ) = 0 en rassemblant les drives de y jusqu lordre dans Y . Maintenant on xe la valeur de Y et considre les composantes de y (+1) comme paramtres libres. Alors, si a appartient limage de lapplication B(Y ) la proprit nonce est donne. Exemple 8.4.1. Le critre des surfaces rgles pour dmontrer la non-platitude est discut dans la section 8.12 (p. 367) pour lexemple dun pendule sur un chariot.

Planication de trajectoires
La proprit de platitude permet une synthse systmatique de trajectoires, en particulier pour des transitions entre rgimes stationnaires. Souvent, au dbut dune telle transition on part dun point dquilibre. On peut dcrire ces points par les quations explicites (locales) z = (y, . . . , y () ), en substituant y (j) = 0, j > 0. Les points dquilibre sont alors paramtrs par les valeurs constants de y. La transition est entirement spcie par le choix dune trajectoire de rfrence pour une sortie plate, et comme y est direntiellement indpendant, les trajectoires pour ses composantes peuvent tre choisies indpendamment. A priori toutes les trajectoires de rfrence t yrf,i (t) sont loisibles ; des restrictions apparaissent toutefois par des singularits rencontres lors de la mise sous forme explicite des quations. Le calcul des trajectoires est particulirement simple si lon choisit des trajectoires polynmiales, car alors leurs coecients rsultent des valeurs de y du dbut (pour t = 0) et de la n de la transition (pour t = t ), comme solution dun systme dquations linaires. Plus gnralement, on obtient pour t = 0 et t = t des conditions pour les yi et toutes leurs drives jusqu un certain ordre i . En choisissant une paramtrisation polynmiale pour la trajectoire de yi le 343

8. Platitude et algbre diffrentielle degr du polynme ncessaire rsulte directement du nombre de ces conditions : Dans le cas de conditions il faut un polynme de degr 1. Si, par exemple, les drives de yi jusqu lordre 2 interviennent dans le calcul de u, et la trajectoire de u doit tre continue, alors on a 6 conditions, que lon peut satisfaire avec un polynme de degr 5 (ou plus), soit yrf,i (t) = ci,0 + ci,1 t + ci,2 t2 + ci,3 t3 + ci,4 t4 + ci,5 t5 . La valeur yrf,i (0) donne ci,0 = yrf,i (0). Les conditions yrf,i (0) = 0 et yrf,i (0) = 0 mnent ci,1 = ci,2 = 0, et les autres coecients (ci,3 , ci,4 et ci,5 ) satisfont le systme linaire yrf,i (t ) yrf,i (0) = ci,3 t3 + ci,4 t4 + ci,5 t5 0 = 3ci,3 t2 + 4ci,4 t3 + 5ci,5 t4 0 = 6ci,3 t + 12ci,4 t2 + 20ci,5 t3 . (8.3)

Il convient dintroduire une reparamtrisation par aj3 = Ainsi on a yrf,i (t) = yrf,i (0) + (yrf,i (t ) yrf,i (0)) t3 t3 a0 + a1 t t2 + a2 2 t t . (8.4) ci,j tj , yrf,i (t ) yrf,i (0) j = 3, 4, 5.

Les nouveaux coecients a0 , a1 et a2 rsultent (indpendamment des valeurs initiales et nales et lindex i) du systme linaire 1 = a0 + a1 + a2 0 = 3a0 + 4a1 + 5a2 0 = 6a0 + 12a1 + 20a2 , que lon obtient ou de (8.3) ou des conditions nales ; il vient a0 = 10, a1 = 15, a2 = 6. (8.5)

Lavantage de la paramtrisation (8.4) est que les coecients a0 , a1 , a2 sont indpendants des valeurs initiale et nale de la transition. Le calcul de trajectoires de rfrence est simple si le problme consiste en une transition sur un intervalle de temps ni, mme si ce ne sont pas des points dquilibre ; on peut utiliser (8.3) pour des valeurs arbitraires des drives initiales et nales. On peut, bien sr, aussi choisir dautres paramtrisations. Exemple 8.4.2. Une plus ample discussion de la planication de trajectoires se trouve, pour lexemple de la grue, dans la section 8.12 (p. 359). 344

8.5. tats gnraliss

8.5

tats gnraliss

tat gnralis : Un tat (gnralis) dune dynamique (algbrique) /k u est une base de transcendance (non direntielle) = (1 , . . . , n ) de /k u . Comme /k u est direntiellement algbrique, n = deg tr /k u est ni (#22) ; on lappelle la dimension dtat de la dynamique /k u . Ltat tant une base de transcendance de /k u , tout lment z de satisfait une quation de la forme (z, ) = 0, avec un polynme appartenant lanneau k u [z, ]. Ces relations scrivent, avec un polynme en z, , ainsi que u et ses drives et coecients dans k, dans la forme (z, , u, . . . , u() ) = 0. En particulier, on a pour la drive des composantes de Ai (i , , u, u, . . . , u(i ) ) = 0, ou bien, localement : i = Fi (, u, u, . . . , u(i ) ), i = 1, . . . , n. i = 1, . . . , n,

De la mme faon on obtient, pour des sorties y = (y1 , . . . , ym ), localement des relations de la forme yj = Hj (, u, u, . . . , u(j ) ), j = 1, . . . , p.

Si dans cette reprsentation dtat aucune drive de u napparat on parle dun tat classique et dune reprsentation dtat classique. Chaque base de transcendance de /k u forme un tat (gnralis). Si satisfait est un autre tat (gnralis) de /k u , alors chaque composante de une quation de la forme P (i , ) = 0, avec les coecients de P dans k u . Deux dune dynamique sont donc relis par une transformation dtat tats et (gnralise) du type j (i , , u, . . . , u(i ) ) = 0 i (i , , u, . . . , u(i ) ) = 0,

i = 1, . . . , n.

Pour les rendre explicites, ces quations peuvent encore tre rsolues (locale ment) par rapport i et i respectivement. On les appelle classiques si elle ne font pas intervenir lentre et ses drives. Notons que, contrairement au cas linaire, il nest pas possible, en gnral, dliminer les drives de lentre des reprsentations dtat gnralises en changeant dtat. Autrement dit, il nexiste pas toujours une reprsentation dtat 345

8. Platitude et algbre diffrentielle classique. On le comprend facilement partir dune condition ncessaire simple, que nous drivons. Si x est un tat classique, alors x est classique si, et seulement si, la trans formation entre x et x est classique : De x = (x) et x = f (x, u) il rsulte x= x f ((), u), x
x=() x

et de x = (x, u) et x = f (x, u) il dcoule que x= x f ((, u), u) + x


x=(,u),u x

u,
x=(,u),u x

qui dpend de u si dpend de u. En gnralisant ce calcul on obtient une condition ncessaire simple pour la ( ) rduction (de 1) de lordre maximal des drives ui i de ui . Pour simplier la dmarche supposons que lordre maximal soit gal i = , i = 1, . . . , m pour toutes les composantes de u. Alors, de x = (x, u, . . . , u(1) ) et x = f (x, u, . . . , u() ) on dduit x= x f ((, u, . . . , u(1) ), u, . . . , u() )+ x
x=(,u,...,u(1) ),u,...,u(1) x

(8.6)

1 i=0

u(i)

u(i+1) .
x=(,u,...,u(1) ),u,...,u(1) x

Par un choix appropri de /u(1) on peut liminer u() du membre droit de cette quation si la fonction f est ane en cette variable, cest--dire lquation (8.6) a la forme x = f1 (x, u, . . . , u(1) ) + f2 (x, u, . . . , u(1) ) u() . Il est vident quune condition ncessaire similaire existe pour la possibilit dliminer les drives dordre maximal individuel des composantes de u. On trouve une discussion complte, avec des conditions ncessaires et susantes3 dans [9].
3 Les conditions susantes correspondent lintgrabilit d.d.p. linaires dordre 1 pour les transformations dtat et sont donc bases sur le thorme de Frobenius.

346

8.6. tat de Brunovsk et forme de commande gnralise Remarque 8.5.1. Dans [13] (voir aussi [41]) il a t dmontr que lidal direntiel correspondant une reprsentation dtat (gnralise) avec une fraction rationnelle dans le membre droit, cest--dire xi = pi (x, u, . . . , u() ) , qi (x, u, . . . , u() ) i = 1, . . . , n,

avec pi , qi k[x, u, . . . , u() ], i = 1, . . . , n, est un idal premier (#3). Ainsi pour une telle reprsentation il existe toujours une extension de corps direntielle k x, u /k. Exemple 8.5.1. Un exemple dune dynamique nadmettant pas de reprsentation dtat classique est le sous-systme pendule du modle de grue [7] (voir section 8.12, p. 364).

8.6

tat de Brunovsk et forme de commande gnralise

Pour les systmes plats on peut dnir des tats particuliers, de Brunovsk, et une forme de commande gnralise correspondante, comme en linaire. Dynamique plate : Une dynamique /k u est appele (direntiellement) plate si le systme /k est (direntiellement) plat. tat de Brunovsk : Soit y = (y1 , . . . , ym ) une sortie plate dune dynamique plate /k u . Alors il existe une famille = (1 , . . . , m ) Nm telle que (avec (1) la convention que yi = ) x = (y1 , y1 , . . . , y1
(1 1) ( , y2 , . . . , ym m 1) )

(8.7)

forme un tat (gnralis) de la dynamique /k u ; un tel x est appel tat de Brunovsk de /k u . Dmonstration [10] : On choisit une base de transcendance y 0 y de lextension k u (y)/k u , et puis pour tout r 0 une base de transcendance y r y r1 (r) )/k u (y, . . . , y (r1) ). Ceci est possible, de lextension de corps k u (y, . . . , y car on a lgalit k u (y, . . . , y (r) ) = k u (y, . . . , y (r1) , y r1 ). Le degr de trans r , r 0, forme un tat de cendance deg tr /k u tant ni, la runion des y /k u . On peut lcrire comme x dans (8.7). Ceci dtermine les i = min{r (r) N | yi y r }, i = 1, . . . , m. Si au moins un des i est non nul, on peut renumroter les composantes de y tel que i > 0, i = 1, . . . , m m, i = 0, i = m + 1, . . . , m. 347

8. Platitude et algbre diffrentielle Si i = 0 pour tout i, choisissons m = 0 et x = . Une telle numrotation des composantes de y sera suppose dans la suite dans les cas o lindex m est i utilis. En plus, on dnit ni = j=1 j , i = 1, . . . , m. Forme de commande gnralise : Un tat de Brunovsk x dune dynamique plate /k u donne lieu une forme de commande gnralise : xj = xj+1 , 0 = j (yj , x, u, . . . , u(j ) ), j {1, . . . , n}\{n1 , . . . , nm }, j = m + 1, . . . , m,

0 = j (xnj , x, u, . . . , u(j ) ), j = 1, . . . , m,

avec j , j = 1, . . . , m, des polynmes coecients dans k, o j / xnj = 0, j = 1, . . . , m, et j /yj = 0, j = m + 1, . . . , m. Exemple 8.6.1. Un tat de Brunovsk et une forme de commande gnralise pour le sous-systme pendule de la grue seront construits en section 8.12 (p. 364).

8.7

quivalence par bouclages dtats quasi statiques

Pour la dnitions de bouclages dtats on se sert de ltrations de lextension de corps direntielle /k dnissant le systme [8] (cf. #28). Filtration entre-tat : Pour une dynamique /k u et un tat (gnralis) correspondant x, la ltration entre-tat U = (U r )rZ de /k est dnie comme suit : Ur = k pour r 2 U 1 = k(x) pour r = 1 r 0.

U r = k(x, u, u, . . . , u(r) ) pour

Une ltration entre-tat U = (U r )rZ pour une dynamique /k u est d nie de faon analogue. Les deux ltrations ont une dirence borne sil existe un entier r0 , tel que U r U r+r0 et U r U r+r0 pour tout r (cf. #28). Il est clair qualors = . quivalence par bouclages dtats : Deux dynamiques /k u et /k u sont dites quivalentes par bouclages quasi statiques dun tat dans X sil existe des tats de /k u et /k u tels que les ltrations entre-tat U de de /k u ont une dirence borne, et en plus U 1 = U 1 = X. /k u et U Les deux dynamiques sont dites quivalentes par bouclages statiques dun tat dans X si les ltrations entre-tat correspondantes concident, cest--dire si pour tout r Z on a U r = U r , et en plus U 1 = U 1 = X.

348

8.7. quivalence par bouclages quasi statiques Les relations dnies sont en eet des relations dquivalence. La symtrie et la reexivit en sont videntes. La transitivit est vidente pour le cas statique. Pour le cas quasi statique, soit /k u une troisime dynamique, avec un tat = (U r )rZ la ltration entre-tat correspondant x, x et X = k x . Soit U pour /k u . Pour lquivalence par bouclages quasi statiques dun tat dans X il vient alors : U r U r+r0 et U r U r+r0 , ainsi que U r U r+r1 et U r U r+r1 , r+r +r et U r U r+r +r , pour tout r, la transitivit pour tout r. Avec U r U 0 1 0 1 est dmontre. Lquivalence de deux dynamiques /k u et /k u , avec des tats respec tifs x et x, par bouclages statiques dun tat dans X implique lexistence de relations du type i,0 (ui , x, u, u, . . . , u(r0 ) ) = 0, u i,0 (i , x, u, u, . . . , u(r0 ) ) = 0,

i = 1, . . . , m,

et des relations analogues existent pour les drives dordres suprieurs :


(r) i,r (ui , x, u, u, . . . , u(r+r0 ) ) = 0,

u(r) i,r (i , x, u, u, . . . , u(r+r0 ) ) = 0,

i = 1, . . . , m, r > 0.

Dans ces relations, i,r , i,r , i = 1, . . . , m, r 0, sont des polynmes coecients dans k. Dans le cas statique aucune drive (dordre suprieur ou gal 1) des entres napparat. Remarque 8.7.1. Les ltrations entre-tat sont discrtes, excellentes et exhaustives (#28). Pour le dmontrer il faut prendre en compte que, pour les indices larges, dans la construction de U r+1 partir de U r on ajoute des ld ments dt z avec z U r , ce qui pour u(r+1) est une consquence de la construction de la ltration, et pour x une consquence de la reprsentation dtat gnralise. Pour les tats x de la dynamique /k u , la condition k(x) = k() implique x lexistence de relations du type j (xj , x) = 0, x j (j , x) = 0,

j = 1, . . . , n,

o les j , j , j = 1, . . . , n, sont encore des polynmes coecients dans k. Ainsi, contrairement aux reprsentations dtat gnralises, dans les transformations dtat admises dans les bouclages dtat aucune entre, ni ses drives, ne peuvent apparatre : Les transformations doivent tre classiques. Lutilit des bouclages dtat quasi statiques rsulte du fait que ltat (ou, plus exactement, le corps k x ) est invariant par ce genre de bouclages (par rapport linvariance voir aussi [51]). Dun point de vue pratique, ceci a lavantage quaucune dynamique supplmentaire nest introduite dans la boucle ferme. 349

8. Platitude et algbre diffrentielle Exemple 8.7.1. La construction dun bouclage dtat quasi statique pour la grue est discute en section 8.12 (p. 366).

Remarques 8.7.1. 1. Soulignons que lapparition des drives dans les quations des bouclages ne signie pas la ncessit de drivations (numriques) de signaux dentre (voir la section 8.9). Des discussions dtailles et des exemples se trouvent aussi dans [11, 12, 10, 54]. 2. Les bouclages dtat quasi statiques forment une classe spciale des bouclages endognes de [39, 26], que lon peut dnir comme suit. Deux systmes 1 /k et 2 /k sont dits quivalents par bouclages endognes si 1 = 2 . Contrairement aux bouclages dtat quasi statiques la dimension dtat nest pas prserve sous bouclages endognes. (En fait, la dnition des bouclages endognes ne fait pas appel aux notions dentre et dtat.) La synthse de bouclages endognes pour la poursuite de trajectoires stable mne, en gnral, des lois de commandes dynamiques, ncessitant lintgration dquations direntielles (voir par ex. [39, 26]). 3. Soit m = 1, et soit ltat utilis pour construire les ltrations entre-tat U et U un tat classique. Alors la dirence borne des deux ltrations U et U implique leur galit, cest--dire le bouclage quasi statique avec ltat x est un bouclage statique. On peut sen rendre compte en essayant, pour un systme x = f (x, u) avec m = 1 et u = 0 (x, u, u), de trouver des quations de la forme (i) = (x, u, . . . , u(i+r0 ) ), i 0. Ceci est impossible. Il sensuit, pour le cas i u m = 1 : Si x est un tat gnralis de /k u qui nest pas classique, alors il ne peut pas non plus tre un tat classique de /k u , car un bouclage statique dun tat k x ne modie pas lordre minimal des drives de lentre apparaissant dans la reprsentation dtat [10]. Ceci est une consquence du fait que x U , x U 1 et U r = U r , r Z impliquent x U , x U 1 . Des rsultats supplmentaires sur lquivalence par bouclages dtat quasi statiques pour des reprsentations dtat classiques se trouvent dans [51].

8.8

Linarisabilit par bouclages dtat quasi statiques

Forme de Brunovsk : Pour des nombres non ngatifs arbitraires 1 , . . . , m ( ) la dynamique k y, v /k v avec vi = yi i , i = 1, . . . , m, est appele une forme de Brunovsk. Il est vident quune forme de Brunovsk est une dynamique plate, dont y est une sortie plate. 350

8.8. Linarisabilit par bouclages quasi statiques

Linarisabilit par bouclages dtat quasi statiques : Une dynamique /k u est dite linarisable par bouclages dtat quasi statiques sil existe un tat x de /k u et une forme de Brunovsk, tels que cette dernire et /k u sont quivalentes par bouclages quasi statiques dun tat dans k(x). Remarque 8.8.1. Le problme de la linarisabilit par bouclages dtat quasi statiques est une gnralisation naturelle du problme bien tabli de la linarisabilit par bouclages dtat statiques pour les reprsentations dtat classiques, qui admet une solution complte dans le cadre de la gomtrie direntielle [33, 31, 59]. Dautres extensions sont la linarisabilit par bouclages dynamiques dans le sens de [2, 3], et, plus particulirement, par les bouclages endognes [26]. Le concept de la platitude t introduit dans ce contexte, et dans [23] on trouve la conjecture que les systmes linarisables par bouclages dynamiques sont juste les systmes plats. (Que les systmes plats soient linarisables par bouclages dynamiques est vident, partir de leur linarisabilit par bouclages dtats quasi statiques ou endognes.) Pour plus de dtails sur ces questions voir [39, 45], par exemple. Platitude et linarisabilit : Une dynamique /k u est linarisable par bouclages dtat quasi statiques si, et seulement si, elle est plate. Preuve [10] : On peut considrer un tat de Brunovsk, de vi = yi i , i = 1, . . . , m, et lutiliser pour construire la ltration tat-sortie pour ltat x et la sortie y, Y = (Y r )rZ , avec Yr = k Y 1 = k(x) pour pour r 2 r = 1 r 0.
( )

Y r = k(x, y, y, . . . , y (r) ) pour

Comme y est une sortie plate, la ltration Y est exhaustive dans , et ainsi k v (x) = . En plus, pour tout r Z, (x, v, v, . . . , v (r) ) est une famille k algbriquement indpendante dans . Or, v est une entre du systme /k, et x est un tat de la dynamique /k v . Dsignant la ltration entre-tat, pour x et v, par V, les ltration U et V ont une dirence borne (#28), car les ltrations entre-tat sont discrtes, excellentes et exhaustives dans (voir aussi la remarque p. 349). Comme x est un tat des deux dynamiques, /k u et /k v , elles sont quivalentes par un bouclage quasi statique de x, ou de nimporte quelle autre base de transcendance de k(x)/k. Pour dmontrer la ncessit il sut de constater que lquivalence par bouclages quasi statiques dun tat dans k(x) dune dynamique /k u et une forme de Brunovsk k y, v /k v implique = k y, v . Ainsi, toute forme de Brunovsk tant plate, /k lest aussi. 351

8. Platitude et algbre diffrentielle

8.9

Poursuite de trajectoires pour des systmes plats

Une mthode systmatique pour la poursuite de trajectoires pour les systmes plats (non linaires) sappuie sur leur linarisabilit par bouclages dtat quasi statiques. Elle permet une stabilisation exponentielle le long de trajectoires (non singulires). Les bouclages dtat linarisants transforment le systme de telle faon que yi
(i )

= vi ,

i = 1, . . . , m.

Pour cette dynamique, linaire commandable, une poursuite de trajectoires par un bouclage stabilisant (exponentiellement) est aise, il sut de prendre
i 1

vi = yr,ii +
j=0

( )

i,j (yi yr,i ),

(j)

(j)

i = 1, . . . , m.

Les yr,i , i = 1, . . . , m, seront ensuite remplacs par les trajectoires de rfrence. La dynamique de la boucle ferme est assigne en choisissant les paramtres ( ) i,j . Pour le calcul des drives de v on substitue vi = yi i , i = 1, . . . , m, et lon obtient ainsi, successivement, ces drives en fonction de ltat x et les drives des trajectoires de rfrence (pour i = 1, . . . , m et l 0) :
i 1l (l) vi i 1 (j+l) i,j (yi j=0

( +l) yr,ii

(j+l) yr,i )

+
r=i l

i,r (vi

(ri +l)

yr,i

(j+l)

).

Exemple 8.9.1. La poursuite de trajectoires est illustre sur lexemple de la grue en section 8.12 (p. 366).

8.10

Les systmes linaires tangents

Les systmes linaires coecients constants rsultent, le plus souvent, dune linarisation dun systme non linaire, modle dun processus, autour dun point dquilibre (dans lespace des variables du systme). En considrant, au lieu dun seul point, une trajectoire, la linarisation donne lieu un systme instationnaire. Pour le systme dquations Pi w, . . . , w() = 0, on obtient
s

i = 1, . . . , q,

Pi

(l) j=1 l=0 wj () (wrf (t),...,wrf (t))

dwj = 0,

(l)

i = 1, . . . , q.

Les quations du systme ainsi linaris sont donc les quations des petits (l) carts dwj , qui prennent leurs coecients dans le corps . Ces coecients 352

8.10. Les systmes linaires tangents dpendront donc du temps, une fois les trajectoires t wrf (t) substitues. Il d est clair que lon peut crire ces quations comme des relations [ dt ]-linaires entre les dwj . Dans le cadre de lalgbre direntielle cette linarisation se traite laide des direntielles de Khler (#24) :
d Systme linaire tangent : Soit /k un systme algbrique. Le [ dt ]-module /k des direntielles de Khler est appel le systme linaire tangent associ.

Le systme linaire tangent est dni en employant la k-drivation d/k : /k (voir #24). Soit = k w , avec w = (w1 , . . . , ws ) ; alors /k est le d [ dt ]-module engendr par les direntielles de Khler d/k wi , i = 1, . . . , s (voir #24). Pour chaque relation R(w, . . . , w() ) = 0 dans il existe une relation de d dpendance [ dt ]-linaire dans /k :
s

R wj
(l)

j=1 l=0

d dt

d/k wj = 0.

Ceci est vident. Ce qui est plus intressant, mais plus dicile dmontrer [35], d cest linverse : Si une famille d/k z dlments de /k est [ dt ]-linairement dpendante (resp. indpendante), alors z est direntiellement k-algbriquement dpendant (resp. indpendante). Ce fait ore une possibilit immdiate pour le calcul des degrs de transcendance (direntielles ou non) importants dans les systmes algbriques [15]. En plus, elle tablie un lien directe entre la platitude et la commandabilit du systme linaire tangent [26] ( propos de lemploi de voir #25) : Platitude et commandabilit du systme linaire tangent : Si le systme (algbrique) /k est plat, alors le systme linaire tangent de /k, cest--dire d le [ dt ]-module des direntielles de Khler /k , est libre. Si y est une sortie plate de /k, alors d/k y est une base de /k . On associe ainsi des modules libres des systmes plats. La commandabilit (libert) du systme linaire tangent est donc une condition ncessaire pour la platitude du systme algbrique. La rciproque, par contre, nest pas vraie en gnrale : Le systme linaire tangent associ un systme non plat peut tre libre (commandable). De mme on le rsultat suivant : Dfaut et sous-systme non commandable : Le dfaut dun systme algbrique /k est au moins aussi large que la dimension dtat du sous-systme non commandable du systme linaris tangent associ.

353

8. Platitude et algbre diffrentielle Dmonstration : Soit , la clture algbrique prs, un corps dextension direntiellement purement transcendant de k, tel que le degr de transcendance (non direntiel) deg tr / est minimal. Alors le dfaut du systme est gal deg tr /, et ce dernier est gal la dimension du -espace vectoriel des d direntielles de Khler4 / . Limage d/k de sous d/k est un [ dt ]sous-module libre de /k , donc un sous-systme du sous-systme commandable du systme linaire tangent /k . Ainsi / est isomorphe /k /d/k , et ce dernier contient un sous-module qui est isomorphe t/k , le sous-module de torsion (cest--dire la partie non commandable) de /k . La dimension du -espace vectoriel / est alors au moins aussi large que celle du -espace vectoriel t/k . Exemple 8.10.1. Un exemple dun systme non plat, un pendule sur un chariot, sera discut en section 8.12 (p. 367).

8.11

Observabilit

Soit /k un systme algbrique. Un systme /k est appel sous-systme de . /k dans le cas Observabilit [14] : Un sous-systme /k de /k est dit observable par une famille z si = k z . Un systme est dit observable si = k y, u . Autrement dit, un ensemble de variables du systme est observable par z si ses lments peuvent tre reconstruits de z (considr comme ensemble de mesures), cest--dire calcul de z et ses drives sans intgration. Pour lobservabilit du systme (tout court) on suppose que ce sont les u et y qui sont connus. On peut considrer le sous-systme k u, y /k de /k comme son sous-systme observable. Remarque 8.11.1. Une notion dobservabilit plus stricte (rationnelle) est obtenue en se passant de la clture algbrique [14]. Pour un systme plat, avec une sortie plate y, on obtient immdiatement de = k y larmation suivante. (Notons que lon ny a pas besoin de faire appel aux entres.) Observabilit par une sortie plate : Un systme plat /k est observable par nimporte quelle sortie plate. Finalement, on peut tablir le lien entre lobservabilit dun systme algbrique et le systme linaire tangent associ.
4

Lapplication d/ : / envoie les lments de 0 (voir #24).

354

8.12. Exemple : Une grue

Observabilit des systmes algbrique et linaire tangent : Un sous systme /k de /k est observable par une famille z si, et seulement si, le systme linaire tangent /k est observable par d/k z. Le systme /k est observable si, et seulement si, le systme linaire tangent /k associ /k est observable. Dmonstration : Il sagit dune consquence directe de lquivalence entre la dpendance k z -algbrique dune famille = (1 , . . . , r ) dlments de et de la dpendance -linaire des direntielles de Khler d/k z = (d/k z 1 , . . . , d/k z r ) (cf. #24 et #25). Remarque 8.11.2. La ralisation des bouclages dtat stabilisants ncessite la connaissance des tats. Si ces derniers ne sont pas mesurs directement, on peut, si le systme est observable par les mesures, construire un observateur. Cest un problme non trivial pour les systmes non linaires. Toutefois, pour les systmes plats (observables) on peut construire un observateur pour le systme linaire tangent autour des trajectoires de rfrence. Une commande stabilisante tant ralise pour la poursuite de ces trajectoires, on obtient une boucle ferme localement stable. On parle dobservateurs de poursuite dans ce cas [28, 29, 45]. Alternativement, des mthodes de calcul numrique rapide des drives des mesures proposes plus rcemment forment une approche intressante plus directement base sur lobservabilit [22].

8.12

Exemple : Une grue

Nous considrons une grue comme esquisse sur la gure 8.1. Pour simplier la discussion, supposons que le chariot et la charge sont toujours situs dans un mme plan vertical ; la gnralisation spatiale en est simple (voir section 8.12). Le modle mathmatique avec les variables X, Y, Dx , R, T, C, F , et scrit : mX = T sin mY = T cos + mg X = R sin + Dx Y = R cos x = F + T sin cd Dx MD J = C T cr R = . (8.8a) (8.8b) (8.8c) (8.8d) (8.8e) (8.8f) (8.8g)

Ici (X, Y ) dsigne les coordonns cartsiennes de la charge (dans un systme xe), Dx celle de la charge. Les autres variables sont T pour la force dans le cble, 355

8. Platitude et algbre diffrentielle

C F 0 Dx R M X

T Y

m
Fig. 8.1: Schma dune grue

R pour sa longueur, pour son angle avec la verticale, C pour le couple exerc au tambour du cble, sa vitesse angulaire, et F la force horizontale exerce au chariot. Les paramtres sont lacclration par la gravit g, les masses m, de la charge, et M , du chariot, ainsi que le moment dinertie J du tambour, son rayon , et les coecients de frottement visqueux cr et cd . Tous ces paramtres sont constants. En liminant langle entre le cble et la verticale, la force T et la vitesse angulaire on obtient une reprsentation algbrique (implicite) : (Y g)(X Dx ) = XY (X Dx )2 + Y 2 = R2 M Dx = F cd Dx mX J Y R = Y (C + cr R) + 2 mR(g Y ). (8.9a) (8.9b) (8.9c) (8.9d)

Ce systme dquations comprend deux parties : la premire dcrit le mouvement pendulaire de la charge xe au cble (avec les quations (8.9a) et (8.9b)), la 356

8.12. Exemple : Une grue seconde dcrit la cintique du chariot et du tambour ((8.9c) et (8.9d)). Pour la synthse dune loi de commande il conviendra de considrer ces deux parties sparment, en commenant par la synthse dune commande en boucle ouverte (ou ferme) pour le sous-systme pendule . Elle servira pour calculer les rfrences des boucles PID sous-jacentes [27, 26] voir aussi la remarque la p. 361.

Dnition de lextension de corps direntielle


Soit le corps direntiel de base k = Q g, M, J, cd , m, , cr . Comme tous les paramtres sont supposs constants on a k = Q g, M, J, cd , m, , cr = Q(g, M, J, cd , m, , cr ), un corps des fractions rationnelles coecients rationnelles. Ensuite, soit le corps direntiel dextension = k X, Y, R, Dx , F, C , dans lequel les relations non triviales sont donnes par (8.9). Il contient les fractions rationnelles en X, Y, R, Dx , F et C, avec des coecients appartenant k. Ainsi le systme est dni comme lextension de corps direntielle /k. Pour la construction de lextension de corps direntielle /k partir de lidal direntiel correspondant aux quations (8.9) (voir #16) on peux sappuyer sur une remarque dans la section 8.2. La structure particulire de (8.10) peut tre exploite. On travaille dans lanneau direntiel k X, Y {W1 , W2 } des polynmes direntiels en les indtermines W1 , W2 , coecients dans k X, Y . Dans cet anneau on considre les deux polynmes direntiels P1 = (Y g)(X W1 ) XY
2 P2 = (X W1 )2 + Y 2 W2 ,

quon extrait des membres gauches des quations (8.9a) et (8.9b), en remplaant Dx par W1 et R par W2 . La structure de P1 implique directement W1 k X, Y , donc k X, Y, W1 = k X, Y . Ensuite P2 peut tre considr comme un polynme appartenant lanneau direntiel k X, Y {W2 }. Soit = (X W1 )2 + Y 2 , pour simplier. Alors, la structure de P2 implique W2 k X, Y {}. Comme k X, Y lanneau direntiel k X, Y {} ne contient pas de diviseur de zro. Son corps de fractions est le corps direntiel k X, Y, R, Dx = k X, Y, R . Pour les variables F et C on obtient alors, de (8.9c) et (8.9d), que F k X, Y, R et C k X, Y, R , et ainsi = k X, Y, R . Une inspection des quations du systme, (8.9), sut ici pour constater que (F, C) est une base de transcendance direntielle de lextension de corps direntielle /k. Les quations (8.9) sont indpendantes, ce qui suit du fait que, en plus de X et Y , (8.9a) ne fait intervenir que Dx , (8.9b) fait intervenir R, (8.9c) fait intervenir F , et (8.9d) fait intervenir C. Somme tout il y a 6 variables du systme dans ces 4 quations indpendantes, et on a donc m = deg tr di /k = 2. On peut choisir (F, C) comme entre, ce qui donne la dynamique /k F, C . Pour le vrier, on pourrait montrer que les quations (8.9) peuvent tre rcrites tel que pour chacune des variables X, Y, R et Dx on obtient une .d.o. 357

8. Platitude et algbre diffrentielle algbrique coecients dans k F, C (correspondant aux quations Q = 0 en section 8.3). Mais cest compliqu, et peu utile. Il sut, plutt, de se servir du fait que le degr de transcendance non direntiel deg tr /k F, C est ni si, et seulement si, deg tr di /k F, C = 0, ce qui veut dire (F, C) est une entre (#22). En reprenant encore (8.9), on observe quune base de transcendance non direntielle de /k F, C est contenue dans z = (X, Y, R, Dx , X, Y , Dx , Y ). (Observons que z nest pas algbriquement indpendante sur k, suite (8.9b), et ne forme donc pas une base de transcendance de /k F, C .) Il en dcoule quune base de transcendance non direntielle de /k F, C est nie : De (8.9a) on dduit directement X k(z), et ainsi, de lquation obtenue en drivant k(z), de (8.9c) il rsulte Dx k F, C (z), et X k(z) ainsi que (8.9b), R k F, C (z) dcoulent de (8.9d). Par consquent, aussi toutes les drives Y suprieures de X, R, Dx et Y appartiennent k F, C (z). Une seconde dynamique, importante dans la synthse de la commande, rsulte du choix de u = (R, Dx ) comme entre. Le fait que lextension de corps diffrentielle /k u dnissant cette dynamique est direntiellement algbrique, cest--dire que deg tr di /k u = 0, est une consquence de = k u (X, X, Y, Y ). (On poursuivra ceci en section 8.12.) Pour reprsenter cette dynamique /k u il sut des quations (8.9a) et (8.9b). Avec cette interprtation, F et C sont dnis par (8.9c) et (8.9d) comme lments de k u (X, X, Y, Y ) = . Comme deg tr di /k = 2 = card u, lentre u = (R, Dx ) est galement indpendante. Linterprtation physique de la dynamique /k u rsulte des quations (8.9a) et (8.9b). Elle dcrit le mouvement de la charge induite par les modications de la longueur R du cble et de la position Dx du chariot.

Platitude
Le systme /k est plat, et les coordonns y = (X, Y ) de la charge en forment une sortie plate [6, 27, 26, 39]. La discussion dans la section prcdente nous a fait comprendre que Dx et R satisfont des quations algbriques (implicites) en y. Par une substitution de (X Dx ) dans (8.9b) on obtient les relations Dx = X R =
2

XY Y g
2

(8.10a) + Y 2. (8.10b)

XY Y g

Ainsi, on pourrait se servir de (8.10), (8.9c) et (8.9d) pour calculer des expressions de F et C en y et ses drives. Il en dcoule, pour les cltures algbriques des corps direntiels, k X, Y = k X, Y, R = . On observe galement que des deux relations (8.10) on ne peut pas liminer R et Dx en mme temps, ni X et Y , an dobtenir une .d.o. uniquement en y = (X, Y ), ou uniquement en u = (R, Dx ) : Les 2 quations en les 4 indtermines sont indpendantes. Ceci correspond au fait que y comme u sont 358

8.12. Exemple : Une grue direntiellement algbriquement indpendants sur k. (Comme lon a vu dans la section prcdente, le degr de transcendance direntiel deg tr di /k = 2, et avec ceci deg tr di /k = deg tr di k X, Y /k = 2.) Pour lextension de corps direntielle /k il en dcoule k y = , et y = (X, Y ) est donc direntiellement k-algbriquement indpendant. Par consquent, le systme /k est direntiellement plat, et y, la position de la charge, en forme une sortie plate. Ceci simplie la synthse de commandes, en boucles ouvertes ou fermes, pour le transport de la charge. On observe, sur les quations (8.10), que la dynamique inverse /k y par rapport la sortie plate y est triviale : Le degr de transcendance non direntiel de /k y est nul, /k y donc une extension de corps algbrique. Remarque 8.12.1. Cet exemple souligne quil convient dintroduire la clture algbrique du corps dans la dnition de la platitude : La variable R nest pas contenue dans le corps k X, Y , mais dans k X, Y si. Ceci correspond la prise en compte de relation implicites (quadratiques ici). Pour une grue dont le chariot peut tre dplac sur un plan horizontal, au lieu dune seule droite, on peut procder de faon analogue [26]. Avec une seconde coordonne horizontale Z et une position Dz du chariot dans cette direction, on obtient pour le sous-systme pendule (Y g)(X Dx ) = XY (Y g)(Z Dz ) = ZY (X Dx )2 + (Z Dz )2 + Y 2 = R2 . Encore les coordonnes de la charge (X, Y, Z) forment une sortie plate : Dx = X XY Y g ZY Dz = Z Y g R =Y +
2 2

XY Y g

ZY Y g

Comme dans le cas du mouvement dans le plan vertical, ce systme peut aisment tre tendu par des quations pour la dynamique du chariot et du tambour.

Planication de trajectoires
La grue est utilise pour transporter des charges entre deux positions de repos. Pendant un transport rapide, des mouvements pendulaires importants peuvent se produire. En prenant en compte leur dynamique (non linaire) on peut admettre ces mouvements, au lieu dessayer de les viter, tel quil serait 359

8. Platitude et algbre diffrentielle ncessaire pour rester dans un domaine dutilit dun modle linaris. Ainsi, il convient de planier une commande sur la base du sous-systme pendule , qui est susamment lent pour ne pas exciter les mouvements rapides non modliss, tout en tant assez rapide ce que des mouvements pendulaires importants de la charge se produisent. Le but sera alors darriver la position nale, de repos, sans quil y ait des oscillations de la charge. En se servant de la sortie plate y = (X, Y ) la synthse dune telle commande est largement simplie, car le problme est dni en ces coordonnes. La commande sensuit directement dune trajectoire de rfrence pour la sortie plate, t yrf (t) = Xrf (t), Yrf (t) , avec les quations (8.10) : Dx,rf (t) = Xrf (t) Xrf (t)Yrf (t) Yrf (t) g + Xrf (t)Yrf (t) Yrf (t) g
2

(8.11a)

Rrf (t) =

(Yrf

(t))2

(8.11b)

Notons quaucun paramtre napparat dans ces quations : Ainsi la commande est indpendante de la masse (inconnue) de la charge.

position initiale

position nale

obstacle de hauteur H

Fig. 8.2: Transport dune charge

Il faut donc choisir des trajectoires de rfrence pour X et Y , qui seront ensuite substitues dans les quations ci-dessus. On y voit que les trajectoires 360

8.12. Exemple : Une grue doivent tre au moins deux fois direntiables. Toutefois, ayant nglig les dynamiques du chariot et du tambour, il convient de demander plus de rgularit, par exemple des trajectoires trois fois direntiables, an de pouvoir les utiliser comme rfrences pour les contrleurs PD ou PID sous-jacents des moteurs lectriques (voir la remarque la p. 361). Les positions initiale et nale dterminent les valeurs initiale et nale des trajectoires de rfrence, Xrf (0), Yrf (0) et Xrf (t ), Yrf (t ) . Les positions initiale et nale devant tre des positions de repos, les valeurs initiales et nales des drives doivent tre nulles. En mme temps, il faut faire attention la condition Yrf (t) < g, sinon les valeurs de fractions intervenant dans les calculs ne seront pas bornes. Cette condition pour lacclration correspond en mme temps au fait que le cble doit toujours tre tendu, ce qui est une hypothse pour la drivation du modle. Le chemin parcouru par la charge dans le plan vertical, entre les deux positions de repos, est encore libre ; a permet dviter des obstacles de position et taille connues. On peut ainsi choisir, par exemple, un chemin parabolique contournant un obstacle de hauteur H (marges comprises) (voir la gure 8.2) : Yrf (Xrf ) = Y (0) H + H 2Xrf X(0) X(t ) X(0) X(t )
2

(8.12)

Les deux trajectoires pour X et Y sont ainsi dcouples, et il sut donc de choisir celle de la position horizontale X, par exemple. En choisissant celle de (8.12), les positions verticales de la charge au dbut et la n du transfert seront gales : Yrf (0) = Yrf (t ). On peut choisir une trajectoire polynmiale pour X, ce qui mne des quations linaires pour les paramtres. Ayant, somme tout, six conditions initiales et nales on a besoin dun polynme de degr 5 pour Xrf : Xrf (t) = Xrf (0) + Xrf (t ) Xrf (0) t3 t3 10 15 t t2 +6 2 t t . (8.13)

Le choix de t Xrf (t) xant ainsi le mouvement horizontal, le mouvement vertical suit du chemin parabolique calcul avec (8.12). Le choix dun temps de transport t susamment grand garantit que la condition sur laccelration, Y < g, sera respecte. Le temps minimal requis avec une trajectoire polynmiale de degr 5 peut tre calcul. Pour rduire ce temps, on peut choisir dautres paramtrisations de la trajectoire de rfrence t Xrf (t). On fera toutefois attention ne pas choisir des mouvements trop rapides, an de pouvoir ngliger les sous-systmes du chariot et du tambour avec leurs contrleurs (voir la remarque suivante). Remarques 8.12.1. Pour la ralisation de la commande on peut se servir de contrleurs PD ou PID au niveau du chariot et du tambour. Ils dterminent dune part la force F , ceci sur la base de lcart Dx = Dx Dx,rf entre la 361

8. Platitude et algbre diffrentielle position Dx du chariot et sa rfrence Dx,rf rsultant de la boucle extrieure, dautre part le couple C, partir de lcart R = R Rrf entre la longueur du cble et sa rfrence Rrf : F = Frf (t) + F = M Dx,rf (t) + cd Dx,rf (t) + mXrf (t) kP Dx kD Dx C = Crf (t) + C J cr mRrf (t)(g Yrf (t)) = Rrf (t) Rrf (t) + lP R lD R. (8.14b) Yrf (t) Pour le choix des paramtres kP , kD , lP et lD on peut regarder le comportement autour dun point stationnaire. Dans ces points le cble est en position verticale, avec des valeurs constantes (arbitraires) Xr = Dx,r et Yr = Rr et la force Tr = mg dans le cble. En linarisant le systme (implicite) (8.10) du sous-systme pendulaire, et les quations (8.8e) et (8.8f) du chariot et du tambour avec (8.8a), (8.8b) et (8.8g) on obtient X + g g X = Dx Rr Rr M Dx = F mX cd Dx J cr R = C + mR + R (8.15a) (8.15b) (8.15c)

(8.14a)

avec X = X Xrf . Bien sur, lquation (8.15a) dcrit les oscillations dun pendule mathmatique de longueur Rr . Les paramtres lP et lD des contrleurs PD (8.14b) pour le chariot peuvent tre choisis en spciant les valeurs propres du systme linaris (8.15c). La paramtrisation du contrleur PD (8.14a) du chariot est lgrement plus dlicate, car les quations (8.15b) et (8.15a) sont couples : Un mouvement de la charge induit un dplacement du chariot. On choisira donc les paramtres du contrleur PD pour rduire cet eet. Pour ceci on peut, en se servant de (8.15a), substituer la partie du contrleur (8.14a) qui est intressante pour les petits mouvements, savoir F = kP Dx kD Dx et puis X, dans (8.15b). On obtient ainsi M Dx = kP Dx kD Dx m ou encore Dx + kD + cd M Dx + kP mg + M M Rr Dx = mg X. M Rr g g Dx X Rr Rr cd Dx ,

On choisit ensuite les coecients dans ce systme selon kD + cd M 362 = 1 + 2 et mg kP + M M Rr = 1 2 , 2

8.12. Exemple : Une grue o 1 et 2 sont de lordre de grandeur de la constante de temps du pendule, g/Rr , et = 1/10. Il en rsultent les gains kP et kD . Avec ce choix des paramtres, le dplacement Dx du chariot oscille ( peu prs) dix fois plus rapidement que la charge, qui, quant elle, nexerce que peu dinuence sur le mouvement du chariot. La base de ce dcouplage entre mouvements lents et rapides est un argument de perturbations singulires [37, 60]. An dviter un cart permanent entre la position nale et sa consigne dans le cas dincertitude sur la masse m de la charge, il convient de complter le contrleur pour la longueur R du cble par une partie intgrale. En plus, on peut introduire un petit ltre pour raliser la partie drivateur. En outre une simplication peut galement tre envisag : On peut utiliser Frf = 0 et Crf = mg, au lieu des rfrences variables Frf (t) et Crf (t), dans (8.14).

Fig. 8.3: Simulation de la commande de la grue : Transfert horizontal avec une commande en boucle ouverte extrieure et des contrleurs PID en cascade.

Le rsultat dune simulation dun transfert horizontal de la charge, avec la commande en boucle ouverte base sur la platitude, est report sur la gure 8.3 ; les trajectoires de rfrence sont celles avec Yrf (t) = Yrf (0) et le polynme de degr 5 dans (8.13) pour Xrf (t). Pour comparer, la gure 8.4 montre les trajectoires obtenues sans la planication base sur la platitude, mais avec des consignes constantes pour la longueur du cble, Rrf (t) = R(0), et pour la position du chariot, Dx,rf (t) = Xrf (t ) (avec les mmes paramtres comme pour la gure 8.3). Enn le rsultat dune simulation dun transport le long dun chemin parabolique, tel que discut ci-dessus, est illustr dans la gure 8.5. Pour toutes les simulations les contrleurs PID discuts ci-dessus ont t utiliss. 363

8. Platitude et algbre diffrentielle

Fig. 8.4: Simulation de la commande de la grue : Transfert horizontal dans le mme intervalle que dans la gure 8.3, mais avec les consignes xes Rrf (t) = R(0) et Dx,rf (t) = Xrf (t ) pour les contrleurs PID.

Fig. 8.5: Simulation de la commande par platitude : Transport dune charge le long dun chemin parabolique.

Reprsentations dtat gnralises


La dimension dtat de la dynamique /k R, Dx est gale 2. En choisissant ltat x = (x1 , x2 ) avec x1 = Y , X Dx x2 = Y (X Dx ) (X Dx )Y

on obtient une reprsentation dtat (gnralise) dans laquelle aucune drive de la longueur de cble R napparat. Si lon remplace X, Y et leurs drives en 364

8.12. Exemple : Une grue se servant de (8.9a) et de (8.9b) x1 = x2 = x2 (1 + x2 ) 1 R2 (Dx x1 + g)R 1 + x2 1 (8.16a) . (8.16b)

(Notons que 1 + x2 = R/(X Dx ) est un lment de .) Cette reprsen1 tation pourrait tre utile si lon considre lacclration Dx du chariot avec la longueur R du cble comme entre. Dans ce cas il sagit dune reprsentation dtat classique pour la dynamique /k R, Dx x de cette reprsentation dtat (gnralise) de On peut liminer D /k R, Dx en choisissant un tat (gnralis) x avec les composants x1 = x1 et x2 = x2 1 + x2 Dx x1 R. Dans la reprsentation dtat (gnralise) rsultante 1 on voit apparatre les drives premires Dx et R : x (2 + Dx R1 ) 1 + x2 x 1 2 R x x x (2 + Dx R1 )2 x1 Dx (2 + Dx R1 ) x x2 = gR + R R 2 1 + x2 1 x1 = (8.17a) 1 + x2 1 x1 RDx . (8.17b)

Il nest donc pas possible dliminer la fois toutes les drives, cest--dire la dynamique /k R, Dx nadmet aucune reprsentation dtat classique [7]. Remarque 8.12.2. Notons quil y a des singularits pour R = 0 et pour Y = 0 ( cause dune division par zro). Toutefois, ceci na pas dimportance pratique, car le cble ne sera jamais compltement enroul et lon fera attention ce quil soit toujours pendant. La forme de commande gnralise associ la dynamique /k R, Dx et son tat gnralis = (X, X) peuvent galement tre dduits des quations du systme, (8.9a) et (8.9b) : 1 = 2 1 D x 2 = g R2 (1 Dx )2 + (2 Dx )2 RR R2 + R2 (RR (1 Dx )(2 Dx ))2 Dx (1 Dx ) R2 (1 Dx )2 avec X = 1 , Y = R2 (1 Dx )2 . (8.18c) (8.18a)

(8.18b)

(Notons encore que la racine

R2 (1 Dx )2 appartient au corps k X, Y .) 365

8. Platitude et algbre diffrentielle

Synthse dune commande pour la poursuite de trajectoires


La forme de commande (gnralise) trouve ci-dessus peut servir dans la synthse de la commande. En choisissant les entres v1 = X et v2 = Y ont obtient une forme de Brunovsk. Ce choix de v dnit un bouclage quasi statique de ltat . On voit sur (8.18b) et (8.18c) que v = (v1 , v2 ) dpend de , u, u et u. Pour trouver la loi de commande implmenter il faut toutefois exprimer u en fonction de , de v et les drives de ce dernier. Si lon se sert de la reprsentation dtat (8.18) pour retrouver les relations requises les calculs sont compliqus. En revanche il est simple de les dduire directement des quations implicites (8.9) du systme. Il sut de remplacer, dans (8.10a) et (8.10b), les variables X par v1 , Y par v2 , Y par v2 et X par 1 : v1 v2 D x = 1 (8.19a) v2 g R2 = v1 v2 v2 g
2 2 + v2 .

(8.19b)

On sest servi ici de la reprsentation dtat explicite (8.18), et lon rsoudra aussi (8.19b) en utilisant la racine positive, car la longueur R du cble est toujours positive. Ainsi, aussi pour la commande, les quations implicites font apparatre une singularit (2 = g) que lon devra surveiller dans le calcul des v commandes. On voit cette singularit galement dans la dnition du bouclage dtat : Les quations du sous-systme pendule sont donnes par (8.9a) et (8.9b), celle de la commande par (8.19). Utilisant (8.19a) et 1 = X dans (8.19b) et 2 soustrayant (8.19b) de (8.9b) on obtient Y 2 = v2 , cest--dire Y est ou bien gal +v2 , ou bien v2 . Mais la commande a t obtenue en choisissant Y = v2 . Quest-ce qui cest pass ? Pour la commande on utilise (8.19). Le systme dquations rsultant de la loi de commande implicite et des quations implicites du modle admet deux branches de solution. Toutefois, dun point de vue pratique, il est clair que lon choisira v2 > 0, R > 0 (et la position de rfrence verticale positive, pour viter le voisinage de la singularit zro). La branche de la solution correspondante est Y = v2 . Remarque 8.12.3. Dans le cadre algbrique les deux branches de la solution correspondent la construction de deux idaux direntiels premiers, I1 et I2 , tels que leur intersection correspond lidal direntiel I engendr par les polynmes dans les quations (8.18) et (8.19) ; ce dernier nest pas premier (#3). Ainsi I1 contient lantcdent de (Y v2 ), et I2 celui de (Y + v2 ), alors que I 2 ne contient que lantcdent de (Y 2 v2 ) mais ni celui de (Y v2 ) ni celui de (Y +v2 ). Ce nest quen choisissant un des idaux premiers, I1 ou I2 , que lon peut construire le corps reprsentant le systme de la boucle ferme. La construction de bouclages dtats par le choix dune nouvelle entre v dans le corps du systme est donc avantageux. Le fait de rester dans le corps correspond au choix dune branche de la solution. 366

8.12. Exemple : Une grue La stabilisation autour de la trajectoire de rfrence est acquise en employant le bouclage dtat supplmentaire (linaire) v1 = Xrf (t) + k1 (2 Xrf (t)) + k0 (1 Xrf (t)) v2 = Yrf (t) (8.20a) (8.20b)

avec des paramtres (gains) constants R k0 , k1 < 0. Ainsi on obtient une dynamique linaire et stable pour lerreur de poursuite (X Xrf (t), Y Yrf (t)). La drive v2 apparaissant dans (8.19) est remplace par Yrf (t). Remarques 8.12.2. 1. La sortie plate y complte ne peut tre inclue dans ltat de la dynamique /k R, Dx , car avec (8.9b) les deux composantes sont relies par une quation polynmiale coecients dans k R, Dx . 2. On pourrait aussi choisir une dynamique dordre deux pour lerreur dans la direction verticale, en utilisant ltat = (Y, Y ) de /k R, Dx . Toutefois, en inspectant les symtries du problme tridimensionnel (au lieu du mouvement dans un plan vertical, voir section 8.12) on comprend que le choix fait est plus naturel : Les coordonnes dans les directions des x et des z sont sur le mme pied. On peut dplacer ou tourner le systme des coordonnes du plan horizontal, sans quil nen rsulte une modication des quations. Il convient ainsi dassocier des chanes dintgrateurs de la mme longueur, 2, aux coordonnes X et Z de la charge. On trouvera plus de rsultats sur les symtries et les bouclages invariants correspondants dans [49, 40].

Un pendule sur un chariot : exemple dun systme non plat


En remplaant le cble de la grue par une barre de longueur xe de masse ngligeable on obtient un pendule avec un point de suspension bougeant sur une droite horizontale (avec le chariot). (On peut, bien sr, galement reprsenter nimporte quel pendule physique planaire par un pendule mathmatique quivalent.) On obtient ainsi un modle du mouvement en substituant R = 0 dans (8.9) : (Y g)(X Dx ) = XY (X Dx )2 + Y 2 = R2 M Dx = F cd Dx mX, la longueur R tant maintenant un paramtre constant. En analogie avec la dmarche pour la grue on peut asservir la position Dx du chariot, avec une structure cascade, tel que le systme en considration se rduit (Y g)(X Dx ) = XY (X Dx )2 + Y 2 = R2 . (8.21a) (8.21b)

Alors les variables du systme sont les coordonnes X, Y de la charge et celle du chariot Dx , et le corps direntiel du systme est k X, Y, Dx , car g, R k. 367

8. Platitude et algbre diffrentielle Nous vrions que le systme k X, Y, Dx /k nest pas plat. Une premire possibilit est donne par lanalyse du systme linaire tangent k X,Y,Dx /k . Ces quations rsultent de (8.21) : (X Dx ) dY + (Y g) (dX dDx ) X dY Y dX = 0 (X Dx ) (dX dDx ) + Y dY = 0. (8.22a) (8.22b)

Lanalyse est simpli par le choix dun point dquilibre particulier. (Les quations valables autour dun point particulier rsultent de celles de k X,Y,Dx /k , bien que ce ne soit pas le mme systme.) Sil existe un point dquilibre autour duquel le linaris est commandable, alors k X,Y,Dx /k est galement commandable. Par contre, on ne peut pas dduire la non-commandabilit de k X,Y,Dx /k de la non-commandabilit autour dun point particulier. Considrons donc dabord des points dquilibre, avec le pendule dans une de ces positions verticales, o X = Dx . Alors, de (8.22) on obtient, bien sr, lquation de loscillateur linaire g (dX dDx ) Y dX = 0, ou encore dX + g g dX = dDx . Y Y

Ce systme linaire constant admet une base (sortie plate) dX. Il est donc commandable, et k X,Y,Dx /k aussi. Lanalyse de la commandabilit du systme linaris ne permet donc pas de conclure sur la platitude du systme k X, Y, Dx /k. Remarque 8.12.4. Dmontrer la commandabilit du systme linaire tangent (instationnaire) k X,Y,Dx /k , obtenu en linarisant autour de trajectoires, en exhibant une sortie plate (base) est un peu plus compliqu. On peut dabord liminer dDx avec (8.22b) : (X Dx )2 dY + (Y (Y g) + (X Dx )X) dY + (X Dx )Y dX = 0. Cette quation a la forme dX dY = dY avec = On montre alors que b = ( + ) (dX dY ) + 2(dX dY + dY ) est une base du module k 368
X,Y,Dx /k .

Y g X + (X Dx ) Y

et =

X Dx . Y

8.12. Exemple : Une grue Nous avons vu que nous ne pouvons pas rpondre la question de la platitude du systme k X, Y, Dx /k uniquement sur la base du systme linaire tangent. Considrons donc une autre condition ncessaire, le critre des surfaces rgles de la section 8.4). Essayons dabord de lappliquer aux quations (8.21). Pour ceci considrons les variables du systme et leurs drives comme des grandeurs indpendantes, et notons 1,0 pour X, 1,1 pour X, 1,2 pour X et 2,i , i = 0, 1, 2, pour Y , Y et Y , ainsi que 3,i , i = 0, 1, 2, pour Dx , Dx et Dx . Avec ces notations, le systme dquations algbrique tudier scrit (2,2 g)(1,0 3,0 ) = 1,2 2,0
2 (1,0 3,0 )2 + 2,0 = R2 .

Si ce systme est plat, il existe a1 , a2 , a3 k(1,0 , 2,0 , 3,0 , 1,1 , 2,1 , 3,1 ) tels que, pour des k arbitraires on ait (2,2 + a2 g)(1,0 3,0 ) = (1,2 + a1 )2,0
2 (1,0 3,0 )2 + 2,0 = R2 .

On voit que cette condition est satisfaite avec a = (0, 0, a3 ) pour des a3 arbitraires. Appliquer le critre des surfaces rgles aux quations (8.21) ne permet donc pas non plus de rpondre la question de la platitude du systme k X, Y, Dx /k. Toutefois, cette condition ncessaire dpend du choix des quations considres. On le verra tout de suite. En posant R = 0 dans la reprsentation dtat (gnralise) (8.17) pour la grue (p. 365) on obtient une reprsentation dtat pour le mouvement horizontal du pendule dans la forme x (2 + Dx R1 ) 1 + x2 x 1 2 R x x x (2 + Dx R1 )2 x1 Dx (2 + Dx R1 ) x x2 = gR + R R 2 1 + x2 1 x1 = (8.23a) 1 + x2 1 , (8.23b)

Y avec x1 = XDx et x2 = x2 1 + x2 Dx x1 R. An dappliquer le critre des 1 surfaces rgles de la section 8.4, introduisons 1,0 = x1 , 1,1 = x1 , 2,0 = x2 , 2,1 = x2 , 3,0 = Dx et 3,1 = Dx . Il vient

1,1 =

(2,0 + 3,1 R1,0 ) R2

2 1 + 1,0

(8.24a) (8.24b)

2 3,1 (2,0 + 3,1 R1,0 ) 1 + 1,0 2 2,1 = gR + (2,0 + 3,1 R1,0 ) 1,0 . R 2 R2 1 + 1,0

369

Bibliographie Si le systme est plat, alors il est possible de trouver a1 , a2 , a3 k(1,0 , 2,0 , 3,0 ) tels que, pour des k arbitraires, on ait 1,1 + a1 = (2,0 + (3,1 + a3 )R1,0 ) 2 1 + 1,0

R2 2,0 + (3,1 + a3 )R1,0 )2 1,0 ( 2,1 + a2 = gR + R2 1 + 2


1,0

2 (3,1 + a3 )(2,0 + (3,1 + a3 )R1,0 ) 1 + 1,0 R

En prenant en compte (8.24), qui correspondent au cas = 0, la premire de ces quations donne 1,0 a1 = a3 2 1 + 1,0 R ,

alors que la seconde mne une quation quadratique pour a3 . Pour des k arbitraires, celle-ci ne peut tre satisfaite quavec a3 = 0. Mais ceci implique ncessairement a1 = 0 et a2 = 0, et le systme k X, Y, Dx /k nest donc pas plat. Une autre possibilit pour dmontrer que ce systme nest pas plat sappuie sur le fait quil sagit dun systme admettant une seule entre indpendante. Comme discut en section 8.7 (voir la remarque la p. 350), dans le cas m = 1 un bouclage dtat quasi statique dun tat classique est ncessairement un bouclage dtat statique. Lquivalence dun systme plat une forme de Brunovsk, ayant une reprsentation dtat classique, implique que la forme de commande du systme est galement classique. Si elle est plate, la dynamique k X, Y, Dx /k Dx doit donc admettre une reprsentation dtat classique. Le membre droit de la reprsentation dtat gnralise (8.23) de la dynamique k X, Y, Dx /k Dx nest pas ane par rapport la drive dordre maximal Dx de Dx . Ceci implique, avec la condition ncessaire de la section 8.5, que lon ne peut pas liminer Dx par le choix dun autre tat gnralis : Aucune reprsentation classique nexiste, et le systme k X, Y, Dx /k ne peut donc pas tre plat5 .

8.13

Bibliographie

[1] Bass, H., A. Buium et P. J. Cassidy (rdacteurs): Selected works of Ellis Kolchin with commentary. Amer. Math. Soc., 1999.
Finalement, on peut aussi dmontrer que k X, Y, Dx /k nest pas plat en introduisant une reprsentation dtat classique (par ex. (8.16), en interprtant Dx comme entre, ou encore en incluant les quations direntielles du chariot et considrant la force F comme entre). Alors on peut se servir des conditions de linarisabilit par bouclage dtat statique (rgulier) issu de la gomtrie direntielle [33, 31, 59, 32, 42, 58]. Elle ne sont pas satisfaites. Comme il sagit dun systme avec une seule entre, ane, ceci implique la non-platitude du systme.
5

370

Bibliographie [2] Charlet, B., J. Lvine et R. Marino: On dynamic feedback linearization. Systems Control Lett., 13 :143151, 1989. [3] Charlet, B., J. Lvine et R. Marino: Sucient conditions for dynamic state feedback linearization. SIAM J. Control Optim., 29 :3857, 1991. [4] Cohn, P. M.: Algebra, tome 2. John Wiley & Sons, Chichester, 2"a dition, 1989. [5] Cohn, P. M.: Algebra, tome 3. John Wiley & Sons, Chichester, 2"a dition, 1991. [6] dAndra-Novel, B. et J. Lvine: Modelling and nonlinear control of an overhead crane. Dans Kaashoek, M. A., J. H. van Schuppen et A. C. M. Ran (rdacteurs) : Robust Control of Linear and Nonlinear Systems, MTNS89, tome 2, pages 523529. Birkhuser, Boston, 1990. [7] Delaleau, E.: Lowering orders of input derivatives in generalized state representations of nonlinear systems. Dans Fliess, M. (rdacteur) : Nonlinear Control Systems Design 1992, Selected papers from the 2nd IFAC symposium, pages 347351. Pergamon Press, Oxford, 1993. [8] Delaleau, E. et M. Fliess: Algorithme de structure, ltrations et dcouplage. C. R. Acad. Sci. Paris Sr. I Math., 315 :101106, 1992. [9] Delaleau, E. et W. Respondek: Lowering the orders of derivatives of controls in generalized state space systems. J. Math. Systems Estim. Control, 5 :1 27, 1995. (Summary : 375378). [10] Delaleau, E. et J. Rudolph: Control of Flat Systems by Quasi-Static Feedback of Generalized States. Internat. J. Control, 71 :745765, 1998. [11] Delaleau, E. et P. S. Pereira da Silva: Filtrations in feedback synthesis : Part I Systems and feedbacks. Forum Math., 10 :147174, 1998. [12] Delaleau, E. et P. S. Pereira da Silva: Filtrations in feedback synthesis : Part II Input-output decoupling and disturbance decoupling. Forum Math., 10 :259275, 1998. [13] Diop, S.: Dierential-algebraic decision methods and some applications to system theory. Theor. Computer Sci., 98 :137161, 1992. [14] Diop, S. et M. Fliess: On nonlinear observability. Dans Proc. 1st European Control Conference, pages 152157, Grenoble, France, 1991. [15] El Asmi, S. et M. Fliess: Formules dinversion. Dans Bonnard, B., B. Bride, J. P. Gauthier et I. Kupka (rdacteurs) : Controlled Dynamical Systems, tome 8 de Progr. Systems Control Theory, pages 201210. Birkhuser, Boston, 1991. [16] Fliess, M.: Automatique et corps direntiels. Forum Math., 1 :227238, 1989. 371

Bibliographie [17] Fliess, M.: Automatique en temps discret et algbre aux dirences. Forum Math., 2 :213232, 1990. [18] Fliess, M.: Some basic structural properties of generalized linear systems. Systems Control Lett., 15 :391396, 1990. [19] Fliess, M.: Reversible linear and nonlinear discrete-time dynamics. IEEE Trans. Automat. Control, AC37 :11441153, 1992. [20] Fliess, M.: Invertibility of causal discrete time dynamical systems. J. of Pure and Applied Algebra, 86 :173179, 1993. [21] Fliess, M. et S. T. Glad: An algebraic approach to linear and nonlinear control. Dans Trentelman, H. L. et J. C. Willems (rdacteurs) : Essays on Control : Perspectives in the Theory and its Applications, tome 14 de Progr. Systems Control Theory, pages 223267. Birkhuser, Boston, 1993. [22] Fliess, M., C. Join et H. Sira-Ramrez: Non-linear estimation is easy. 2007. [23] Fliess, M., J. Lvine, P. Martin, F. Ollivier et P. Rouchon: Flatness and dynamic feedback linearizability : two approaches. Dans Isidori, A., S. Bittanti, E. Mosca, A. De Luca, M. D. Di Benedetto et G. Oriolo (rdacteurs) : Proc. 3rd European Control Conference, pages 649654, 1995. [24] Fliess, M., J. Lvine, P. Martin et P. Rouchon: Linarisation par bouclage dynamique et transformations de Lie-Bcklund. C. R. Acad. Sci. Paris Sr. I Math., 317 :981986, 1993. [25] Fliess, M., J. Lvine, P. Martin et P. Rouchon: A Lie-Bcklund approach to equivalence and atness of nonlinear systems. IEEE Trans. Automat. Control, AC44 :922937, 1999. [26] Fliess, M., J. Lvine, Ph. Martin et P. Rouchon: Flatness and defect of non-linear systems : introductory theory and examples. Internat. J. Control, 61 :13271361, 1995. [27] Fliess, M., J. Lvine et P. Rouchon: Generalized state variable representation for a simplied crane description. Internat. J. Control, 58 :277283, 1993. [28] Fliess, M. et J. Rudolph: Local tracking observers for at systems. Dans Proc. Symposium on Control, Optimization and Supervision, Computational Engineering in Systems Application, IMACS Multiconference, Lille, July 9 12 1996 (CESA96), pages 213217, 1996. [29] Fliess, M. et J. Rudolph: Corps de Hardy et observateurs asymptotiques locaux pour systmes direntiellement plats. C. R. Acad. Sci. Paris Sr. IIb, 324 :513519, 1997. [30] Hilbert, D.: ber den Begri der Klasse von Dierentialgleichungen. Math. Ann., 73 :95108, 1912. 372

Bibliographie [31] Hunt, L. R., R. Su et G. Meyer: Design for multi-input nonlinear systems. Dans Brockett, E. W. (rdacteur) : Dierential Geometric Control Theory, pages 258298. Birkhuser, Boston, 1983. [32] Isidori, A.: Nonlinear Control Systems. Springer-Verlag, Berlin, 3"a dition, 1995. [33] Jakubczyk, B. et W. Respondek: On linearization of control systems. Bull. Acad. Polonaise Sci. Sr. Sci. Math., 28 :517522, 1980. [34] Johnson, J.: Dierential dimension polynomials and a fundamental theorem on dierential modules. Amer. J. Math., 91 :239248, 1969. [35] Johnson, J.: Khler dierentials and dierential algebra. Ann. of Math., 89 :9298, 1969. [36] Kaplansky, I.: An introduction to dierential algebra. Hermann, Paris, 2"a dition, 1976. [37] Kokotovi, P., H. K. Khalil et J. OReilly: Singular perturbation methods in control : analysis and design. Academic Press, London, 1986. [38] Kolchin, E. R.: Dierential Algebra and Algebraic Groups. Academic Press, New York, 1973. [39] Martin, P.: Contribution ltude des systmes direntiellement plats. Thse de Doctorat, cole Nationale Suprieure des Mines de Paris, 1992. [40] Martin, P., R. M. Murray et P. Rouchon: Flat systems. Dans Bastin, G. et M. Gevers (rdacteurs) : Plenary Lectures and Mini-Courses, 4th European Control Conference, Brussels, Belgium, pages 211264. 1997. [41] Moog, C. H., J. Perraud, P. Bentz et Q. T. Vo: Prime dierential ideals in nonlinear rational control systems. Dans Proc. Symposium on Nonlinear Control Systems Design (NOLCOS89), pages 178182, Capri, Italy, 1989. [42] Nijmeijer, H. et A. J. van der Schaft: Nonlinear Dynamical Control Systems. Springer-Verlag, New York, 1990. [43] Pomet, J. B.: A dierential geometric setting for dynamic equivalence and dynamic linearization. Dans Jakubczyk, B., W. Respondek et T. Rzeuchowski (rdacteurs) : Geometry in Nonlinear Control and Dierential Inclusions, tome 32 de Banach Center Publ., pages 319339. Banach Center, Warszawa, 1995. [44] Ritt, J. F.: Dierential Algebra. American Mathematical Society, New York, 1950. [45] Rothfu, R.: Anwendung der achheitsbasierten Analyse und Regelung nichtlinearer Mehrgrensysteme. Fortschritt-Berichte, Reihe 8, Nr. 664. VDI-Verlag, Dsseldorf, 1997. 373

Bibliographie [46] Rothfu, R., J. Rudolph et M. Zeitz: Flatness Based Control of a Nonlinear Chemical Reactor Model. Automatica J. IFAC, 32 :14331439, 1996. [47] Rouchon, P.: Flatness and robust control of pendulum mechanical systems. Technical report 469, Centre Automatique et Systmes, cole des mines de Paris, June 1994. [48] Rouchon, P.: Necessary condition and genericity of dynamic feedback linearization. J. Math. Systems Estim. Control, 5 :345358, 1995. [49] Rouchon, P. et J. Rudolph: Invariant tracking and stabilization. Dans Aeyels, D., F. Lamnabhi-Lagarrigue et A. van der Schaft (rdacteurs) : Stability and Stabilization of Nonlinear Systems, tome 246 de Lecture Notes in Control and Inform. Sci., chapitre 14, pages 261273. Springer-Verlag, 1999. [50] Rouchon, P. et J. Rudolph: Racteurs chimiques direntiellement plats : planication et suivi de trajectoires. Dans Corriou, J. P. (rdacteur) : Commande de procds chimiques Racteurs et colonnes de distillation, chapitre 5, pages 163200. Herms Science Publications, 2001. [51] Rudolph, J.: Well-formed dynamics under quasi-static state feedback. Dans Jakubczyk, B., W. Respondek et T. Rzeuchowski (rdacteurs) : Geometry in Nonlinear Control and Dierential Inclusions, tome 32 de Banach Center Publ., pages 349360. Banach Center, Warszawa, 1995. [52] Rudolph, J.: Beitrge zur achheitsbasierten Folgeregelung linearer und nichtlinearer Systeme endlicher und unendlicher Dimension. Shaker Verlag, 2003. [53] Rudolph, J.: Flatness based control of distributed parameter systems. Berichte aus der Steuerungs- und Regelungstechnik. Shaker Verlag, Aachen, 2003. [54] Rudolph, J. et E. Delaleau: Some examples and remarks on quasi-static feedback of generalized states. Automatica J. IFAC, 34 :993999, 1998. [55] Rudolph, J. et S. El Asmi: Filtrations and Hilbert polynomials in control theory. Dans Helmke, U., R. Mennicken et J. Saurer (rdacteurs) : Systems and Networks : Mathematical Theory and Applications, (MTNS93, Invited and Contributed Papers), tome 2, pages 449452. Akademie Verlag, 1994. [56] Seidenberg, A.: Some basic theorems in dierential algebra. Trans. Amer. Math. Soc., 73 :174190, 1952. [57] Sira-Ramrez, H. et S. K. Agrawal: Dierentially Flat Systems. Marcel Dekker, 2004. [58] Slotine, J. J. E. et J. W. Li: Applied Nonlinear Control. Prentice-Hall, Englewood Clis, 1991. 374

8.A. Bases mathmatiques [59] Sommer, R.: Control design for multivariable non-linear time-varying systems. Internat. J. Control, 31 :883891, 1980. [60] Tikhonov, A., A. Vasileva et A. Sveshnikov: Dierential equations. Springer-Verlag, Berlin, 1980.

8.A

Bases mathmatiques

# 1 : Dans lalgbre direntielle on tudie des structures algbriques avec des drivations [44, 38]. Soit R un anneau commutatif, 1 R et Q R. Une drivation dans (ou de) R est une application : R R, telle que, a, b R : (i) (a + b) = a + b (ii) (ab) = ( a) b + a b (linarit) (rgle de Leibniz).

Un anneau direntiel ordinaire R est un anneau muni dune seule drivation tel que a R a R.
d Notation : On crit aussi dt pour la drivation dun anneau direntiel d d d d ordinaire R, et a pour dt a, ainsi que dt ( dt a) = dt a = a, et plus gnra d lement ( dt )i a = a(i) , i > 0.

Rem. : On parle danneau direntiel ordinaire car une relation a = 0 dans R peut tre interprte comme une quation direntielle ordinaire. Avec plusieurs drivations, commutant entre elles, on traite des .d.p.. Un corps direntiel K est un anneau direntiel qui forme un corps (commutatif). La rgle de drivation de fractions a/b K, a, b R, b = 0 se dduit de celles de R : (b(a/b)) = a, (b) (a/b) + b ((a/b)) = a, b2 ((a/b)) = ba (b) a, do (a/b) = (ba (b) a)/(b2 ). Une constante dans un corps direntiel K est un lment c K, tel que c = 0. Un corps de constantes C est un corps direntiel dans lequel c C, c = 0. (Il est ais de vrier le proprits dun corps.) Ex. : 1. Les corps de nombres Q, R, C sont des exemples simples de corps de constantes. 2. Le corps R(t) des fractions rationnelles en t avec des coecients appartenant (ou dans) R est un corps direntiel ordinaire (avec la drid vation dt ). # 2 : Une extension de corps F/E consiste en deux corps E et F commutatifs tels que E est un sous-corps de F (cest--dire en restreignant la multiplication et laddition de F aux lments de E ce dernier forme un corps). Le corps F est aussi appel corps dextension de E. 375

Bibliographie Soit X un sous-ensemble de F . Le corps engendr par X sur E est le plus petit (par rapport linclusion (#7)) sous-corps de F contenant la fois E et X. On le note E(X). Lextension de corps F/E est dite simple, si X ne contient quun seul lment, elle est dite niment engendre (ou de type ni) si X contient un nombre ni dlments. Ex. : Lextension de corps C/R est niment engendre, car C = R( 1). # 3 : Un idal premier dun anneau commutatif R est un idal I dans R pour lequel a, b R et ab I implique quau moins un des lments a et b appartient lidal I. Lanneau des rsidus S = R/I ne contient pas de diviseur de zro si, et seulement si, I est un idal premier. En introduisant les inverses des lments non nuls (par rapport la multiplication), cest--dire en localisant en S\{0}, on obtient le corps des fractions (non commutatif) S. Soit donn un systme dquations algbriques Pi (x1 , . . . , xn ) = 0, i = 1, . . . , q,

avec Pi , i = 1, . . . , q, des polynmes en xi , i = 1, . . . , n, coecients dans un corps. Soit Pi (X1 , . . . , Xn ) K[X1 , . . . , Xn ], i = 1, . . . , q, avec K[X1 , . . . , Xn ] = K[X] lanneau polynmial engendr librement par X = (X1 , . . . , Xn ) (cest--dire les Xi ne satisfont aucune quation non triviale, il sagit dindtermines), et soit lidal I engendr par la famille P = (P1 , . . . , Pq ) dans K[X] un idal premier. Alors on obtient le corps des fractions de lanneau des rsidus K[X]/I par la construction dcrite. Si les xj , j = 1, . . . , n sont les lments du corps des fractions, issus des classes Xi + I, alors ils satisfont aux quations Pi (x) = 0, i = 1, . . . , q. Rem. : Si I nest pas premier, on peut trouver des idaux premiers dans K[X] dont lintersection est I. Pour chacun des ces idaux contenant I on peut construire un corps. Ceci correspond une runion des ensembles des solutions des systmes dquations correpondant ces idaux, cest-dire aux branches de solutions.
2 Ex. : Considrons lquation P (x1 , x2 ) = x2 x2 = 0. Avec P = X1 1 2 2 Q[X] lidal I dans Q[X] engendr par P nest pas premier, car X2 P = (X1 +X2 )(X1 X2 ). En revanche, les deux idaux I1 et I2 , engendrs par P1 = X1 + X2 et P2 = X1 X2 respectivement, sont premiers. On a I = I1 I2 . La solution de lquation en considration est donne par la runion de deux branches, les solutions respectives de x1 + x2 = 0 et x1 x2 = 0.

# 4 : Un lment a de F est dit algbrique sur E sil existe un polynme (non trivial) P E[Z], P = 0 tel que P (a) = 0. Sinon a est dit transcendant sur E. 376

8.A. Bases mathmatiques Si tout lment de F est algbrique sur E lextension de corps F/E est dite algbrique, elle est dite transcendante sinon. Si lextension de corps E(a)/E est transcendante, E(a) est isomorphe au corps E(X) des fractions rationnelles en une indtermine X coecients dans E. Ex. : 1. La racine a = 2 R est algbrique sur Q, car avec P (Z) = Z 2 2 on a P (a) = 0. 2. On sait que e et sont transcendants sur Q. # 5 : Soient K un corps et E/K une extension de corps algbrique. Alors si tout polynme P K[x] scrit P = a0 (x 1 ) (x n ), a0 k, i E

on appelle E une clture algbrique de K. Si on peut choisir E = K le corps K est dit algbriquement clos. Chaque corps admet une clture algbrique, qui est dtermine un isomorphisme sur K prs. On crit K pour cette clture algbrique unique ( un isomorphisme prs) [4]. # 6 : Une famille z dlments de L est dite algbriquement indpendante sur K sil nexiste aucun polynme P (Z) K[Z], P = 0, tel que P (z)=0. Dans le cas contraire on dit que z est K-algbriquement dpendant (ou bien algbriquement dpendant sur K). # 7 : Un ensemble A est un sous-ensemble minimal (par rapport linclusion) de B avec une certaine proprit E, si A possde la proprit E, mais aucun de ses sous-ensemble A\{a}, a A ne la partage. De mme, A est un sous-ensemble maximal (par rapport linclusion) de B avec une certaine proprit E, si A a la proprit E, mais pour des b B arbitraires, la runion A {b} ne la partage pas. # 8 : Soit l une loi qui chaque sous-ensemble ni X dun ensemble S associe certains lments de S, que lon appelle dpendant de X. Une famille x = {xi | i I} dlments de S est appel indpendante, si aucun des xi nest dpendant de {xj | j = i; i, j I}, sinon elle est dite dpendante. Supposons en plus que les conditions suivantes soient remplies : (i) Il suit de x = {x1 , . . . , xn } que chacun des xi , i = 1, . . . , n est dpendant de x. (ii) Si un lment z S est dpendant dun ensemble Y et chaque lment de Y est dpendant de X, alors z est galement dpendant de X. (iii) Si un lment z S est dpendant de x = {x1 , . . . , xn }, main non de {x2 , . . . , xn }, alors x1 est dpendant de {z, x2 , . . . , xn }. Dans ce cas l est appele une loi de dpendance. La troisime proprit est appele proprit dchange, la seconde transitivit [5]. 377

Bibliographie # 9 : Soit encore X un sous-ensemble dun ensemble S avec une loi de dpendance. On dit que X engendre S si tous les lments de S sont dpendant de X. Lensemble X est appel base de S si X est indpendant et engendre S. Lensemble X est un sous-ensemble de S, qui est maximal (par rapport linclusion (#7))), si, et seulement si, X forme une base de S. En outre X est une base de S si, et seulement si, X est un sous-ensemble minimal de S engendrant S. Pour une preuve voir [5, Prop. 1.4.1] ou [52]. # 10 : Soit S un ensemble avec une loi de dpendance admettant une base nie. Alors tout sous-ensemble indpendant fait partie dune base, et deux bases ont le mme cardinal. Pour une preuve voir [5, Lemma 1.4.2] ou [52]. # 11 : La dpendance algbrique sur K est une relation de dpendance au sens de #8. On dit y L est algbriquement dpendant sur K dune famille z = (z1 , . . . , zs ) dlments de L si (y, z1 , . . . , zs ) est K-algbriquement dpendant. Pour une preuve voir [4, 5] ou [52]. # 12 : Soit F/E une extension de corps. Une famille z dlments de F qui est algbriquement indpendante sur E, et qui, en plus, est maximale (par rapport linclusion (#7)), est appele une base de transcendance de F/E. Le cardinal dune telle famille z est appel le degr de transcendance de F/E ; on le note deg tr F/E. (Lunicit du degr de transcendance dune extension de corps de type nie suit de #11 et #10.) Lextension de corps F/E(z) est alors appele algbrique. On observe que si F/E est algbrique (#4) deg tr F/E = 0, et inversement, deg tr F/E = 0 implique que F/E est algbrique. Rem. : Pour les extensions de corps nies il existe toujours une base de transcendance (nie), que lon peux prendre dans une famille gnratrice. # 13 : Si G/F et F/E sont deux extensions de corps il en est de mme pour G/E. En outre deg tr G/E = deg tr G/F + deg tr F/E. Si X et Y sont des bases de transcendance de F/E et de G/F respectivement, alors X Y est une base de transcendance de G/E. Pour une preuve voir [52] ou [5, p. 170]. # 14 : Une extension de corps direntielle L/K consiste en deux corps direntiels K et L (voir #1) tels que K est un sous-corps de L (#2), et en plus la drivation de K concide avec celle de L. Alors en appelle aussi le corps direntiel L un corps direntiel dextension de K. 378

8.A. Bases mathmatiques Si X est un sous-ensemble de L, le corps direntiel engendr (direntiellement) par X sur K est le plus petit (par rapport linclusion (#7)) sous-corps direntiel de L qui contient et K et X. On le note K X . Une extension de corps direntielle L/K est dite (direntiellement) niment engendre (ou de type direntiel ni), si L = K x avec une famille nie x = (x1 , . . . , xn ) dlments de L. Rem. : Nous supposons partout que les extensions de corps direntielles soient direntiellement niment engendres une clture algbrique prs. En outre, comme dj ramarqu dans #1, on ne considre que des corps direntiels ordinaires. Les extensions de corps (non direntielles), quant elles, ne sont pas ncessairement de type ni. Par exemple, toute extension direntielle K z /K peut tre interprte comme une extension de corps non direntielle. Soit le cardinal de z gal 1, pour simplier. Alors les gnrateurs sont juste toutes les drives de z, et si z est direntiellement transcendant sur K (voir #17), alors on ne peut se passer daucun des lments du systme de gnrateurs Z = {z, z, z , . . .}, cest--dire aucun sous-ensemble de Z ne forme un systme de gnrateurs de K z /K. # 15 : Un polynme direntiel en une indtermine Z (ou en la famille dindtermines Z = (Z1 , . . . , Zs )) coecients dans un corps direntiel K, que lon note P (Z, Z, . . . , Z () ) (avec N), est un lment de lanneau direntiel K{Z} (voir #1). On obtient ce dernier, par exemple, en quipant lanneau des polynmes K[Z] dune drivation dont la restriction K concide avec la drivation de K. Ainsi P K{Z} est un polynme coecients dans K, en les lments de Z et un nombre ni de ces drives. # 16 : Un idal direntiel I dun anneau direntiel R est un idal dans R qui est clos sous la drivation de R : a I a I. Si I est un idal premier, alors on obtient, de manire analogue la construction dans #3, un corps de fractions de lanneau (direntiel) R/I, qui est un corps direntiel. Ainsi la construction dun corps direntiel peut se faire partir dun systme d.d.o. algbriques menant un idal premier, comme dans le cas non direntiel dans #3. # 17 : Un lment a L est dit direntiellement algbrique sur K sil existe un polynme direntiel (non trivial) P (Z, Z, . . . , Z () ) coecients dans K (cest--dire un polynme P K{Z}, P = 0), tel que P (a, a, . . . , a() ) = 0. Dans le cas contraire on dit que a est diren tiellement transcendant sur K. Soit r le plus petit entier tel quil existe un polynme P dont lordre maximal de drives apparaissant eectivement est gal r (cest--dire P/Z (i) = 0, i = r et P/Z (i) = 0, i > r). Alors le degr de transcen379

Bibliographie dance non direntiel de lextension de corps (simple) K a /K est gal r, car la famille a = (a, a, . . . , a(r1) ) en forme une base de transcendance (non direntielle) de K a /K. Dmonstration : Visiblement a est algbriquement indpendant sur K, d mais a(r) est K(a)-algbrique. Par drivation on obtient dt P = 0, et (r+1) est donc K(a, a(r) )-algbrique, et K(a)-algbrique. On peut proa cder de la mme manire pour toutes les drives suprieures. Si tout lment de L est direntiellement algbrique sur K, lextension de corps direntielle L/K est dite direntiellement algbrique ; elle est dite direntiellement transcendante sinon. Si tout lment de L qui nappartient pas K est direntiellement transcendant sur K lextension de corps direntielle L/K est dite direntiellement purement transcendante. Ex. : On voit que a = sin t Q sin t est direntiellement algbrique sur Q, car avec P (Z, Z) = Z 2 + Z 2 1 on a P (a, a) = 0. # 18 : Une famille z dlments de L est dite direntiellement algbriquement indpendante sur K sil nexiste aucun polynme direntiel P (Z, Z, Z, . . . , Z () ) K{Z}, P = 0 tel que P (z, z, z , . . . , z () ) = 0. Dans le cas contraire on dit que z est direntiellement K-algbriquement dpendant (ou direntiellement algbriquement dpendant sur K). # 19 : La dpendance algbrique direntielle sur K est une relation de dpendance au sens de #8. On dit pour ceci que y L est direntiellement algbriquement dpendant sur K dune famille z = (z1 , . . . , zs ) dlments de L si (y, z1 , . . . , zs ) est direntiellement K-algbriquement dpendant. (Comparer au cas non direntiel dans #11.) Pour une preuve voir [52]. # 20 : Soit L/K une extension de corps direntielle. Une famille z dlments de L qui est direntiellement algbriquement indpendante sur K et maximale (par rapport linclusion) est appele base de transcendance direntielle de L/K. Pour les extensions de corps direntielles de type ni il existe toujours une base de transcendance direntielle (nie). (Ceci est vident, car on peut la choisir dans une famille gnratrice.) Le cardinal dune base de transcendance direntielle de L/K est appel le degr de transcendance direntiel de L/K ; on le note deg tr di L/K. (Lunicit du degr de transcendance direntiel dune extension de corps direntielle (de type ni) suit de #11 et #10.) Si z est une base de transcendance direntielle dune extension de corps direntielle L/K, alors lextension de corps direntielle L/K z est direntiellement algbrique. 380

8.A. Bases mathmatiques # 21 : Une extension de corps direntielle L/K est direntiellement algbrique (#17) si, et seulement si, deg tr di L/K = 0. Si L/K est direntiellement purement transcendant alors une famille gnratrice minimale (par rapport linclusion) est aussi une base de transcendance direntielle, et rciproquement, dans ce cas, une base de transcendance direntielle est une famille gnratrice. Comme une base de transcendance direntielle est direntiellement K-algbriquement indpendante, elle est aussi minimale. Ainsi une extension de corps direntielle L/K qui est direntiellement purement transcendante est caractrise par le fait quil existe une famille z = (z1 , . . . , zm ) dans L telle que L = K z et deg tr di L/K = m. # 22 : Il existe une base de transcendance (non direntielle) nie dune extension de corps direntielle L/K (cest--dire une base de transcendance nie pour lextension non direntielle des corps avec les lments de L, respectivement de K) si, et seulement si, L/K est direntiellement algbrique, cest--dire deg tr di L/K = 0. Preuve : Soit z = (z1 , . . . , zm ) une famille gnratrice de L/K, et soit deg tr di L/K = 0. Le degr de transcendance de lextension de corps (simple) K z1 /K est ni (#17). Il en est de mme pour chacune des extensions de corps (simples) K z1 , . . . , zj /K z1 , . . . , zj1 , j = 2, . . . , m. Avec #13 on sait que deg tr L/K est galement ni. Comme dans #17 il est aussi clair que, pour toutes les extensions de corps (simples) K z1 /K et K z1 , . . . , zj /K z1 , . . . , zj1 , j = 2, . . . , m, il existe des bases de (r ) transcendance de la forme zi = (zi , zi , . . . , zi i ). Soit, pour la rciproque, L direntiellement transcendant sur K. Alors il ny a pas de dpendance K-algbrique entre le nombre inni dlments (j) , j 0 de L, et ainsi le degr de transcendance (non direntiel) ne peut tre ni. Rem. : Si lextension de corps direntielle nest niment engendre qua une clture algbrique prs, on obtient le mme rsultat. Il sut de prendre la clture algbrique la n de la dmonstration, ceci ne change pas le degr de transcendance (non direntiel).
d # 23 : Soit k un corps direntiel, et soi dt la drivation de k. Dans lanneau d d k[ dt ] des polynmes en dt coecients dans k nous dnissons la multiplication par d d a k : a := a + a . dt dt d d Les lments de k[ dt ] sont alors de la forme n ai dt , avec ai k, i = i=1 1, . . . , n, que lon peut interprter (formalement) comme des oprateurs direntiels. i

381

Bibliographie
d Visiblement, lanneau k[ dt ] est alors commutatif si, et seulement si, k est un corps de constantes.

# 24 : Soit L/K une extension de corps direntielle, niment engendre par d z = (z1 , . . . , zm ), cest--dire L = K z , et soit L/K un L[ dt ]-module (gauche). Supposons que lapplication dL/K : L L/K satisfasse, pour tout x, y L et a K, d (d (x)) = dL/K (x) dt L/K dL/K (x + y) = dL/K (x) + dL/K (y) dL/K (xy) = y dL/K (x) + x dL/K (y) dL/K (a) = 0. Il sagit donc dune K-drivation de L dans L/K . (Les images des lments de K sont nuls.) On crit dL/K x pour dL/K (x).
d Le module L/K est le L[ dt ]-module (gauche) engendr par limage suivante dL/K z = (dL/K z1 , . . . , dL/K zm ) de la famille des gnrateurs z de L/K. Le module L/K est appel le module des direntielles de Khler de L/K, ses lments sont appels direntielles de Khler.

Rem. : 1. Si L/K est clair par le contexte, on crit aussi d z au lieu de dL/K z, pour simplier. d 2. La construction de L/K est universelle : Si M est un L[ dt ]-module quelconque et D une K-drivation de L dans M , il existe un homod morphisme de L[ dt ]-modules, et un seul, : L/K M , pour lequel dL/K = D (voir [35]). 3. partir dune extension de corps (non direntielle) F/E on obtient d (comme cas spcial avec L = F , K = E et dt la drivation triviale) un F -espace vectoriel de direntielles de Khler. # 25 : Un lment w L = K z satisfait une quation de la forme P (w, z, z, . . . , z () ) = 0, avec P K{Z}[W ], un polynme en W et Z, et un nombre ni de drives de Z, coecients dans K. Lapplication dL/K envoie P sur dL/K P = d P , avec
m P (j) Zi m

dP =

P W

dw +
i=1 j=0 P d j j=0 Z (j) dt , i

d zi

(j)

P W

dw +
i=1

Qi

d dt

d zi

d et Qi ( dt ) =

i = 1, . . . , m. Lquation d P = 0 dnit donc

d une relation de dpendance L[ dt ]-linaire pour (d w, d z1 , . . . , d zm ). Il suit P de w L = K z que W = 0. Or, on peur diviser dans cette relation de

382

8.A. Bases mathmatiques dpendance par ce coecient, un lment du corps L. Par consquent d w d est un lment dans le L[ dt ]-module engendr par d z. Si L = K z , le mod dule des direntielles de Khler est le L[ dt ]-module L/K , engendr par la famille des direntielles de Khler dL/K z = (dL/K z1 , . . . , dL/K zm ), o L/K L[ dt ] L[ d ] L/K . = d
dt

# 26 : Soit L/K une extension de corps direntielle, et soit y une famille dlments de L. Alors y est direntiellement algbriquement dpendant sur d K si, et seulement si, dL/K y est une famille L[ dt ]-linairement indpendante dans L/K . De mme, si y est (non direntiellement) algbriquement indpendant sur K, alors dL/K y est une famille L-linairement indpendante dans L/K (voir [35]). On en dduit deg tr di L/K = RangL[ d ] L/K .
dt

Pour une preuve voir [35] ou [52]. # 27 : Si M/L et L/K sont deux extensions de corps direntielles, alors il en est de mme de M/K, et lon a deg tr di M/K = deg tr di M/L + deg tr di L/K. Si X et Y sont des bases de transcendance direntielles de M/L, respectivement de L/K, alors X Y est une base de transcendance direntielle de M/K. La preuve suit les lignes de celle de #13. # 28 : Une ltration (direntielle) dune extension de corps direntielle L/K est une suite non dcroissante L := (Lr )rZ de corps (non direntiels) Lr , qui sont algbriquement clos, telle que K Lr L et Lr Lr+1 pour tout r Z. Une ltration L de L/K est appele (i) exhaustive (dans L) si rZ Lr = L ; (ii) discrte si Lr = K pour r Z susamment petit ; (iii) nie si, une clture algbrique prs, tous les Lr sont niment engendr sur K ;
d (iv) bonne si, avec un r Z appropri, Ls+1 = Ls ( dt Ls ) pour s > r (o pour un sous-ensemble Z dun corps direntiel K on a dni d d lensemble dt A = {x K | z Z, x = dt z}), cest--dire si pour des s assez larges les corps successifs Ls de la ltration sont engendrs par drivation, et clture algbrique.

Enn on dit que la ltration est excellente si elle est et nie et bonne [34, 55] .
Dans [34] les corps Lr ne sont pas pris algbriquement clos. En plus on y suppose a Lr , a Lr pour toutes les ltrations L. Ainsi la dnition des ltrations bonnes nest pas exactement la mme.

383

Bibliographie Deux ltrations L et L ont une dirence borne (ou nie) sil existe un r0 Z tel que Lr Lr+r0 et Lr Lr+r0 , pour tout r Z. Sil existe un tel r0 on lappelle la dirence de deux ltrations. La dirence nie dnit une relation dquivalence sur lensemble des ltrations de L/K. Deux ltrations de L/K qui sont discrtes, excellentes et exhaustives ont une dirence nie. Preuve [10] : Soient L et L deux ltrations de L/K qui sont discrtes et excellentes, ainsi que exhaustives (dans L). Du fait que les ltrations sont discrtes il dcoule que Lr = Lr = K pour r susamment petit. Comme elles sont nies et exhaustives (dans L) on a Lr Lsr +r et Lr Lsr +r pour tout r Z et pour des sr , sr Z assez large, dpendants de r. Pour des r susament larges, Lr+1 = Lr ( d Lr ) Lr+sr ( d Lr+sr ) = Lr+sr +1
dt dt d d et Lr+1 = Lr ( dt Lr ) Lr+r ( dt Lr+r ) = Lr+r +1 , et en plus les sr et sr s s s ne dpendent plus de r. La dirence nie sensuit par le choix de r0 = max(sr , sr ) pour des r larges.

384

Institut Suprieur des Systmes Industriels de Gabs

Institut Suprieur des tudes Technologiques de Djerba

Association Tunisienne dAutomatique et de Numrisation

Il est bien admis et depuis longtemps que les mathmatiques constituent un passage obligatoire pour tout dveloppement en matire de recherche et dveloppement. Plusieurs outils sont actuellement disponibles sous forme de programmes permettant lingnieur et au chercheur de rsoudre le problme qui se pose eux sans sattarder sur lcriture des procdures mathmatiques. Malheureusement ceci ne se passe pas toujours sans incidents. En eet, une certaine ignorance des thories mathmatiques a t frquemment lorigine de msaventures des utilisateurs potentiels de ces boites outils mathmatiques. Cest justement pour combler ce dcit de connaissances des thories mathmatiques les plus exploites aussi bien en recherche quen ingnierie que cet ouvrage est propos un prix symbolique aux tudiants, ingnieurs, enseignants et chercheurs. Editeurs : Ridha Ben Abdennour Kamel Abderrahim Hugues Mounier

Institut National de Recherche en Informatique et en Automatique

Vous aimerez peut-être aussi