Vous êtes sur la page 1sur 70

Partie 2 - Optimisation convexe dans RN

Chapitre 1. Autour de la fonction Objectif de plusieurs variables

Igor Ciril
igor.ciril@ipsa.fr

Ma 321 - Aéro 3 Tronc commun


Institut Polytechnique des Sciences Avancées, Ivry sur Seine
Table des matières

1 Modes de visualisation
La problématique
Hypersurface représentative
Lignes de niveau
Visualisation par fonctions partielles
Fonction scalaire affine

2 Dérivabilité & différentiabilité


Dérivée directionnelle
Gradient
Différentiable
Information locale d’ordre 1
Cas des fonctions vectorielles

3 Différentiabilité seconde
Hessienne et courbure

© Igor Ciril , igor.ciril@ipsa.fr 2


Introduction

♦ Contenu
Ce chapitre comprend principalement des révisions d’analyse d’Aéro 2 avec
quelques compléments indispensables pour la suite du module, ainsi que le
module Ma 324.
• Les

révisions :
Section 1 - Modes de visualisation
∗ Surface et hypersurface représentative, carte de niveau ;
∗ Visualisation des fonctions partielles.

Section 2 - Dérivabilité et différentiabilité première
∗ Dérivée directionnelle et dérivabilité (dérivée partielle, gradient, point critique,
interprétation géométrique);
∗ Différentiabilité (définition, lien avec la dérivée directionnelle, formulation matricielle,
informations locales et interprétation géométrique).

Section 3 - Second-order differentiability
∗ Hessian matrix (Schwarz’s theorem)
∗ The concept of curvature in one direction.

• Les

quelques compléments sont les suivants :
Section 1 - Modes de visualisations
∗ Tracés à l’aide de Python de surfaces représentative et lignes de niveau;
∗ Étude des divers modes de visualisation d’une fonction affine.

© Igor Ciril , igor.ciril@ipsa.fr 3


Introduction

Section 2 - Dérivabilité et différentiabilité
∗ Fonctions vectorielles de plusieurs variables (extension des concepts de dérivée
directionnelles, dérivabilité, matrice gradient et Jacobienne);
∗ Fonctions vectorielles de plusieurs variables (différentiabilité, forme matricielle et
formule de différentiation d’une composée de fonctions).

Section 3 - Différentiabilité seconde
∗ Direction de plus forte et plus faible courbure, conditionnement local d’une fonction ;
∗ Une Étude des fonctions quadratiques (écriture matricielle, Classification en fonction
des points critiques et des valeurs propres associées à la partie quadratique).

Section 4 - Convexité
∗ Définition analytique et interprétations géométriques (cordes et épigraphe, convexité
et sections de niveau);
∗ Caractérisations de la convexité des fonctions régulières.

♦ Notations
RN désigne l’espace affine euclidien de dimension N dirigé par l’espace vectoriel
euclidien de dimension N, noté aussi RN .
• Base et repère canonique de RN

Base canonique : RN est muni d’une base canonique en tant qu’espace vectoriel
de dimension N, noté EN := (e1 , . . . , eN ) où ei est un N−uplet dont tous les
coefficients sont nuls sauf le ième qui vaut 1.

Repère canonique : RN est muni d’un repère canonique en tant qu’espace affine
de dimension N, noté RN := (O, EN ) où l’origine O est le N−uplet (0, . . . , 0).

© Igor Ciril , igor.ciril@ipsa.fr 4


Introduction

• Eléments

et représentations
Point
∗ Correspondance : un N−uplet (a1 , . . . , aN ) ∈ RN représente un point, noté a, dans
l’espace affine RN dont a1 , a2 , . . . , aN sont les coordonnées dans le repère
canonique RN
∗ Notation analytique : a(a1 ,  aN ).
. . . ,
a1
 . 
∗ Notation matricielle : a :=  ..  .

√ aN
Vecteur
∗ Correspondance : un N−uplet (x1 , . . . , xN ) ∈ RN représente un vecteur, noté x, dans
l’espace vectoriel RN dont x1 , x2 , . . . , xN sont les composantes dans la base
canonique EN
∗ Notation analytique : x(x1 , .. . , 
xN ).
x1
.
∗ Notation matricielle : x :=   ..  .

xN

Relation bipoint - vecteur : un bipoint (A, B) ayant pour origine A(a1 , . . . , aN ),
pour extrémité B(b1 , . . . , bN ) et définit donc un vecteur AB(b1 − a1 , . . . , bN − aN ).

© Igor Ciril , igor.ciril@ipsa.fr 5


Introduction


Lourdeur des notations : Pour limité le nombre d’écriture, relativement au repère
canonique RN (resp. la base canonique EN ) on confond la notation du point
(resp. du vecteur), de son représentant analytique et matricielle.
• Structure euclidienne

produit scalaire canonique : Le produit scalaire canonique du vecteur
x(x1 , . . . , xN ) ∈ RN et du vecteur y(y1 , . . . , yN ) ∈ RN est
y1
 
N
xi yi = (x1 , . . . , xN )  ..  = xT y.
X
⟨x; y⟩ :=
 
.
i=1
yN

Norme canonique : La norme euclidienne (qui dérive du produit scalaire
canonique) d’un vecteur x(x1 , . . . , xN ) ∈ RN est
N
∥x∥2 := ⟨x; x⟩ = xi2 = xT x = ,
X

i=1

© Igor Ciril , igor.ciril@ipsa.fr 6


1. Modes de visualisation - La problématique

♦ Fonction scalaire / vectoriel


 N

 R → RM
  

 f1 (x)
f:  ..  , (1)

 x := (x1 , . . . , xN ) 7−→ f(x) := 
 .




fM (x)

où N ∈ N∗ , M ∈ N∗ et fi : RN → R est la ième fonction composante de f.


• M = 1 : Fonction ou champ scalaire

√ N = 1: Fonction scalaire d’une variable réelles (Lycée, Aéro 1 et [1]).
N > 1: Fonction scalaire de N variables réelles (Aéro 2).
• M > 1 : Fonction ou champ vectoriel(le)

√ N = 1 : Fonction vectorielle d’une variable réelle ou Arc paramétré (Aéro 2).
N > 1 : Fonction vectorielle de N variables réelles ou Nappe paramétrée.

♦ Objectif :
Étude des fonctions de plusieurs variables sous un angle visuelle :
• Hypersurface représentative ;
• Cartographie des lignes de niveau ;
• Représentation par fonctions partielles.
© Igor Ciril , igor.ciril@ipsa.fr 7
1. Modes de visualisation - Hypersurface représentative

♦ Pourquoi cela se complique pour deux variable ou plus ?


• Courbe représentative de f : R → R (c.f. section 1 de [1]) :
√ 2
√ Représentation dans le plan euclidien R ;
Unique visualisation graphique associée à f.

Figure: Visualisation de la courbe représentative d’une fonction d’une variable réelle

• Complication de représentation : Problème physique de visualisation pour


N > 2.
© Igor Ciril , igor.ciril@ipsa.fr 8
1. Modes de visualisation - Hypersurface représentative

♦ Définition

Définition 1 (Graphe d’une fonction scalaire de deux variables)

Soit une fonction f définie sur R2 à valeurs dans R. Le graphe de f est le sous-ensemble
de R3 : n o
gr(f) := (x1 , x2 , f(x1 , x2 )) ∈ R2 × R | (x1 , x2 ) ∈ dom(f) . (2)

♦ Visualisation (c.f. la figure slide 7)


• Repère canonique R3 := (O, e1 , e2 , e3 ) de R3 :

Plan horizontal (e1 , e2 ) : axes relatifs aux variables, x1 et x2 , qui décrivent R2 ;

Axe verticale1 e3 : axe relatif aux valeurs f(x1 , x2 ) prises par la fonction f lorsque
le couple (x1 , x2 ) décrit R2 .
• Surface représentative :

Surface formée des points de coordonnées (x1 , x2 , f(x1 , x2 )) relativement au
√ repère cartésien canonique R3 de R3 ;
Équation cartésienne (dans R3 )
x3 = f(x1 , x2 ). (3)

1
relativement au plan horizontal.

© Igor Ciril , igor.ciril@ipsa.fr 9


1. Modes de visualisation - Hypersurface représentative

Figure: Principe de visualisation de la surface représentative d’une fonction scalaire de


deux variables réelles.

© Igor Ciril , igor.ciril@ipsa.fr 10


1. Modes de visualisation - Hypersurface représentative

♦ Visualisation sous Python


• c.f. pages 6-7 du document en ligne à l’adresse https:
//exo7math.github.io/deepmath-exo7/pythonxy/pythonxy.pdf.

♦ Généralisation pour N > 2


• Définition

Définition 2 (Graphe d’une fonction scalaire de deux variables ou plus

Soit N ≥ 1. Le graphe de la fonction f : RN → R est la partie de RN+1 définie par :


n o
gr(f) := (x1 , . . . , xN , f(x1 , . . . , xN )) ∈ RN × R : (x1 , . . . , xN ) ∈ RN . (4)

• Représentation

du graphe
Repère canonique RN+1 := (O, e1 , . . . , eN , eN+1 )
∗ Espace horizontal (e1 , . . . , eN ) : axes relatifs aux variables, x1 , . . . , xN , qui décrivent
RN ;
∗ Axe verticale2 eN+1 : axe relatif aux valeurs f(x1 , . . . , xN ) prises par la fonction f
lorsque le couple (x1 , . . . , xN ) décrit RN .

2
orthogonal relativement à l’espace horizontal.

© Igor Ciril , igor.ciril@ipsa.fr 11


1. Modes de visualisation - Hypersurface représentative


Hypersurface représentative :
∗ Lieu géométrique formé des points M de coordonnées (x1 , . . . , xN , f(x1 , . . . , xN ))
relativement au repère cartésien canonique RN+1 de RN+1 ,
∗ Équation cartésienne relativement au repère cartésien canonique RN+1 de RN+1 :
xN+1 = f(x1 , . . . , xN ) (5)

♦ Il faut introduire d’autres modes de visualisation !


• Les deux principales raisons :

Pour une fonction de trois variables ou plus (c.-à-d. N > 2), la visualisation de
√ l’hypersurface représentative devient physiquement impossible.
Définir d’autres moyens de visualisation de la fonction afin de mieux visualiser
la graphe de la fonction mais aussi l’étudier.

• Deux autres moyens de représentation :



√ Tranches horizontales de l’hypersurface représentative → carte de niveaux ;
Tranches verticales de l’hypersurface représentative → visualisation des
fonctions partielles.

© Igor Ciril , igor.ciril@ipsa.fr 12


1. Modes de visualisation - Lignes de niveau
♦ Courbe de niveau & carte de niveaux
• Tranches horizontales de la surface représentative
Une courbe de niveau β ∈ R est la la courbe obtenue par projection
orthogonale dans le plan (Ox1 x2 ) de la trace laissées par l’intersection entre
la surface représentative Sf de f suivant le plan horizontal d’altitude β,
c.-à-d. la plan d’équation cartésienne x3 = β.
• Définitions

Courbe de niveau

Définition 3 (Courbe de niveau et carte de niveaux)

Soient un scalaire β ∈ R et une fonction f définie sur R2 à valeur dans R. La courbe de


niveau β de f est une partie de R2 définie par
n o
Lβ (f) := (x1 , x2 ) ∈ R2 : f(x1 , x2 ) = β . (6)


Carte de niveaux

Définition 4 (Carte de niveaux)

Soit une fonction f définie sur R2 à valeur dans R. On parle de carte de niveau de f lorsque
l’on trace dans le plan des variables x1 et x2 plusieurs ligne de niveau (c.f. figure slide 11).

© Igor Ciril , igor.ciril@ipsa.fr 13


1. Modes de visualisation - Lignes de niveau

Section inférieure de niveau

Définition 5 (Section inférieure de niveau )

Soient un scalaire β ∈ R et une fonction f définie sur R2 à valeur dans R. La section


inférieure de niveau β de f est la partie
n de R2 définie par o
Sβ (f) := (x1 , x2 ) ∈ R2 : f(x1 , x2 ) ≤ β . (7)

Figure: Illustration de la construction de quelques courbes de niveau d’une fonction


scalaire de deux variables réelles.

© Igor Ciril , igor.ciril@ipsa.fr 14


1. Modes de visualisation - Lignes de niveau

• Exemples
√ familiers de courbes de niveau
Cartes topographiques : courbe reliant les points de même altitude (c.f. Figure
ci-dessous)

Figure: Carte de topographie.

© Igor Ciril , igor.ciril@ipsa.fr 15


1. Modes de visualisation - Lignes de niveau

Carte métrologique :
∗ une isobare est une courbe reliant les points de même pression (c.f. Figure
ci-dessous);
∗ une isotherme est une courbe reliant les points de même température (c.f. Figure
ci-dessous).

Figure: Carte des températures mondiales moyennes au niveau de la mer en janvier en


degrés Celsius.
© Igor Ciril , igor.ciril@ipsa.fr 16
1. Modes de visualisation - Lignes de niveau
♦ Généralisation N > 2
• Ligne de niveau

Définition 6 (Ligne de niveau)

Soient un réel β ∈ R et une fonction f : RN → R. La ligne de niveau β de f est la partie de


RN définie par : n o
Lβ (f) := x ∈ RN | f(x) = β . (8)

• Interprétation géométrique de Lβ (f) : correspond à la projection


orthogonale (suivant l’axe verticale eN+1 relatif aux valeurs prises par f) sur
l’espace horizontal RN (relatif aux variables x1 , . . . , xN ) de l’intersection de
l’hypersurface représentative de f avec le plan horizontal xN+1 = β de RN+1 .
• Section inférieure de niveau

Définition 7 (Section inférieure de niveau)

Soient un réel β ∈ R et une fonction f : RN → R. La section inférieure de niveau β de f est


la partie de RN définie par : n o
Sβ (f) := x ∈ RN | f(x) ≤ β . (9)

• Représentation ne souffrant pas de problème physique de visualisation


suivant la dimension N: Représentation des fonctions partielles.
© Igor Ciril , igor.ciril@ipsa.fr 17
1. Modes de visualisation - Fonction partielle

♦ Cas d’une fonction de deux variables


On considère une fonction f : R2 → R.
• Coupe verticale en un point fixé (c.f. Figure slide 19)
√ 2
√ Soit un point a(a1 , a2 ) ∈ R .
On peut considérer au point a une multitude de coupes verticales (orthogonale
au plan (O, x1 , x2 ) de représentation des variables x1 et x2 , c.f. figure (a) du slide
16) :
∗ Soit une direction unitaire d(d1 , d2 )
∗ On désigne par D(a, d) := {a + td : t ∈ R} la droite du plan (O, x1 , x2 ) passant par
le point a et de direction d.
∗ On désigne par Pa,d le plan dit verticale (orthogonale au plan de représentation des
variables x1 et x2 ,) : plan affine passant par le point (a1 , a2 , 0) ∈ R3 et dirigé par les
deux vecteurs orthogonaux (unitaires) (d1 , d2 , 0) ∈ R3 et e3 ∈ R3 .

Courbe représentative de la fonction partielle de f en a suivant d dans l’espace
tridimensionnel R3 résulte de l’intersection de la surface représentative Sf de f
avec le plan Pa,d .
• Interprétation fonctionnelle

√ Notation : fa,d
fa,d correspond à la restriction de la fonction f à la droite D(a, d).

© Igor Ciril , igor.ciril@ipsa.fr 18


1. Modes de visualisation - Fonction partielle

Définition 8 (Fonction partielle d’une fonction de deux variables)

Soient un point a ∈ R2 , un vecteur unitaire (ou au moins non nul) d ∈ R2 et f une fonction
scalaire définie sur R2 . La fonction partielle de f en a suivant le vecteur d est une fonction
d’une variable réelle définie par : ∀t ∈ R, fa,d (t) := f(a + td).

(a) Intersection du graphe de f et du plan P(a, d). (b) Représentation du graphe de la fonction fa,d

Figure: Illustration de la construction de la fonction partielle fa,d de f au point a suivant le


vecteur unitaire d.

© Igor Ciril , igor.ciril@ipsa.fr 19


1. Modes de visualisation - Fonction partielle

fa,d rapportée dans le plan de représentation classique d’une fonction d’une
variable (c.f. figure (b) slide 16) :
∗ Le repère :
- Axe des ordonnées : repérage des valeurs prises par f restreinte à la droite Da,d ;
- Axe des abscisses : repérage de t ∈ R, variable paramétrant la droite Da,d .
∗ Correspondances entre les figures (a) et (b) du slide 16 :
- Dans la figure (b) du slide 16 le point de la courbe représentative de fa,d d’abscisse
t = 0 et d’ordonnée fa,d (0) correspond au point A′ de la figure (a) du slide 16;
- Dans la figure (b) du slide 16 le point de la courbe représentative de fa,d d’abscisse t
et d’ordonnée fa,d (t) correspond au point M′ (t) de la figure(a) du slide 16.

♦ Généralisation N > 2
• Restriction de f à la droite D(a, d)

Définition 9 (Fonction partielle d’une fonction de deux variables ou plus)

Soient N ≤ 2, un point a ∈ RN , un vecteur unitaire (ou au moins non nul) d ∈ RN et


f : RN → R. La fonction partielle de f en a suivant d est une fonction d’une variable réelle
définie par :
∀t ∈ R, fa,d (t) := f(a + td). (10)

• Interprétation géométrique

La droite D(a, d) := {x(t) := a + td : t ∈ R} de l’espace RN de représentation
des variables x1 , x2 , . . . , xN .

© Igor Ciril , igor.ciril@ipsa.fr 20


1. Modes de visualisation - Fonction partielle

Le plan Pa,d , orthogonale à l’espace affine RN de représentation des variables
x1 , . . . xN , c.-à-d. définie par la droite D(a, d) et eN+1 , le (N + 1)ème vecteur de la
√ base canonique de R
N+1 .
la courbe représentative de fa,d résulte de l’intersection dans RN+1 de
√ l’hypersurface représentative de la fonction f et du plan Pa,d .
La visualisation s’effectue de manière classique comme pour une fonction
d’une variable réelle, ici notée t paramétrage de la droite D(a, d).

Remarque 1 (On se ramène à l’étude de fonctions d’une variable !)


• Au vu de la définition 9, quelque soit le nombres de variables de la fonction
f, les fonctions partielles associées sont toujours des fonctions d’une
variables réelle !
• Ceci permet de ramener l’étude en un point donnée de la fonction de
plusieurs variables à l’étude de fonctions d’une variables (un choix judicieux
de fonction partielle), problématique beaucoup plus simple et permettant
toujours une visualisation.
• Cette approche :

permet d’introduire des concepts fondamentaux d’analyse tels que la dérivée et
√ la courbure directionnelle en un point, direction de descente en un point, etc.
est à la base de la philosophie des méthodes de descente, objet de la suite de
ce module.

© Igor Ciril , igor.ciril@ipsa.fr 21


1. Modes de visualisation - Fonction scalaire affine
♦ Expressions
• Extension
√ de la proportionnalité
√ Fonction affine d’une variable réelle correspond au concept de proportionnalité ;
Fonction affine de N−variables x1 , x2 , . . . , xN correspond au concept de
combinaison linéaire des variables x1 , . . . , xN .
• Forme algébrique

Définition 10 (Fonction scalaire affine - forme algébrique)

Soit N ≥ 1, Une fonction f : RN → R est une fonction affine si elle s’ecrit sous la forme
algèbrique suivante : N
X
∀(x1 , . . . , xN ) ∈ RN , f(x1 , . . . , xN ) = bi xi + c, (11)
i=1
où b1 , b2 , . . . , bN et c sont des scalaires données.
• Forme matricielle
Définition 11 (Fonction scalaire affine - forme matricielle)

Soit N ≥ 1, Une fonction f : RN → R est une fonction affine si elle peut s’écrire,
relativement au repère canonique de RN , sous la forme matricielle suivante :
∀x ∈ Mn,1 (R), f(x) = bT x + c, (12)
où la matrice uni-colonne b ∈ Mn,1 (R) et le scalaire c sont donnés.

© Igor Ciril , igor.ciril@ipsa.fr 22


1. Modes de visualisation - Fonction scalaire affine

• Passage de la forme algébrique à matricielle et réciproquement :


b1
 

Relativement au repère canonique de RN , on pose b :=  ..  ∈ Mn,1 (R).
 
.
bN

Les formes matricielle (12) et algébrique (11) de f sont équivalentes.

• Exemple illustratif : Formes algébrique et matricielle


On considère la fonction scalaire définie sur R2 par
f(x1 , x2 ) = x1 + x2 + 1. (13)

Fonction affine : D’après la définition 10 slide 19, f est la forme algébrique d’une
fonction affine scalaire de R2 .

Forme matricielle : D’après la définition 11 slide 19 et la démarche de l’item
précédent, f s’écrit, relativement 2
  au repère canonique de R , sous la forme
1
matricielle (12) avec b := et c := 1.
1

© Igor Ciril , igor.ciril@ipsa.fr 23


1. Modes de visualisation - Fonction scalaire affine
♦ Hypersurface représentative
• Nature géométrique : Hyperplan affine de RN+1 .
Proposition 1 (Hypersurface représentative - forme cartesienne)

Soit f une fonction scalaire affine d’expression algébrique (11) caractérisé par les scalaires
b1 , . . . , bN et c. L’hypersurface représentative Hf de f est un hyperplan affine de RN+1
contenant le point A, de représentant matriciel dans RN+1
0
 
.
.
A :=  .  ∈ MN+1,1 (R)
0
c
et de vecteurs normale n, de représentant matriciel dans EN+1
b1
 
 . 
 . 
n :=  .  ∈ MN+1,1 (R).
b 
N
−1
En d’autres termes, Hf est l’ensemble l’ensemble des points M ∈ RN+1 tel que :
nT AM = 0.

© Igor Ciril , igor.ciril@ipsa.fr 24


1. Modes de visualisation - Fonction scalaire affine

Preuve : Durant séance CM n°1 bis □


• Exemple illustratif : Hypersurface représentative (c.f. Figure slide 23)
Soit la fonction scalaire affine f définie par l’expression algébrique (13).

En appliquant la proposition 1 du slide 21 (avec b1 = b2 := 1 et c := 1), on
conclut que l’hypersurface représentative Hf de f est un plan affine de R3
passant par le point A, de représentant matriciel dans le repère canonique de R3
0
 

A := 0 ,
1

de vecteur normale n, de représentant matriciel dans la base canonique de R3


1
 

n :=  1  .
−1

On peut aussi retrouver ce résultat en passant par l’expression cartésienne
(relativement au repère canonique de R3 ) comme ci-dessous pour tout point M,
de représentant matriciel (x1 , x2 , x3 )T dans le repère canonique de R3 :
 
x1
x3 = x1 + x2 + 1 ⇔ 1 1 −1 x2  = 0 ⇔ nT AM = 0. (14)


x3 − 1

© Igor Ciril , igor.ciril@ipsa.fr 25


1. Modes de visualisation - Fonction scalaire affine

Figure: Plan affine représentatif de la fonction scalaire affine f définie par (13)

© Igor Ciril , igor.ciril@ipsa.fr 26


1. Modes de visualisation - Fonction scalaire affine

♦ Carte de niveaux
• Nature géométrique : Hyperplans affines parallèles non confondus de RN .

Proposition 2 (Carte de niveaux)

Soit f une fonction scalaire affine d’expression algébrique (11) caractérisé par les scalaires
b1 , . . . , bN et c. On désigne par :
- b le représentant matriciel du vecteur de coordonnées b1 , b2 , . . . , bN dans EN ;
- j∗ un indice de [1, . . . , N] tel que bj∗ ̸= 0.

 niveau β ∈ R : Hyperplan
• Nature géométrique de la ligne de  affine de RN passant
par le point Aβ , de coordonnées 0, . . . , 0, β−c , 0, . . . 0 ∈ RN (où la j ème
b ∗
j∗
β−c
composante est égale à bj ∗
) relativement à la base canonique EN et de normal le
vecteur de représentant matricielle b relativement à BN . En d’autres termes, Lβ (f) est
l’ensemble des points M ∈ RN tel que :
bT Aβ M = 0.
• Propriétés géométrique de la carte de niveaux :

√ Hyperplans affines parallèles (car le vecteur normal n est indépendant de β);
non confondues (car Aβ dépend de β).

© Igor Ciril , igor.ciril@ipsa.fr 27


1. Modes de visualisation - Fonction scalaire affine

Preuve : Durant séance CM n°1 bis □

• Exemple illustratif : Carte de niveau (c.f. Figure slide 27)


Soit la fonction scalaire affine f définie par l’expression algébrique (13).

En appliquant la proposition 2 du slide 24 (avec b1 = b2 = c := 1, β ∈ R et
j∗ := 1), on conclut que :
∗ la courbe de niveau β ∈ R est une droite affine passant par le point Aβ , de
coordonnées (β − 1, 0) relativement au repère canonique de R2 , et de normal le
vecteur de représentant matriciel b := (1, 1)T
∗ Propriétés géométrique de la carte de niveau : Droites affines parallèles non
confondues.

On peut aussi retrouver ce résultat en passant par l’expression cartésienne
(relativement au repère canonique de R2 ) comme ci-dessous pour tout point M,
de représentant matriciel (x1 , x2 )T dans le repère canonique de R2 :
 x1 − (β − 1)
 
(x1 − (β − 1)) + x2 = 0 ⇔ 1 1 = 0 ⇔ nT Aβ M = 0. (15)
x2
Ainsi on a :
* n indépendant de β ∈ R ⇒ droites affines parallèles
* Aβ dépend de β ⇒ droites non confondues.

© Igor Ciril , igor.ciril@ipsa.fr 28


1. Modes de visualisation - Fonction scalaire affine

(a) Le graphe de la fonction f. (b) Lignes de niveau de la fonction f.

Figure: Surface représentative et lignes de niveau de la fonction scalaire affine f définie


par (13) : la surface représentative de f, définie par (13), est vu comme un empilement de
courbes (droites affines) de niveau élevées à leurs altitudes respectives qui forment le plan
affine de R3 .

© Igor Ciril , igor.ciril@ipsa.fr 29


1. Modes de visualisation - Fonction scalaire affine

♦ Représentation par fonctions partielles

• Nature géométrique : Droites affines de R2 .

Proposition 3 (Fonctions partielles)

Soit f une fonction scalaire affine d’expression algébrique (11) caractérisé par les scalaires
b1 , . . . , bN et c. On désigne par :
- b le représentant matriciel du vecteur de coordonnées b1 , b2 , . . . , bN dans la base
canonique EN ;
Soient un point a ∈ RN et un vecteur d ∈ RN non nul (généralement unitaire pour la norme
euclidienne). L’expression algébrique de la fonction partielle fa,d de f en a suivant d est :

∀t ∈ R, fa,d (t) = bT d t + f(a). (16)

• Type de fonction : Fonction affine scalaire de coefficient de proportionnalité bT d et


constante f(a).
• Nature géométrique de la courbe représentative relativement au plan affine P(a, d) :
droite affine passant par le point de coordonnées (0, f(a)) dans R2 et de vecteur
normal de composante bT d, −1 dans E2 .

© Igor Ciril , igor.ciril@ipsa.fr 30


1. Modes de visualisation - Fonction scalaire affine

• Exemple illustratif : Quelques fonctions partielles (c.f. Figure slide 29)


Soit la fonction scalaire affine f définie par l’expression algébrique (13).
√ T
Quelques fonctions partielles au point a := 0 0
∗ Suivant e1
- Expression algébrique : ∀t ∈ R, fa,e1 (t) = f(t, 0) = t + 1.
- Type de fonction : Fonction affine de coefficient de proportionnalité égale à 1.
- Courbe représentative : Droite passant par le point passant par le point de
coorodonnées (0, 1) dans R√2 et de vecteur normal de composantes (1, −1) dans E2 .
∗ Suivant d de composantes 22 (1, 1) dans√ E2 . √ !
- Expression algébrique : 2 2 √
fa,d (t) = f t, t = 2t + 1. (17)
2 2

- Type de fonction : Fonction affine de coefficient de proportionnalité égale à 2.
- Courbe représentative : Droite passant par le point passant par le point
√ de 
coordonnées (0, 1) dans R2 et de vecteur normal de composantes 2, −1 dans
E2 .

Fonctions partielles et carte de niveaux
∗ Suivant la droite D(a, e1 ) :
les distances entre les lignes de niveau β = 2 et β = 3 puis β = 3 et β = 4 sont
égales et valent 1. (c.f. figures (a) et (d) du slide 29)
∗ Suivant la droite D(a, d) :
les distances entre

les lignes de niveau β = 2 et β = 3 puis β = 3 et β = 4 sont
égales et valent 22 . (c.f. figures ()b et (d) du slide 29)

© Igor Ciril , igor.ciril@ipsa.fr 31


1. Modes de visualisation - Fonction scalaire affine

(a) Courbe représentative fa,e1 (b) Courbe représentative fa,d .

(c) Courbe représentative fa,e2 (d) Quelques lignes de niveau de f.

Figure: Courbes représentatives de fonctions partielles de f au point a suivant les


directions e1 , e2 et d et quelques lignes de niveau (β := 0, 1, 2, 3, 4, 5).

© Igor Ciril , igor.ciril@ipsa.fr 32


2. Dérivabilité & différentiabilité - Dérivée directionnelle

♦ Comment étendre le concept de dérivabilité à des fonctions de deux


variables réelles ou plus ?
• Le√concept à généraliser
√ Dérivabilité d’une fonction f : R → R en un point a ∈ I;
Définition mathématique (c.f. Définition 2 slide 8 de [1]).
f(x) − f(a)
lim := f ′ (a) (18)
x→a x−a
• Difficultés

√ Impossibilité de diviser par un vecteur : le vecteur x − a dans (18).
Complexification de la notion de limite (c.f. figure ci-dessous) :
∗ Pour une variable : chemin par la gauche ou la droite de a;
∗ Pour deux variables ou plus : une infinité de directions rectiligne et non rectiligne.

Figure: Différentes façons de s’approcher du point x : (a) représente des trajectoires


rectilignes, (b) et (c) représente des trajectoires non rectilignes

© Igor Ciril , igor.ciril@ipsa.fr 33


2. Dérivabilité & différentiabilité - Dérivée directionnelle

• Généralisation f : RN → R et a ∈ RN .

Dérivée directionnelle au point a : Étude de la dérivabilité de f au voisinage a
√ lorsque la variable suit l’une de ces directions rectilignes passant par a.
Dérivée partielle : concept précédent dans le cas particuliers des directions
définies par le repère cartésien canonique de RN .

♦ Cas de deux variables


Soient une fonction f : R2 → R, un point a(a1 , a2 ) ∈ R2 et une direction
d(d1 , d2 ) ∈ R2 unitaire (ou au moins non nulle).
• Problématique : Étude de la dérivabilité en 0 de la fonction partielle fa,d de f
en a suivant la direction d.
• Le concept

Définition 12 (Dérivée directionelle d’une fonction de deux variables)

Une fonction f : R2 → R admet au point a(a1 , a2 ) ∈ R2 une dérivée directionnelle suivant


le vecteur d(d1 , d2 ) ∈ RN unitaire (ou au moins non nulle) si et seulement si la fonction
partiel fa,d de f en a suivant d est dérivable en 0, c.-à-d.
fa,d (t) − fa,d (0) f(a + td) − f(a)
lim = lim existe. (19)
t→0 t t→0 t
Notation : f ′ (a; d) ∈ R désigne la dérivé de f en a suivant la direction d.

© Igor Ciril , igor.ciril@ipsa.fr 34


2. Dérivabilité & différentiabilité - Dérivée directionnelle

Définition 13 (Dérivée partielle d’une fonction de deux variables)

Soit i ∈ {1, 2}. Une fonction f : R2 → R admet au point a(a1 , a2 ) ∈ R2 une ième dérivée
partielle si et seulement si f admet au point a ∈ R2 une dérivée directionnelle suivant le
ième vecteur ei de la base canonique E2 de R2 .
Notation : ∂x∂f
(a) ∈ R désigne la ième dérivée partielle de f en a, et ∂x
∂f
(a) = f ′ (a; ei ).
i i

• Interprétation géométrique (c.f. Figure slide 34)



Notations
∗ Sf : Surface représentative de f;
∗ La direction d, de composantes (d1 , d2 ) dans B2 , est supposée unitaire ;
∗ Da,d : Droite du plan (O, x1 , x2 ) passant par le point a (représentant matriciel dans R2
) et de vecteur directeur d (représentant matriciel dans B2 );
∗ Pa,d : Plan orthogonal au plan (O, x1 , x2 ) et contenant la droite Da,d ;
∗ Cfa,d : courbe représentative de fa,d obtenu comme intersection de Pa,d et C.

Dans le contexte du plan Pa,d rapporté au plan de représentation d’une
fonction scalaire d’une variable (c.f. Figure (b) slide 34)
∗ La droite Ta,d (f), de Pente f ′ (a, d) et d’ordonnée f(a) à l’origine, tangente la courbe
représentative Cfa,d de la fonction partielle fa,d au point A de coordonnées
0, fa,d (0) = (0, f(a)) dans le repère R2 .


© Igor Ciril , igor.ciril@ipsa.fr 35


2. Dérivabilité & différentiabilité - Dérivée directionnelle

∗ Équation cartésienne de la droite Ta,d (f) relativement à R2 :


′ ′ ′ T
x3 = fa,d (0)+fa,d (0)t = f(a)+f (a, d)t ⇔ f (a, d)t−(x3 −f(a)) = 0 ⇔ AM na,d (f) = 0,
où M point de Ta,d (f) de coordonnées (t, x3 ) dans R2 et na,d (f) le vecteur de
composantes (f ′ (a, d), −1) dans B2 .
∗ Normale commune à Ta,d (f) et Cfa,d au point A : na,d (f).

Dans le contexte de l’espace R3 de visualisation de la surface représentative
de f (c.f. Figure (a) slide 34)
∗ La droite Ta,d (f) (droite rouge) tangente la courbe représentative Cfa,d (courbe jaune)
de la fonction partielle fa,d et par conséquent aussi à la surface représentative Sf au
point A de coordonnées (a1 , a2 , f(a1 , a2 )) dans le repère R3 .
∗ Équation paramétrique de la droite Ta,d (f) relativement à R3 :

x1 = a1 + td1

x2 = a2 + td2 t ∈ R. (20)
x = f(a) + f ′ (a, d)t

3

∗ Équation cartésienne de la droite Ta,d (f) relativement à R3 : D’après la forme


paramétrique (20)
′ ′ T
f (a, d)d1 (x1 − a1 ) + f (a, d)d2 (x2 − a2 ) − (x3 − f(a)) = 0 ⇔ AM ña,d (f) = 0.
où M point de Ta,d (f) de coordonnées (x1 , x2 , x3 ) dans R3 et ña,d (f) le vecteur de
composantes (f ′ (a, d)d1 , f ′ (a, d)d2 , −1) dans B3 .
∗ Normale commune à Ta,d (f) et Cfa,d au point A : ña,d (f).

© Igor Ciril , igor.ciril@ipsa.fr 36


2. Dérivabilité & différentiabilité - Dérivée directionnelle

(a) Vue dans l’espace R3 de représentative de Sf . (b) Vue dans le plan de représentaion de Cfa,d .

Figure: Représentations de la dérivées directionnelles f ′ (a, d) d’une fonction f scalaire de


deux variables réelles en un point a dans la direction d.

© Igor Ciril , igor.ciril@ipsa.fr 37


2. Dérivabilité & différentiabilité - Dérivée directionnelle
♦ Généralisation à N−variables
Soient N ≤ 2, f : RN → R, un point a(a1 , . . . , aN ) ∈ RN et d(d1 , . . . , dN ) ∈ RN
direction unitaire (ou non nulle).
• Dérivée directionnelle

Définition 14 (Dérivée directionelle d’une fonction de deux variables ou plus)

Une fonction f : RN → R admet au point a(a1 , . . . , aN ) ∈ RN une dérivée directionnelle


suivant le vecteur d(d1 , . . . , dN ) ∈ RN unitaire (ou au moins non nulle) si et seulement si la
fonction partiel fa,d de f en a suivant d est dérivable en 0, c.-à-d.
fa,d (t) − fa,d (0) f(a + td) − f(a)
lim = lim existe. (21)
t→0 t t→0 t
Notation : f (a; d) ∈ R désigne la dérivé de f en a suivant la direction d.

• Dérivée partielle
Définition 15 (Dérivée partielle d’une fonction de deux variables ou plus)

Soit i ∈ {1, . . . , N} Une fonction f : RN → R admet au point a(a1 , . . . , aN ) ∈ RN une ième


dérivée partielle si et seulement si f admet au point a ∈ RN une dérivée directionnelle
suivant le vecteur ei .
Notation : ∂x∂f
(a) ∈ R désigne la ième dérivée partielle de f en a, et ∂x
∂f
(a) = f ′ (a; ei ).
i i

© Igor Ciril , igor.ciril@ipsa.fr 38


2. Dérivabilité & différentiabilité - Dérivée directionnelle

• Interprétation

géométrique
Notations
∗ Sf : Hypersurface représentative de f;
∗ La direction d, de composantes (d1 , . . . , dN ) dans EN , est supposée unitaire ;
∗ Da,d : Droite de l’espace affine (O, x1 , x2 , . . . , xN ) passant par le point de représentant
matriciel a dans RN ) et de vecteur directeur d (représentant matriciel dans EN );
∗ Pa,d : Plan orthogonal au plan (O, x1 , x2 , . . . , xN ) et contenant la droite Da,d ;
∗ Cfa,d : courbe représentative de fa,d obtenu comme intersection de Pa,d et C.

Dans le contexte du plan Pa,d rapporté au plan de représentation d’une
fonction scalaire d’une variable
∗ Visualisation : Même pour une fonction de plus de deux variable on peut en donner
une visualisation (c.f. Figure slide 38)
∗ La droite Ta,d (f), de Pente f ′ (a, d) et d’ordonnée f(a) à l’origine, tangente la courbe
représentative Cfa,d de la fonction partielle fa,d au point A de coordonnées
0, fa,d (0) = (0, f(a)) dans le repère R2 .


∗ Pente de la droite Ta,d (f) : f ′ (a, d).


∗ Équation cartésienne de la droite Ta,d (f) relativement à R2 :
′ ′ ′ T
xN+1 = fa,d (0)+fa,d (0)t = f(a)+f (a, d)t ⇔ f (a, d)t−(x3 −f(a)) = 0 ⇔ AM na,d (f) = 0,
où M point de Ta,d (f) de coordonnées (t, xN+1 ) dans R2 et na,d (f) le vecteur de
composantes (f ′ (a, d), −1) dans B2 .
∗ Normale commune à Ta,d (f) et Cfa,d au point A : na,d (f).

© Igor Ciril , igor.ciril@ipsa.fr 39


2. Dérivabilité & différentiabilité - Dérivée directionnelle

Dans le contexte de l’espace R3 de visualisation de la surface représentative
de f
∗ Visualisation : Pas de visualisation possible, juste possibilité d’abstraction en
généralisant le cas de deux variables à 3 variables ou plus (N > 2).
∗ La droite Ta,d (f) (droite rouge) tangente la courbe représentative Cfa,d de la fonction
partielle fa,d et par conséquent aussi à la hypersurface représentative Sf au point A
de coordonnées (a1 , . . . , aN , f(a1 , . . . , aN )) dans le repère RN+1 .
∗ Équation paramétrique de la droite Ta,d (f) relativement à RN+1 :
x = a1 + td1

 1

..


. t ∈ R. (22)
x = aN + tdN


 N



xN+1 = f(a) + f (a, d)t

∗ Équation cartésienne de la droite Ta,d (f) relativement à R3 : D’après la forme


paramétrique (20)
N
′ T
X
f (a, d) (di (xi − ai )) − (xN+1 − f(a)) = 0 ⇔ AM ña,d (f) = 0.
i=1

où M point de Ta,d (f) de coordonnées (x1 , . . . , xN+1 ) dans RN+1 et ña,d (f) le vecteur
de composantes (f ′ (a, d)d1 , . . . , f ′ (a, d)dN , −1) dans EN+1 .
∗ Normale commune à Ta,d (f) et Cfa,d au point A : ña,d (f).

© Igor Ciril , igor.ciril@ipsa.fr 40


2. Dérivabilité & différentiabilité - Dérivée directionnelle

Figure: Vue dans le plan de représentation de la courbe représentative de la fonction


partielle de f en a ∈ Ω suivant d ∈ RN

© Igor Ciril , igor.ciril@ipsa.fr 41


2. Dérivabilité & différentiabilité - Gradient

♦ Dérivabilité & gradient


• Dérivabilité

Définition 16 (Dérivabilité d’une fonction scalaire de plusieurs variable)

Soient N ≥ 2, une fonction scalaire f : RN → R et un point a ∈ RN (représentant matriciel


dans RN ). On dit que f est dérivable en a si et seulement si f admet au point a toutes ses
dérivées partielles premières.

• Matrices gradient et Jacobienne


Soient N ≥ 2 et une fonction scalaire f : RN → R dérivable au point a ∈ RN
(représentant matriciel dans RN ).

Matrice uni-colonne Gradient de f en a
 ∂f

∂x1
(a)
 .. 
 
 . 
 
 ∂f (a) 
∇f(a) =  ∂x . (23)
 i
 . 

 . 
 . 
∂f
∂x
(a)
N

© Igor Ciril , igor.ciril@ipsa.fr 42


2. Dérivabilité & différentiabilité - Gradient

Matrice ligne Jacobienne de f en a
 
∂f ∂f ∂f
Jf (a) = ∂x
(a) ... ∂xi
(a) ... ∂xN
(a) (24)
1
T
= ∇f(a) . (25)
♦ Dérivabilité et continuité
• Attention ! : une fonction scalaire f : RN → R peut être dérivable en un
point, voir même admettre en ce point des dérivées directionnelles dans
toutes les directions et ne pas être continue en ce point.
• Le contre-exemple
Soit la fonction scalaire f : R2 → R définie par :
( 3
x2
, si x1 ̸= 0
f(x1 , x2 ) = x1 . (26)
0, si x1 = 0
On montre que la fonction f admet des dérivées directionnelles suivant
toutes

les directions à l’origine, cependant f n’est pas continue en (0, 0).
Dérivable suivant toutes les directions à l’origine : Soit un vecteur non nul
d = (d1 , d2 ) ∈ R2 on a :
ta32
(
f ((0, 0) + t(d1 , d2 )) − f(0, 0) f(td1 , td2 ) si a ̸= 0
= = d1 −→ 0,
t t 0 si a = 0 t→0

Donc f ′ ((0, 0), d) = 0.

© Igor Ciril , igor.ciril@ipsa.fr 43


2. Dérivabilité & différentiabilité - Gradient

f n’est pas continue à l’origine (0, 0) :
∗ Soit le chemin dérivable non rectiligne t ∈ R → γ(t) := (t3 , t) ∈ R2 .
∗ Le chemin γ approche le point (0; 0) quand t tends vers 0, car lorsque t → 0 on a
γ(t) → γ(0) = (0; 0).
∗ Cependant, on a : (
1 si t ̸= 0
t ̸= 0, f(γ(t)) = ⇒ lim f(γ(t)) = 1 ̸= f(γ(0)) = 0.
0 si t = 0 t→0

♦ Fonction dérivée directionnelle et gradient


• Fonction dérivée suivant une direction
Définition 17 (Fonction dérivée directionnelle)

Soient N ≥ 2 et d un vecteur unitaire (au moins non nul) de RN . Une fonction scalaire
f : RN → R est dérivable sur Ω suivant la direction d si et seulement si f est dérivable
suivant d en tout point de Ω. Alors, on peut définir sur Ω, la fonction dérivée directionnelle
suivant d : f ′ (·, d) : x ∈ Ω 7→ f ′ (x, d), où f ′ (x, d) donnée dans la définition 14 slide 34.

• Fonction Gradient
Définition 18 (Fonction Gradient)

Soient N ≥ 2 et Ω un ouvert de RN . Une fonction scalaire f : RN → R est dérivable sur Ω si


et seulement si f est dérivable en tout point de Ω. Alors, on peut définir sur Ω, la fonction
gradient : ∇f : x ∈ Ω 7→ ∇f(x), où ∇f(x) définie par (23).

© Igor Ciril , igor.ciril@ipsa.fr 44


2. Dérivabilité & différentiabilité - Différentiable

♦ Cas d’une fonction scalaire d’une variable


• Différentiabilité et dérivabilité en un point, deux concepts équivalents (c.f.
Proposition 1 [2]) : la fonction f : R → R est différentiable ou de manière
équivalente dérivable en a ∈ R, alors :

dans un un voisinage3 de a on a :
f(x) = f(a) + f ′ (a)(x − a) + o(|x − a|). (27)

la fonction différentielle, notée Df(a), de f en a est la fonction scalaire linéaire
définie sur R par :
∀h ∈ R, Df(a)(h) = f ′ (a)h. (28)
• Interprétations : Approximation locale linéaire tangentielle d’ordre 1

Point de vue fonctionnelle (c.f. proposition 2 [2] et (27)) : La fonction affine
Tf,a , définie sur R par
∀x ∈ R, Tf,a (x) := f(a) + f ′ (a)(x − a), (29)
réalise une approximation au voisinage du point a ∈ R d’erreur d’ordre 1 :
Ef,a (x) := |f(x) − Tf,a (x)| = o(|x − a|). (30)

Point de vue géométrique (c.f. proposition 2 [2]): La courbe représentative de la
fonction Tf,a correspond à la droite tangente à la courbe représentative de f au
point de coordonnées (a, f(a)) dans le repère canonique de R2 .

3
Intervalle ouvert centré en a

© Igor Ciril , igor.ciril@ipsa.fr 45


2. Dérivabilité & différentiabilité - Différentiable

♦ Contexte d’une fonction de deux variables ou plus : Différentiabilité et


dérivabilité, deux concepts différents !
Soient N ≥ 2, et une fonction f : RN → R.
• Position

du problème
Problématique :
∗ En termes fonctionnels : approximer f au voisinage de a ∈ Ω par une fonction affine.
∗ En terme géométrique : existence d’un (Plan si N = 2) Hyperplan tangent4 en
(a, f(a)) ∈ RN+1 à (la surface si N = 2) l’hypersurface représentative de f.

Difficulté : plus d’équivalence entre la dérivabilité et la différentiabilité en a.
∗ Raison : la dérivabilité repose sur des limites le long de direction de la base
canonique.
∗ Conséquence : La dérivabilité apparaît comme un concept trop faible pour garantir
l’existence d’un Hyperplan tangent en (a, f(a)) ∈ RN+1 à l’hypersurface
représentative de f.
• Généralisation du concept de différentiabilité en un point : extension du
concept vu pour les fonctions d’une variable réelle (c.f. rappels au slide 40).

Idée : notion de limite demande l’utilisation d’une norme vectorielle sur RN .
∗ norme généralement utilisée : la norme canonique5
∗ Sur RN la notion de limite est indépendante de la norme choisie6 .

4
Elle correspond à la hypersurface représentative de l’approximé affine de f en a.
5
Elle dérive du produit scalaire canonique.
6
On dit aussi que sur RN toutes les normes sont équivalentes topologiquement.

© Igor Ciril , igor.ciril@ipsa.fr 46


2. Dérivabilité & différentiabilité - Différentiable

♦ Différentiabilité en un point
• Le concept

Définition 19 (Différentiabilité en un point d’une fonction de plusieurs variables)

Soient N ≥ 2, ∥ · ∥ désigne une norme vectoriel (généralement la norme euclidienne) de


RN et a un point de RN . Une fonction f est différentiable en a ∈ RN si et seulement s’il
existe une unique application (forme) linéaire de RN dans R, notée Df(a), telle que dans un
voisinage7 de a, noté V(a), on a :
∀x ∈ V(a), f(x) = f(a) + Df(a)(x − a) + o (∥x − a∥) . (31)
L’application (forme) linéaire Df(a) : RR → R est appelée la différentielle de f en a.

• Formulations équivalentes

L’égalité (56) est équivalente à
|f(x) − (f(a) + Df(a)(x − a))| = o (∥x − a∥) ; (32)

L’égalité (56) est aussi équivalente à
|f(x) − f(a) − Df(a)(x − a)|
lim = 0. (33)
x→a ∥x − a∥

7
Le voisinage est une boule de centre a et de rayon r > 0, c.-à-d. B(a, r) := {x ∈ RN : ∥a − x∥ ≤ r}

© Igor Ciril , igor.ciril@ipsa.fr 47


2. Dérivabilité & différentiabilité - Différentiable

• Lien

entre différentielle et dérivée directionnelle :
Le résultat

Proposition 4 (Différentiabilité et dérivabilité directionnelle en un point)

Soient N ≥ 2 et a un point de RN . Si la fonction f : RN → R est différentiable en a alors elle


admet a une dérivée directionnelle suivant tout vecteur non nul d ∈ RN . De plus on a :
f ′ (a, d) = Df(a)(d), (34)
et plus particulièrement pour les directions de la base canonique :
∂f(a)
= f ′ (a, ei ) = Df(a)(ei ). (35)
∂xi

La réciproque de la proposition 4 est fausse : c.f. le contre-exemple slide 38.

Formulation matricielle8 des égalités (34) et (35)
∗ Matrice représentant la forme linéaire Df(a) dans la base canonique RN de RN :
Jf (a) = [Df(a), EN ] = [Df(a)(e1 ), . . . , Df(a)(ei ), . . . , Df(a)(eN )]
 
∂f ∂f ∂f T
= (a), . . . , (a), . . . , (a) = ∇f(a) , (36)
∂x1 ∂xi ∂xN
∗ l’égalité vectorielle (34) s’écrit matriciellement
′ T
f (a, d) = ∇f(a) (d) = Jf (a)(d). (37)
8
Toutes les écritures matricielles sont faite relativement à la base canonique.

© Igor Ciril , igor.ciril@ipsa.fr 48


2. Dérivabilité & différentiabilité - Différentiable

• Interprétations - Approximation locale linéaire tangentielle d’ordre 1



Le résultat :

Proposition 5 (Approximation locale linéaire tangentielle d’ordre 1)

Soient un point a ∈ RN et une fonction f : RN → R différentiable au point a. La fonction


affine, notée Tf,a et définie par

∀x ∈ RN , Tf,a (x) := f(a) + ∇f(a)T (x − a), (38)


réalise au point a une approximation linéaire tangentielle d’ordre 1 de la fonction f. C’est
pour cela, que communément, on dit que Tf,a est l’approximation linéaire ou linéarisée
tangentielle d’ordre 1 de f au point a.

Preuve : Durant CM n°1 bis. Les deux points de vue qui suivent correspondent
aux éléments essentiels de la preuve. □

Point de vue fonctionnelle : En combinant la définition 19 slide 42, la
proposition 4 slide 43 et l’égalité slide 45, on établit que la fonction affine Tf,a ,
définie sur RN par l’expression (38) , réalise une approximation au voisinage du
point a ∈ RN d’erreur d’ordre 1 :
Ef,a (x) := ∥f(x) − Tf,a (x)∥ = o(∥x − a∥). (39)

© Igor Ciril , igor.ciril@ipsa.fr 49


2. Dérivabilité & différentiabilité - Différentiable


Point de vue géométrique :
∗ L’hypersurface représentative STf,a est un hyperplan affine passant par le point de
coordonnés (a1 , . . . , aN , f(a1 , . . . , aN )) dans
 RN+1 et de normale le vecteur de
composantes ∂f
∂x1 (a), . . . , ∂f
∂xN (a), −1 dans EN+1 .
9
∗ L’hyperplan STf,a tangente l’hypersurface représentative Sf de f au point de
coordonnés (a1 , . . . , aN , f(a1 , . . . , aN )) dans le repère canonique RN+1 de RN+1 .
∗ Normale commune des hypersurfaces STf,a et Sf au point de contact : vecteur de
 
composantes ∂x ∂f ∂f
(a), . . . , ∂x (a), −1 dans la base canonique EN+1 de RN+1 .
1 N

• Relations entre classe C 1 , différentiabilité, dérivabilité et continuité



Fonction de classe C 1 sur un ouvert

Définition 20 (Classe d’ordre 1)

Soient N ≥ 2 et Ω un ouvert de RN . La fonction f : RN → R est de classe d’ordre 1 sur Ω,


noté f ∈ C 1 (Ω), si et seulement si f et ses fonctions dérivées partielles
∂f
∂x
∂f
, . . . , ∂x ∂f
, . . . , ∂x sont continues sur Ω.
1 i N

9
Nous donnerons une preuve de ce résultat à la section suivante SLIDE .....

© Igor Ciril , igor.ciril@ipsa.fr 50


2. Dérivabilité & différentiabilité - Différentiable


Schéma récapitulatif des relations entre classe C 1 , différentiabilité, dérivabilité
et continuité d’une fonction scalaire en un point et/ou un ouvert de RN .

© Igor Ciril , igor.ciril@ipsa.fr 51


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

♦ Position relative des lignes de niveau f(a) de f et Tf,a au voisinage de a


• Le résulat

Proposition 6 (Gradient et ligne de niveau)

Soient N ≥ 2, un point a ∈ RN , et f : RN → R une fonction différentiable en a.


• La ligne de niveau f(a) de Tf,a , notée Lf(a) (Tf,a ), est un hyperplan affine tangente au
point a à la ligne de niveau f(a) de f.
• Le vecteur ∇f(a) est la normale commune au point a aux lignes de niveau Lf(a) (Tf,a )
et Lf(a) (f).

• Exemple Illustratif

On considère la fonction f définie sur R2 par l’expression :
∀(x1 , x2 ) ∈ R2 , f(x1 , x2 ) = x12 − x1 x2 + x22 − x1 − x2 . (40)

Valeur et Gradient de f en a :
   
−10 −24
a := , f(a) = 146, ∇f(a) = . (41)
3 15

Expressions du linéarisé Tf,a de f en a:

Tf,a (x) = f(a) + ∇f(a)T (x − a) = −24x1 + 15x2 − 139. (42)

© Igor Ciril , igor.ciril@ipsa.fr 52


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

Positions relatives des surfaces représentatives de f et Tf,a au voisinage de a:
∗ Équation cartésienne de la surface représentative STf,a de Tf,a :
T
∇f(a) (x − a) − (x3 − f(a)) = 0 ⇔ −24(x1 + 10) + 15(x2 − 3) − (146 − x3 ) = 0. (43)
∗ STf,a est le plan affine tangent au point A′ , de coordonnées (−10, 3, 146) dans R3 , à
la surface représentative Sf de f;
∗ Normale commune aux surfaces STf,a et Sf au point A′ : le vecteur de composantes
(−24, 15, −1) dans la base canonique E3 .
∗ Illustration : c.f. figure slide 53.

Position relative des lignes de niveau f(a) de f et Tf,a au voisinage de a:
∗ Notations : L146 (f) et L146 Tf,a (car f(a) = Tf,a (a) = 146).

∗ Interprétations géométriques :
- L146 (f) est la projection orthogonale sur le plan (O, x1 , x2 ) de la trace dessiné par la
surface représentative Sf de f sur le plan horizontal (parallèle au plan de
représentation des variables x1 et x2 ) d’altitude 146 (équation cartésienne x3 = 146).
- L146 (Tf,a ) correspond à la projection orthogonale sur le plan (O, x1 , x2 ) de la trace
dessiné par la surface représentative STf,a de Tf,a sur le plan horizontal (parallèle au
plan de représentation des variables x1 et x2 ) d’altitude 146 (équation cartésienne
x3 = 146).
∗ Natures géométriques :
- L146 (f) est une ellipse (elle sera explicité dans la prochaine section du chapitre)
d’équation cartésienne dans R2 :
2 2
x1 − x1 x2 + x2 − x1 − x2 = 146. (44)
- L146 (Tf,a ) Droite affine d’équation cartésienne :
f(x) = 146 ⇔ −24x1 + 15x2 = 285. (45)

© Igor Ciril , igor.ciril@ipsa.fr 53


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

Figure: 1) Représentation des surfaces représentatives de f et Tf,a - Le plan affine STf,a


 
tangente Sf au point A′ (−10, 3, 146), et le vecteur de composantes ∂x ∂f ∂f
(a), ∂x (a), −1
1 2
dans E3 est la normale commune au point A′ à STf,a et Sf . 2) Lignes de niveau
f(a) = Tf,a (a) = 146 de f et Tf,a - La droite affine L146 (Tf,a ) tangente L146 (f) au point
 
−24
a(−10, 3), et le vecteur gradient ∇f(a) = est la normale commune à L146 (Tf,a ) et
15
L146 (f) en leur point de contact a.

© Igor Ciril , igor.ciril@ipsa.fr 54


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

Figure: 1) Représentation des lignes de niveau de f et Tf,a passsant par a - ellipse L146 (f)
de centre le point critique de f et la droite affine L146 (Tf,a ) tangente à L146 (f) au point
a(−10, 3). 2) Le vecteur ∇f(a) est la normale commune au point a aux lignes de niveau
L146 (f) et L146 (Tf,a ).

© Igor Ciril , igor.ciril@ipsa.fr 55


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

∗ Position relative :
- La droite affine L146 (Tf,a ) de R2 tangeante au point a à la courbe de niveau
L146 (f).
- Normale commune en a aux lignes de niveau L146 (f) et L146 Tf,a : le gradient

 
−24
∇f(a) = .
15
∗ Illustrations : Figures slide 53 et 54.
♦ Direction de descente
• Définitions

Point critique

Définition 21 (Point critique)

Soit f : RN → R une fonction différentiable sur RN . Le point a ∈ RN est un point critique


de f si et seulement si ∇f(a) = 0.

Direction de descente

Définition 22 (Direction de descente)

Soient un point a ∈ R et une fonction f : RN → R différentiable au point a. Le vecteur non


nul d ∈ RN est une direction de descente de f au point a ⇔ f ′ (a, d) = ∇f(a)T d < 0.

© Igor Ciril , igor.ciril@ipsa.fr 56


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

• Propriétés

Zone de direction de descente

Proposition 7 (Demi-espace affine des directions de descentes en un point)


Soit f : RN → R une fonction différentiable en a ∈ RN telle que ∇f(a) ̸= 0. L’hyperplan
affine Lf(a) Tf,a , tangent au point a à l’hypersurface représentative Sf de f, partage
l’espace RN en deux demi-espace affine ouvert :
• l’un contenant le vecteur ∇f(a), c.-à-d. le demi-espace affine
N T
{d ∈ R : ∇f(a) d > 0}, (46)
correspondant à celui contenant les directions de montée de f au point a;
• l’autre ne contenant pas le vecteur ∇f(a), c.-à-d. le demi-espace affine
N T
{d ∈ R : ∇f(a) d < 0}, (47)
correspondant à celui contenant les directions de descente de f au point a.

Visualisations utiles dans la compréhension de la philosophie des méthodes
dites à directions de descentes
∗ Combinaison de deux modes visualisations : carte de niveau et fonction partielle.
∗ La carte de niveau guide dans le choix de la direction de descente au point considéré
(Définition 22 slide 55 et Proposition 7);
∗ Visualisation de la fonction partielle au point considéré et suivant la direction de
descente choisie permet de guider sur le choix de combien on peut faire décroître la
valeur de f suivant la direction choisie.
© Igor Ciril , igor.ciril@ipsa.fr 57
2. Dérivabilité & différentiabilité - Information locale d’ordre 1

√ ∗ Illustration : Combinaison des figures (a) et (b) de la figure slide 59.


Direction de plus forte descente

Proposition 8 (Direction de plus forte descente)

Soit f : RN → R une fonction différentiable en un point a ∈ RN telle que ∇f(a) ̸= 0. La


∇f(a)
direction unitaire v := − ∥∇f(a)∥ est la direction de plus forte descente de f au point a au
sens où pour tout vecteur unitaire d ∈ RN on a : ∇f(a)T v ≤ ∇f(a)T d.

• Exemple illustratif (suite)


√ 2
On considère la fonction f définie  sur R
 par l’expression (40) et le point
−24
a(−10, 3), pour lequel ∇f(a) = ̸= 0.
15

Zone de direction de descente : demi-espace affine ouvert  ne contenant pas le
vecteur ∇f(a) et de frontière (exclue) la droite L146 Tf,a .
√ √  
−8
Direction unitaire de plus forte descente : v := − ∥∇f(a)∥ := 8989
∇f(a)
. De
5

√ plus la dérivée en a dans cette direction vaut : f (a, v) = −∥∇f(a)∥ = −3 89.

Direction de descente ou montée de f en a ?
- Pour e1 direction de descente car f ′ (a, e1 ) = ∇f(a)T e1 = −24 < 0;
√ - Pour e2 direction de montée car f ′ (a, e2 ) = ∇f(a)T e2 = 15 > 0.
Illustration : c.f. Figures slide 58 et 59 (direction de descente e1 ).

© Igor Ciril , igor.ciril@ipsa.fr 58


2. Dérivabilité & différentiabilité - Information locale d’ordre 1

Figure: 1) Représentation des surfaces représentatives de f et Tf,a et du plan P(a, d)


vertical contenant la droite du plan de représentation des variables x1 et x2 de f passant
par a et de direction d, c.-à-d. la droite D(a, d) 2) En imaginant les courbes dessinée par les
surfaces Sf et STf,a sur le plan P(a, d) on retrouve la figure (b) du slide 59.
© Igor Ciril , igor.ciril@ipsa.fr 59
2. Dérivabilité & différentiabilité - Information locale d’ordre 1

(a) Lignes de niveau (b) Fonctions partielles


Figure: 1) La figure (b) représente la trace verticale de la figure en 3D du slide 58 suivant le
plan P(a, d). On retrouve cette configuration en plaçant la figure (b) perpendiculairement
au plan de la figure (a) de manière à faire coïncider l’axe des α (figure (b)) avec la droite en
pointillés vert de la figure (a) tel que le point α = 0 (figure (b)) se superpose sur le point a
(figure(a)) et le point α = βk (figure (b)) se superpose sur le point a′ . 2) e1 est bien une
direction de descente de f en a. Cela se vérifie en regardant la figure (b). En effet, fa,d est
strictement décroissante au voisinage de α = 0, c.-à-d. fa,d ′ (0) < 0. Mais aussi en

observant la figure (a). En effet, l’angle entre les vecteurs ∇f(a) et e1 est obtus donc leur
produit scalaire est strictement négatif.
© Igor Ciril , igor.ciril@ipsa.fr 60
2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

♦ Principe de généralisation
• Problématique : Généralisation des concepts de dérivée directionnelle,
dérivabilité (gradient et Jacobienne), différentiabilité au cas des fonctions
vectorielles de plusieurs variables, c.-à-d. f : RN → RM telle que :
f1 (x)
 
 .. 
 . 
N
(48)
 
∀x ∈ R , f(x) :=   fj (x) 

 . 
 .. 
fM (x)

où fj : RN → R est la j−ème fonction composante de f.


• Point crucial pour l’extension : on détermine la limite en un point d’une
fonction vectorielle au travers des limites au point considéré de ses
fonctions composantes.
• Indispensable pour :

définir la matrice hessienne et ainsi le concept de courbre directionnelle en un
√ point (c.f. section 3) ;
Caractériser la convexité et la stricte convexité d’une fonction deux fois
différentiables (c.f. section 4).

© Igor Ciril , igor.ciril@ipsa.fr 61


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

♦ Dérivée directionnelle et partielle


• En un point (local)

Définition

Définition 23 (Dérivée directionnelle et partielle)


Soient f : RN → RM la fonction vectoriel (48), un point a ∈ RN et un vecteur unitaire (au
moins non nul) d ∈ RN .
• On dit que f est dérivable en a suivant la direction d si et seulement si toutes ses fonctions
composantes fj admettent une dérivée directionnelle en a suivant d.
• Soit i ∈ [1, . . . , N]. Si d := ei dans l’item précédent, alors on parle de la ième dérivée partielle de f
au point a.


Notations :
∗ f′ (a, d) désigne la dérivée directionnelle de f en a suivant d, et correspond à la
matrice uni-colonne de M−lignes
 f ′ (a, d) 
1
.
.
 
.
 
 
′  f ′ (a, d) M
f (a, d) :=  j ∈R . (49)

.
 
.
 
.
 

fM (a, d)

© Igor Ciril , igor.ciril@ipsa.fr 62


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

∗ Soit i ∈ [1, . . . , N] et d := ei , alors f′ (a, ei ) = ∂f


∂xi (a) désigne la ième dérivée partielle
de f au point a, et correspond à la matrice uni-colonne de M−lignes
 ∂f1 
∂xi (a)
.
 
.
 
.
 
 
∂f  ∂fj
 ∈ RM . (50)

(a) := 
 ∂xi (a)
∂xi 
.
 
.
 
.
 
 
∂fM
∂x (a) i

• Sur un ouvert (global)



Définition

Définition 24 (Fonction dérivée directionnelle et partielle)


Soient f : RN → RM la fonction vectoriel (48), un ouvert Ω ⊂ RN et un vecteur unitaire (au
moins non nul) d ∈ RN .
• On dit que f est dérivable sur Ω suivant la direction d si et seulement si toutes ses fonctions
composantes fj admettent une dérivée directionnelle suivant d en tout point de Ω.
• Soit i ∈ [1, . . . , N]. Si d := ei dans l’item précédent, alors on parle de la ième dérivée partielle de f
sur l’ouvert Ω.

© Igor Ciril , igor.ciril@ipsa.fr 63


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

Notations :
∗ f′ (·, d) désigne la fonction dérivée directionnelle de f suivant d
(
′ Ω ⊂ RN → RM
f (·, d) : ,
x 7−→ f ′ (x, d)
où f ′ (x, d) est donnée par (49).
∗ Soit i ∈ [1, . . . , N] et d := ei , alors ∂f
désigne la fonction ième dérivée partielle de f
∂xi

Ω → RM
(
∂f
: ∂f(x) , (51)
∂xi x 7−→ ∂x
i
∂f(x)
où ∂xi est donnée par (50).

♦ Dérivabilité
• En un point (local)

Définition

Définition 25 (Dérivabilité)

Soient f : RN → RM la fonction vectoriel (48), un point a ⊂ RN . On dit que la fonction f est


dérivable en a si et seulement si f admet au point a toutes ses dérivées partielles
premières.

© Igor Ciril , igor.ciril@ipsa.fr 64


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

Notations:
∗ On désigne par ∇f(a) ∈ MN,M (R) la matrice gradient de f en a
 ∂f ∂fj ∂fM

1 (a) ...
 ∂x1 ∂x1 (a) ... ∂x1 (a)
 . .. . . 
 . . . 
 . . . . 
 ∂fj

 ∂f1 ∂fM
∇f(a) =  ∂x (a) ... (a) . . . ∂xi (a)

∂xi

 i
 . . . 
 . . . .. . 
 . . . 
 
∂f1 ∂fj ∂fM
∂xN (a) ... ∂xN (a) ... ∂xN (a)
 
↑ ↑ ↑
= ∇f1 (a) . . . ∇fj (a) . . . ∇fM (a) (52)
↓ ↓ ↓
∗ On désigne par Jf (a) ∈ MM,N (R) la matrice Jacobienne de f en a
T
Jf (a) = ∇f(a)
 ∂f ∂f1 ∂f1
1

∂x (a) ... ∂xj (a) ... ∂xN (a)
← Jf1 (a) →
 1
 
 . . .

 . . . .
 
.

 . . .
 
.
  
 ∂f   
∂fi ∂fi
=  ∂xi (a)  (53)

... ∂x (a) ... ∂xN (a) = ← Jfi (a) →
  
 1 j
.
 
 . . . 

 . . . 
 . 
 . . . 
 . 
← JfM (a) →
 
∂fM ∂fM ∂fM
∂x (a)
1
... ∂xj (a) ... ∂x (a)
N

© Igor Ciril , igor.ciril@ipsa.fr 65


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

• Sur un ouvert (global)



Définition

Définition 26 (Fonction gradient)

Soient f : RN → RM la fonction vectoriel (48) et un ouvert Ω ⊂ RN . On dite que f est


dérivable sur Ω si et seulement si f est dérivable en tout point de Ω.

Notations :
∗ Fonction Gradient de f:
(
Ω ⊂ RN −→ MN,M (R)
∇f : , (54)
x 7−→ ∇f(x)

où ∇f(x) est donnée par (52).


∗ Fonction Jacobienne de f:
(
Ω ⊂ RN −→ MM,N (R)
Jf : , (55)
x 7−→ Jf (x)

où Jf (x) est donnée par (53).



Dérivabilité et continuité : f : RN → RM peut être dérivable en un point, voir
même admettre en ce point des dérivées directionnelles dans toutes les
directions et ne pas être continue en ce point (c.f. contre exemple pour M = 1
aux slides 42-43).

© Igor Ciril , igor.ciril@ipsa.fr 66


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

♦ Différentiabilité
• Définition

Définition 27 (Différentiabilité en un point d’une fonction vectorielle)

Soit un point a de RN . Une fonction f : RN → RM est différentiable en a ∈ RN si et


seulement s’il existe une unique application linéaire de RN dans RM , notée Df(a), telle que
dans un voisinage10 de a, noté V(a), on a :
∀x ∈ V(a), f(x) = f(a) + Df(a)(x − a) + o (∥x − a∥) . (56)
L’application linéaire Df(a) : RN → RM est appelée la différentielle de f en a.

• Lien

entre différentiabilité et dérivabilité directionnelle
Le résultat

Proposition 9 (Différentiabilité et dérivabilité directionnelle)

Soit a un point de RN . Si la fonction f : RN → RM est différentiable en a alors elle admet


au point a une dérivée directionnelle suivant tout vecteur non nul d ∈ RN . De plus on a :
f′ (a, d) = Df(a)(d). (57)

10
Le voisinage est une boule de centre a et de rayon r > 0, c.-à-d. B(a, r) := {x ∈ RN : ∥a − x∥N ≤ r}

© Igor Ciril , igor.ciril@ipsa.fr 67


2. Dérivabilité & différentiabilité - Cas des fonctions vectorielles

Formulation matricielle de l’égalité fonctionnelle (57)
∗ Matrice représentant l’application linéaire Df(a) : RN → RM relativement aux bases
canoniques EN et EM des espaces RN etRM :
Jf (a) = [Df(a), EN , EM ] = [Df(a)(e1 ), . . . , Df(a)(ej ), . . . , Df(a)(eN )]
T
= Jf (a) = ∇f(a) , (58)
où Jf (a) et ∇f(a) sont données respectivement par les expressions (53) et (52).
∗ L’égalité vectorielle (34) s’écrit matriciellement : f ′ (a, d) = ∇f(a)T (d) = Jf (a)(d).
∗ L’égalité (56), correspondant au développement de Taylor-Young d’ordre 1 de f au
√ point a, se réécrit : ∀x ∈ V(a), f(x) = f(a) + ∇f(a)T (a)(x − a) + o (∥x − a∥) .
Formule de composition de fonctions différentiables

Proposition 10 (Différentiation en chaîne)

Soient U un ouvert de RN et g : U ⊂ RN → Rp une fonction différentiable en a ∈ U. Soient


V un ouvert de Rp contenant g(U) et f : V ⊂ Rp → RM une fonction différentiable en g(a).
Alors l’application f ◦ g est différentiable en a de différentielle exprimée sous les formes
équivalentes suivantes :
• Écriture fonctionnelle :
D(f ◦ g)(a) = D(f) (g(a)) ◦ Dg(a). (59)
• Écritures matricielles :
Jf◦g (a) = Jg (a) Jf (g(a)) , (60)
∇(f ◦ g)(a) = ∇f (g(a)) ∇g(a). (61)

© Igor Ciril , igor.ciril@ipsa.fr 68


3. Différentiabilité seconde - Hessienne et courbure

TO BE CONTINUED

© Igor Ciril , igor.ciril@ipsa.fr 69


Bibliographie I

[1] I. Ciril.
Optimisation convexe différentiable sans contrainte - Partie 1 : Optimisation
convexe dans R - Chapitre 1 : Autour de la fonction Objectif.
Slide Ma 321, IPSA, 2024.
[2] I. Ciril.
Optimisation convexe différentiable sans contrainte - Partie 1 : Optimisation
convexe dans R - Chapitre 3 : Quelques méthodes.
Slide Ma 321, IPSA, 2024.

© Igor Ciril , igor.ciril@ipsa.fr 70

Vous aimerez peut-être aussi