Vous êtes sur la page 1sur 3

DÉRIVÉE MATRICIELLE (A3, A7)

(09 / 05 / 2020, © Monfort, Dicostat2005, 2005-2020)

Les deux notions suivantes interviennent souvent en Statistique :

(a) fonction matricielle : c’est une fonction à valeurs matricielles (ensemble


image), quelle que soit la nature de ses arguments (ensemble de départ) ;

(b) fonction de matrice : c’est une fonction dont les arguments sont des
matrices (ensemble de départ), quelle que soit la nature de l’ensemble d’arrivée.

Ces deux notions peuvent faire l’objet d’un calcul différentiel (cf dérivée), qui se
combine avec les propriétés du calcul matriciel.

Ce qui suit est un relevé de propriétés usuelles de différentiabilité en rapport avec


des matrices.

(i) Dérivée d'une fonction différentiable (cf différentiabilité)

(a) soit f : Rn  Rm une fonction différentiable. Si m = 1, on appelle gradient


de f la fonction vectorielle, notée Grad f (ou D f, ou f ', ou f / x, ou encore  f),
définie sur Rn et à valeurs dans Rn, dont la valeur au point x  Rn est :

(1) (Grad f)(x) ou Grad f (x) = ( f (x) /  x1 ,...,  f (x) /  xn)ʹ.

Ainsi :

(a)1 lorsque f  Hom (Rn, R), ie si f (x) = a' x (resp x' a), alors (dérivée en x d'une
forme linéaire) Gradx f (x) = a' (resp Grad fx (x) = a),  x  Rn ;

(a)2 lorsque f (x) = x' A x, avec A  Sn (R) (matrice symétrique), alors (dérivée d'une
forme quadratique) Grad f (x) = 2 A x ;

(b) soit X  Mmn (R) et f : Mmn (R)  R. La dérivée f ' de f au point X est définie
par la matrice :

(2) f ' (X) = f / X = (fij' (X))(i , j)  Mmn (R),

avec X = (xij)(i,j) et fij' (X) = (f / xij)(X).

Ainsi :

(b)1 lorsque f (X) = a' X b, on a f ' (X) = a b' (dérivée d’une fq) ;

(b)2 lorsque f (X) = Dét X, on a f ' (X) = Com X (comatrice de X) ;

(b)3 lorsque f (X) = tr X (trace de X), avec n = m, alors f ' (X) = In ;

1
(c) lorsque m = 1, on appelle (application) hessienne de f : Rn  R la
fonction matricielle définie par les dérivées secondes de f, notée Hess f, ou Hf , ou
même H, et dont la valeur au point x  Rn est :

(3) (Hess f)(x) = (f ''xi xj (x))(i, j)  Sn (R).

Cette matrice est appelée (matrice) hessienne de f au point x. Son déterminant en


x s'appelle (déterminant) hessien de f en x.

La formule de B. TAYLOR limitée à l'ordre 2 s'écrit :

(4) f (x + dx) = f (x) + (1 !)-1 (Grad f (x))' dx + (2 !)-1 (dx)' (Hess f (x)) (dx) + o (dx),

ou encore :

(5) f (x + dx) = f (x) + < f ' (x), dx > + 2-1 < H (x) dx, dx > + o (dx),

où H (x) = Hess f (x), x  Rn et < u, v > = i ui vi .

(ii) Dérivée d'une fonction matricielle

Soit f : Mmn (R)  Mp (R) une fonction matricielle à valeurs dans l'espace des
matrices carrées d'ordre p.

(a) si l'on pose Y = f (X), avec y = f (X), on appelle dérivée matricielle
partielle de Y pr à l'élément xij de X la fonction matricielle fxij' : Mmn (R)  Mp (R) dont
la valeur au point X est :

(6) fxij' (X) = (Y / xij)(X) = (f (X) / xij ) .

Ainsi, avec m = n et Y = X-1, on établit les propriétés suivantes :

(a)1 d’une part, si Eij est la matrice d'indices (i, j) de la base canonique de Mn (R) :

(7)1 Y / xij = - X-1 Eij X-1,  X  Rn (R) ;

(a)2 d'autre part :

(7)2 (Dét Y) / xij = tr {(Com Y) (Y' / xij)} ;

(b) soit f : Rn  Rm une application de classe C1. On appelle (application)


jacobienne de f l'application dérivée, notée D f, ou f ', dont la valeur au point x  Rn
est :

(8) f ' (x) = (fi (x) / x j)(i , j)  Mmn (R).

2
La matrice associée à f ' est appelée (matrice) jacobienne de f au point x. Son
déterminant s'appelle (déterminant) jacobien de f en x.

A titre d'exemples :

(b)1 si m = n et si x  f (x) = A x + b est la représentation matricielle d'une


application affine dans Rn, sa jacobienne est f ' (x) = A,  x  Rm ;

(b)2 si m = 1 et si x  f (x) = x' A x / x'x,  x  0, avec f (x) = 0 si x = 0 (où A  Sn


(R)), alors il existe un vecteur propre v de A tq f ' (v) = Grad f (v) = 0.

(b)3 si n = 1 et si f : R  Mm (R) est une fonction matricielle régulière sur une partie R
 R (cf matrice régulière), alors :

(9) D (f (x))-1 = - f (x)-1 (D f (x)) f (x)-1,  x  R,

soit, en posant Y = f (x) :

(9)' D (Y-1)' = - Y-1 (D Y) Y-1,

où D Y(x) = (fij' (x))(i,j) et fij' (x) = dfij (x) / dx,  x  R.

Les résultats précédents sont des exemples de différentiation de fonctions définies


sur un espace normé et à valeurs dans un autre espace normé.

Vous aimerez peut-être aussi