Académique Documents
Professionnel Documents
Culture Documents
1-Dériver une sommation (un produit scalaire de deux vecteurs) par un vecteur -colonne
Soit
a z
1 1
a z
am×1 = 2 et z m×1 = 2 ,
⋮ ⋮
am zm
m
alors a ' z = ∑ ai z i = a1 z1 + a2 z 2 + ... + am z m = z ' a
i =1
pour résumer
∂a ' z ∂z ' a
= =a
∂z ∂z
Exemple:
1 z
1 3
a = 2 , z 3×1 = z 2 , a ' z = ∑ ai z i = z ' a = 1z1 + 2z 2 + 3z 3
3 i =1
z3
∂z ' a ∂(1z + 2z + 3z )
1 2 3
∂z ∂z1
1 1
∂(1z + 2z + 3z )
∂a ' z ∂z ' a ∂z ' a 3 2 = a
= = =
1 2
=
∂z ∂z ∂z 2 ∂z 2 3
∂z ' a
∂(1z 1 + 2z 2 + 3z )
3
∂z 3 3×1 ∂z 3
Soit
z a ⋯ a1m
1 11 a12
z a a22 ⋯ a2m
z m×1 = 2 , Am×m = 21
⋮ ⋮ ⋮ ⋱ ⋮
zm am 1 am 2 ⋯ amm
a ⋯ a1m z1
11 a12
a a22 ⋯ a2m z 2
avec la fonction quadratique f (z ) = z ' Az = z1 z2
⋯ z m 21
⋮ ⋮ ⋱ ⋮ ⋮
am 1 a m 2 ⋯ amm z m
m
∑ a1i z i
a z + a z + ... + a z i =1
11 1 12 2 1m m m
a z + a z + ... + a z m m
⋯ zm ∑
2m m a2i z i =
= z1 z2 ⋯ z m 21 1 22 2
= z1 z2
∑ z j ∑ a ji zi
i =1
j =1 i =1
a z + am 2z 2 + ... + amm z m m
m1 1
∑ ami z i
i =1
Pour le gradient on a :
∂f (z )
∂z
1
∂f (z )
∂f (z ) ∂z ' Az Az + A ' z = (A + A ')z ∀Am×m
gradf (z ) = ∇z f (z ) = = ∂z 2 = =
∂z 2Az si A = A ' (A est symétrique)
z1 ⋮
z
∂f (z )
∂ 2
⋮ ∂z
m m×1
zm
pour résumer
∂z ' Az Az + A ' z = (A + A ')z ∀Am×m
=
∂z 2Az si A = A ' (A est symétrique)
a a z a z + a z
z 'A z = z1 z 2 11 12 1 = z1 z 2 11 1 12 2
= z1 a11z1 + z1 a12z 2 + z 2 a21z1 + z 2 a22z 2
a a z +a z
21 a22 z 2 21 1 22 2
∂z 'A z ∂(z a z + z a z + z a z + z a z )
1 11 1 1 12 2 2 21 1 2 22 2
∂z 'A z
=
∂z 'A z
=
∂z 1
=
∂z1 = 2a11z1 + a12z 2 + a21z 2
∂z ∂z ∂z 'A z a z + a z + 2a z
∂(z1 a11z1 + z1 a12z 2 + z 2 a21z1 + z 2 a22z 2 ) 12 1 21 1 22 2
∂z
2 ∂ z 2
a z + a z a z + a z a a z a a z
= 11 1 12 2
+ 11 1 21 2
= 11 12 1 + 11 21 1
a21z1 + a22z 2 a12z1 + a22z 2 a21 a22 z 2 a12 a22 z 2
a
11 a12 a11 a12 z1
= + ' = (A + A ')z
a21 a22 a21 a22 z 2
Pour résumer
∂2 z ' Az ∂ ∂z ' Az ∂ A + A ' ∀Am×m
= = ( (A + A ')z ) =
∂z ∂z ' ∂z ' ∂z ∂z ' 2A si A = A '
Si on a
z a ⋯ a13 b
1 11 a12 1
z a a22 ⋯ a2m b
2
zm×1 = 2 , Am×m = 21 et bm×1 =
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
zm am 1 am 2 ⋯ amm bm
∂ℓ(z )
∂z
1
∂ℓ(z )
∂ℓ(z ) ∂ℓ(z )
gradℓ(z ) = ∇z ℓ(z ) = = = ∂z 2
∂z z
1 ⋮
z
2 ∂ℓ(z )
∂
⋮ ∂z
m m×1
zm
a a z
A2×2 = 11 12 , z 2×1 = 1 ,
a a z
21 22 2
a a z a z + a z
z 'A z = z1 z 2 11 12 1 = z1 z 2 11 1 12 2 = z a z +z a z +z a z +z a z
a a z +a z 1 11 1 1 12 2 2 21 1 2 22 2
21 a22 z 2 21 1 22 2
∂ ∂z 'A z ∂
(2a z + a z + a z ) (a z + a z + 2a z )
2
∂ z ' Az ∂ ∂z ' Az ∂z ∂z ' 11 1 12 2 21 2 12 1 21 1 22 2
= = 1 = ∂z1
∂z ∂z ' ∂z ∂z ' ∂ ∂z 'A z ∂
(2a z + a z + a z ) (a z + a z + 2a z )
∂z ∂z ' ∂z 11 1 12 2 21 2 12 1 21 1 22 2
2 2
2a (a12 + a21 ) a + a a + a
= 11
= 11
12
+ 11 21
= (A + A ')
(a12 + a21 ) 2a22 a21 + a22 a12 + a22
∂2 f (z ) ∂ ∂f (z )
C.D.O. : ≡ = H >> 0 , ce qui veut dire que la forme quadratique est positive définie
∂z ∂z ' ∂z ∂z ' z =z *
z =z *
car H est une matrice positive définie. Bref la fonction f (z ) est strictement convexe au point z * .
∂2 f (z ) ∂ ∂f (z )
C.D.O. : ≡ = H << 0 , ce qui veut dire que la forme quadratique est négative
∂z ∂z ' ∂z ∂z ' z =z *
z =z *
définie car H est une matrice négative définie. Bref la fonction f (z ) est strictement concave au point z * .
- Si x ' Ax > 0 pour un ou des x ∈ ℝ n et x ' Ax < 0 pour un ou plusieurs autre(s) x ∈ ℝ n ⇒ A est Non-définie
Exemples
M i* est la matrice composée de la sous-matrice prenant les i -ièmes premières lignes et i -ièmes colonnes de la matrice
Hessienne H , donc M i* comporte i × i éléments.
Ainsi mi* = det( M i* ) est le i -ième mineur principal primaire, c’est donc le déterminant de la matrice M i*
Attention : il ne faut pas confondre le i -ième mineur principal primaire noté mi* = det( M i* ) avec le mineur
mij = det( M ij ) de la matrice de mineur M ij qui est construite à partir d’une matrice A auquel on a enlevé la ligne i et
la colonne j . Pour éviter la confusion j’ai ajouté un * lorsque l’on parle de mineurs principaux primaires.
Les mineurs principaux primaires sont utilisés pour déterminer la forme de la matrice Hessienne dans les problèmes
d’optimisation.
Les mineurs (simples) sont utilisés pour calculer des déterminants avec l’expansion de Laplace.
a11 a12 a b
Pour A2×2 = =
a22 c d
on a la définition suivante
a21
a11 a12
det( A2×2 ) = A2×2 = = a11a22 − a21a12 = ad − bc
a21 a22
n
det( A) =| A | = ai1ci1 + ai 2 ci 2 + ⋯ + ain cin = ∑ aij cij
j =1
∀i, j ∈ ℕ* tel que 1 ≤ i ≤ n et 1 ≤ j ≤ n
n
= a1 j c1 j + a2 j c2 j + ⋯ + anj cnj = ∑ aij cij
i =1