Vous êtes sur la page 1sur 18

Analyse des données

"ADD"

L.Sami & R.AZZAZ


Table de matieres

Objectifs
- Chapitre I: Analyse en Composantes Principales (ACP) 4
1. Initiation et rappels analyse des données ........................................................................4
1.1. Qu'est-ce que l'Analyse de Données ? .........................................................................................................4
1.2. Rappel statistique descriptive et de la probabilité.....................................................................................5
1.3. Ajustement linéaire et Corrélation ..............................................................................................................8
1.4. Rappel Algèbre linéaire..............................................................................................................................14

2
Objectifs
Lʼobjet de ce cours est de présenter les principes de lʼanalyse des données. Le
programme rassemble un groupe de techniques aux fondements mathématiques qui
permet dʼappréhender la structure de lʼinformation contenue dans un espace à
plusieurs dimensions.
A l'issue de ce cours, lʼétudiant sera capable de :
Traiter et décrire l'information contenue dans des grands ensembles de données.
Comprendre les moyens théoriques et pratiques pour exploiter les informations issues de base de
données statistiques multidimensionnelles grâce aux méthodes dʼanalyse statistique multivariées.
Comprendre les mécanismes qui justifient l'emploi de telle ou telle méthode
Interpréter correctement les graphiques et résultats fournis par les logiciels.

3
I Chapitre I: Analyse en Composantes
Principales (ACP)
Ce chapitre introduit l'Analyse en Composantes Principales (ACP) en tant que technique essentielle pour
simplifier des données multivariées complexes. L'ACP cherche à révéler des motifs dans les données en
trouvant des combinaisons linéaires appelées composantes principales. Il couvre les principes fondamentaux,
l'interprétation et les aspects géométriques de l'ACP, offrant des outils pour réduire la dimensionnalité des
données et comprendre les données multivariées, améliorant ainsi les capacités d'analyse des données.

1. Initiation et rappels analyse des données


L'Analyse en Composantes Principales (ACP) est une méthode statistique qui repose sur des principes
mathématiques et statistiques. Pour maîtriser efficacement cette technique, il est important de bien
comprendre les notions statistiques de base. Dans cette section, nous vous fournirons un aperçu simple et clair
des concepts statistiques fondamentaux que vous devez connaître, tels que l'algèbre linéaire, les mesures de
tendance centrale, différents types de données, la régression linéaire, la corrélation, et bien plus encore. Cette
connaissance fondamentale vous aidera à mieux comprendre l'ACP et comment l'utiliser dans l'analyse de
données.

1.1. Qu'est-ce que l'Analyse de Données ?


 Definition : l'Analyse de Données
L'analyse de données est le processus d'inspection, de nettoyage, de transformation et de modélisation des
données afin d'extraire des informations utiles, de suggérer des conclusions et de soutenir la prise de
décision. Elle implique diverses opérations mathématiques et graphiques qui peuvent être effectuées sur des
données expérimentales pour extraire les informationspertinentes contenues dans les données.

4
Chapitre I: Analyse en Composantes Principales (ACP)

1.2. Rappel statistique descriptive et de la probabilité.


a) statistique descriptive
Vocabulaire statistique
Cette figure résume le vocabulaire statistique.

Graphic 1

Vocabulaire statistique

Description Example

Ω = l'ensemble des étudiants de la section


A.
L'ensemble entier sur lequel l'étude
Population Ω = la population de l'Algérie est définie
statistique est axée. (Notation : Ω)
comme l'ensemble de toutes les
personnes résidant en Algérie.

Un individu est tout étudiant de la section


Individu A.
Tout élément de la population Ω. (Notation :
(unité Unseul element de n'importe quelle
w, où w ∈ Ω)
statistique) population donnée est appelé un élément
ou un individu.

Un échantillon est un groupe plus restreint


choisi parmi une population plus large pour Sélectionner 1000 individus de la
Échantillon
représenter et étudier les caractéristiques ou population de l'Algérie.
attributs de l'ensemble de la population

Une variable est une caractéristique qui La température corporelle est une
change ou varie avec le temps et/ou d'un variable qui change au fil du temps chez
variable
individu ou d'un objet à l'autre pris en un individu donné ; elle varie également
considération. d'une personne à une autre.

Si la variable statistique est "état civil", les


Les différentes valeurs qu'une variable
Modalités modalités pourraient être "célibataire,
statistique peut prendre.
marié, divorcé,..."
.

Variable Une variable qualitative est une variable dont


le genre (Homme, Femme)
qualitative les Modalités ne sont pas numériques

5
Chapitre I: Analyse en Composantes Principales (ACP)

Description Example

Les éléments de C sont numériques. Il y a deux types :


Variable quantitative discrète : peut prendre uniquement un nombre fini ou
dénombrable de valeurs (par exemple, nombre d'élèves par salle, Modalités : 1, 2,
Variable
3...)
quantitative
Variable quantitative continue : peut prendre un nombre infini de valeurs
correspondant aux points sur un intervalle de ligne (par exemple, taille des élèves,
Modalités : [150, 180] cm).

Données univariées : lorsque seule une variable est mesurée


Données
univariées,
Données bivariées : résultent lorsque deux variables sont mesurées
bivariées et .
multivariées
Données multivariées : lorsque plus de deux variables sont mesurées.

 Definition : Analyse de données multivariées vs analyse de données univariées


L'analyse de données multivariées (ADDM) est une approche statistique utilisée pour analyser des ensembles
de données avec de multiples variables. Contrairement à l'analyse univariée, qui traite une seule variable à la
fois. Elle englobe diverses techniques telles que l'analyse de régression, l'analyse en composantes
principales (ACP), l'analyse factorielle et l'analyse de regroupement (Classification), entre autres. L'ADDM est
largement appliquée dans des domaines tels que la science des données (Data science), la finance, la
biologie et les sciences sociales pour découvrir des motifs, des relations et des informations au sein
d'ensembles de données complexes.

b) Mesures de tendance centrale, de dispersion et de relation


 Definition : Moyenne arithmétique
La moyenne arithmétique peut être décrite comme la distance moyenne de chaque point de données de
l'échantillon au point d'origine.
¯
X =
1

n

n

i=1
xi ,

 Example :
Considérons un échantillon contenant les notes annuelles de 5 étudiants dans le domaine de la statistique
inférentielle, notées x = 13, x = 16, x = 10, x = 4, etx = 6. Dans ce contexte, la moyenne
1 2 3 4 5

arithmétique est calculée en ajoutant toutes les notes et en divisant la somme par le nombre d'étudiants.
Mathématiquement, cela peut être exprimé par la formule :
¯x1 +x2 +x3 +x4 +x5 49
X = = = 9.8
5 5

Visuellement, si nous représentons ces notes sur un graphique, la note x = 13 peut être vue comme la
1

distance moyenne par rapport au point d'origine (0, 0). La moyenne arithmétique représente la
distance moyenne des notes de tous les étudiants par rapport à ce point central.

 Definition : Variance
La variance peut être définie comme la moyenne des carrés des différences entre chaque point de données
de l'échantillon et la moyenne.
Visuellement, si nous représentons ces notes sur un graphique, la distance au carré entre la note x 1
= 13 et
la moyenne= 9, 8 est égale à (13 − 9, 8) = 3, 2 = 10, 24.
2 2

6
Chapitre I: Analyse en Composantes Principales (ACP)

La distance moyenne au carré par rapport à la moyenne peut être exprimée mathématiquement comme suit :
¯ 1 n=5 2
V (X) = ∑i=1 (xi − X)
n

Lorsque l'écart (distance) entre les points de données et la moyenne est plus grand, cela signifie que nos
données sont plus dispersées. Par conséquent, des valeurs plus élevées de la variance indiquent une
dispersion accrue des données, tandis que des valeurs plus faibles indiquent le contraire.

 Definition : La Covariance
La Covariance (Cov(X, Y )) est une mesure de la manière dont deux variables évoluent ensemble, indiquant
si elles ont tendance à augmenter ou à diminuer simultanément. En termes plus simples, la covariance aide à
évaluer s'il existe une association linéaire entre deux variables (X, Y ) et, le cas échéant, si cette association
est positive ou négative. Elle est représentée mathématiquement comme suit :
¯
¯
1 n
Cov(X, Y ) = ∑ (xi − X)(yi − Y )
n i=1

La covariance peut être influencée par l'échelle des variables, rendant les comparaisons entre les ensembles
de données difficiles. Pour standardiser la mesure, les chercheurs utilisent souvent le coefficient de
corrélation (r), qui est la covariance divisée par le produit des écarts-types des variables.

c) Autres concepts
Variables aléatoire :
Une variable aléatoire X est une fonction mathématique qui attribue une valeur à chaque résultat possible
d'une expérience aléatoire.
Par exemple, si nous définissons X comme "le résultat d'un lancer de dé", alors X peut prendre les valeurs
, , , , , .
1 2 3 4 5 6

"Variable centrée réduite" vs "Variable centrée"


Variable centrée réduite (Variable standardisée) :
La standardisation, également connue sous le nom de normalisation z-score, transforme les données de
manière à ce qu'elles aient une moyenne (moyenne) de 0 et un écart-type de 1. Ce processus fait en sorte que
les données suivent une distribution normale standard (avec une moyenne de 0 et un écart-type de 1). La
standardisation est utilisée lorsque les données ont des unités différentes ou lors
de la comparaison de variables avec des échelles différentes.
La formule de la standardisation est la suivante :
¯
¯
xi −X xi −X
Xi standardized = =
√ V (X) σx


σx est l'écart-type de l'ensemble de données.
La standardisation recentre les données autour de zéro et les rééchelonne, ce qui les rend adaptées aux
algorithmes qui supposent une distribution normale des données, tels que la régression linéaire et l'analyse
en composantes principales (PCA).
Variable centrée (Mean Centering):
Centering, ou centrer les données, est une technique de prétraitement des données utilisée pour décaler les valeurs
des données de manière à ce que leur moyenne devienne zéro. Ce processus consiste à soustraire la valeur moyenne
à chaque point de données. Le centrage est particulièrement utile lorsqu'il s'agit de caractéristiques
ayant des unités différentes ou lorsque les valeurs absolues des points de données ne sont pas aussi importantes
que leurs différences relatives par rapport à la moyenne.
La formule pour recentrer une variable X est la suivante :
¯
xic entre = xi − X

7
Chapitre I: Analyse en Composantes Principales (ACP)

Le centrage "reloge" efficacement les données autour d'un nouveau point de référence (zéro), ce qui facilite
leur interprétation et leur analyse. Cette technique est couramment utilisée dans diverses applications
statistiques et de modélisation pour simplifier l'analyse des données et améliorer l'interprétabilité des
résultats.

1.3. Ajustement linéaire et Corrélation


a) Relation entre deux variables
Il existe souvent une relation entre deux ou plusieurs variables statistiques, telles que le poids et la taille, ou la
saison et le nombre de chauffages fabriqués. Cette relation est exprimée mathématiquement à l'aide d'une
équation mathématique qui relie ces variables.
i) Relation entre deux variables
1 Relation entre deux variables

Nuage de points
Un graphique de dispersion, également connu sous le nom de nuage de points , est une représentation
graphique de points de données dans un espace bidimensionnel. Il est couramment utilisé pour afficher la
relation entre deux variables ou pour montrer la distribution des points de données.
Dans un nuage de points, chaque point de données est représenté par un point ou un marqueur sur le
graphique, avec une variable tracée sur l'axe horizontal (axe des x) et l'autre variable tracée sur l'axe vertical
(axe des y), formant ainsi un point (x , y ).
i i

Graphic 2 Scatterplot

8
Chapitre I: Analyse en Composantes Principales (ACP)

2 La Nature de la Relation

Relation linéaire

Une relation est considérée comme linéaire lorsqu'elle peut


être exprimée sous la forme de Y = aX + b. En d'autres
termes, cela indique que le nuage de points s'aligne bien avec
une ligne droite lorsqu'il est ajusté correctement.

Relation non linéaire


si la relation entre X et Y n'est pas de la forme Y = aX + b, mais de type différent (parabole, hyperbole, etc)
,le nuage de point présente alors une forme complexe avec des courbures

Graphic 3 non-linear relationship


1 Exemple

 Example :
Considérez X et Y comme deux variables représentant l'âge et le prix d'une voiture d'occasion,
respectivement, comme indiqué dans le tableau ci-dessous :

X 2 3 5 7 9 10

Y 1 4 7 11 14 17

9
Chapitre I: Analyse en Composantes Principales (ACP)

Les données du tableau sont représentées visuellement à travers un nuage de points, comme illustré ci-
dessous :

Graphic 4
Comme le montre le graphique, le graphique de dispersion peut être approximé par une ligne droite, ce qui
suggère une relation linéaire entre X et Y .

ii) L'ajustement linéaire


1 Equation d’ajustement linéaire

La méthode des moindres carrés


Pour identifier la ligne "optimale", une technique mathématique appelée méthode des moindres carrés (ou -
Moindres carrés ordinaires : MCO) est utilisée. Dans sa forme de base, cette approche cherche la ligne qui
minimise la somme des carrés des différences entre les points représentatifs et la ligne elle-même, souvent
représentée comme (Y = aX + b).

Graphic 5

10
Chapitre I: Analyse en Composantes Principales (ACP)

Graphic 6
La minimisation des distances implique l'utilisation de la méthode des moindres carrés bien connue, qui
consiste à déterminer la ligne d'ajustement de manière à minimiser la somme des écarts carrés, notée d , d , 1 2

et ainsi de suite :
n
∑i=1 di = min

Les valeurs des constantes (paramètres) a et b de l'équation Y = aX + b sont obtenues par la résolution
simultanée des équations normales associées à la ligne des moindres carrés. Cela conduit au résultat suivant
:
Cov(X,Y )
a =
V (X)

¯
¯
b = Y − aX

Avec :
¯
¯
¯
¯
1 n 1 n
Cov(X, Y ) = ∑i=1 (xi − X)(yi − Y ) = ∑i=1 xi yi − X Y
n n

et:
2
¯
¯
1 n 2 1 n 2
V (X) = ∑ (xi − X) = ∑ x − X
n i=1 n i=1 i

 Note :
La méthode des moindres carrés permet la création de la ligne de régression pour X par rapport à Y ou pour
Y par rapport à X .

 Example : Exemple
Calcul des paramètres de régression (ligne d'ajustement Y=aX+b) en utilisant la méthode des moindres carrés
en se basant sur l'ensemble de données suivant.

données X & Y

11
Chapitre I: Analyse en Composantes Principales (ACP)

xi yi

2 7

4 10

6 13

8 15

9 20

13 28

Solution :
Dans cet exemple, nous voulons déterminer la relation linéaire entre la variable indépendante X et la variable
dépendante Y. Nous utiliserons la méthode des moindres carrés pour trouver la meilleure ligne d'ajustement
(ligne de régression linéaire).
Étape 1 : Calcul des moyennes
¯−
Moyenne de X : X = (2 + 4 + 6 + 8 + 9 + 13)/6 = 42/6 = 7


¯
Moyenne de Y : Y = (7 + 10 + 13 + 15 + 20 + 28)/6 = 93/6 = 15, 5

Étape 2 : Compléter le tableau

Calcules

¯
¯
¯
¯ −
− − −
xi yi xi yi 2 −
xi − X yi − Y (xi − X) (yi − Y )
(xi − X )

2 7 14 -5 -8.5 25 42.5

4 10 40 -3 -5.5 9 16.5

6 13 78 -1 -2.5 1 2.5

8 15 120 1 -0.5 1 -0.5

9 20 180 2 4.5 4 9

13 28 364 6 12.5 36 75

42 93 796 - - 76 145

Étape 3 : Calcul de Cov(X, Y ) and V (X)


¯
¯
n
− −
1 145
Cov(X, Y ) = ∑ (xi − X)(yi − Y ) = = 24.16
n i=1 6

¯
1 n 2 76
V (X) = ∑i=1 (xi − X) = = 12.67
n 6

Étape 4 : Calculer la pente (a) et l'intercept (b)


Cov(X,Y ) 24.16
a = = = 1.908
V (X) 12.67

¯
¯
b = Y − aX = 15.5 − (1.908). (7) = 2.145

L'équation de régression linéaire est donnée par yi = a ∗ xi + b . En substituant les valeurs :


Y = 1.908X + 2.1445

12
Chapitre I: Analyse en Composantes Principales (ACP)

Graphic 7
1 Corrélation linéaire

 Definition : Corrélation linéaire


La relation qui existe entre deux variables statistiques est couramment notée "corrélation". Pour évaluer la
force de cette relation linéaire entre deux variables statistiques, il devient essentiel d'établir un indicateur
approprié.

Coefficient de corrélation linéaire (r) :


Le coefficient de corrélation linéaire, noté "r", est calculé à l'aide de la formule , où −1 . Ce
Cov(x,y)
≤ r ≤ 1
σx σy

coefficient mesure la force et la direction de la relation linéaire entre deux variables.


Voici ce que signifient différentes valeurs de r :
r = 0 : Il n'y a aucune corrélation linéaire entre les variables (Indépendance linéaire).
r = 1 : Il y a une corrélation linéaire positive parfaite, ce qui signifie que les variables évoluent dans la même
direction.
r = −1 : Il y a une corrélation linéaire négative parfaite, ce qui indique que les variables évoluent dans des
directions opposées.

 Note :Remarque
Le coefficient de corrélation nous fournit des informations sur la présence d'une relation linéaire
(sous la forme d'une ligne droite) entre les deux variables en question.
Un coefficient de corrélation nul n'implique pas l'absence de toute relation entre les deux
variables. Il pourrait toujours y avoir une relation non linéaire entre elles.
La corrélation ne doit pas être confondue avec les relations de cause à effet. L'existence d'une
corrélation, quelle que soit sa force, n'est jamais une preuve d'une relation de cause à effet.

13
Chapitre I: Analyse en Composantes Principales (ACP)

Voici quelques représentations graphiques possibles :

Graphic 8

Graphic 9

Graphic 10

1.4. Rappel Algèbre linéaire


Dans cette section, nous explorons des concepts essentiels de l'algèbre linéaire qui servent de base aux
méthodes factorielles avancées telles que l'ACP, l'AC et l'ACM. Maîtriser ces notions fondamentales est essentiel
pour exploiter pleinement la puissance de ces techniques d'analyse de données.
a) Le Produit Scalaire

Norme du vecteur : La norme d'un vecteur v représente sa


longueur et est notée comme ||v||

14
[cf.]
Exemple: Soit : [

Exemple: Si u

2
||u||
=

= [2, 3, 4] ⋅

⟨u, v⟩ = u

λ = 2 :
T

⟨u, λv⟩ = 2⟨u, v⟩

Nous avons :

⎢⎥
Formule du produit scalaire : Le produit scalaire de deux vecteurs
⟨u, v⟩ = ||u|| ⋅ ||v|| ⋅ cos(θ) = u v.

v = [1

⟨u, 2v⟩ = [3, 4] ⋅ [


]


and v

4

2 ⋅ 1

2 ⋅ 2
and
= [

= 2

− 1][

2
4

6
1

+ 3

Vecteurs orthogonaux : Si le produit scalaire de deux


]
T

. Alors, ⟨u, v⟩

, Alors, ⟨u, v⟩

vecteurs est nul, ⟨u, v⟩ = 0, cela signifie que u and v sont


orthogonaux (et indépendants).
Exemple : supposons que nous ayons deux
vecteurs
bidimensionnels : u = [
1
] and v = [
2
]
−1
+ 4
2
Chapitre I: Analyse en Composantes Principales (ACP)

= 3 ⋅ 1 + 4 ⋅ 2 = 11

Produit scalaire élément par élément : Le produit scalaire peut également s'exprimer comme la
somme des produits élément par élément: ⟨u, v⟩ = ∑ u v .
n

i=1

= 4 + 9 + 16 = 29

] = (1 ⋅ 2) + (−1 ⋅ 2) = 0

Comme le produit scalaire de u et v est nul, cela signifie que


u and v sont des vecteurs orthogonaux (perpendiculaires).

Multiplication scalaire à des produits scalaires : ⟨u, λv⟩

Exemple : Supposons qu' on a deux vecteurs : u

] = [3, 4] ⋅ [
2

4
= [
3

4
]
i i

= 1 ⋅ 4 + 2 ⋅ 5 + 3 ⋅ 6 = 32

Propriété commutative : Le produit scalaire est commutatif, ce qui signifie ⟨u, v⟩


Identité de la norme au carré : c'est une expression mathématique qui calcule la norme au carré (ou
la longueur) d'un vecteur.
⟨u, u⟩ = ∥u∥
2
= u
T
u = ∑
n

i=1
u

Exemple: Supposons que nous ayons un vecteur tridimensionnel u


2
i

= λ⟨u, v⟩,

and v

] = (3 ⋅ 2) + (4 ⋅ 4) = 22
=

= [
.

2

]
2

4
u


.

∀λ ∈ R
et v est donné par :

= ⟨v, u⟩ = v
T

, ainsi qu'une valeur scalaire


u .

15
Chapitre I: Analyse en Composantes Principales (ACP)

16
et :

2⟨u, v⟩ = 2 ⋅ [3, 4] ⋅ [

Exemple : Matrice: A

A est symétrique car A

lignes et p colonnes.

A(n,p) =

Exemple:

Exemple :

Matrice: A

.
T

A = [

(A. B)
A =

T
3

−2
implique

1. Matrice: A

2. Transposée: A

une matrice carrée.

T rA = 3 + 4 = 7

= B
=

√2

√2

4
1

T
]
(3,2)

√2

√2

−1

√2

√2
1
A

T
=

⎤ ⎡

⎦ ⎣

Multiplication de matrices : est notée A

.A
T
1

T
(p, n)

−1

√2

√2

.
T

⎢⎥
] = 2 ⋅ (3 ⋅ 1 + 4 ⋅ 2) = 22

Comme vous pouvez le voir, les deux équations donnent le même résultat.

b) Matrices et leurs propriétés


Symétrie des matrices : Une matrice A est considérée comme symétrique si et seulement si sa
transposée A est égale à elle-même : A est symétrique: ⟹ A = A
T

= A
1

√2

−1

√2
2

.
3

Dimensions de l'ordre de la matrice et transposition : Une matrice A


Supposons que nous ayons une matrice A d'ordre (3, 2), ce qui signifie qu'elle a 3 lignes et 2 colonnes.

(2,3)

= [
1

5
2

2

4
5

6
]

Remarque : si le nombre de lignes est égal au nombre de colonnes d'une matrice A, on dit que A est

Matrices orthogonales : Une matrice orthogonale A est une matrice pour laquelle le produit de la
matrice et de sa transposée est égal à la matrice identité A . A = I

$Aisorthogonalbecause$A

√2

√2
1

1


= [
1

(n,p)

La transposée du produit de deux matrices est égale au produit de leurs transposées :


0

Trace de la matrice : La trace d'une matrice, TrA, est la somme de ses éléments diagonaux.
Exemple : Supposons que nous ayons la matrice carrée suivante A :
]
T

T
A = I

∗ B(p,m) = C(n,m) .
T

(n,p) est définie comme ayant n


Chapitre I: Analyse en Composantes Principales (ACP)

Example :
Supposons que nous ayons deux matrices, la matrice A (2,3)
et la matrice B
(3,4)

1 2 3
A = [ ]
4 5 6

7 8 9 10
⎡ ⎤
B = 11 12 13 14
⎣ ⎦
15 16 17 18

74 80 86 92
La matrice C (2,4)
= A. B = [ ]
173 188 203 218

[cf.]
Déterminant d'une matrice : Il existe plusieurs méthodes pour calculer le déterminant d'une matrice, chacune adaptée à différentes situations. Voici deux
méthodes couramment utilisées :
1. Expansion par les mineurs (développement par les cofacteurs) : Cette méthode convient aux matrices de petite à moyenne taille.
a b
Pour une matrice 2x2 det(A) = = ad − bc
c d

Pour les matrices plus grandes : vous pouvez développer le long d'une ligne ou d'une colonne de votre choix :
n i+j
det(A) = ∑i=1 (−1) aij det(Aij )

Où a est l'élément de la i-ème ligne et de la j-ème colonne de la matrice A, et A est la matrice obtenue en supprimant la i-ème ligne et la j-
ij ij

ème colonne de A.
2. Shortcut method:

2 −1 2

5 9 5 = −108 + −45 + 0 − (162 + 0 + 30) = −345

9 0 −6

17
Chapitre I: Analyse en Composantes Principales (ACP)

Valeurs propres et vecteurs propres : les valeurs propres et les vecteurs propres sont essentiels pour
diverses applications en algèbre linéaire et en analyse de données.
Soit athbf A une matrice carrée d'ordre p. Une valeur propre λ de la matrice A existe s'il existe un
vecteur colonne non nul v satisfaisant à l'équation : A v (p,p) (p,1)
= λv(p,1) .
Cette relation peut s'exprimer comme suit (:A − λI)v = 0 , Où , I est la matrice identité.
La technique pour calculer les valeurs propres d'une matrice consiste à résoudre son polynôme
caractéristique :
det(A − λI) = 0

Autres rappels:
1. Trace des matrices :
trace(ABC) = trace(BCA) = trace(CAB)

2. Diagonalisation de matrices symétriques :


Si A est une matrice symétrique, elle est diagonalisable si et seulement si il existe une matrice C

λ0 0 ⋯ 0
⎡ ⎤
0 λ1 ⋯ 0

unique telle que: A = C


T
DC3 où D λ
=

⋮ ⋮ ⋱ ⋮
⎣ ⎦
0 0 ⋯ λn

3. Matrice symétrique et trace ::


Pour la trace de la matrice V :
T T
trace(V ) = trace(C DCλ ) = trace(C C)Dλ = trace(Dλ ) = ∑ λi

Vecteur unitaire: Un vecteur unitaire, noté u, est un vecteur ayant une norme de 1, représentée
comme ||u|| = 1 (normalized).
Pour normaliser un vecteur v, vous pouvez diviser ses composantes par sa norme, ce qui donne un
vecteur unitaire : u = v

∥v∥

La projection d'un vecteur v sur un axe D est calculée à l'aide du produit scalaire de v et d'un vecteur
unitaire u aligné avec l'axe D :
Projection(v, D) = v ⋅ u

Ces règles sont utilisées pour les transformations de coordonnées en analyse de données.
Pour calculer la distance euclidienne au carré entre deux vecteurs x et , vous pouvez utiliser la
y

formule suivante :
2 2 n 2
d (x, y) = ∥x − y∥ = ∑ (xi − yi )
i=1

Minimum avec contrainte : Dans ce contexte, nous cherchons à déterminer la valeur de u qui
maximise la fonction Q(u) tout en satisfaisant la contrainte G(u) = 0.
Pour ce faire, nous introduisons la fonction de Lagrange, notée L(u), définie comme suit :
L(u) = Q(u) − λG(u)

Ici, λ représente le multiplicateur de Lagrange.


La valeur optimale de u est obtenue en résolvant le système d'équations suivant :
∂L(u0 )
= 0
{ ∂u0 )

G(u) = 0

Dans le contexte de l'Analyse en Composantes Principales (PCA), u est souvent appelé l'axe factoriel,
0

une nouvelle variable, ou la composante principale.

18

Vous aimerez peut-être aussi