Académique Documents
Professionnel Documents
Culture Documents
1
2021-2022
Plan
par Dr. Hasna CHAIBI
❑Introduction
❑Analyse en Composantes Principales
❑Analyses Factorielles
❑Analyse Factorielle des Correspondances
❑Analyse des Correspondances Multiples
❑Classification
Analyse de donnée
2
2021-2022
Introduction
par Dr. Hasna CHAIBI
3
2021-2022
Introduction
• Statistiques Descriptives permettent de résumer des données grâce à des calculs ou des
par Dr. Hasna CHAIBI
financiers. Les modèles d'évaluation traitent les antécédents de crédit d'un client, les
demandes de prêt, les données client, etc. , afin de classer les individus selon la
probabilité de rembourser leurs crédits en temps voulu.
4
Analyse de donnée par Dr. Hasna CHAIBI 2021-2022
Introduction
5
Analyse de donnée par Dr. Hasna CHAIBI 2021-2022
Introduction
Statistiques exploratoire
6
Analyse de donnée par Dr. Hasna CHAIBI 2021-2022
Introduction
Statistiques exploratoire
7
2021-2022
Introduction
par Dr. Hasna CHAIBI
8
2021-2022
Introduction
par Dr. Hasna CHAIBI
9
2021-2022
Introduction
par Dr. Hasna CHAIBI
➢ Si on a une seule variable nous pouvons tracer les données sur une
droite numérique (représentation axiale)
Maths
Elève1 17
Elève2 18
Elève3 15
Elève4 6
Interprétation: Les élèves 1, 2et 3 ont valeurs relativement élevées et les
Elève5 5 élèves 4,5 et 6 ont des faibles valeurs
Analyse de donnée
Elève6 3
10
2021-2022
Introduction
par Dr. Hasna CHAIBI
Elève6 7 6
11
2021-2022
Introduction
par Dr. Hasna CHAIBI
Elève6 10 14 4.25
Les points les plus
grands ont des
valeurs plus petites
pour la philosophie
12
et sont plus proches
2021-2022
Introduction
Tirer des conclusion à partir d’un tableau de 6 lignes (individus) et deux ou trois colonnes (variables) est
un exercice simple
par Dr. Hasna CHAIBI
Mais lorsque le tableau a plus de 3 colonnes (variables) les choses deviennent plus complexes.
Elève1 18 4 17.5 … … …
Elève2 17 7 16.5 … … …
Elève3 16 8 15.75 … … …
Elève4 14 10 14 … … …
Analyse de donnée
Elève5 13 12 13.5 … … …
Elève6 10 14 11.25 … … …
Elève7 8 16 8.75 … … …
Elève8 6 17 5.75 … … …
Elève9 3 18 3.25 … … … 13
2021-2022
Introduction
Maths Histoire Philos. Arabe Franc physiq
par Dr. Hasna CHAIBI
Elève1 18 4 17.5 … … …
Elève2 17 7 16.5 … … …
Elève3 16 8 15.75 … … …
Elève4 14 10 14 … … …
Elève5 13 12 13.5 … … …
Elève6 10 14 11.25 … … …
Elève7 8 16 8.75 … … …
Analyse de donnée
Elève8 6 17 5.75 … … …
Elève9 3 18 3.25 … … …
Introduction
L’analyse des données permet de traiter un nombre très important de données et de dégager les aspects les
plus intéressants de la structure de celles-ci. Le succès de cette discipline dans les dernières années est dû,
par Dr. Hasna CHAIBI
Elève1 18 4 17.5 … … …
Elève2 17 7 16.5 … … …
Elève3 16 8 15.75 … … …
Elève4 14 10 14 … … …
Analyse de donnée
Elève5 13 12 13.5 … … …
Elève6 10 14 11.25 … … …
Elève7 8 16 8.75 … … …
Elève8 6 17 5.75 … … …
Elève9 3 18 3.25 … … … 15
2021-2022
Analyse de Données
par Dr. Hasna CHAIBI
16
2021-2022
• Classification automatique
• Analyse factorielle discriminante
❑Analyse des données et régressions
17
2021-2022
Méthode statistique
exploratoire multidimensionnelle
est
Méthode factorielle
recherche
Facteurs
qui remplacent les variables initiales
Analyse de donnée
Réduit
Nombre données en
déformant le moins
possible la réalité
18
2021-2022
Logiciels
par Dr. Hasna CHAIBI
19
2021-2022
Analyse en Composantes Principales (ACP)
par Dr. Hasna CHAIBI
20
2021-2022
21
2021-2022
22
2021-2022
Rechercher l’interaction
Traitement bivarié Signifie entre 2 variables
Analyse de donnée
Rechercher la liaison
simultanée entre plus de
Traitement multivarié Signifie
deux variables et fournir une
information synthétisée
23
2021-2022
Elève5 13 12 13.5 … … …
Elève6 10 14 11.25 … … …
• L’ACP traite des tableaux rectangulaires (matrice) donnant les valeurs d’un ensemble de variables
quantitatives( au nombre de p) relevés sur un ensemble d’individus (au nombre de n)
p Variables quantitatives
X : le tableau (la matrice ) individu- variables
quantitatives
n : le nombre d’individus
p : le nombre des variables
i : L’indice désignant les individus
j : L’indice désignant les variables
Analyse de donnée
𝟏
𝑋ത𝑗 : la moyenne de la jème variable (𝑋ത𝑗 = 𝒏 σ𝒏𝒊=𝟏 𝒙𝒊𝒋 )
𝟏
𝑽 𝑿𝒋 : la variance de la jème variable (𝑽 𝑿𝒋 = 𝒏 σ𝒏𝒊=𝟏(𝒙𝒊𝒋 − 𝑋ത𝑗 )𝟐 )
Variables
par Dr. Hasna CHAIBI
26
2021-2022
Analyse en Composantes Principales (ACP)
Variables
par Dr. Hasna CHAIBI
Résultat 1:
➢Visualisation des individus (Notion de distance entre individus)
✓Quels sont ceux qui se ressemblent?
Analyse de donnée
𝒑
𝟐 𝟐
𝒅 𝒌, 𝒎 = (𝒙𝒌𝒋 − 𝒙𝒎𝒋 )
𝒋=𝟏
Analyse de donnée
29
2021-2022
Analyse en Composantes Principales (ACP)
• Résultat 2:
30
2021-2022
Analyse en Composantes Principales (ACP)
1 𝑛
➢Moyenne: ത
𝑋𝑗 = σ𝑖=1 𝑥𝑖𝑗
𝑛
1 𝑛
➢Variance: 𝑉(𝑋𝑗 ) = σ𝑖=1(𝑥𝑖𝑗 ത 2
− 𝑋)
𝑛
Analyse de donnée
31
2021-2022
Analyse en Composantes Principales (ACP)
1 𝑛
• Covariance: 𝜎𝑥,𝑦 = σ (𝑥 − 𝑥)(
ҧ 𝑦𝑖 − 𝑦)
ത
𝑛 𝑖=1 𝑖
𝜎𝑥,𝑦
Analyse de donnée
• Coefficient de Corrélation: 𝑟 𝑥, 𝑦 = − 1 ≤ 𝑟 𝑥, 𝑦 ≤ 1
𝜎𝑥 𝜎𝑦
32
2021-2022
Analyse en Composantes Principales (ACP)
Coefficient de Corrélation
Analyse de donnée
33
rx,y
2021-2022
Analyse en Composantes Principales (ACP)
35
2021-2022
Analyse en Composantes Principales (ACP)
Nous calculerons la
Et la moyenne des
moyenne des données
données (notes) pour
(notes) pour la variable
la variable 2 (Histoire)
1 (Maths)
Maths Histoire
Elève1 18 4
Elève2 17 7
Analyse de donnée
Elève3 16 8
Elève4 14 10
Elève5 13 12
Elève6 10 14
36
2021-2022
Analyse en Composantes Principales (ACP)
Nous allons maintenant déplacer les données de sorte que le centre soit au-dessus de l'origine dans le graphique
38
2021-2022
Analyse en Composantes Principales (ACP)
• L’ACP vise à fournir une image simplifiée de nuage de point qui soit la plus fidèle
possible – trouver le sous-espace qui résume au mieux les données.
• Une image est bonne si on visualise bien la diversité, la variabilité dans les
données
• Une image est bonne s’elle ne déforme pas trop les distance entre individus
Analyse de donnée
40
2021-2022
Analyse en Composantes Principales (ACP)
41
2021-2022
Analyse en Composantes Principales (ACP)
• La dispersion du nuage de points est mesurée par son inertie par rapport
au centre de gravité
• L’inertie I est égale à la somme des variances des variables étudiées
𝑝 𝒏
1
𝐼= 𝜎𝑖2 = 𝒅𝟐 (𝑰𝒊 , 𝑮)
𝑛
𝑖=1 𝒊=𝟏
➢Remarque:
Analyse de donnée
45
2021-2022
Analyse en Composantes Principales (ACP)
46
2021-2022
Tableau de données
Ou
Matrice de variance-covariance (Ω ) Si les données sont homogènes
48
2021-2022
Analyse en Composantes Principales (ACP)
par Dr. Hasna CHAIBI
• A partir de la matrice X
1. Calculer le centre de gravité de X noté Gx.
2 0 1
2. Déduire la matrice Y la matrice des données centrées 1 0 1
0 0 1
3. Calculer le centre de gravité de Y, noté Gy. 𝑋=
2 1 0
4. Calculer la matrice variance covariance Ω de X 1 1 0
0 1 0
Analyse de donnée
49
2021-2022
Analyse en Composantes Principales (ACP)
Centre de gravité
par Dr. Hasna CHAIBI
1 6 1+1+1 1
ത
• 𝑋2 = σ𝑖=1 𝑥𝑖2 = =
Analyse de donnée
6 6 2
1 1
1 6 1+1+1 1
Donc 𝐺𝑥 (𝑋ത1 , 𝑋ത2 , 𝑋ത3 ) = (1, , )
2 2
ത
• 𝑋3 = σ𝑖=1 𝑥𝑖3 = =
6 6 2
50
2021-2022
Analyse en Composantes Principales (ACP)
1 1
ഥ ത ത
• 𝒀𝒊𝒋 = 𝒙𝒊𝒋 − 𝑿𝒋 on a : 𝑋1 = 1 , 𝑋2 = ത
et 𝑋3 =
2 2
Analyse de donnée
51
2021-2022
Analyse en Composantes Principales (ACP)
6
1 1 2+0−2+2−2
ത
𝑌1 = 𝑦𝑖1 = ∗ =0
6 2 6
𝑖=1
6
1 1 −1 − 1 − 1 + 1 + 1 + 1
𝑌ത2 =
Analyse de donnée
𝑦𝑖2 = ∗ =0
6 2 6
𝑖=1
𝑑𝑜𝑛𝑐 𝐺𝑌 (𝑌ത1 , 𝑌2 , 𝑌ത3 ) = (0,0,0)
6
1 1+1+1−1−1−1
𝑌ത3 = 𝑦𝑖3 = =0
6 6
𝑖=1 52
2021-2022
Analyse en Composantes Principales (ACP)
1 𝑡
• Ω= 𝑌 𝑌
𝑛
8
• 𝑉 𝑋1 = 12 ,
3 1
• 𝑉 𝑋2 = 12 = 4 ,
1
• 𝑉 𝑋3 = 4
Analyse de donnée
8
• 𝜎 𝑋1 = ,
12
16 0 0 8 0 0
1 2 • 𝜎 𝑋2 =
1
= 2,
1
Ω= 0 6 −6 = 0 3 −3 Donc 4
24 24
0 −6 6 0 −3 3 • 𝜎 𝑋3 =
8
12 53
2021-2022
Analyse en Composantes Principales (ACP)
1 𝒏 1 𝑛
•𝐼= σ𝒊=𝟏 𝒅𝟐 (𝑰𝒊 , 𝑮𝒀 ) = σ𝑖=1 𝐼𝑖 2
𝑛 𝑛
Analyse de donnée
54
2021-2022
Analyse en Composantes Principales (ACP)
16 0 0 8 0 0
𝐼 = 𝑇𝑟𝑎𝑐𝑒(Ω)= Ω11 + Ω22 + Ω33 Ω=
1
24
0 6 −6 =
1
12
0 3 −3
0 −6 6 0 −3 3
Analyse de donnée
55
2021-2022
Analyse en Composantes Principales (ACP)
On a:
Analyse de donnée
8 8
• 𝑉 𝑋1 = 12 • 𝜎 𝑋1 = = 0.816
12
3 1
• 𝑉 𝑋2 = 12 =4, 1 1
1
• 𝜎 𝑋2 = = 2 = 0.5
4
• 𝑉 𝑋3 = 4
1
• 𝜎 𝑋3 = =0.5
4 56
Analyse en Composantes Principales (ACP)
2021-2022
𝟏 𝒕
• On a : ∑ = 𝒁𝒁
𝒏
Analyse de donnée
57
2021-2022
Examinez la matrice des corrélations entre les variables. Et tirez des conclusions
concernant leurs corrélations.
par Dr. Hasna CHAIBI
Analyse de donnée
58
2021-2022
Analyse en Composantes Principales (ACP)
Démarche Mathématiques
par Dr. Hasna CHAIBI
1
Ω = 𝑌𝑡 𝑌 Y est la matrice des données centrées
Analyse de donnée
Démarche Mathématiques
par Dr. Hasna CHAIBI
ACP non normée S< 5 → données homogènes On utilise la matrice de I=Trace(Ω)= somme des
variance covariance noté Ω variances
comme forme quadratique
d’inertie
60