Académique Documents
Professionnel Documents
Culture Documents
Espace euclidien:
𝑈𝑛 𝑒𝑠𝑝𝑎𝑐𝑒 𝑣𝑒𝑐𝑡𝑜𝑟𝑖𝑒𝑙 𝐸 𝑑𝑒 𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛 𝑷 𝑒𝑠𝑡 𝑑𝑖𝑡 𝑒𝑢𝑐𝑙𝑖𝑑𝑖𝑒𝑛 𝑠’𝑖𝑙 𝑒𝑠𝑡 𝑚𝑖𝑛𝑖 𝑑’𝑢𝑛 𝑝𝑟𝑜𝑑𝑢𝑖𝑡 𝑠𝑐𝑎𝑙𝑎𝑖𝑟𝑒
𝑑é𝑓𝑖𝑛𝑖 𝑝𝑎𝑟 : < 𝑥, 𝑦 > ∀ (𝑥, 𝑦) ∈ 𝐸 × 𝐸
Espace vectoriel
Espace euclidien
Produit scalaire
Définie
< 𝑥, 𝑥 >=‖𝑥‖2 = 0 ⟺ 𝑥 = 0 Symétrique
< 𝑥, 𝑦 >=< 𝑦, 𝑥 >
Positive
< 𝑥, 𝑥 >=‖𝑥‖2 ≥ 0 Bilinéaire
< 𝑥1 + 𝑥2 , 𝑦> : Linéaire à gauche
et
< 𝑥, 𝑦1 + 𝑦2 > : Linéaire à gauche
On définit la norme (ou longueur) d’un vecteur X en posant : ‖𝑥‖ = √< 𝑥, 𝑥 >= √𝑥12 + … + 𝑥𝑝2
Théorème de Pythagore :
Les coordonnées de u sont ∶ 𝒙 = 𝒙𝑩 − 𝒙𝑨 = 𝟒 𝒆𝒕 𝒚 = 𝒚𝑩 − 𝒚𝑨 = 𝟐 dans le triangle ABH
(Ci-dessous), on a AB²=AH²+HB² = x²+y²=20 d’où AB=‖𝑢‖ = 2√5
p. 1
Analyse exploratoire 2020/2021
𝑥 = ∑𝑝𝑖=1 𝛼𝑖 𝑒𝑖 , 𝑦 = ∑𝑝𝑗=1 𝛽𝑗 𝑒𝑗
𝒑 𝒑
< 𝒙, 𝒚 >= ∑𝒊=𝟏 ∑𝒋=𝟏 𝜶𝒊 𝜷𝒋 <𝒆𝟏 , 𝒆𝟏 >
Metriques:
Pour définir la distance euclidienne entre deux individus, on a besoin d’une métrique M.
Il s’agit d’une matrice symétrique définie positive de dimension p.
Remarques :
- Un produit scalaire : < 𝒙 , 𝒚 >𝑴 = 𝒙𝒕 𝑴𝒚
<𝒙 ,𝒚 >𝑴
- Des angles : cos 𝜃𝑀 = ‖𝒙‖
𝑴 ∙ ‖𝒚‖𝑴
p. 2
Analyse exploratoire 2020/2021
Donc
2
⇒ si 𝑴 = 𝑰, 𝑑²𝑀 (𝑥𝒊 , 𝑥𝑖′ ) = ∑𝑝𝑗=1(𝑥𝒊𝒋 − 𝑥𝑖′𝑗 ) ⟶ 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 𝑒𝑢𝑐𝑙𝑖𝑑𝑖𝑒𝑛𝑛𝑒 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠 𝑏𝑟𝑢𝑡𝑒𝑠
𝑝
2
= ∑(𝑧𝒊𝒋 − 𝑧𝑖′ 𝑗 ) ⟶ 𝑑2 𝑫 𝟏 (𝑥𝒊 , 𝑥𝑖′ ) = 𝑑2 𝐼 (𝑧𝒊 , 𝑧𝑖′ )
𝑗=1 𝝈𝟐
𝐸𝑥𝑒𝑚𝑝𝑙𝑒: 𝑑2 𝑫 𝟏 (1,2) =
𝝈𝟐
p. 3
Analyse exploratoire 2020/2021
Rappels Matriciels
Définitions
On représente la matrice 𝑀 par un tableau à 𝑛 lignes et 𝑝 colonnes, en mettant l’élément
𝑚𝑖𝑗 à l’intersection de la 𝑖 è𝑚𝑒 ligne et la 𝑗 è𝑚𝑒 colonne
p. 4
Analyse exploratoire 2020/2021
p. 5
Analyse exploratoire 2020/2021
⇒ Diagonalisation :
p. 6
Analyse exploratoire 2020/2021
La corrélation est une mesure qui décrit la force et la direction d'une relation entre deux
variables. Il est couramment utilisé dans les statistiques, l'économie et les sciences sociales
pour les budgets, les plans d'entreprise, etc.
La méthode utilisée pour étudier le degré de corrélation entre les variables s'appelle l'analyse
de corrélation. Quelques exemples de corrélation forte :
- Le nombre de calories que vous mangez et votre poids (corrélation positive)
- La température extérieure et vos factures de chauffage (corrélation négative)
Définition
1
̅ =( 1 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ) − 𝑋̅𝑌̅
̅ (𝑦 − 𝑌)
La covariance : 𝜎𝑋𝑌 = 𝑐𝑜𝑣(𝑋, 𝑌) = ∑𝑛𝑖=1(𝑥𝑖 − 𝑋)
𝑛 𝑖 𝑛
1 1
La variance de X : 𝜎𝑋 ² = 𝑣𝑎𝑟(𝑋) = ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅ )² ⟹ 𝜎𝑋 = √ ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅ )²
𝑛 𝑛
1 1
La variance de Y :𝜎𝑌 ² = 𝑣𝑎𝑟(𝑌) = ∑𝑛𝑖=1(𝑦𝑖 − 𝑌̅ )² ⟹ 𝜎𝑌 = √ ∑𝑛𝑖=1(𝑦𝑖 − 𝑌̅ )²
𝑛 𝑛
p. 7
Analyse exploratoire 2020/2021
p. 8
Analyse exploratoire 2020/2021
Matrice de corrélation
On appelle matrice de corrélation la matrice regroupant tous les coefficients de corrélation
linéaire entre les p variables prises deux à deux qu’on la note R
En posant :
p. 9
Analyse exploratoire 2020/2021
On
Conclusion :
On remarque que les variables ne sont pas très corrélées entre elles.
p. 10
Analyse exploratoire 2020/2021
Quelques définitions
p. 11