Académique Documents
Professionnel Documents
Culture Documents
DES DONNÉES
Cours : Analyse de données
Volume Horaire
CM: 15H
1
TD : 15 H
OBJECTIF D’APPRENTISSAGE
2
Amis Max temp (°C) Poids (kg) Taille (cm) Genre Compagnie
EXEMPLE
12
Pourcentage d'étudiants
35%
Homme
Femme
65%
VISUALISATION DES DONNÉES UNIVARIÉES
24
σ𝑛 ҧ
𝑖=1(𝑥𝑖 −𝑥)(𝑦 𝑖 −𝑦)
𝐶𝑜𝑣 𝑥, 𝑦 =
𝑛−1
Dans cette équation, 𝑥𝑖 et 𝑥ҧ sont, respectivement, la ième
valeur et la moyenne de l'attribut x.
La covariance est influencée par de valeurs des attributs.
On peut normaliser les attributs sur le même intervalle.
La corrélation n'est pas affectée par ce défaut. La
corrélation linéaire entre deux attributs, également connue
sous le nom de corrélation de Pearson, donne une
indication plus claire du degré de similitude entre les
attributs.
COEFFICIENT DE CORRÉLATION
45
𝑐𝑜𝑣(𝑥,𝑦)
𝑐𝑜𝑟𝑟 𝑥, 𝑦 = 𝑟𝑥𝑦 =
𝑠𝑥 .𝑠𝑦
52
Univariées Bivariées
Graphiques et
Graphiques et tableaux Statistiques Statistiques
tableaux
Mesures de dispersion:
Box plot Étendue Tableau de corrélation
contingence
Interquartile
Variance
Diagramme circulaire
Écart-type
Coefficient de variation
Tableau de
fréquence
53