Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
La classification
(K Nearest Neighbors)
Objectifs
Ce module est introductif et a pour objectif la familiarisation des étudiants avec les concepts relatifs à la Science des données et à la
compréhension de son utilité à travers des exemples.
Chapitres :
Chapitre 1 : Introduction à la Science des données
Chapitre 2 : Méthodologie de Science des données (processus)
Chapitre 3 : Outils de la Science des données ( langages et algorithmes)
Chapitre 4 : Applications de la Science des données
Chapitre 5 : la Science des données et le Big data
Chapitre 6 : La Visualisation dans la Science des données
Chapitre 7 : Ethiques des Sciences des données
2
Data Science Fundamentals
Outils de la Science des données ( Algorithmes de base)
3
Introduction
9.1 11.0 ??
Classification | Example de classification utilisant
l’algorithme KNN
• Mesurer la distance
• Il existe de nombreuses façons possibles de mesurer la
distance entre deux instances avec n valeurs d'attribut
S'il y a deux points (a1, a2, a3) et (b1, b2, b3) dans un espace
tridimensionnel, la formule de distance euclidienne est
•A = {0,1,2,5,6}
•B = {0,2,3,4,5,7,9}
Solution:
Indice_de_Jaccard(A,B) = |A∩B| / |A∪B| = |{0,2,5}| / |{0,1,2,3,4,5,6,7,9}| = 3/9 = 0.33.
Distance_de_Jaccard = 1- 0,33 = 0,67
Classification |Mesures : Distance de dimension maximale
Une troisième possibilité est la distance dimensionnelle maximale. Il s'agit de la plus grande
différence absolue entre n'importe quelle paire de valeurs d'attributs correspondantes.
Remarque : la différence absolue est la différence convertie en un nombre positif si elle est
négative (Ib1-a1I or Ia1-b1I).
Par exemple, la distance dimensionnelle maximale entre les instances ci-dessous est de :