K Means

Transféré par

khalil sabrina

0% ont trouvé ce document utile (0 vote)

6 vues5 pages

Titre original

k-means

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

6 vues5 pages

K Means

Transféré par

khalil sabrina

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 5

Rechercher à l'intérieur du document

K-means

K-means (k-moyennes) est un algorithme non supervisé de clustering, populaire

en Machine Learning.

Qu’est ce que le clustering

Le clustering est une méthode d’apprentissage non supervisé (unsupervised learning).
Ainsi, on n’essaie pas d’apprendre une relation de corrélation entre un ensemble de
features X d’une observation et une valeur à prédire Y, comme c’est le cas pour
l’apprentissage supervisé. L’apprentissage non supervisé va plutôt trouver des patterns dans
les données. Notamment, en regroupant les choses qui se ressemblent.

En apprentissage non supervisé, les données sont représentées comme suit :

Le clustering va regrouper en plusieurs familles (clusters) les individus/objets en

fonction de leurs caractéristiques. Ainsi, les individus se trouvant dans un même cluster
sont similaires et les données se trouvant dans un autre cluster ne le sont pas
Qu’est ce que K-means
K-means est un algorithme non supervisé de clustering non hiérarchique. Il permet de
regrouper en K clusters distincts les observations du data set. Ainsi les données similaires se
retrouveront dans un même cluster. Par ailleurs, une observation ne peut se retrouver que dans
un cluster à la fois (exclusivité d’appartenance). Une même observation, ne pourra donc,
appartenir à deux clusters différents.

Notion de similarité
Pour pouvoir regrouper un jeu de données en K cluster distincts, l’algorithme K-Means a besoin
d’un moyen de comparer le degré de similarité entre les différentes observations. Ainsi, deux
données qui se ressemblent, auront une distance de dissimilarité réduite, alors que deux objets
différents auront une distance de séparation plus grande.
La distance Euclidienne :

C’est la distance géométrique qu’on apprend au collège. Soit une matrice X à n variables
quantitatives. Dans l’espace vectoriel En. La distance euclidienne d entre deux observations
x1 et x2 se calcule comme suit :

La distance de Manhattan (taxi-distance)

Choisir K : le nombre de clusters

Pour un même jeu de données, il n’existe pas un unique clustering possible. La difficulté résidera
donc à choisir un nombre de cluster K qui permettra de mettre en lumière des patterns intéressants
entre les données. Malheureusement il n’existe pas de procédé automatisé pour trouver le bon
nombre de clusters.

La méthode la plus usuelle pour choisir le nombre de clusters est de lancer K-Means avec différentes
valeurs de K et de calculer la variance des différents clusters. La variance est la somme des distances
entre chaque centroid d’un cluster et les différentes observations inclues dans le même cluster. Ainsi,
on cherche à trouver un nombre de clusters K de telle sorte que les clusters retenus minimisent la
distance entre leurs centres (centroids) et les observations dans le même cluster. On parle de
minimisation de la distance intra-classe.

La variance des clusters se calcule comme suit :

Avec :

cj : Le centre du cluster (le centroïd)

xi : la ième observation dans le cluster ayant pour centroïd cj
D(cj, xi) : La distance (euclidienne ou autre) entre le centre du cluster et le point xi

Vous aimerez peut-être aussi

TP Vagrant
Document7 pages
TP Vagrant
khalil sabrina
Pas encore d'évaluation
QCM Protocoles Internet Et Reseaux Corri
Document4 pages
QCM Protocoles Internet Et Reseaux Corri
ISmãelMadani
100% (4)
TP Docker
Document3 pages
TP Docker
khalil sabrina
Pas encore d'évaluation
Black Dummy Measuring Tape PowerPoint Templates
Document10 pages
Black Dummy Measuring Tape PowerPoint Templates
khalil sabrina
Pas encore d'évaluation
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
Document9 pages
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
Maxima
Pas encore d'évaluation
Aide Freeplane
Document24 pages
Aide Freeplane
Anouar Dhahri
Pas encore d'évaluation
Cahier Des Charges
Document4 pages
Cahier Des Charges
khalil sabrina
Pas encore d'évaluation
Enfant
Document11 pages
Enfant
khalil sabrina
Pas encore d'évaluation
TP1 Part1 203
Document3 pages
TP1 Part1 203
khalil sabrina
Pas encore d'évaluation
6th Central Pay Commission Salary Calculator
Document15 pages
6th Central Pay Commission Salary Calculator
rakhonde
100% (436)
6th Central Pay Commission Salary Calculator
Document15 pages
6th Central Pay Commission Salary Calculator
rakhonde
100% (436)
Exam
Document9 pages
Exam
khalil sabrina
Pas encore d'évaluation
QCM Protocoles Internet Et Reseaux Corri
Document4 pages
QCM Protocoles Internet Et Reseaux Corri
ISmãelMadani
100% (4)
QCM Protocoles Internet Et Reseaux Corri
Document4 pages
QCM Protocoles Internet Et Reseaux Corri
ISmãelMadani
100% (4)
Exam
Document9 pages
Exam
khalil sabrina
Pas encore d'évaluation
Exam
Document9 pages
Exam
khalil sabrina
Pas encore d'évaluation
Correction P4 Administration BD
Document5 pages
Correction P4 Administration BD
khalil sabrina
Pas encore d'évaluation
TD Ipv6
Document3 pages
TD Ipv6
khalil sabrina
Pas encore d'évaluation
Production de La Levure de Panification Par Biotechnologie
Document10 pages
Production de La Levure de Panification Par Biotechnologie
Samsouma Soumia
100% (1)
Guide Technique DELTA Protection Soubassements PDF
Document28 pages
Guide Technique DELTA Protection Soubassements PDF
nonornachour
Pas encore d'évaluation
Jiop
Document22 pages
Jiop
Oussama El Bassim
Pas encore d'évaluation
TermS 06 Explication Texte de Bergson Sur L Art
Document4 pages
TermS 06 Explication Texte de Bergson Sur L Art
medina
Pas encore d'évaluation
FG Revue Presse
Document2 pages
FG Revue Presse
ambinintsoa
Pas encore d'évaluation
Pollution Tellurique Du Littoral Tanger Tetouan
Document194 pages
Pollution Tellurique Du Littoral Tanger Tetouan
Abdellah Saad
Pas encore d'évaluation
2017 AmNord Exo1 Correction DiffractionCacao 5pts
$2017 AmNord Exo1 Correction DiffractionCacao 5pts$
Document3 pages
2017 AmNord Exo1 Correction DiffractionCacao 5pts
Karim Boufrad
Pas encore d'évaluation
Confirmation de Rendez-Vous À L'ambassade D'allemagne À Yaoundé / Appointment Confirmation at The German Embassy in Yaounde
Document2 pages
Confirmation de Rendez-Vous À L'ambassade D'allemagne À Yaoundé / Appointment Confirmation at The German Embassy in Yaounde
kouekam
Pas encore d'évaluation
M2DOSI Guide Candidature 2024 2025
Document5 pages
M2DOSI Guide Candidature 2024 2025
calabi mozart
Pas encore d'évaluation
Adam P. Droit Du Travail B
Document3 pages
Adam P. Droit Du Travail B
Alyssa Patrois
Pas encore d'évaluation
588
Document24 pages
588
dknews
Pas encore d'évaluation
Tuesta Et Al (2015)
Document29 pages
Tuesta Et Al (2015)
Mr.Ston
Pas encore d'évaluation
Registar Sorti Poljoprivrednog Bilja
Document104 pages
Registar Sorti Poljoprivrednog Bilja
Rasadnik Kokai Temerin
100% (1)
Cours Management Des Organisations Hec Master 1
Document25 pages
Cours Management Des Organisations Hec Master 1
Yaofelix Atta
Pas encore d'évaluation
Epreuve Maths Bac C
Document2 pages
Epreuve Maths Bac C
rayannongni
Pas encore d'évaluation
Lettre de Soumission
Document1 page
Lettre de Soumission
guevba
Pas encore d'évaluation
Support Du Stockage
Document3 pages
Support Du Stockage
Imen Megdich
100% (3)
Cours UFHB M2 - Finance Internationale
Document45 pages
Cours UFHB M2 - Finance Internationale
christian toure
Pas encore d'évaluation
Excel Formation Au Calcul Matriciel
Document46 pages
Excel Formation Au Calcul Matriciel
Mouhamed Beuleup Ndao
Pas encore d'évaluation
Descsaf - Operations de Fusions
Document25 pages
Descsaf - Operations de Fusions
Ablaye Sall
Pas encore d'évaluation
1 - Epilepsie Et Crise Convulsive
Document24 pages
1 - Epilepsie Et Crise Convulsive
See Down
Pas encore d'évaluation
Cimfeu Calcul Feu Structure Beton
Document82 pages
Cimfeu Calcul Feu Structure Beton
Lionel Tebon
Pas encore d'évaluation
P4167bf-Not 48V 60A
Document88 pages
P4167bf-Not 48V 60A
fayssal salvador
Pas encore d'évaluation
Cahier Des Nouvelles Problematiques de Societe - Tome 1-1
Document120 pages
Cahier Des Nouvelles Problematiques de Societe - Tome 1-1
leroy
Pas encore d'évaluation
Codes Phone
Document2 pages
Codes Phone
Junmarie Radoc
Pas encore d'évaluation
Exercises SNMP v1 v2c VFR PDF
Document7 pages
Exercises SNMP v1 v2c VFR PDF
Al moubarak
Pas encore d'évaluation
Texte Suivi de Question Niveau 3eme 1C
Document2 pages
Texte Suivi de Question Niveau 3eme 1C
Sabaa Seck
Pas encore d'évaluation
Workbook 5jours Transformation Interieur
Document22 pages
Workbook 5jours Transformation Interieur
Halim Genie Civil
100% (2)
Rapport Consolidation - Présentations Des États Consolidés
Document37 pages
Rapport Consolidation - Présentations Des États Consolidés
Youssef Benayad
Pas encore d'évaluation
Parasito Par 1 Tableaux
Document36 pages
Parasito Par 1 Tableaux
zerfaoui
100% (1)
Mathematiques Par Les Problemes Au Brevet
D'Everand
Mathematiques Par Les Problemes Au Brevet
Seifedine Kadry
Pas encore d'évaluation
La Cryptographie ou l'art d'écrire en chiffres
D'Everand
La Cryptographie ou l'art d'écrire en chiffres
Bibliophile Jacob
Pas encore d'évaluation
Électrotechnique | Pas à Pas: Bases, composants & circuits expliqués pour les débutants
D'Everand
Électrotechnique | Pas à Pas: Bases, composants & circuits expliqués pour les débutants
M.Eng. Johannes Wild
Évaluation : 5 sur 5 étoiles
5/5 (1)
Le monde occulte ou mystères du magnétisme
D'Everand
Le monde occulte ou mystères du magnétisme
Henri Delaage
Évaluation : 5 sur 5 étoiles
5/5 (3)
Enjeux contemporains de l'éducation scientifique et technologique
D'Everand
Enjeux contemporains de l'éducation scientifique et technologique
Abdelkrim Hasni
Pas encore d'évaluation
Les contes des mille et un mythes - Volume II
D'Everand
Les contes des mille et un mythes - Volume II
Nas E. Boutammina
Pas encore d'évaluation
Temps: Les Grands Articles d'Universalis
D'Everand
Temps: Les Grands Articles d'Universalis
Encyclopaedia Universalis
Pas encore d'évaluation
La pensée dirigée: Traité sur le raisonnement et les logiques
D'Everand
La pensée dirigée: Traité sur le raisonnement et les logiques
Claire Wagner-Rémy
Évaluation : 5 sur 5 étoiles
5/5 (2)
Théorie relative de la musique: Maîtriser le mouvement par la logique des intervalles
D'Everand
Théorie relative de la musique: Maîtriser le mouvement par la logique des intervalles
Denis Jarrige
Évaluation : 4 sur 5 étoiles
4/5 (1)
L'univers est intelligent. L'âme existe. Mystères quantiques, multivers, intrication, synchronicité. Au-delà de la matérialité, pour une vision spirituelle du cosmos.
D'Everand
L'univers est intelligent. L'âme existe. Mystères quantiques, multivers, intrication, synchronicité. Au-delà de la matérialité, pour une vision spirituelle du cosmos.
François Aroche
Pas encore d'évaluation
Production de l'électricité: Essai sur la physique
D'Everand
Production de l'électricité: Essai sur la physique
Ligaran
Pas encore d'évaluation
Historique et description des procédés du daguerréotype et du diorama: Essai historique sur les sciences et techniques
D'Everand
Historique et description des procédés du daguerréotype et du diorama: Essai historique sur les sciences et techniques
Ligaran
Pas encore d'évaluation
Physique quantique pour les débutants: Découvrez les fondements de la mécanique quantique et la façon dont elle affecte le monde dans lequel nous vivons à travers ses théories les plus célèbres
D'Everand
Physique quantique pour les débutants: Découvrez les fondements de la mécanique quantique et la façon dont elle affecte le monde dans lequel nous vivons à travers ses théories les plus célèbres
Pierre Anglois
Évaluation : 5 sur 5 étoiles
5/5 (2)
Mathématiques et Mathématiciens Pensées et Curiosités
D'Everand
Mathématiques et Mathématiciens Pensées et Curiosités
Archive Classics
Évaluation : 4.5 sur 5 étoiles
4.5/5 (5)
Les mathématiques: La géométrie
D'Everand
Les mathématiques: La géométrie
Petit Guide
Évaluation : 4.5 sur 5 étoiles
4.5/5 (2)
Les LES TRUCS MATHEMATIQUES AU PRIMAIRE: et si on leur donnait du sens!
D'Everand
Les LES TRUCS MATHEMATIQUES AU PRIMAIRE: et si on leur donnait du sens!
Patricia Marchand
Évaluation : 2 sur 5 étoiles
2/5 (1)
La dioptrique
D'Everand
La dioptrique
René Descartes
Pas encore d'évaluation
Les 10 Secrets pour une Vie Plus Heureuse avec la Maladie de Parkinson
D'Everand
Les 10 Secrets pour une Vie Plus Heureuse avec la Maladie de Parkinson
Michael S. Okun M.D.
Pas encore d'évaluation
Saturne: Les Grands Articles d'Universalis
D'Everand
Saturne: Les Grands Articles d'Universalis
Encyclopaedia Universalis
Pas encore d'évaluation
L'Ombre à l'Univers: La structure des particules élémentaires XIIf
D'Everand
L'Ombre à l'Univers: La structure des particules élémentaires XIIf
Uwe Geitner
Pas encore d'évaluation
Voyager à Travers les Mondes Parallèles pour Atteindre vos Rêves
D'Everand
Voyager à Travers les Mondes Parallèles pour Atteindre vos Rêves
Kevin Michel
Évaluation : 4 sur 5 étoiles
4/5 (11)
Sur les fondements de la théorie des ensembles transfinis
D'Everand
Sur les fondements de la théorie des ensembles transfinis
Georg Cantor
Pas encore d'évaluation
7 mensonges scientoïdes
D'Everand
7 mensonges scientoïdes
Lucia Canovi
Évaluation : 3 sur 5 étoiles
3/5 (2)
Je me prépare aux examens du ministère en mathématiques: Es-tu prêt à passer le test ?
D'Everand
Je me prépare aux examens du ministère en mathématiques: Es-tu prêt à passer le test ?
Souleymane Barry
Évaluation : 4 sur 5 étoiles
4/5 (1)