P. 1
Détection des changements pour les observatoires photographiques du paysage

Détection des changements pour les observatoires photographiques du paysage

|Views: 1,176|Likes:
Publié parMario Gharib

More info:

Categories:Types, Research, Science
Published by: Mario Gharib on Sep 16, 2011
Droits d'auteur :Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

02/07/2013

pdf

text

original

La classification non-supervisée, ou bien le (Clustering) est une des tâches de
l’apprentissage non-supervisé. L’algorithme de Clustering utilise comme entrée un ensemble
d’apprentissage de données complètement non-libellées, dont le but est de séparer les données
en classes, sans aucune supervision. [1]

Il existe de nombreux algorithmes de Clustering, citons : Kmeans, les k plus proches
voisins, la classification hiérarchique ascendante, etc. [18]

On s’intéresse à l’un des algorithmes

les plus simples qui est la classification hiérarchique ascendante.

Algorithme : Classification Hiérarchique Ascendante [1]

Entrée : Ensemble d’apprentissage :

;

Le nombre de Clusters : ;

Une fonction de distance : ;

Initialement, on place chaque instance/donnée de dans un groupe (singleton).

Tant que le nombre de groupe est plus grand que , faire

Trouver la paire de groupes les plus proches , ; (c’est-à-dire dont la distance est
minimale au sens de )

Combiner et pour former un nouveau groupe ;

Fin tant que

Sortie : un arbre binaire illustrant la manière dont les groupes ont été combinés.

Page 10

L’algorithme fonctionne de la façon suivant : initialement chaque instance/donnée est
placée dans un singleton, ensuite l’algorithme va décider à chaque itération quelle paire de

groupes doit être combinée en un nouveau groupe, en fonction de la distance entre chaque
groupe, (on choisit la distance minimale entre deux groupes), puis il refait ce travail à nouveau
tant que le nombre de groupes est plus grand que le nombre de Clusters .

Il existe deux manières pour calculer la distance entre les groupes : [1] [19]

Dans le cas de singletons : on peut utiliser la distance Euclidienne, qui est définie par :

Dans le cas des groupes contenant plus qu’un élément, on peut utiliser l’une des trois
possibilités :

a. Lien minimal (Single-Linkage) : c’est la distance minimale entre les couples
d’éléments de chaque Cluster, définie par :


b. Lien Maximal (Complete-Linkage) : idem, mais avec cette fois la distance
maximale, définie par :


c. Lien Moyenne (Average-Linkage) : c’est la distance moyenne entre les couples
d’élément de chaque Cluster, définie par :


Dans notre cas d’observatoire photographique du paysage, on ne s’intéresse pas à ce type
de classification puisqu’il nécessite la présence d’un analyste qui va donner des échantillons de
différentes types de classes d’information, c’est qu’on va définit dans la partie suivante.

You're Reading a Free Preview

Télécharger
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->