Cheval
et/ou
Herbe
Requête
Moteur de
recherche
dataset ou
WWW Résultats
Notion de similarité vs. dissimilarité :
Une mesure est une similarité si elle est :
grande lorsque les deux objets se ressemblent
et petite lorsque les deux objets ne se ressemblent pas
Une mesure est une dissimilarité dans le cas opposé, c'est-à-dire qu’elle
est :
grande lorsque les deux objets ne se ressemblent pas
et petite lorsque les deux objets se ressemblent
Exemples
Quelques métriques :
Distance de Manhattan (ou distance de l’échiquier ou L1) :
𝐿1 𝑋, 𝑌 = 𝑑𝑖=1 |𝑥𝑖 − 𝑦𝑖 |
Distance Euclidienne (ou L2) :
𝑑
𝐿2 𝑋, 𝑌 = 𝑥𝑖 − 𝑦𝑖 2
𝑖=1
Distance de Mahalanobis :
𝐷 𝑋, = 𝑋 − 𝑡 −1 𝑋 −
Le nombre de pixels B
dans le sous-espace
Histogramme de la couleur
Application :
Application des mesures de similarité à la recherche du texte sur le Web :
Illustration
Collecter des pages Web
Compter la fréquence de chaque mot
Constituer le vecteur représentatif de chaque page
Comparer entre ces vecteurs en utilisant les différentes mesures de
similarités. Ex la cosinus.