Académique Documents
Professionnel Documents
Culture Documents
Similarité numérique:
1-Distance Euclidienne:
La distance euclidienne est une mesure de la distance "linéaire" entre deux points
dans un espace à n dimensions
La formule générale de la distance euclidienne entre deux points P(x1,y1,...,z1)
Q(x2,y2,...,z2) dans un espace à n dimensions est donnée par:
Supposons que nous ayons deux points A(1,2) et B(4,6) dans un espace
bidimensionnel.
Plus la distance euclidienne est petite, plus sim(A,B) sera proche de 1, indiquant
une grande similarité.
// Seuil prédéfini
double seuil = 2.0;
Exemple concret :
A(1,3) et B(4,7). La distance de Manhattan entre ces deux points serait calculée
comme suit :
dManhattan(A,B)=∣4−1∣+∣7−3∣=3+4=7
// Seuil prédéfini
double seuil = 10.0;
Enregistrement 2 :
● Nom : John D.
● Longueur du nom : 7
Dans cet exemple, la différence de longueur des noms est de 1, indiquant une légère
variation. Cependant, le coefficient de corrélation de Pearson est de 1, ce qui
suggère une forte corrélation ou similarité entre les longueurs des noms. Cela peut
être dû au fait que les noms sont structurellement similaires malgré la petite
différence dans la longueur.
Diagramme de classe: