Vous êtes sur la page 1sur 2

Coeficiente de Jaccard /

Tanimoto
Esta calculadora en lnea mide la similaridad de dos conjuntos de muestra
utilizando el coeficiente de Jaccard / Tanimoto
TimurHace 3 aos
El coeficiente de Jaccard / Tanimoto es una de las mtricas utilizadas para comparar la
similaridad y diversidad de conjuntos de pruebas. Utiliza la razn del conjunto interceptante al
conjunto de unin como la medida de similaridad. Es decir, es igual a cero si no hay elementos
que intercepten e igual a uno si todos los elementos interceptan.
La ecuacin es

donde
- cantidad de elementos en el conjunto
- cantidad de elementos en el conjunto B
- cantidad de elementos en el conjunto que intercepta
Cmo utilizarlo - introduce los elementos separados por coma, y la calculadora muestra el
coeficiente y conjunto de intercepcin

;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;,,

Criterios basados en similaridades. Medidas de similaridad


Para determinar la homogeneidad entre los individuos se puede trabajar con
indicadores de su divergencia o disimilaridad, como las distancias que hemos
relatado anteriormente; o bien, podemos utilizar indicadores de la similitud.
Si una distancia alta entre individuos nos indica que son muy diferentes y una baja
que son muy similares; los indicadores de similitud actuar n de manera contraria:
conforme aumente su valor, aumentar la similaridad entre los individuos. Muchos
de los indicadores de similitud se basan en coeficientes de correlacin o de
asociacin.
El coeficiente de correlacin de Pearson se utiliza, en ocasiones, preferentemente
con datos cuantitativos y utilizando el algoritmo de distancia mnima. Los

coeficientes de correlacin por rangos de Kendall y Spearman se utilizan, tambin,


en casos de variables ordinales.
Para variables binarias se utilizan distintos coeficientes de asociacin o matching
type:

ndice binario:
donde m es el nmero de coincidencias y M el un nmero total de variables
comunes.

ndice de Tanimoto
donde h es el nmero de variables con 1 en los dos individuos y H es el nmero de
variables con algn 1.
y una veintena de indicadores ms que no tiene sentido mencionar aqu .

Vous aimerez peut-être aussi