Vous êtes sur la page 1sur 5

ALGORITMO K-NN

El mtodo de los k vecinos ms cercanos (en ingls, k-nearest neighbors,


abreviado k-nn) es un mtodo de clasificacin supervisada (Aprendizaje, estimacin
basada en un conjunto de entrenamiento y prototipos).
Este es un mtodo de clasificacin no paramtrico, que estima el valor de la
funcin de densidad de probabilidad o directamente la probabilidad a posteriori de
que un elemento x pertenezca a la clase Cj a partir de la informacin proporcionada
por el conjunto de prototipos. En el proceso de aprendizaje no se hace ninguna
suposicin acerca de la distribucin de las variables predictoras.
En el reconocimiento de patrones, el algoritmo k-nn es usado como mtodo
de clasificacin de objetos (elementos) basado en un entrenamiento mediante
ejemplos cercanos en el espacio de los elementos. k-nn es un tipo de aprendizaje
vago (lazy learning), donde la funcin se aproxima solo localmente y todo el
cmputo es diferido a la clasificacin.
PROBLEMA
Utilizando el algoritmo de clasificacin K-NN se busca clasificar por reas de
conocimiento a un grupo de estudiantes de nivel de educacin media-superior de los
cuales se conocen las calificaciones de todas sus materias para as poder
recomendarles una carrera a la cual se puedan dedicar. Los datos sern divididos en
dos conjuntos, el conjunto de entrenamiento (80%) y el conjunto de prueba (20% de
los datos). El conjunto de entrenamiento se usar para determinar los parmetros
del clasificador y el conjunto de prueba se usar para estimar el error de
generalizacin, buscando obtener un error de generalizacin pequeo para no hacer
un sobre entrenamiento.
De esta manera con el algoritmo K-NN se buscar obtener un grupo de
prototipos de los k prototipos ms cercanos al patrn a clasificar.
PARAMETROS
Debemos seleccionar un K: Normalmente es un numero entero pequeo que
determina el numero de clases que revisar de los vecinos ms prximos.
Weightned vote: Este parmetro permite que se tomen en cuenta las
distancias entre los ejemplos. Puede ser muy til para examinar si los vecinos ms
cercanos aportan mas que los mas lejanos.
Measure types: Este parmetro se usa para determinar el tipo de medida que
se utilizar para encontrar a los vecinos mas cercanos.
Nominal measure: Solo se encuentra disponible si Measure Types est
configurado como Mixed Measures.
Numerical measure: Solo se encuentra disponible si Measure Types est
configurado como Numerical Measures. Este parmetro no se puede configurar si
los datos de entrada son de tipo nominal.
Divergence: Solo se encuentra disponible si Measure Types est configurado
como Bregman divergences.
Kernel Type: Solo se encuentra disponible si Numerical Measure est
configurado como Kernel Euclidean Distance. Se pueden encontrar diferentes tipos
de kernel (Nucleo).

Dot.
Radial.
Polynomial.
Neural.
Sigmoid.
Anova.
Epachnenikov.
Gaussian Combination.
Multiquadric.
Por cada kernel se pueden encontrar parmetros que los modifican,
dependiendo cada kernel podramos encontrar:

Kernel gamma.
Kernel sigma1.
Kernel sigma2.
Kernel sigma3.
Kernel shift.
Kernel degree.
Kernel a.
Kernel b.

RESULTADOS ESPERADOS
Al final lo que obtendremos ser una clasificacin en la cual se mostrar con
base en el algoritmo, las reas de estudio en las que se ubican para poder as
recomendarles una carrera adecuada a sus aptitudes.
REDES NEURONALES
Es una tcnica de Inteligencia Artificial utilizada sobre todo para la clasificacin, sta
consiste en mostrarle una serie de productos asociados a una categora a la red de
manera que sta entienda cules son las caractersticas que los hacen ser parte de
esa categora, y tras haber aprendido el modelo introducirle nuevos datos y que la
red los pueda categorizar por s sola e inclusive crear nuevas categoras si lo cree
necesario.
Elementos:
Neuronas: Elementos de la red que realizaran la evaluacin de los elementos
cargados por el usuario.
Capas: Conjunto de neuronas, entra ms capas y ms neuronas mayor
exactitud tendr la clasificacin.
PARMETROS
Ciclos de entrenamiento: Especifica el nmero de ciclos para el entrenamiento de la
red neuronal.
ndice de aprendizaje: Especifica que tanto deben cambiar los pesos para cada ciclo
de entrenamiento.

Parmetros de salida
Modelo de red neuronal: Conjunto de nodos conectados de acuerdo a ciertas reglas.
PROBLEMA
Para aplicar el algoritmo de redes neuronales, se plantea el siguiente caso:
La tienda en lnea Amazon busca encontrar una clasificacin correspondiente a las
importaciones de los pases. Para esto, se disponen de datos histricos
correspondientes a los aos 2005 hasta el ao de 2017 de las importaciones
correspondientes a los pases as como el monto en efectivo equivalente a stas
importaciones.
REGRESIN LINEAL
Regresin es una tcnica usada para la prediccin numrica. Es una medida
estadstica que intenta determinar la intensidad o fuerza de una relacin entre una
variable dependiente y una serie de variables cambiantes conocidas como variables
independientes. Regresin es usado para predecir un valor continuo. Regresin
linear intenta modelar la relacin entre una variable explicada (dependiente) y una o
ms variables explicativas (independientes) mediante el ajuste de una funcin linear
a partir de los datos observados.
PARMETROS
Y: Variable dependiente o explicada.
X1,,Xn: Variables independientes o explicativas.
Parmetros de salida
Modelo de regresin linear: Ecuacin lineal.
FUNCIONAMIENTO
La estructura del modelo de regresin lineal es la siguiente:
Y = 0 + 1 X +
Se parte de una muestra de valores X e Y medidos sobre n individuos y se busca
estimar valores en
Y segn el modelo anterior, donde 0 y 1 son por el momento valores desconocidos.
En esta expresin se admiten todos los factores o causas que influyen en la variable
respuesta Y pueden dividirse en dos grupos: el primero contiene a una variable
explicativa X y el segundo incluye un conjunto amplio de factores no controlados
que se engloban bajo el nombre de perturbacin o error aleatorio, , que provoca
que la dependencia entre las variables dependientes e independientes no sea
perfecta, sino que est sujeta a incertidumbre.
PROBLEMA
Para aplicar el algoritmo de regresin lineal, se plantea el siguiente caso:
La tienda en lnea Amazon busca una manera de predecir el ndice de precios al
consumidor (CPI) dado por las rutas martimas teniendo en cuenta el nuevo ndice
de cambio para el presente ao de 2017, ya que no se cuenta con esa informacin y es
de vital importancia conocer este ndice. Para esto se propone utilizar el algoritmo
de regresin lineal con el objetivo de obtener una ecuacin que permita predecir el
CPI de un pas en especfico.

Vous aimerez peut-être aussi