LVQ

LVQ
Aprendizaje por Cuantificación

Vectorial
LVQ
Cuándo de clasificar información se trata un método simple para hacerlo puede
ser encontrar una función lineal que devuelva un valor que represente la
membresía a una clase determinada.
Sin embargo en los problemas del mundo real no existen la mayoría de las veces
funciones lineales capaces de hacer esto.
Cuando esto ocurre, una posible solución puede ser utilizar técnicas de
inteligencia artificial para estimar este tipo de funciones .

Tuevo Kohonen presentó
un modelo de red neuronal
Índice con capacidad para formar
mapas de características
Visión general
de manera similar a como
Aprendizaje por
Análisis de los problemas ocurre en el cerebro.
cuantificación vectorial
Objetivo del proyecto Es un método para
Audiencia objetivo
entrenamiento de capas
Tendencias de mercado
Diagrama de ciclo competitivas de manera
supervisada
Cuál es su ventaja?
-Una capa competitiva aprende
automáticamente a clasificar los
vectores de entrada.
-Aprende a clasificar vectores de
entrada en clases “objetivo”
escogidas por un usuario.
-Las clases que las capas
competitivas encuentran son
dependientes solamente de las
distancias que existen entre los
vectores de entrada
ARQUITECTURA
El modelo LVQ utiliza una arquitectura de dos capas :

-La primera capa es una capa competitiva que aprende a
clasificar los vectores de entrada de la misma forma que las
capas competitivas.
-La segunda capa transforma las clases de la capa
competitiva en clasificaciones objetivo definidas por el usuario
Las primeras son conocidas como subclases .
Las segundas son conocidas como clases objetivo.
En el modelo LVQ sus
Índice conexiones se realizan
hacia delante. Los pesos
Visión general de conexión se
Análisis de los problemas
representan mediante una
Objetivo del proyecto
Audiencia objetivo matriz de pesos 𝑊 según
Tendencias de mercado cada capa de la red
Diagrama de ciclo
neuronal
FUNCIONAMIENTO
El proceso de entrenamiento comienza con la inicialización de
los pesos sinápticos.
Se puede realizar de varias formas, entre ellas están: pesos

nulos, pesos aleatorios de pequeños valor absoluto, o pesos
con un valor de partida predefinido.
Se escoge una instancia del conjunto de entrenamiento y se

presenta a la entrada de la red.
Cada vector prototipo de la capa competitiva calcula su

distancia con respecto al vector de entrada
FUNCIONAMIENTO
El criterio de medida fue la distancia euclidiana definida por la

ecuación
Después se establece una competición entre los vectores

prototipos y el vector de entrada para determinar cuál es el
más cercano al vector de entrenamiento el cual será
proclamado ganador, es decir, la neurona ganadora es cuya
distancia sea la menor de todas.
FUNCIONAMIENTO
Así la salida de la primera capa de la red LVQ se define por la

ecuación
La función 𝐶𝑜𝑚𝑝𝑒𝑡(. ) es una función de transferencia que

dicho de una manera sencilla la neurona cuyo vector de pesos
esté más cercano al vector de entrada tendrá salida 1 y el
resto de las neuronas tendrán salida 0
FUNCIONAMIENTO
Donde a1 es la salida y n1es la entrada neta a la función de

transferencia, definida por la siguiente ecuación
FUNCIONAMIENTO
Una propiedad importante de esta red, es que el proceso de

combinar subclases para formar clases, permite la creación
de clases más complejas. Una sola capa competitiva estándar
tiene la limitación de que puede crear solo regiones de
decisión convexas; la red LVQ soluciona esta limitación.
FUNCIONAMIENTO
La segunda capa de la red LVQ combina las subclases en

una sola clase. Las columnas de W ^ 2 representan
subclases, y las filas representan clases. La matriz W ^2 tiene
un 1 en cada columna, con los otros elementos iguales a cero.
La fila en la cual el 1 ocurre indica a cual clase pertenece la
subclase apropiada
FUNCIONAMIENTO
Para generar la matriz W^2, antes de que se inicie el

aprendizaje, cada neurona en la segunda capa es asignada a
una neurona de salida; por lo general igual número de
neuronas ocultas son conectadas a cada neurona de salida,
para que cada clase pueda ser conformada por el mismo
número de regiones convexas.
Una vez que ha sido definida nunca será alterada durante el
proceso de entrenamiento que solo modificará los pesos de
𝑊^1
FUNCIONAMIENTO
Para obtener la salida final se calcula
que indicará a quien está siendo asignado el vector de

entrada 𝑃 presentado inicialmente a la red. Se procede
entonces a la actualización de los pesos sinápticos de la
neurona ganadora por medio de la regla de Kohonen que es
empleada para mejorar solo la capa oculta de la red LVQ.
FUNCIONAMIENTO
La regla de Kohonen es utilizada SOLO para actualizar el

peso de la i-ésima neurona competitiva si esa neurona
objetivo es 1
FUNCIONAMIENTO
La salida no cero representa una subclase, muchas neuronas

(subclases), conforman una clase.
Si el objetivo de la neurona ganadora es cero ( es decir la

neurona forma una subclase distinta a la clase objetivo actual)
la regla de Kohonen es aplicada con un cambio de signo
alejando a la neurona del vector de peso actual.
FUNCIONAMIENTO
La actualización de los pesos para el instante 𝑡 + 1 se realiza

según la ecuación
FUNCIONAMIENTO
Donde 𝛼(𝑡) es la tasa de aprendizaje, la misma se utiliza de

tres formas posibles en la ecuación
1. 𝛼(𝑡) con signo positivo si pertenecen a la
misma clase, en este caso se premia la neurona ganadora.
2. 𝛼(𝑡) con signo negativo si pertenecen a
clases diferentes, en este caso se castiga la neurona
ganadora.
3. 𝛼(𝑡) = 0, es decir para el caso de
cualquier otro vector prototipo Wi1(t)distinto del ganador.
FUNCIONAMIENTO
Este parámetro 𝛼(𝑡) tasa de aprendizaje es utilizado por

muchas redes neuronales en su fase de entrenamiento para
controlar la velocidad de convergencia de los pesos
sinápticos. Resulta de gran importancia la elección de un valor
adecuado para la tasa de aprendizaje que permita hallar un
punto de equilibrio entre la velocidad de convergencia y la
estabilidad final de los vectores.
FUNCIONAMIENTO
Una 𝛼(𝑡) cercana a 0, hace que el aprendizaje sea lento pero

asegura que cuando un vector prototipo haya alcanzado una
clase se mantenga allí indefinidamente
Una 𝛼(𝑡) cercana a 1 hacen que el acercamiento del vector
prototipo al vector de entrada sea muy rápido, pero como
desventaja los pesos tendrán grandes oscilaciones
provocando muchas veces inestabilidad en el proceso de
convergencia.
FUNCIONAMIENTO
Otra posibilidad es utilizar un 𝛼(𝑡) adaptativo, se inicializa con

algún valor no muy alto, por ejemplo 0.3; y se decrementa a
medida que avanza el entrenamiento según alguna función,
de manera que al final del proceso su valor sea muy cercano
a 0.
EJEMPLO

LVQ

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

LVQ

Transféré par

Droits d'auteur :

Formats disponibles

LVQ

Aprendizaje por Cuantificación

inteligencia artificial para estimar este tipo de funciones .

El modelo LVQ utiliza una arquitectura de dos capas :

Se puede realizar de varias formas, entre ellas están: pesos

Se escoge una instancia del conjunto de entrenamiento y se

Cada vector prototipo de la capa competitiva calcula su

El criterio de medida fue la distancia euclidiana definida por la

Después se establece una competición entre los vectores

Así la salida de la primera capa de la red LVQ se define por la

La función 𝐶𝑜𝑚𝑝𝑒𝑡(. ) es una función de transferencia que

Donde a1 es la salida y n1es la entrada neta a la función de

Una propiedad importante de esta red, es que el proceso de

La segunda capa de la red LVQ combina las subclases en

Para generar la matriz W^2, antes de que se inicie el

Para obtener la salida final se calcula

que indicará a quien está siendo asignado el vector de

La regla de Kohonen es utilizada SOLO para actualizar el

La salida no cero representa una subclase, muchas neuronas

Si el objetivo de la neurona ganadora es cero ( es decir la

La actualización de los pesos para el instante 𝑡 + 1 se realiza

Donde 𝛼(𝑡) es la tasa de aprendizaje, la misma se utiliza de

Este parámetro 𝛼(𝑡) tasa de aprendizaje es utilizado por

Una 𝛼(𝑡) cercana a 0, hace que el aprendizaje sea lento pero

Otra posibilidad es utilizar un 𝛼(𝑡) adaptativo, se inicializa con

Vous aimerez peut-être aussi