Lev M

Backpropagation con Levemberg Marquard
Pgina 1 de 4
Algoritmo de Levenberg - Marquardt:[] Este algoritmo es una modificacin del mtodo de Newton, el que fue diseado para minimizar funciones que sean la suma de los cuadrados de otras funciones no lineales; es por ello que el algoritmo de Levenberg - Marquardt, tiene un excelente desempeo en el entrenamiento de redes neuronales donde el rendimiento de la red est determinado por el error medio cuadrtico. El mtodo de Newton para optimizar el rendimiento e(x) es: (2.3.48)
(2.3.49) Si asumimos que e(x) es una suma de funciones cuadrticas:
(2.3.50) El gradiente puede ser escrito entonces en forma matricial: (2.3.51) Donde J(x) es la matriz Jacobiana. Ajustando el mtodo de Newton, obtenemos el algoritmo de Levenberg Marquardt
(2.3.52) o
(2.3.53) La nueva constante determina la tendencia el algoritmo, cuando se incrementa, este algoritmo se aproxima al algoritmo de pasos descendientes para ratas de aprendizaje muy peque as; cuando Newton se decrementa este algoritmo se convierte en el mtodo de Gauss -
El algoritmo comienza con un valor pequeo para , por lo general 0.01, si en ese paso no se alcanza el valor para e(x) entonces el paso es repetido con multiplicado por un factor . Si se ha escogido un valor pequeo de paso en la direccin de paso descendiente, e(x) http://ohm.utp.edu.co/neuronales/Capitulo2/Backpropagation/LevMarqB.htm 04/04/2007
Pgina 2 de 4
debera decrecer. Si un paso produce un pequeo valor para e(x), entonces el algoritmo tiende al mtodo de Gauss - Newton, el que se supone garantiza una rpida convergencia. Este algoritmo genera un compromiso entre la velocidad del mtodo de Gauss-Newton y la garanta de convergencia del mtodo de paso descendiente. Los elementos de la matriz Jacobiana necesarios en el algoritmo de Levenberg-Marquardt son de este estilo:
(2.3.54) Donde x es el vector de parmetros de la red, que tiene la siguiente forma:
(2.3.55) Para utilizar este algoritmo en las aplicaciones para redes multicapa, se redefinir el trmino sensitividad de forma que sea ms simple hallarlo en cada iteracin.
(2.3.56) Donde h=(q-1)SM + k Con la sensitividad definida de esta manera, los trminos de la matriz Jacobiana pueden ser calculados ms fcilmente:
(2.3.57) y para las ganancias:
(2.3.58) De esta forma, cuando la entrada pQ ha sido aplicada a la red y su correspondiente salida aMQ ha sido computada, el algoritmo Backpropagation de Levenberg-Marquardt es inicializado con:
http://ohm.utp.edu.co/neuronales/Capitulo2/Backpropagation/LevMarqB.htm
04/04/2007
Pgina 3 de 4
(2.3.59) Cada columna de la matriz SMQ debe ser propagada inversamente a travs de la red para producir una fila de la matriz Jacobiana. Las columnas pueden tambin ser propagadas conjuntamente de la siguiente manera: (2.3.60) La matrices sensitividad total para cada capa en el algoritmo de Levenberg-Marquardt son formadas por la extensin de las matrices computadas para cada entrada: (2.3.61) Para cada nueva entrada que es presentada a la red, los vectores de sensitividad son propagados hacia atrs, esto se debe a que se ha calculado cada error en forma individual, en lugar de derivar la suma al cuadrado de los errores. Para cada entrada aplicada a la red habr SM errores, uno por cada elemento de salida de la red y por cada error se generara una fila de la matriz Jacobiana.
Este algoritmo puede resumirse de la siguiente manera: 1. Se presentan todas las entradas a la red, se calculan las correspondientes salidas y cada uno de los errores segn (2.3.62) se calcula despus, la suma de los errores cuadrados para cada entrada e(x) 2. Se calculan las sensitividades individuales y la matriz sensitividad total y con estas, se calculan los elementos de la matriz Jacobiana. 3. Se obtiene 4. Se recalcula la suma de los errores cuadrados usando . Si esta nueva suma es ms pequea que el valor calculado en el paso 1 entonces se divide por , se calcula y se regresa al paso 1. Si la suma no se reduce entonces se multiplica por y se regresa al paso 3.
04/04/2007
Backpropagation con Levemberg Marquard El algoritmo debe alcanzar convergencia cuando la norma del gradiente de (2.3.63)
Pgina 4 de 4
sea menor que algn valor predeterminado, o cuando la suma de los errores cuadrados ha sido reducida a un error que se haya trazado como meta. El comportamiento de este algoritmo se visualiza en la figura 2.3.12, la cual muestra la trayectoria de convergencia con y
Figura 2.3.12 Trayectoria del algoritmo Levenberg-Marquardt
Como puede verse, este algoritmo converge en menos iteraciones que cualquier m todo discutido anteriormente, por supuesto requiere mucha ms computacin por iteracin, debido a que implica el clculo de matrices inversas. A pesar de su gran esfuerzo computacional sigue siendo el algoritmo de entrenamiento ms rpido para redes neuronales cuando se trabaja con un moderado nmero de parmetros en la red, si el nmero de parmetros es muy grande utilizarlo resulta poco pr ctico.
04/04/2007

Lev M

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Lev M

Transféré par

Droits d'auteur :

Formats disponibles

Backpropagation con Levemberg Marquard

(2.3.49) Si asumimos que e(x) es una suma de funciones cuadrticas:

Backpropagation con Levemberg Marquard

(2.3.54) Donde x es el vector de parmetros de la red, que tiene la siguiente forma:

(2.3.57) y para las ganancias:

Backpropagation con Levemberg Marquard

Figura 2.3.12 Trayectoria del algoritmo Levenberg-Marquardt

Vous aimerez peut-être aussi