Linear

Transféré par

alfredusko

0% ont trouvé ce document utile (0 vote)

36 vues4 pages

Titre original

Linear.pptx

Copyright

Formats disponibles

PPTX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

36 vues4 pages

Linear

Transféré par

alfredusko

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 4

Rechercher à l'intérieur du document

Linear Reward-Penalty

LR-P Algoritmo Lineal de recompensa y penalizacin

APRENDIZAJE SUPERVISADO POR REFUERZO Durante el entrenamiento no se indica exactamente la salida que se desea ante una determinada entrada. La funcin del supervisor se reduce a indicar mediante una SEAL DE REFUERZO si la salida de la red se ajusta a lo deseado (+1), o DE PENALIZACIN (-1) en caso contrario.

APRENDIZAJE ESTOCSTICO Este tipo de aprendizaje consiste bsicamente en realizar cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

Linear Reward-Penalty
Fue presentado por Narendra y Thathacher en 1974 Fue ampliado por Barto y Anandan en 1985 con el nombre de Associative Reward-Penalty

Durante los aos de 1980, Barto , ampli el algoritmo de aprendizaje reforzado

desarrollando el modelo asociativo con recompensa y penalizacin, que se aplica en redes con
conexin hacia delante de dos capas cuyas neuronas de salida presentan una funcin de activacin estocstica. En este caso existe una nica seal de error, que representa un ndice global del

rendimiento de la red. Penalizando errores vs. descubriendo similitudes, el aprendizaje basado en la

similitud encuentra que elementos del conjunto de entrenamiento estn codificados de manera insuficiente por la red para adicionarlo y modificar el conocimiento almacenado para adaptarlo a las caractersticas del ambiente. Esto hace que la informacin acumulada previamente por la red no sea desechada a medida que la red interacta con el ambiente, realizando as un aprendizaje estable. El proceso de bsqueda regula de forma interna la modificacin la topologa y de los pesos de la red.

Vous aimerez peut-être aussi

Comandos para Configurar Un Switch y Router Cisco
Document8 pages
Comandos para Configurar Un Switch y Router Cisco
alfredusko
Pas encore d'évaluation
Las Cronicas de Narnia el Leвn, la Bruja y el ropero (Movie Script)
Document18 pages
Las Cronicas de Narnia el Leвn, la Bruja y el ropero (Movie Script)
Adriana Córsico
Pas encore d'évaluation
Hackers PDF
Document17 pages
Hackers PDF
alfredusko
Pas encore d'évaluation
Estructuras Algebraicas
Document13 pages
Estructuras Algebraicas
alfredusko
Pas encore d'évaluation
Ejemplos Algebra Relacional
Document7 pages
Ejemplos Algebra Relacional
alfredusko
Pas encore d'évaluation
Manual SIMOCODE Pro Safety es-MX
Document124 pages
Manual SIMOCODE Pro Safety es-MX
Ricardo Tito
Pas encore d'évaluation
Pasos para Configuara La Hora e Idioma en Windows 10
Document2 pages
Pasos para Configuara La Hora e Idioma en Windows 10
Leidy Burbano
Pas encore d'évaluation
Cadena de Valor
Document1 page
Cadena de Valor
Lixon Rios
Pas encore d'évaluation
Manual Enrolamiento Cajeros
Document10 pages
Manual Enrolamiento Cajeros
Cuenta para todo
Pas encore d'évaluation
Comparativa de Las Computadoras
Document4 pages
Comparativa de Las Computadoras
Shad V Montes
Pas encore d'évaluation
Guía de Aprendizaje 1 Unidad 1
Document11 pages
Guía de Aprendizaje 1 Unidad 1
Ivonne Casnanzuela
Pas encore d'évaluation
20 Instructivo Transferencias Internas Masivas
Document7 pages
20 Instructivo Transferencias Internas Masivas
Jenny Calderon Vasquez
Pas encore d'évaluation
Grupo 3 - Ambientes Virtuales (Práctica)
Document10 pages
Grupo 3 - Ambientes Virtuales (Práctica)
Juan Manuel Alvarado
Pas encore d'évaluation
Normas IEEE
Document4 pages
Normas IEEE
krystel
Pas encore d'évaluation
Comercio Internacional Temas Completo 2020
Document315 pages
Comercio Internacional Temas Completo 2020
Natalia Jauregui Gumucio
Pas encore d'évaluation
ELibro - Tutorial Usuarios
Document22 pages
ELibro - Tutorial Usuarios
Ivan Calvi
Pas encore d'évaluation
Manual Del Concurso Extraordinario de Méritos - Procesos de Estabilización Del Profesorado
Document22 pages
Manual Del Concurso Extraordinario de Méritos - Procesos de Estabilización Del Profesorado
Carlos Perez Villadangos
Pas encore d'évaluation
Cómo Instalar Zabbix 5 en CentOS 7
Document29 pages
Cómo Instalar Zabbix 5 en CentOS 7
Jaime García
Pas encore d'évaluation
Anexo Guia Mapa Conceptual Mental Aprendiz AA1 EV01
Document5 pages
Anexo Guia Mapa Conceptual Mental Aprendiz AA1 EV01
John Romero Estrada
Pas encore d'évaluation
Mof Laboratorio
Document2 pages
Mof Laboratorio
Carmen Diana
Pas encore d'évaluation
Control de Apertura de Puerta
Document5 pages
Control de Apertura de Puerta
Luis miguel Ávila Aldana
Pas encore d'évaluation
3265 Textodelartculoannimo 14680 1 10 20191024
Document11 pages
3265 Textodelartculoannimo 14680 1 10 20191024
geanfranco
Pas encore d'évaluation
Documentacion Cerradura Con Interfaz Proyecto1
Document15 pages
Documentacion Cerradura Con Interfaz Proyecto1
Luis Gustavo Fabian
Pas encore d'évaluation
Que Es OLAP
Document2 pages
Que Es OLAP
Viviana Velasquez
Pas encore d'évaluation
Caso de Estudio I
Document2 pages
Caso de Estudio I
Alberto Leon Azo
0% (1)
Diseño de Programas
Document21 pages
Diseño de Programas
Omer
Pas encore d'évaluation
Guia de Registro CCT 2022
Document29 pages
Guia de Registro CCT 2022
ElCigarroGabriel
Pas encore d'évaluation
Induccion Ofimatica
Document8 pages
Induccion Ofimatica
Maria Cambil
Pas encore d'évaluation
Evaluación 1 Manejo de Información
Document4 pages
Evaluación 1 Manejo de Información
cesar guzman
Pas encore d'évaluation
Notación Científica
Document16 pages
Notación Científica
Jorge John Saldaña Vásquez
Pas encore d'évaluation
Caso de Estudio-Mis en Su Bolsillo
Document7 pages
Caso de Estudio-Mis en Su Bolsillo
Mirla Bertrand Urbina
Pas encore d'évaluation
Tarea 1 Arquitectura en Hardware
Document6 pages
Tarea 1 Arquitectura en Hardware
Rodolfo Alvarado
Pas encore d'évaluation
2391 - Sistemas Operativos - 01 - CL1
Document14 pages
2391 - Sistemas Operativos - 01 - CL1
Eduardo Turpo
Pas encore d'évaluation
Lab 4 Terminado
Document7 pages
Lab 4 Terminado
Evelyn Huanca Maquera
Pas encore d'évaluation
Atenuadores de Luz Con Placa: Black Silver Blanco
Document1 page
Atenuadores de Luz Con Placa: Black Silver Blanco
Adriana G. Rodriguez
Pas encore d'évaluation