Sesion1 Vision de Rna

VISIÓN PANORÁMICA DE LAS
REDES NEURONALES ARTIFICIALES

Introducción
 Búsqueda constante de nuevas vías para mejorar
condiciones de vida del hombre.
Máquinas mecánicas (fuerza)
Calculadoras para resolver operaciones básicas
Primera computadora electrónica: ENIAC (1946)
• El computador convencional puede ejecutar

operaciones aritméticas y lógicas mucho más rápido
que el cerebro humano
• PERO .......
Introducción
 El computador convencional puede ejecutar

operaciones aritméticas y lógicas mucho más rápido
que el cerebro humano
PERO .......
¿Pero .....?
 ¿Clasificación de objetos por razgos comunes?

 ¿Contamos con información imprecisa, masiva y
muchas veces distorsionada?
 ¿Si no se puede definir un algoritmo para obtener el
resultado deseado?
Introducción
 Enfoque del problema de una manera distinta

 Característica común de los problemas que no se
resuelven con un algoritmo:
LA EXPERIENCIA
 Estudio del cerebro humano desde el punto de vista
de la computación
Cerebro Computador
Velocidad de = 10-2 seg. (100 Hz) =10-9 seg. (1000
Proceso MHz)
Estilo de Paralelo Secuencial
Procesamiento
# de Procesadores 10 11 - 1014 Pocos
Conexiones 10,000 por Pocas
procesador
Almacenamiento del Distribuido Direcciones fijas
conocimiento
Tolerancia a fallos Amplia Nula
Tipo de control del Auto organizado Centralizado
proceso
Introducción
 La IA busca descubrir y describir aspectos de la inteligencia humana que
pueden ser simulados mediante máquinas.
 Los sistemas neuronales toman las características esenciales de la estructura
neuronal del cerebro para emularlo en parte.
Las RNA no intentan solucionar los

problemas mediante una secuencia
de pasos, sino combinando muchos
elementos simples (neuronas)
interconectados y operando en
paralelo.
Introducción
Operan en base a reconocimiento de

patrones.
Adquieren, almacenan y utilizan
conocimiento experimental obtenido a
partir de ejemplos.
No se programan: “aprenden” mediante
un algoritmo de aprendizaje.
Las redes neuronales son modelos
matemáticos multivariantes que utilizan
procedimientos iterativos, en general para
minimizar funciones de error.
Elementos Básicos
La Neurona biológica
Elementos Básicos
Comunicación entre neuronas: SINAPSIS

Elementos Básicos
 Las sinapsis alteran la efectividad con la que la señal

es transmitida, a través de un parámetro: El peso.
 El aprendizaje resulta de la modificación de estos
pesos, los que unidos al procesamiento de
información de la neurona determinan el mecanismo
básico de la memoria.
Elementos Básicos
 El soma de la neurona recibe todos estos inputs, y

emite una señal de salida (output) si la entrada total
supera el valor del umbral.
 Esta salida se transmite a través del axón, desde
donde se propaga mediante diferencias de potencial
a las dentritas de otras neuronas
Elementos Básicos
 Hay grupos neuronales, compuestos de millones de

neuronas pertenecientes a una determinada región
del cerebro, que constituyen unidades funcionales
especializadas en ciertas tareas (un área visual, un
área auditiva, etc.).
Estructura de un Sistema
Neuronal Artificial
E S
N A
T L
 R I
A D
D A
A S
S Parte
algorítmica
Neurona Capa Red Sistema Neuronal

Características
Aprendizaje adaptativo:
 Capacidad de aprender a realizar tareas basadas en un entrenamiento o
en una experiencia inicial.
 Una red neuronal no necesita un algoritmo para resolver su
problema, ya que puede generar su propia distribución de los
pesos de los enlaces mediante el aprendizaje.
Características
Auto organización:
 Pueden crear su propia organización o representación de la información
que reciben mediante una etapa de aprendizaje.
 Da lugar a la generalización: Para entradas poco claras o incompletas
Características
Tolerancia a fallos:
 Estando la información distribuida por las sinapsis de la red, si una
sinapsis se daña solamente perdemos una pequeña parte de la
información.
Características
Procesamiento Paralelo:
 Los cómputos neuronales pueden ser realizados en paralelo
 Para esto se diseñan y fabrican máquinas con hardware especial para
obtener esta capacidad.
Elementos Básicos
Un sistema neuronal o conexionista tiene:

 Un conjunto de procesadores elementales o neuronas artificiales.
 Un patrón de conectividad o arquitectura.
 Una dinámica de activaciones.
 Una regla o dinámica de aprendizaje.
 El entorno donde opera.
La Neurona Artificial
Es un dispositivo simple de cálculo que, a partir de un vector de

entrada procedente del exterior o de otras neuronas, proporciona
una única respuesta o salida.
Tipos de Neuronas
E I1 O1 S
N A
T L
R I2 O2 I
A . . . . . . D
D .
. . . . . . A
. . . . .
A S
S Im Om
Nivel de Niveles Nivel de

Entrada Ocultos Salida
Elementos de la neurona i:
Valor o estado de Activación ai(t): Valor

numérico que caracteriza a la neurona.
Función de transferencia fi que transforma
el estado actual de activación en una
señal de salida yi, la que es enviada a
otras neuronas de la red a través de los
canales de comunicación.
Estas señales se modifican de acuerdo a
los pesos sinápticos wji asociados a cada
canal.
 Las entradas moduladas que llegan a la

neurona j se combinan entre ellas, generando
la entrada total
Netj   yi wji
i
 Una regla de activación determina el nuevo
estado de activación aj (t+1) de la neurona,
teniendo en cuenta la entrada total
calculada y el anterior estado de activación
aj (t).
Neurona Uh
yh
Neurona Uj
wjh
Neurona Ui
F(aj(t), Netj) fj(aj(t+1))
yi Netj = = yj
wji
. aj (t+1) yj
.
. wjg
.
Neurona Ug
yg
APRENDIZAJE
 Biológicamente, la información memorizada en el cerebro está

más relacionada con los valores sinápticos de las conexiones entre
las neuronas, que con ellas mismas; es decir, el conocimiento se
encuentra en las sinapsis.
APRENDIZAJE
 Una red neuronal artificial aprende mediante la modificación de

los pesos de las conexiones entre las neuronas.
 Se dice que la red “ha aprendido” cuando los valores de los pesos
permanecen estables:
dwij /dt = 0
APRENDIZAJE
Reglas de Aprendizaje:
Supervisado
No supervisado o autoorganizado
Aprendizaje Supervisado
 Se proporciona a la red parejas de patrones entrada – salida, y

ésta aprende a asociarlos.
Formas:
Aprendizaje por corrección de

error
Aprendizaje por refuerzo
Aprendizaje estocástico
Aprendizaje Supervisado por
Corrección de Error
 Los pesos de las conexiones de la red se ajustan en función de la

diferencia entre los valores deseados y los obtenidos en la salida;
es decir, en función del error cometido.
y1
1
.
. wj1
.
yi wji
i yj
. wjn
.
. yn
Unidad Uj
n
Regla de aprendizaje del Perceptrón (Rosenblatt, 1958)

 wji =  yi (dj – yj)
Donde
 wji = variación en el peso de la conexión
yi : Valor de salida de la neurona i.
dj : Valor de salida deseado para la
neurona j.
yj :Valor de salida obtenido de la neurona j.
 : Factor de aprendizaje (0 <  <= 1) que
regula la velocidad del aprendizaje.
Regla Delta o del error mínimo cuadrado (Widrow y Hoff, 1960).
P N
1
Errorglobal  
2 P k 1 j 1
( yj  dj )
(k ) (k ) 2
N : número de neuronas de salida

P: número de informaciones que debe aprender
1 N

2 j 1
( yj
k
 dj
k 2
) Error cometido en el aprendizaje de la
información k-ésima
Regla Delta Generalizada, LMS – Least Mean Square Error - Multicapa
ó Backpropagation (1986).
 Se aplica a redes con una o más capas ocultas
 Se emplean en muchas más aplicaciones que las anteriores
 Su aprendizaje en más lento por la mayor cantidad de conexiones que
explorar.
Aprendizaje Supervisado por Refuerzo
 Mas lento que el anterior, basado en no indicar exactamente a la

red la salida deseada ante una determinada entrada.
 Se indica a la red mediante una señal de refuerzo si la salida
obtenida se ajusta a la deseada (éxito = +1 ó fracaso = -1), y en
función de ello se ajustan los pesos.
Aprendizaje Supervisado Estocástico
 Consiste básicamente en realizar cambios aleatorios en los valores

de los pesos de las conexiones de la red, y evaluar su efecto a
partir del objetivo deseado y de distribuciones de probabilidad.
Aprendizaje No Supervisado
 Se proporciona a la red solamente las entradas, para que extraiga

los razgos característicos esenciales.
 La red busca el agrupamiento de los patrones de entrada, análisis
de conglomerados o cluster, escalas multidimensionales, etc.
 La interpretación de las salidas depende de su estructura y del
algoritmo de aprendizaje.
Aprendizaje No Supervisado
 Puede representar el grado de similitud entre la información que se le

está presentando en la entrada y las informaciones que se le han
mostrado en el pasado (Aprendizaje Hebbiano).
 En otro caso, podría realizar un clustering o establecimiento de
categorías (Aprendizaje competitivo y comparativo).
COMPARACIÓN CON OTRAS
TÉCNICAS
Inteligencia Artificial (IA):
 Imitar el razonamiento humano a través de una lógica deductiva o
manipulación de símbolos:
Qué hace el cerebro
Redes Neuronales Artificiales (RNA):
 Inspiración biológica:
Cómo funciona el cerebro
Comparación con otras
técnicas
IA - Sistemas Expertos:
 Motor de Inferencia con la programación de las manipulaciones
genéricas de tipo lógico a aplicar,
 Base de Conocimiento, que almacena la información a emplear en el
problema (reglas y parámetros)
técnicas
Redes Neuronales Artificiales:
 El conocimiento emerge de las interconexiones de la estructura de la red
de procesadores elementales (inteligencia computacional)
 La intensidad de las conexiones se obtiene mediante entrenamiento: no
hay que programarla.
técnicas
IA - Sistemas Expertos:
 Desarrollos normalmente costosos en tiempo y dinero.
 Tiempo de respuesta usualmente lento, por frondosos árboles de
decisión
técnicas
Redes Neuronales Artificiales:
 Tiempos de respuesta muy pequeños (milisegundos), aún en
computadores convencionales.
 Lo costoso es el aprendizaje, pero se suele realizar solamente una vez.
 Pueden resolver problemas complejos para los que no existe un
algoritmo definido.
técnicas
 La IA tiene un enfoque descendente (reglas, conceptos y cálculos
secuenciales), como la mitad izquierda del cerebro.
 Las RNA tienen enfoque emergente, interpretando intuitiva y
paralelamente imágenes, sonidos y estímulos, como el lado derecho del
cerebro.
técnicas
 La IA y las RNA son tecnologías complementarias, no excluyentes.

 Los mejores resultados se obtienen aplicando cada técnica al aspecto
del problema para el que resulte más apropiada.
APLICACIONES
 RNA lineales
 Clasificación de Patrones
 Predicción y Análisis financiero
 Control y Optimización
 Aplicaciones militares
 Aplicaciones Médicas y Biomédicas
 ..........................
APLICACIONES
Características que debe tener el problema para trabajarlo con RNA:

 No se cuenta con reglas que lo describan completamente.
 Se dispone de muchos ejemplos o datos históricos.
 Datos imprecisos o con “ruido”
 Elevada dimensionalidad
 Condiciones cambiantes
APLICACIONES
Características que hacen desaconsejable el uso de RNA:

 Existe un algoritmo que resuelve con total eficacia el problema.
 No se dispone de un número adecuado de casos ejemplo para entrenar la
red.
 Tareas críticas o potencialmente peligrosas, cuya solución siempre deba ser
perfectamente predecible y explicable.
CASO DE ESTUDIO
Administración de Servicio de
Perinatología
 El cuerpo humano y sus interacciones con su entorno conforman uno de

los sistemas más complejos.
 Muchas variables: Alta dimensionalidad
 Información a menudo incompleta y con errores
 Abundancia de datos clínicos
CASO DE ESTUDIO
Perinatología
Se dispone de data detallada de

más de 160,000 nacimientos de los
últimos 4 años:
Información de la madre
Información del hijo: Peso al nacer,
edad gestacional, condiciones al
egreso
Si fallecido, edad y causa de muerte
CASO DE ESTUDIO
Perinatología
Se requiere identificar el perfil de

salud de la madre asociado al
fallecimiento de los bebes según:
Madre: dolencias generales que
cursan con el embarazo, y dolencias
obstétricas
Hijo: peso al nacer y edad al fallecer
CASO DE ESTUDIO
Perinatología
Peso /
FATP FDTP F<1día F<7 días F<27días
edad
< 1500 gr
< 2500 gr
> 2500 gr
CASO DE ESTUDIO
Perinatología
Estrategia:
Planteamiento del Problema
Requerimientos del sistema
Revisión bibliográfica
Elección del modelo: MLP con
aprendizaje BP
CASO DE ESTUDIO
Perinatología
Estrategia:
Datos disponibles y selección de
variables relevantes
Elección del conjunto de
aprendizaje y prueba.
Preprocesamiento: Tratamiento de
los datos para adecuarlos a la red
CASO DE ESTUDIO
Perinatología
Estrategia:
Entrenamiento: pesos, ritmo de
aprendizaje, cantidad de neuronas
ocultas
Evaluación de resultados

Sesion1 Vision de Rna

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Sesion1 Vision de Rna

Transféré par

Droits d'auteur :

Formats disponibles

VISIÓN PANORÁMICA DE LAS

REDES NEURONALES ARTIFICIALES

• El computador convencional puede ejecutar

 El computador convencional puede ejecutar

 ¿Clasificación de objetos por razgos comunes?

 Enfoque del problema de una manera distinta

Las RNA no intentan solucionar los

Operan en base a reconocimiento de

Comunicación entre neuronas: SINAPSIS

 Las sinapsis alteran la efectividad con la que la señal

 El soma de la neurona recibe todos estos inputs, y

 Hay grupos neuronales, compuestos de millones de

Neurona Capa Red Sistema Neuronal

Un sistema neuronal o conexionista tiene:

Es un dispositivo simple de cálculo que, a partir de un vector de

Nivel de Niveles Nivel de

Valor o estado de Activación ai(t): Valor

 Las entradas moduladas que llegan a la

 Biológicamente, la información memorizada en el cerebro está

 Una red neuronal artificial aprende mediante la modificación de

 Se proporciona a la red parejas de patrones entrada – salida, y

Aprendizaje por corrección de

 Los pesos de las conexiones de la red se ajustan en función de la

Regla de aprendizaje del Perceptrón (Rosenblatt, 1958)

N : número de neuronas de salida

 Mas lento que el anterior, basado en no indicar exactamente a la

 Consiste básicamente en realizar cambios aleatorios en los valores

 Se proporciona a la red solamente las entradas, para que extraiga

 Puede representar el grado de similitud entre la información que se le

 La IA y las RNA son tecnologías complementarias, no excluyentes.

Características que debe tener el problema para trabajarlo con RNA:

Características que hacen desaconsejable el uso de RNA:

 El cuerpo humano y sus interacciones con su entorno conforman uno de

Se dispone de data detallada de

Se requiere identificar el perfil de

Vous aimerez peut-être aussi