Modelos Matemáticos Del Condicionamiento

Revista Latinoamericana de Psicología
2006, volumen 38, No 2, 215-243
MODELOS MATEMÁTICOS DEL CONDICIONAMIENTO

CLÁSICO: EVOLUCIÓN Y DESAFÍOS ACTUALES
EDGAR H. VOGEL1, FABIÁN A. SOTO

Universidad de Talca, Chile
MARÍA E. CASTRO Y PAOLA A. SOLAR

Universidad del Mar, Chile
ABSTRACT
From the beginning of the study of classical conditioning, the formulation of mathematical
theories has been a major goal of theoreticians. After more than a century of research, the
amount of empirical data accumulated is impressive and the theories have become progressively
more complex and sophisticated. Nowadays, there is such a diversity of models, each
addressing only certain categories of phenomena and using somewhat different formalisms,
that a critical analysis seems opportune. This article attempts to provide such an analysis for
the Spanish speaking audience.
Key words: Associative learning, Pavlovian conditioning, classical conditioning, neural

networks, connectionism.
RESUMEN
Desde los inicios del estudio del condicionamiento clásico, la formulación de modelos
matemáticos ha sido uno de los principales objetivos de los autores. Después de más de un siglo
de investigación, la cantidad de información empírica acumulada es impresionante y los
modelos teóricos han llegado a ser progresivamente más complejos y sofisticados. Hoy en día,
continúa
Agradecimientos: Esta investigación fue financiada por el Proyecto Regular Fondecyt N° 1040109.
1 Correspondencia: EDGAR H. VOGEL, Universidad de Talca, Escuela de Psicología, Casilla N° 747, Talca, Chile. E-mail:
evogel@utalca.cl
216 VOGEL, SOTO, CASTRO Y SOLAR
es tal la diversidad de modelos, cada uno implementado con distintos formalismos y destinado
a explicar diferentes grupos de fenómenos, que una evaluación crítica nos parece oportuna.
Este artículo pretende entregar este análisis al público de habla hispana.
Palabras clave: aprendizaje asociativo, condicionamiento Pavloviano, condicionamiento

clásico, redes neuronales, conexionismo.
INTRODUCCIÓN mor en ratas, y el condicionamiento palpebral en

conejos, los cuales permitieron abordar en for-
A principios del siglo pasado, se difundieron ma simultánea los aspectos conductuales y
internacionalmente las observaciones experi- neurobiológicos del aprendizaje. Hoy en día, los
mentales realizadas en el laboratorio de Iván circuitos neuronales que subyacen a algunas
Pavlov, acerca de un tipo de aprendizaje asocia- formas de condicionamiento se han descrito con
tivo en el cual los animales cambian su patrón de cierto detalle (McCormick & Thompson, 1983)
respuesta a un estímulo, llamado condicionado, y sus mecanismos celulares están comenzando a
en virtud de su asociación con otro estímulo, ser identificados (Medina et al., 2000). Estos
llamado incondicionado (Pavlov, 1927). Este hallazgos significan nuevos desafíos para las
tipo de aprendizaje, conocido como teorías, las cuales, además de explicar los fenó-
condicionamiento clásico o pavloviano, fue ini- menos conductuales, deben cumplir con crite-
cialmente estudiado en el reflejo salivatorio de rios de plausibilidad biológica.
perros, pero rápidamente se desarrollaron otros
procedimientos que incluían los sistemas de En los últimos años, con la proliferación del
respuesta de una variedad de especies, tales uso de computadores personales que favorecen
como moluscos, insectos, peces, aves, roedo- la realización de gran cantidad de cálculos en
res, conejos, simios y humanos. poco tiempo, se observa un explosivo creci-
miento en el número de modelos cuantitativos
Con el fin de dar cuenta de los innumerables de condicionamiento clásico. La mayoría de
hallazgos experimentales obtenidos con el estos son presentados en la forma de redes
condicionamiento pavloviano, los investigado- neuronales conexionistas, donde los estímulos
res comenzaron a elaborar teorías que rápida- se representan por nódulos que se influyen unos
mente evolucionaron hacia modelos matemáticos. a otros a través de conexiones plásticas. En el
Esta temprana inclinación por la cuantificación presente artículo, más que revisar un gran núme-
obedeció a la necesidad de examinar hipótesis no ro de modelos, hemos optado por clasificarlos
ambiguas, lo cual era una de las grandes dificul- en unas pocas categorías, describiendo uno o
tades de la Psicología en el comienzo del siglo dos de los modelos más representativos de cada
pasado. Desde entonces, los modelos de categoría y los fenómenos para los cuales fueron
condicionamiento han crecido en complejidad y creados.
poder explicativo, siguiendo los avances de otras
disciplinas afines tales como la inteligencia artifi- PRIMERA GENERACIÓN: MODELOS DE
cial y la neurociencia. ENSAYO DISCRETO
Además, la década de los ochenta fue testigo El fenómeno de condicionamiento clásico se

del perfeccionamiento de varios procedimientos describe usualmente como el resultado de la
experimentales mixtos, tales como el retiro del presentación conjunta del estímulo condiciona-
sifón en la aplysia, el condicionamiento de te- do (inicialmente neutral) y el estímulo incondi-
MODELOS DEL CONDICIONAMIENTO CLÁSICO 217
cionado. Cada una de estas presentaciones o to representadas por círculos. El nivel de activación
“pareamientos” se denomina ensayo, y se asu- de las unidades, xi (para el EC) y z (para el EI), es
me que el grado de aprendizaje es una función binario, es decir asume el valor de 1 cuando el
directa del número de éstos. Aquellos modelos estímulo está presente y de 0 cuando no lo está. La
que se han preocupado por describir cómo ocu- unidad adaptativa es la encargada de la generación
rre el aprendizaje a través de los ensayos, se de la respuesta. Las unidades sensoriales influyen
denominan modelos de ensayo discreto, a la unidad adaptativa por medio de sus conexio-
enfatizando con ello que el ensayo es la unidad nes, las cuales se representan gráficamente como
mínima de aprendizaje, y que, por lo tanto, el líneas que las conectan. Los valores de vi represen-
aprendizaje se describe exclusivamente en fun- tan la fuerza asociativa de cada estímulo condicio-
ción de la ausencia o presencia de los estímulos nado (EC), es decir la capacidad de éstos para
en el ensayo como un todo. provocar la respuesta, mientras que el valor de l
representa la fuerza de la asociación entre el estí-
En la Figura 1 se presenta una red neuronal que mulo incondicionado (EI) y la respuesta. Se asume
se puede utilizar para describir la mayoría de los que el EI tiene una conexión “máxima” o perfecta
modelos de ensayo discreto. Se asume que los con la unidad adaptativa, y que la fuerza asociativa
eventos del ambiente (estímulos condicionados o de cada EC, vi, es una expresión de la asociación
EC y estímulo incondicionado o EI), activan sus entre el EC y el EI. Esta figura nos servirá como
respectivas unidades sensoriales de procesamien- punto de partida para describir las distintas catego-
rías de modelos de condicionamiento pavloviano.
Respuesta
UNIDAD
ADAPTATIVA
Y
v3
v1 l
v2
UNIDADES X1 X2 X3 Z
SENSORIALES
EC1 EC2 EC3 EI
Figura 1. Una red neural prototípica para el condicionamiento Pavloviano. Los círculos
representan unidades de procesamiento y las líneas continuas y discontinuas representan conexio-
nes modificables (vi) e inmodificables (l) entre las unidades, respectivamente. Las letras xi, z e Y,
representan la actividad de las unidades sensoriales y la unidad adaptativa.
El operador lineal pareados con EI, aumentarán en su fuerza

asociativa, independientemente del valor asocia-
La tradición cuantitativa en teoría del aprendi- tivo de los otros estímulos presentes en el ensayo.
zaje se inició simultáneamente bajo la influencia Esto es un ejemplo de lo que se ha denominado
de 2 enfoques teóricos diferentes: Las “hipótesis de la continuidad” (Spence, 1945), la
formulaciones de Clark Hull y Keneth Spence cual sostiene que la asociación entre el EC y el EI
(Hull, 1943; Spence, 1960), y la “teoría estadísti- depende exclusivamente de parámetros relacio-
ca del aprendizaje” o “teoría del muestreo de nados con estos dos estímulos.
estímulos” (Bush & Mosteller, 1955; Estes, 1950).
Pese a que la contribución de ambos enfoques es La hipótesis de la continuidad fue seriamente
vasta, en este artículo incluimos solamente un desafiada a fines de los años 60 por una serie de
mínimo de detalles, considerados necesarios para experimentos, que sugerían que el nivel de apren-
comprender los desarrollos teóricos posteriores. dizaje alcanzado por un determinado estímulo,
X, depende no sólo de sus propiedades (por
Dejando de lado importantes diferencias ejemplo la intensidad de X), sino también del
entre ambos enfoques, se puede decir que am- valor asociativo que tuvieran todos los otros
bos postulan virtualmente el mismo algoritmo estímulos presentes en el ensayo. Por ejemplo,
para describir cómo se produce el aprendizaje Kamin (1968) descubrió un fenómeno llamado
a lo largo de los ensayos. La idea básica, bloqueo, en el cual un EC que ha desarrollado
conocida como “operador lineal”, señala que una asociación con el EI, “bloquea” el aprendi-
las variaciones en la fuerza del hábito (en el zaje de cualquier otro potencial EC en una fase
caso de las formulaciones de Hull y Spence) o de posterior en la que se presentan ambos estímulos
la probabilidad de la respuesta (en el caso de los juntos y seguidos por el EI. Las demostraciones
modelos estocásticos) son una función de la discre- básicas de bloqueo implican un experimento de
pancia entre un valor máximo o asintótico y el 3 fases. En la primera fase, un estímulo A (por
valor asociativo actual del EC. La siguiente ecua- ejemplo un tono), es presentado en conjunto con
ción general describe el operador lineal usando la el EI (por ejemplo un choque eléctrico), hasta
terminología de la red neuronal de la Figura 1: que desarrolla la habilidad para generar la res-
puesta condicionada. En la segunda fase, el
∆vi =θ(zλ-xivi) (1) estímulo A es presentado en conjunto con otro
estímulo, B (por ejemplo, una luz) y ambos son
Donde vi es la fuerza asociativa del ECi, λ la seguidos por el EI. En la tercera fase, se evalúa
fuerza asociativa máxima proporcionada por el la respuesta condicionada emitida por el animal
EI, y θ un parámetro que dicta la tasa de apren- en presencia de A y B separadamente. El resul-
dizaje. Este algoritmo de aprendizaje asume que tado es que el estímulo B desarrolla muy poca o
el aprendizaje es un proceso gradual de correc- ninguna capacidad para producir RC, es decir,
ción de errores. Es decir, en cada ensayo el es bloqueado por A.
animal aprende una fracción de lo que le queda
por aprender, reduciendo progresivamente el El bloqueo y otros fenómenos similares,
error hasta llegar a una asíntota. Este fenómeno tales como la validez relativa (Wagner, Logan,
se ha observado prácticamente en todas las Haberlandt & Price, 1968) y el ensombrecimien-
situaciones de aprendizaje y se describe como la to (Pavlov, 1927) fueron interpretados como
forma negativamente acelerada de la función evidencia de que el condicionamiento clásico es
que relaciona el nivel de respuesta (intensidad o “competitivo”, ya que los ECs parecen “compe-
frecuencia) con el número de ensayos. tir” por la asociación con el EI. Esto no puede
ser explicado por el operador lineal, el cual
Otro aspecto distintivo de la Ecuación 1 es que asume que la contigüidad entre el EC y el EI es
todos los ECs que se presenten simultáneamente el único requisito para el aprendizaje.
El modelo de Rescorla y Wagner (1972) cuánto es lo que tienen que aprender los “apren-
dices” o ECs. Cuando la suma total del aprendi-
Los hallazgos de competencia entre estímu- zaje de los ECs es igual al valor de la entrada
los motivaron la formulación de teorías compe- maestra, el error es cero y el aprendizaje se
titivas del aprendizaje. El principal objetivo de detiene.
estas teorías era describir cómo un animal asocia
un EC y con un EI, en función del grado en el que Para ver cómo opera el modelo, examinemos
el EC tiene un valor predictivo o informacional el fenómeno de bloqueo en el cual un grupo
acerca de la ocurrencia del EI. Uno de los experimental recibe una primera fase con la
primeros y más exitosos modelos competitivos contingencia A+ (EC A seguido por el EI) y una
fue propuesto por Rescorla y Wagner (1972), segunda fase con AB+ (estímulos A y B presen-
quienes sostenían que los organismos aprenden tados en conjunto y seguidos por el EI). Según
que un evento predice o es “causa” de una el modelo, en la fase 1 el estímulo A aumenta
consecuencia dependiendo de cuán predecible progresivamente su fuerza asociativa hasta que
es dicha consecuencia por otros eventos. For- alcanza la asíntota (es decir, vA =λ). En la segun-
malmente, el modelo señala que el cambio en la da fase, cuando los dos estímulos se presentan
fuerza de la asociación entre un ECi y el EI está juntos, el valor de Σxivi =λ (gracias a la contribu-
dado por: ción de A) con lo cual el error es cero y no se
produce aprendizaje. Esto significa que al termi-
∆vi= αβ(zλ-Σxivi) (2) nar la segunda fase, tanto A como B permanecen
con su valor asociativo inicial (VA =λ y VB =0).
donde ∆vi es el cambio en la fuerza asociativa Es decir, B ha sido bloqueado por A.
del estímulo i en el ensayo, α y β representan la
intensidad del EC y el EI, respectivamente, λ es El modelo de Rescorla y Wagner es la teoría
el valor máximo o asintótico de aprendizaje y más influyente y exitosa en el ámbito del apren-
Σxivi es la suma de la fuerzas asociativas de dizaje asociativo. Da cuenta de todos los fenó-
todos los ECs que están presentes en el ensayo. menos de aprendizaje asociativo simple,
incluyendo los efectos de competición de estí-
La aplicación del modelo presentado en la mulos y anticipa los resultados de otros estudios
Figura 1 a la teoría de Rescorla y Wagner, que fueron diseñados para desafiarlo. Natural-
implica asumir que el aprendizaje se produce mente, el modelo tiene varias limitaciones, las
cuando la unidad adaptativa, que en un comien- cuales han estimulado la investigación en esta
zo sólo era activada por el estímulo incondicio- área durante más de 3 décadas. Más aún, la
nado con valor de lambda igual a 1, comienza historia de las teorías matemáticas del aprendi-
progresivamente a aumentar su probabilidad de zaje después de 1972 puede ser descrita, en gran
activación por el estímulo condicionado debido medida, como los intentos de los científicos para
a que la conexión entre ambos, vi, crece a solucionar las fallas de este modelo. Las siguien-
medida que se repiten las presentaciones con- tes secciones describen dos categorías de mode-
juntas del EC y el EI. El monto en que cambiará los que fueron formulados con estos fines.
el valor de vi depende de la diferencia entre el
valor total de todas las conexiones activas y el El modelo atencional de Mackintosh (1975)
valor del estímulo incondicionado, es decir, zλ-
xΣv. El modelo de Rescorla y Wagner sostiene
que los fenómenos de competición de estímulos,
Descrito de esta manera, el modelo de tales como el bloqueo, se deben a una disminu-
Rescorla y Wagner puede ser considerado un ción en las propiedades reforzantes del EI. Esto
caso especial de aprendizaje supervisado, en el significa que un EI completamente predicho por
cual el EI es la “entrada maestra” que dicta los ECs pierde todo su poder reforzador. Una
explicación alternativa, conocida como “enfo- fase (es decir, los estímulos llamados
que atencional”, sugiere que el fracaso asociati- “contextuales”). Luego, cuando el EC se presen-
vo que se da en la competición de estímulos no ta pareado con el EI, su valor de alfa es inferior
ocurre porque el EI pierde efectividad, sino a lo normal y, por lo tanto su aprendizaje es más
porque el animal “ignora” un EC que se presenta lento.
en conjunto con otro EC que tiene mayor rele-
vancia, debido a que éste último fue asociado Otro rasgo interesante del modelo de
previamente con el EI. Mackintosh es cómo concibe la relación entre el
aprendizaje excitatorio y el inhibitorio. El mode-
El ímpetu por la formulación de modelos lo asume que la presentación de un EI inespera-
atencionales proviene de una serie de fenóme- do produce un aumento en la fuerza asociativa
nos en los cuales el EC pierde su capacidad para excitatoria hacia una asíntota (por ejemplo, +1),
asociarse con el EI sin que haya mediado algún mientras que la omisión de un EI esperado
cambio en la predictibilidad del EI. El más resulta en el incremento de la fuerza asociativa
conocido de estos fenómenos es la inhibición inhibitoria hacia una asíntota de valor contrario
latente, en la cual la preexposición de un estímu- (por ejemplo, -1). La fuerza asociativa neta de un
lo por sí solo, resulta en una disminución de su EC es una función de la suma de sus tendencias
capacidad posterior para asociarse con el EI excitatorias e inhibitorias. Esta concepción de la
(Lubow, 1973). El modelo de Rescorla y Wagner inhibición, soslaya uno de los problemas más
no puede dar cuenta de este fenómeno porque graves del modelo de Rescorla y Wagner, el cual
predice que en la fase de preexposición, cuando es la predicción incorrecta de que las presenta-
no está presente el EI, ningún tipo de aprendizaje ciones no reforzadas de un estímulo inhibitorio
debería ocurrir. deberían llevarlo a perder su valor inhibitorio (es
decir, su valor negativo se extingue hasta llegar
Mackintosh (1975) formuló el primer y más a 0). Esto ocurre porque, según el modelo de
influyente modelo atencional de condicionamiento Rescorla y Wagner, la ausencia del EI causa que
clásico. Según este modelo, cuando hay un con- tanto inhibidores como excitadores se extingan
junto de potenciales estímulos condicionados, la hacia una asíntota de 0. Por su parte, el modelo
saliencia (alfa) de un estímulo en particular va a de Mackintosh predice que no debería producir-
aumentar si este estímulo es un mejor predictor se tal extinción de la inhibición, ya que en
del EI que todos los otros estímulos juntos, y va a ausencia del EI, la asíntota es –1. La no existen-
disminuir si este estímulo es un peor predictor del cia de extinción de la inhibición ha sido confir-
EI que todos los demás juntos. Según este mode- mada experimentalmente por Zimmer-Hart y
lo, aunque el procesamiento del EI tiene un rol en Rescorla (1974).
el aprendizaje, su función se limita solamente a
determinar cuál es la asíntota que cada estímulo El modelo mixto de Pearce y Hall (1980)
puede alcanzar. Los fenómenos de competición
de estímulos se explican completamente en fun- Pearce y Hall (1980) creían que un mecanis-
ción de una competencia entre los ECs por tener mo atencional era necesario para explicar los
acceso a un nivel de procesamiento que les permi- fenómenos de preexposición. Sin embargo, no
ta aprovechar el reforzamiento disponible. estaban satisfechos con la idea de Mackintosh de
que la preexposición no reforzada del EC era la
El modelo de Mackintosh (1975) explica la única manera de obtener inhibición latente. Por
inhibición latente asumiendo que durante la ejemplo, Hall y Pearce (1979) encontraron que
preexposición no reforzada de un EC, éste dis- era posible retardar la asociación entre un EC y
minuye su valor de alfa debido a que no es un un EI, si el EC se presenta previamente pareado
mejor predictor del EI que todos los otros estí- con el mismo EI pero de menor intensidad. El
mulos que se encuentran presentes durante esta modelo de Mackintosh (1975) no puede expli-
car este hallazgo, ya que predice que durante la postura elementalista ha sido cuestionada por
primera fase el EC debería ganar más que perder John Pearce (1994, 2002), quien propuso un
asociabilidad, debido a que éste es el mejor modelo que asume que las configuraciones son
predictor del EI del momento, aunque sea de las unidades funcionales básicas en una situa-
menor intensidad. ción de condicionamiento. Según este enfoque,
cada estímulo compuesto es una configuración
Frente a este dilema, Pearce y Hall (1980) única que desarrolla una asociación unitaria con
propusieron que la asociabilidad de un determi- el EI. Sin embargo, además de la fuerza asociativa
nado ECi (i) disminuye a medida que éste se que adquiere directamente la configuración, Ei,
transforma en un buen predictor del EI y aumenta se asume la existencia de otra fuerza asociativa,
cuando no se presenta un EI que se esperaba. Se ei, que la configuración obtiene indirectamente
asume entonces que los animales tienen una gracias a la generalización desde otras configu-
capacidad limitada para procesar simultáneamente raciones que contienen algunos de sus compo-
varios estímulos y que solamente aquellos estí- nentes. Por ejemplo, se asume que un estímulo
mulos que anteceden a eventos “inesperados” compuesto AB tendrá un fuerza asociativa total
ganan acceso al procesador. Usando la red VAB equivalente a la suma de EAB+ jeAB+….+neAB,
neuronal de la Figura 1, la idea de Pearce y Hall donde los últimos sumandos representan las
puede describirse señalando que la asociabilidad fuerzas asociativas que se generalizan a la con-
del ECi es proporcional al valor absoluto de la figuración AB, provenientes de las configura-
discrepancia entre la activación de la unidad ciones j,…,n, que incluyen a los estímulos A o B.
adaptativa generada por el EI y la activación de El valor de jeAB está dado por la fuerza asociativa
dicha unidad generada por todos los estímulos de la configuración J, ponderada por la semejan-
condicionados. Es decir, el error de predicción se za que ésta tiene con AB. La semejanza entre dos
usa para ajustar los valores de α. configuraciones, Sij, está a su vez dada por la
cantidad de elementos que comparten. En resu-
Otra innovación con respecto al modelo de men vi = Ei + ΣSijei.
Rescorla y Wagner, es que Pearce y Hall (1980),
sugirieron que el aprendizaje excitatorio y el Más allá de estas diferencias en la forma en
inhibitorio ocurren separadamente, ocupan dis- que el modelo de Pearce concibe la representa-
tintas reglas y nunca se extinguen. En rigor, la ción de los estímulos, éste utiliza la misma regla
red neuronal de la Figura 1 debería modificarse para calcular el cambio asociativo en los ensa-
de tal forma que cada EC tenga 2 tipos de yos de entrenamiento que el modelo de Rescorla
conexiones con la unidad adaptativa: excitatorias y Wagner. Específicamente, el modelo de Pearce
e inhibitorias. La fuerza asociativa neta que (1987, 1994) sostiene que el cambio en la fuerza
adquiere un determinado EC, se obtiene sustra- asociativa directamente condicionada a la confi-
yendo la fuerza asociativa inhibitoria de la fuer- guración AB, está dada por β[λ - (EAB + jeAB +….+
za asociativa excitatoria. e )].
n AB
El modelo configuracional de Pearce Aunque las posturas elementalista y

(1987, 2002) configuracional se han descrito como posturas
contrapuestas, es importante apreciar que ambas
Los modelos propuestos por Rescorla y reconocen tanto procesos configuracionales
Wagner (1972), Mackintosh (1975) y Pearce y como elementalistas. Brandon, Vogel y Wagner
Hall (1980) son modelos elementísticos (o ele- (2000) enfatizaron que la principal diferencia
mentales). Esto significa que la representación entre estos dos enfoques se puede apreciar en la
de un conjunto de estímulos que se presentan operación que el modelo realiza cuando se for-
juntos es equivalente a la suma de las represen- ma un compuesto con estímulos que se habían
taciones de cada estímulo por separado. Esta presentado por separado (o composición de
estímulos). La visión elementalista siempre que ambos tipos de enfoques son parcialmente
asume una sumatoria de la fuerza asociativa de correctos, que la codificación de estímulos
los componentes al formar un compuesto, mien- involucra tanto aspectos configuracionales como
tras que el modelo configuracional siempre asu- elementalistas y que el predominio de una u otra
me una sustracción de la fuerza asociativa de estrategia de codificación depende de ciertas
cada elemento cuando éstos se presentan juntos. variables relacionadas con los estímulos, la tarea
y los individuos. Consecuentemente, los inves-
Se han realizado numerosos experimentos tigadores se han interesado por determinar las
acerca de la composición de estímulos. Por condiciones precisas que determinan uno u otro
ejemplo, el enfoque elementalista predice tipo de procesamiento y han comenzado a
sumatoria de la respuesta a dos estímulos entre- desarrollar modelos flexibles que permitan esta
nados separadamente y probados en compuesto alternancia de procesamiento (Wagner, 2003).
(entrenamiento con A+ y B+ y prueba con AB),
mientras que el enfoque configuracional predice SEGUNDA GENERACIÓN: MODELOS
un fenómeno de “promediación”. La predicción BÁSICOS DE TIEMPO REAL
del modelo elementalista radica en su carácter
aditivo, donde cada elemento aporta la totalidad Los modelos de ensayo discreto de la sec-
de su fuerza asociativa al formar un compuesto ción anterior describen los cambios asociativos
con otro estímulo. Por el contrario, según el que ocurren entre los ensayos pero no al interior
modelo configuracional sustractivo, cada estí- de éstos. Es decir, el ensayo es considerado
mulo aporta sólo la mitad de su fuerza asociativa como un todo asociativo discreto, en el cual el
al formar el compuesto, ya que cada uno de ellos aprendizaje ocurre o no ocurre. Con esta estra-
se parece sólo en un 50% al estímulo AB. tegia, los investigadores han podido dar cuenta
de la mayoría de los fenómenos de adquisición,
Con respecto a la sumatoria, la literatura en extinción, discriminación, generalización y com-
condicionamiento clásico muestra resultados petición de estímulos.
contradictorios. Por ejemplo, numerosos estu-
dios realizados con ratas y conejos, los cuales Sin embargo, existe un cúmulo de evidencia
generalmente utilizan estímulos condicionados que indica que el aprendizaje depende de la
de distintas modalidades sensoriales (auditiva, relación temporal entre el EC y el EI. Por ejem-
visual y táctil), han encontrado evidencia de plo, se ha encontrado que a mayor intervalo de
sumatoria, lo cual apoya la perspectiva tiempo entre la iniciación del EC y la iniciación
elementística (Rescorla, 1997). Por el contrario, del EI, mayor es la latencia de iniciación y pico
se ha observado ausencia de sumatoria en estu- de la respuesta condicionada (Gallistel & Gibbon,
dios que utilizan el procedimiento de 2000). También se ha visto que el intervalo entre
automoldeamiento en palomas y estímulos vi- estímulos determina la rapidez y asíntota con la
suales (Aydin & Pearce, 1995). Además de estos que se adquiere la respuesta condicionada, en lo
experimentos con sumatoria simple, se han rea- que se ha denominado “función del intervalo
lizado algunas pruebas más complejas de los entre estímulos”. Esta función tiene una forma
principios aditivo y sustractivo que distinguen a de U invertida, es decir existe un intervalo de
ambos enfoques, encontrándose el mismo nivel duración intermedia, que es óptimo para el apren-
de ambigüedad en los resultados. A pesar de dizaje (Smith, Coleman & Gormezano, 1969).
ciertos esfuerzos por explicar estas discrepan-
cias (Myers, et al., 2001; Pearce, 2002), este El descubrimiento de estos “fenómenos tem-
tema está aún sin solución. porales” condujo a la evolución hacia un nuevo
tipo de modelos, los modelos de tiempo real, los
La idea predominante en la actualidad es que cuales describen el proceso asociativo momento
la controversia puede ser resuelta asumiendo a momento, en lugar de ensayo tras ensayo,
como lo hacían sus predecesores. El rasgo tiempo, Wagner (1981) presentó su versión en
medular de esta categoría de modelos, es la tiempo real del modelo de Rescorla y Wagner, y
noción de “trazo” o “huella”, la cual se refiere a Schmajuk y Moore (1985) hicieron lo mismo
cómo cambia la representación interna del estí- con el modelo de Pearce y Hall (1980). En esa
mulo a través del tiempo. Por ejemplo, Hull misma década, Sutton y Barto (1981) inventaron
(1943) avanzó que la representación del estímu- una regla de aprendizaje completamente nueva,
lo condicionado no es la misma a lo largo de toda la regla de la derivada del tiempo.
su duración y que el aprendizaje será óptimo
cuando la presentación del EI coincida con el Por supuesto, no todos estos modelos tuvie-
momento en el cual la representación del EC es ron el mismo éxito. Esta sección describirá tres
máxima. Con este simple supuesto, es posible modelos representativos de esta segunda gene-
dar cuenta de los fenómenos temporales más ración de modelos de condicionamiento clásico,
básicos, tales como el hecho de que el nivel de que hemos denominado “modelos básicos de
aprendizaje óptimo es para intervalos de dura- tiempo real”. Usamos el término “básico” por-
ción intermedia. que estos modelos tienen el diseño estructural
más elemental que se requiere para transformar
La mayoría de los modelos de tiempo real un modelo de ensayo discreto en un modelo de
pueden ser descritos a partir de la red neuronal tiempo real, agregando una representación tem-
de la Figura 1. La única modificación que tiene poralmente variable de los estímulos.
que hacerse con respecto a los modelos de
ensayo discreto es asumir que el nivel de activa- Una versión de tiempo real del modelo de
ción de cada unidad de procesamiento, xi (EC) y Rescorla y Wagner
zi (EI), es una función continua en lugar de
binaria. Dicho de otro modo, ya no se habla de Schmajuk (1997) propuso que inmediata-
estímulo presente (con valor de xi =1) y estímulo mente después de la presentación del EC, su
ausente (con valor xi =0) sino que se habla de representación interna, xi, aumenta en forma
niveles de activación (por ejemplo, 0 < xi < 1). El negativamente acelerada hasta llegar a un máxi-
patrón no lineal de activación de un estímulo mo, donde se estabiliza hasta comenzar a decaer
durante un ensayo es lo que se denomina huella una vez que el estímulo termina. Por simplici-
del estímulo. Nótese que la huella de un estímulo dad, Schmajuk asume que la representación del
es sinónimo de su representación interna, y por EI es binaria. El aprendizaje consiste en aplicar
lo tanto no necesariamente tiene que coincidir la regla de Rescorla y Wagner (1972) para
con la presentación física real de éste, es decir, la evaluar el cambio en la fuerza asociativa del EC
huella puede iniciarse en cualquier momento momento a momento de acuerdo a la intensidad
después de la presentación del estímulo y conti- de la representación interna del EC y a la presen-
nuar aún después de que éste ha cesado. cia o ausencia del EI. Estas nociones se formali-
zan de la siguiente manera:
En los últimos años la creación de modelos
de tiempo real ha experimentado un auge. Sin ∆vi= αiβj[z (t)λ(t)-Σxi(t)vi(t)]x i(t) (3)
duda, esta diversidad es reflejo de los diversos
orígenes teóricos de cada modelo. De hecho, Usando la nomenclatura de la Figura 1, la
cada uno de los modelos de ensayo discreto que Ecuación 3 plantea que el monto de aprendizaje
se describieron en la sección anterior inspiró la obtenido por el EC en cada instante de tiempo,
formulación de uno o varios modelos de tiempo depende de la discrepancia momentánea entre la
real. Por ejemplo, el primer modelo de tiempo activación de la unidad adaptativa por todos los
real, publicado por Moore y Stickney (1980) es ECs y la activación por el EI [z(t)λ(t)-Σxi(t)vi(t)], y
una extensión del modelo atencional de de la fuerza de la representación interna del EC
Mackintosh (1975). Más o menos al mismo en ese momento, [xi(t)]. La forma en que opera
este modelo se puede ilustrar con un ejemplo de coincide con el EI durante el máximo de su
adquisición con un EC y un EI, donde el EC está huella.
presente durante 10 momentos y el EI tiene una
aparición de un momento de duración durante el El modelo de la derivada del tiempo de Sutton
momento número 10. En el primer ensayo, no y Barto
hay aprendizaje desde el momento 1 al 9, ya que
la unidad adaptativa no es activada ni por el EC Sutton y Barto (1981) propusieron un mode-
ni por el EI (ya que z(t)λ(t)-Σxi(t)vi(t)=0). En el lo en el cual la unidad adaptativa no requiere de
momento 10, la unidad adaptativa es activada una entrada especial o supervisor para producir
por el EI proveyendo de reforzamiento para el cambios en la fuerza asociativa de los estímulos
EC, cuyo monto es proporcional a la activación condicionados. Concretamente, se asume que el
de la unidad adaptativa por el EI (z(t)λ(t)) y a la reforzamiento proviene tanto de los ECs como
fuerza de la huella del EC (xi(t)), es decir el EC del EI, y que su magnitud depende de la diferen-
desarrolla fuerza asociativa excitatoria. En el cia entre la activación de la unidad adaptativa en
segundo ensayo, las porciones iniciales del EC dos momentos de tiempo. De ahí la denomina-
activan la unidad adaptativa en proporción a la ción modelo de la derivada del tiempo, ya que el
fuerza de la huella en esos momentos (xi(t)) y a la reforzamiento es una función de la derivada de
fuerza asociativa excitatoria adquirida por el EC la activación de la unidad adaptativa en el
en el ensayo anterior (vi). Sin embargo, ya que momento t y el momento inmediatamente ante-
en esos momentos iniciales no hay activación de rior, t-1.
la unidad adaptativa por el EI, se produce apren-
dizaje inhibitorio (ya que z(t)λ(t) <Σxi(t)vi(t)), lo Una de las ventajas del modelo de la deriva-
que causa que el EC pierda parte de la fuerza da del tiempo es su capacidad para explicar un
asociativa que ganó durante el ensayo anterior. fenómeno conocido como “condicionamiento
Al llegar al momento 10 del segundo ensayo, el de segundo orden” (Rescorla, 1980a), en el cual
EC nuevamente gana fuerza asociativa. Este un ECi adquiere fuerza asociativa en virtud de su
proceso continua ensayo tras ensayo, resultando pareamiento con un EC j, el cual había sido
en que la fuerza asociativa neta adquirida en pareado previamente con el EI. Ya que según
cada uno va estar dada por la interacción entre este modelo los ECs también otorgan
excitación e inhibición que se adquiere momen- reforzamiento, la predicción del fenómeno es
to a momento. Naturalmente, mientras más largo obvia.
es el intervalo entre el EC y el EI, mayor oportu-
nidad para que las porciones tempranas del EC Para implementar el modelo, Sutton y Barto
desarrollen inhibición. (1981) asumen que la representación interna del
EC incluye 2 tipos de huellas. La primera,
A través de esta simple modificación del denominada “huella de estimulación”, xi(t), es
modelo de Rescorla y Wagner, es posible dar una función binaria que asume el valor de 1
cuenta de la forma de U invertida de la función cuando el estímulo está presente y 0 cuando no
del intervalo entre EC y EI. Específicamente, el lo está. Esta huella está a cargo de la generación
modelo predice que intervalos largos generan de la RC. La segunda huella, llamada “huella de
bajos niveles de aprendizaje excitatorio debido elegibilidad”, ei(t), sigue un patrón de activación
a la mayor cantidad de momentos en los cuales variable durante la presentación del estímulo y
se produce aprendizaje inhibitorio. Por otra par- controla el grado de adquisición de fuerza
te, intervalos cortos generan menos aprendizaje asociativa del estímulo en función del tiempo.
porque la huella del EC no ha alcanzado su
máximo en el momento de la presentación del Con respecto a la regla de aprendizaje, el
EI. Los intervalos de duración intermedia resul- modelo de la derivada del tiempo asume que
tan óptimos para el aprendizaje puesto que el EC habrá reforzamiento disponible para cambiar las
asociaciones del EC con la unidad adaptativa, ocurre porque, según la Ecuación 4, el EC desa-
siempre que haya una diferencia en la actividad rrolla fuerza asociativa negativa cada vez que la
de la unidad adaptativa en dos momentos del activación de la unidad adaptativa en un momen-
tiempo. Dicho de otro modo, el aprendizaje que to dado es menor que la activación en el momento
ocurre en cualquier momento está dado por la anterior. Esto significaría, por ejemplo, que si se
discrepancia entre la actividad actual de la uni- presentan el EC y EI simultáneamente, el EC no
dad adaptativa y su actividad en el momento debería desarrollar fuerza asociativa alguna ya
inmediatamente anterior. Así, el reforzamiento que la excitación del inicio del EI se cancelaría
es una función de la diferencia (derivada del con la inhibición de su término. Aunque hay
tiempo) entre la respuesta en el momento t, Y(t), evidencia de aprendizaje inhibitorio con el proce-
y la respuesta en el momento t-1, Y(t-l). Siguien- dimiento de condicionamiento retrospectivo
do la nomenclatura de la Figura 1, esta regla se (Siegel & Domjan, 1971), la mayoría de los
puede expresar del siguiente modo: estudios han mostrado que la presentación simul-
tánea del EC y el EI produce aprendizaje excitatorio
∆Vi= α[{Σxi(t)vi(t)+z(t)λ(t)}- (Rescorla, 1980b).
(4)
{Σx i(t-1)v i(t-1)+z (t-1) λ (t-1)]e i(t) El modelo SOP de Wagner
El modelo SOP intenta explicar varios fenó-

El modelo de la derivada del tiempo tiene menos que no fueron considerados por la mayo-
bastante éxito explicando una gran parte de los ría de los modelos descritos anteriormente, tales
fenómenos de ensayo discreto. Por ejemplo, como los fenómenos de primacía y las diferen-
explica el bloqueo (A+ /AB+), asumiendo que cias cualitativas que a menudo se observan entre
una vez que el estimulo A ha adquirido la la RC y la RI. La primacía se refiere a una
capacidad para activar a la unidad adaptativa en situación en la que los eventos que ocurren fuera
la primera fase, anulará el efecto reforzador del del ensayo afectan la formación de asociaciones
EI en la segunda fase. Esta cancelación del de los estímulos que ocurren dentro de los ensa-
reforzamiento afecta a B, puesto que A y B se yos (Wagner, Rudy & Whitlow, 1973). Por
presentan en el momento t-1 y el EI en el ejemplo, Donegan y Wagner (1987) demostra-
momento t, con lo cual no hay diferencia entre la ron que hay una reducción de la amplitud de la
activación en t-1 y en t. Con esto el estímulo B se respuesta incondicionada cuando el EI es prece-
queda sin reforzamiento y no desarrolla asocia- dido por un EC bien entrenado. Wagner (1981)
ción con el EI. conjeturó que la respuesta generada en el mo-
mento de la presentación del EI está determinada
Aunque el modelo fue desarrollado princi- por el grado de activación de su representación
palmente para dar cuenta de los fenómenos interna, y que un EC puede activar esa represen-
temporales, presenta una serie de problemas en tación justo antes de la ocurrencia de la respuesta
este dominio. Por ejemplo, ya que la huella de incondicionada, con lo cual “gasta” los recursos
elegibilidad sigue un curso temporal indepen- antes que aparezca el EI.
diente de la duración del estímulo condicionado,
el modelo predice que el nivel de aprendizaje no Una forma obvia en la que un EI “pre-
depende de la duración del EC, lo cual es contra- procesado” (es decir, cuya representación in-
dicho por la evidencia empírica que señala que, terna ya ha sido activada) puede afectar el nivel
después de alcanzar una duración óptima, a de la respuesta incondicionada, es el conocido
medida que aumenta el largo del EC, el aprendi- paradigma de habituación de corto plazo, el
zaje se empobrece. Otro problema de este mode- que se refiere a una disminución en la amplitud
lo es que predice el desarrollo de aprendizaje de respuesta al segundo de un par de estímulos
inhibitorio cada vez que se termina el EI. Esto incondicionados. Esto ocurre siempre y cuan-
do haya cercanía temporal entre los dos estímu- cos. El panel A de la Figura 2 contiene los
los (Whitlow, 1975). principales elementos de SOP de acuerdo a una
de sus últimas rendiciones (Brandon et al., 2002).
El modelo de Rescorla y Wagner (1972) fue Se asume que todos los estímulos (ECs y EIs)
la primera implementación cuantitativa de la están representados por un par de unidades de
noción de que un EI esperado es menos efectivo procesamiento, una unidad primaria, A1 y una
como reforzador. Sin embargo, este modelo no unidad secundaria, A2. Las unidades primarias
da cuenta de la sensibilidad temporal con la que y secundarias están compuestas por un número
estos fenómenos ocurren. Por otra parte, se ha grande pero finito de elementos, los cuales pue-
observado también que la “predictibilidad” no den estar activos o inactivos. La presentación de
sólo afecta el pre-procesamiento del EI, si no un estímulo causa la activación de una propor-
también al pre-procesamiento del EC, como ción de sus elementos en la unidad A1 (de
puede darse en el caso de la inhibición latente, lo acuerdo al parámetro p1), a lo cual sigue la
cual también está fuera del alcance del modelo activación de una proporción de elementos de la
de Rescorla y Wagner. En rigor, puede decirse unidad secundaria, A2 (de acuerdo al parámetro
que SOP fue diseñado para proveer una versión pd1). A su vez, los elementos de A2 que se
computacional de la noción de “primacía”. activan ejercen un efecto inhibitorio sobre los
elementos de A1 que se encuentran inactivos, es
Después de su formulación original (Wagner, decir, estos no pueden ser activados. Eventual-
1981), el modelo SOP se ha descrito de varias mente, los elementos de A2 decaen (según el
maneras, cada una reflejando distintas posibili- parámetro pd2) y liberan a los elementos de A1
dades de implementación de sus supuestos bási- de su estado refractario.
Respuesta Respuesta
(A) secundaria primaria
Pd1EI
A2EI A1EI

v1 v2
Pd11 Pd1
A21 A11 A22 A12

P11 P12
EC1 EC2 EI
continúa
(B) Respuesta
l
Y
V111
V112
V121 V123
V113 V122
X111 X112 X113 X121 X122 X123 Z
EC1 EI
Figura 2. Representación de dos modelos de tiempo real en el lenguaje de las redes neuronales.
Los círculos representan unidades de procesamiento y las líneas continuas y discontinuas
representan conexiones inmodificables y modificables, respectivamente. El Panel A describe la
arquitectura del modelo SOP para dos ECs, el cual asume que los estímulos activan sus respecti-
vas unidades primarias de acuerdo a los valores p1i y éstas activan a las unidades secundarias de
acuerdo a los valores pd1i. Las unidades secundarias inhiben a las primarias a través de
inhibición recurrente (-). La unidad primaria del EI es responsable de la generación de la RI
primaria, mientras la unidad secundaria genera tanto la RI secundaria como la RC provocada por
los ECs a través de sus conexiones vi. El Panel B describe la arquitectura del modelo TD para un
estímulo condicionado, representado por una línea de demora con tres unidades asociadas con su
encendido (x111, x112 y x113) y tres unidades asociadas con su apagado (x121, x122 y x123). Cada
unidad, xijk, se conecta a la unidad adaptativa por medio de conexiones asociativas, vijk.
Según esta concepción, el curso temporal de mulo. Estas huellas cumplen un rol específico en
la activación de cada estímulo es representado el proceso asociativo y en la generación de la
por 2 tipos de huellas: la huella de la actividad de respuesta. En breve, SOP asume que la respuesta
la unidad primaria y la huella de la unidad incondicionada es bifásica, donde su primer
secundaria. El valor instantáneo de cada huella componente es una función del nivel de activi-
está dado por la proporción de elementos que dad A1 y el segundo de A2. Adicionalmente, se
están activos en ese momento. Las formas de las asume que el condicionamiento dota al EC de la
huellas describen un período de reclutamiento capacidad para activar directamente los elemen-
de elementos, un pico, una estabilización y un tos del estado A2 del EI, sin pasar por A1. Esta
decaimiento después de la terminación del estí- noción es consistente con numerosas observa-
ciones, donde la respuesta condicionada no es fortalecimiento de las conexiones excitatorias

una réplica de la RI, sino que más bien se entre el EC y el EI.
asemeja a su parte final, la cual muchas veces es
opuesta a la parte inicial. Este fenómeno es Según SOP, la asociación entre el EC y el EI
particularmente notorio cuando se usan EIs no sólo afecta la probabilidad y tipo de respues-
farmacológicos ante los cuales los animales ta, sino que también afecta el procesamiento del
muestran patrones de respuesta complejos. Ya estímulo incondicionado. Esta propiedad es la
que no siempre la RI es opuesta a la RC, Wagner que permite a SOP dar cuenta de los fenómenos
(1981) ideó el acrónimo “SOP”, que significa de primacía. Por ejemplo, es posible explicar el
“procesos algunas veces oponentes” (sometimes fenómeno llamado “disminución condicionada
opponent processes). de la RI” (Donegan, 1981; Marcos, 1997; Mar-
cos & Redondo, 2002), el cual se trata de una
En términos de la conectividad mostrada en reducción en la amplitud de la RI cuando el EI es
el panel A de la Figura 2 y siendo consistentes precedido por un EC con fuerza asociativa,
con la terminología usada para otros modelos, asumiendo que el EC causa que cierta propor-
puede decirse que la unidad secundaria del EI, ción de elementos del EI se movilicen al estado
A2EI equivale a la unidad adaptativa de la Figura secundario de actividad e inhiban a sus respec-
1. Si bien existe otra unidad que también produ- tivos elementos primarios, los cuales, entonces,
ce una respuesta (la unidad A1EI), ésta no está no se activarán cuando se presenta el EI.
disponible para plasticidad. El EC desarrolla su
capacidad para provocar respuesta por interme- SOP logra mantener el valor explicativo de
dio de la fuerza de su asociación con la unidad su predecesor, el modelo de Rescorla y Wagner
secundaria del EI. En suma, la RC es una función (1972), resolviendo además varias de sus princi-
del grado de actividad primaria del EC, A1EC y de pales falencias. Por ejemplo, SOP no cae en la
la fuerza de la conexión entre esta unidad y A2EI. predicción incorrecta de extinción de la inhibi-
ción condicionada, ya que asume que las pre-
Según SOP el aprendizaje excitatorio e inhi- sentaciones no reforzadas de un EC inhibitorio
bitorio se desarrollan por separado. Se asume no tienen efectos en la actividad de las unidades
que en todo momento el cambio en las conexio- representacionales del EI, y por lo tanto, no
nes excitatorias, ∆vi+, es proporcional al pro- puede ocurrir ningún tipo de aprendizaje.
ducto entre el número de elementos primarios
del EC y del EI que están activos en ese momen- TERCERA GENERACIÓN: MODELOS
to. Análogamente, el aprendizaje inhibitorio, COMPLEJOS
∆vi -, es proporcional al producto del número de
elementos primarios del EC y el número de Todos los modelos que hemos llamado de
elementos secundarios del EI que se encuentran primera y segunda generación se basan en los
activos en un momento dado. En resumen, el supuestos más simples que se requieren para
aprendizaje excitatorio depende del procesa- explicar los fenómenos básicos de aprendizaje.
miento simultáneo de las unidades A1EC y A1EI, Por ejemplo, como se aprecia en la Figura 1, la
y el aprendizaje inhibitorio de A1EC y A2EI. El red neuronal incluye sólo dos capas, una capa
curso temporal de las huellas primarias y secun- sensorial o de entrada y una capa motora o de
darias es fundamental para las predicciones del salida. Además, cada estímulo es representado
modelo. Por lo general se asume que en los por una única unidad de procesamiento que
ensayos típicos de adquisición, en el cual el EC actúa como un todo influyendo a la unidad
precede al EI, la actividad primaria del EC (A1EC) adaptativa. Esta arquitectura ha sido seriamente
coincide principalmente con la actividad prima- criticada, tanto por su poca plausibilidad bioló-
ria del EI (A1EI) y muy poco con la actividad gica como por su fracaso en explicar ciertos
secundaria de éste (A2EI), lo que da lugar al fenómenos conductuales que se han ido descu-
briendo con el correr de los años. Los modelos el entrenamiento desde un principio con dos
que se describen en esta sección representan intervalos entre EC y EI, digamos algunos ensa-
distintas estrategias que se han implementado yos con uno corto y otros ensayos con uno largo,
para hacer modelos más sofisticados y explica- el resultado es que la RC desarrolla dos picos,
tivos. uno en la localización del EI para el intervalo
corto y otro para su ubicación en el intervalo
Modelos componenciales largo. Es decir, el animal aprende dos respuestas
topográficamente distintas y apropiadas para
Se ha descubierto que a medida que progresa cada intervalo (Millenson, Kehoe & Gormezano,
el aprendizaje, no sólo se producen cambios en 1977). La noción de huella molar incorrecta-
la frecuencia y amplitud de la respuesta condi- mente predice una respuesta con una localiza-
cionada, sino que también se modifican sus ción intermedia, entre los dos intervalos, ya que
características temporales, tales como el tiempo según esta noción la ubicación temporal de la
que demora en iniciarse y en alcanzar el máxi- respuesta es una función de la fuerza asociativa
mo. Ya que la mayoría de las medidas de la RC neta que se obtiene como producto de los dos
están correlacionadas, éstas pueden considerar- tipos de ensayos de aprendizaje.
se como diferentes manifestaciones del
constructo “fuerza de la asociación entre el EC y Estas dificultades se han resuelto creando
el EI”. Esta noción de huella molar, presente en una representación más compleja del EC, cono-
los modelos de la sección anterior, sostiene que cida como representación molecular o
una repuesta débilmente aprendida tendrá me- componencial. Esta noción asume que la huella
nos frecuencia, menor amplitud y demorará más del estímulo se forma a partir de la actividad de
en iniciarse y en alcanzar su máximo que una un gran número de componentes o elementos,
respuesta bien aprendida. los cuales se activan en distintos momentos a lo
largo de la duración del estímulo y tienen sus
Existen ciertas situaciones experimentales propias conexiones con el EI. Es decir, la con-
en las cuales se ha demostrado que ciertas carac- cepción molecular asume que cada elemento
terísticas temporales de la RC no se correlacionan. por separado y no el EC como un todo, son
Por ejemplo, se ha observado que si se comienza quienes establecen la asociación con el EI. Por
el entrenamiento con un determinado intervalo y ello, la forma de la RC está dada por la fuerza
luego se modifica a otro más largo o más corto, asociativa de los elementos que se encuentran
se produce también un cambio en la latencia de activos en cada momento de la duración del EC.
iniciación y pico de la RC hacia valores más De este modo, se espera que los elementos que
largos o cortos, según sea la dirección del cam- se encuentran activos al momento de la presen-
bio (Coleman & Gormezano, 1971). Nótese que tación del EI obtengan el máximo de fuerza
el cambio en la temporalidad de la RC no se da asociativa, lo cual explica que el pico de la RC
como un desplazamiento gradual de la respuesta sea aproximadamente en la localización tempo-
hacia su nueva ubicación, sino más bien consiste ral donde se espera el EI. Del mismo modo, si un
en la desaparición de la respuesta en su ubica- animal está entrenado con 2 intervalos entre
ción original y su aparición en la ubicación estímulos, se esperaría que dos constelaciones
nueva. La noción de la huella molar predice de elementos, una en cada localización, desarro-
incorrectamente que el cambio debería ser gra- llen la fuerza asociativa que corresponde a cada
dual ya que reflejaría simplemente la ganancia o intervalo.
la pérdida de fuerza asociativa producto del
cambio en el intervalo de tiempo. Otra ventaja de la representación componencial
es su plausibilidad biológica. Más aún, se ha
Otra observación que resulta problemática comenzado a acumular evidencia de que las
para la noción de huella molar es que si se realiza principales características temporales del
condicionamiento podrían emerger de la activi- puesto por Sutton y Barto (1990). Este modelo es
dad de constelaciones de neuronas que se activan una variación del modelo de la derivada temporal
a partir de un sólo EC y que exhiben plasticidad que busca resolver algunos de los problemas de
a nivel de sus sinapsis. Por ejemplo, el modelo del este último.
condicionamiento de parpadeo en conejos pro-
puesto por Medina y col. (2000) asume que las Específicamente, TD asume que el EC está
características temporales de la RC dependen del representado por una “línea de demora”, en la
patrón de activación de millares de células Golgi cual la presentación del EC desencadena una
y su influencia en la generación de la respuesta a cascada de activación de elementos los cuales
través de las sinapsis con las células Purkinje y su están ordenados secuencialmente en una “línea
efecto regulador sobre el núcleo interpósito del de demora”. Cada elemento, además de pasar la
cerebelo. activación al elemento siguiente de la línea, está
conectado con la unidad adaptativa. Por último,
Se han propuesto varias estrategias para cons- se asume que la presentación y terminación de un
truir representaciones componenciales del EC. estímulo dan lugar a cascadas de activación inde-
Por ejemplo, Desmond y Moore (1988) propusie- pendientes: los elementos de encendido y los
ron un tipo de representación llamada “línea de elementos de apagado. El panel B de la Figura 2
demora” en la cual el comienzo del EC genera una muestra un ejemplo del modelo TD para un EC
activación secuencial de elementos a lo largo del con sus líneas de demora para el encendido y el
tiempo. Grossberg y Schmajuk (1989) sugirieron apagado del estímulo. La actividad de cada ele-
que el EC genera una población de señales con mento se denota como xijk, para indicar (1) el EC
forma de campana, las cuales varían en una serie que la activa (subíndice “i”), (2) si el elemento es
de parámetros generando señales “lentas” y “rá- activado por el inicio o por el término del estímulo
pidas”. Vogel y col. (2003), propusieron una (subíndice “j”), y (3) su orden en la secuencia de
representación dual del EC, en la cual algunos activación (subíndice “k”). Los elementos pue-
elementos tienen patrones de actividad localiza- den estar activos (xijk=1) o inactivos (xijk=O). Por
dos en el tiempo mientras que otros no codifican último, se asume que cada elemento está repre-
información temporal sino que se activan al azar sentado por una huella de estimulación (que
en cualquier momento durante al presentación controla la generación de la respuesta) y una
del estímulo. Por último, McLaren y Mackintosh huella de elegibilidad (que controla el nivel de
(2000) propusieron un modelo que asume que aprendizaje). La huella de estimulación es el valor
cualquier estímulo (condicionado o incondicio- binario de activación xijk=1, mientras que la hue-
nado) está representado por un conjunto elemen- lla de elegibilidad sigue una función exponencial
tos que se encuentran recíprocamente conectados similar a la descrita para el modelo de la derivada
por lazos asociativos que se fortalecen cada vez del tiempo.
que se activan simultáneamente. Los elementos
pueden ser activados “externamente” por lo estí- En cuanto a la regla de aprendizaje, el modelo
mulos que representan o bien internamente a TD difiere del modelo de la derivada del tiempo
través de su asociación con otros elementos, que al considerar separadamente la contribución del
a su vez son activados externamente por otros EC y el EI al reforzamiento. Formalmente, el
estímulos. modelo TD enuncia que el cambio en la fuerza
asociativa de cada elemento en la línea de demo-
Además de los modelos mencionados en el ra, vijk, está dado por la siguiente ecuación:
párrafo anterior, se han propuesto otros tantos
modelos componenciales. Con el fin de ilustrar la Av¡jk= αβ(z(t)λ(t)+γΣxijk(t)vi(t)- Σxijk(t-1)vijk(t-1)] (5)
forma en que opera esta estrategia, hemos elegido
describir con cierto detalle uno de estos modelos: Donde, γ es llamado “parámetro de descuen-
el modelo de la diferencia temporal (TD) pro- to” el cual permite que un EC con cierta fuerza
asociativa genere reforzamiento en todos los suma de sus componentes. En efecto, si el animal
momentos en los que está presente y no sólo al “sumara” las fuerzas asociativas de A y B cuando
comienzo. Al comparar la ecuación 5 (TD) con la se presentan juntos, éste debería responder más al
ecuación 4 (derivada del tiempo) se pueden apre- compuesto que a los componentes.
ciar dos grandes diferencias. La primera se refiere
a que mientras que en el modelo de la derivada Las dos primeras generaciones de modelos
temporal el EI, a través zλ, contribuye al término descritas en este artículo resolvieron este proble-
de reforzamiento tanto en el momento t como en ma agregando un elemento adicional en la capa
el momento t-1, en el modelo TD el valor de zλ se sensorial, llamado “elemento configuracional”
aplica solamente en el momento t. Esto significa (Pearce 1987; Wagner & Rescorla, 1972), el cual
que en el modelo TD es la presencia del EI más representa la conjunción de dos o más estímulos
que los cambios en su presencia aquello que y establece asociaciones con la unidad adaptativa
determina el reforzamiento, lo cual es esencial- como cualquier otro elemento sensorial. Natural-
mente lo mismo que plantea el modelo de Rescorla mente, se requieren tantos elementos configura-
y Wagner. cionales como combinaciones posibles de
elementos, lo cual ha sido considerado
La segunda diferencia se refiere a la contribu- antieconómico por sus detractores (Schmajuk,
ción de los ECs al cómputo del reforzamiento. 1997). Una alternativa a este enfoque es asumir
Como se ve en la ecuación 5, la contribución de los que las configuraciones no son preexistentes ni
ECs en el momento t es ponderada o “descontada” pertenecen a la capa sensorial, sino que se forman
por el parámetro γ, lo que permite que los ECs para resolver un determinado problema y residen
contribuyan al reforzamiento incluso cuando el en una capa intermedia, llamada “capa de las
valor agregado de sus fuerzas asociativas no cam- unidades ocultas”.
bie entre los momentos t y t-1. Con estas dos
diferencias, es posible concluir que el modelo TD En el ámbito del condicionamiento Pavloviano
está a mitad de camino entre el modelo de la se han propuesto varios modelos con unidades
derivada del tiempo y el modelo de Rescorla y ocultas, los cuales difieren principalmente en el
Wagner. Con esta estructura, TD da cuenta de la número de capas y el patrón de interconexiones.
gran mayoría de los fenómenos temporales, exclu- El panel A de la Figura 3 muestra un ejemplo
yendo solamente los fenómenos de primacía en los prototípico de este tipo de redes neuronales, basa-
cuales ha mostrado su fortaleza el modelo SOP. do en una de las propuestas más exitosas, el
modelo SD de Schmajuk y DiCarlo (1992). La
Modelos con unidades escondidas primera capa, llamada “capa sensorial” contiene
unidades que se activan directamente por los
Una de las principales motivaciones para cons- estímulos externos (condicionados e incondi-
truir modelos con unidades escondidas fue el cionados). La segunda capa contiene las unida-
descubrimiento de un fenómeno conocido como des ocultas, la cuales se activan exclusivamente
“patrón negativo”, el cual se refiere a una situa- por las unidades sensoriales, es decir, no reciben
ción experimental en la que dos ECs se parean influencia directa del mundo exterior. En la figu-
con el EI cada vez que se presentan por separado ra, cada unidad oculta tiene conexiones disponi-
(A+/B+) pero no cuando se presentan en conjunto bles con todas las unidades sensoriales, lo que le
(AB-). El resultado es que la repuesta a cualquiera otorga la posibilidad de representar cualquier
de los dos estímulos, A o B, es mayor que la configuración posible. Por último, la tercera capa,
respuesta al compuesto AB. Este fenómeno, tam- denominada “capa de salida”, contiene la unidad
bién conocido como “problema del ó exclusivo”, adaptativa, la cual tiene conexiones con todas las
sugiere que la representación interna de un estí- unidades de las dos capas anteriores y es la
mulo compuesto debería ser diferente de la mera encargada de generar la respuesta.
(A) Respuesta
l
CAPA DE
UNIDADES DE Y
SALIDA
VS3
VS1 VH2
CAPA DE VH1 VS2
UNIDADES
OCULTAS
W1 W2
C 11 C 32
C 12 C 31
C 21
C 22
CAPA DE
X1 X3 Z
UNIDADES X2
SENSORIALES
EC 1 EC2 EC3 EI
Respuesta
(B)
CAPA DE Y l
UNIDADES DE
SALIDA
VH 1 VH 3
VH2
1 1 1
VB 1 VB2 VB 3
CAPA DE W2
W1 W3
UNIDADES
OCULTAS
C 12 C 22
C 23
C 11
CAPA DE C 23 C 21
X1 X2 Z
UNIDADES
SENSORIALES
EC1 EC2 EI
Figura 3. Representación de dos modelos con unidades escondidas en el lenguaje de las redes
neuronales. Los círculos representan unidades de procesamiento y las líneas continuas y
discontinuas representan conexiones inmodificables y modificables entre unidades,
respectivamente. El Panel A describe la arquitectura del modelo SD, en el cual las unidades más
pequeñas en la capa de unidades sensoriales son activadas directamente por estímulos ambienta-
les. Las unidades de tamaño mediano en la capa de unidades escondidas, son activadas por las
unidades sensoriales a través de las conexiones Cij. La unidad grande en la capa de unidades de
salida es activada por el EI a través de su conexión, l y también por las unidades sensoriales y
escondidas a través de las conexiones VSi y VHi, respectivamente. La actividad de la unidad de
salida, Y(t), es responsable de la generación de la respuesta. El Panel B describe la arquitectura
del modelo APECS, el cual difiere del modelo SD en que carece de conexiones directas entre los
ECs y la unidad adaptativa y en la presencia de unidades de sesgo que influyen a las unidades
escondidas a través de las conexiones VBi.
Un aspecto central de los modelos con uni- samiento es directamente proporcional a la dis-
dades ocultas es que las conexiones entre las crepancia entre la actividad “real” y la actividad
unidades sensoriales y las unidades ocultas se “predicha” en dicha unidad.
pueden modificar con la experiencia. Esto signi-
fica que la red tiene 3 tipos de conexiones Por otra parte, la asociación entre las unidades
plásticas: 1) conexiones entre unidades senso- sensoriales y la unidad adaptativa cambia de acuer-
riales y unidades ocultas (Cij), 2) conexiones do a una regla conocida como retropropagación
entre unidades sensoriales y la unidad adaptativa (Rumelhart, et al., 1986). Esta regla consiste en
(VSi) y 3) conexiones entre unidades ocultas y la calcular un error especial para estas conexiones,
unidad adaptativa (VHj). Así, la actividad de la conocido como EH (la H proviene de “Hidden”, es
unidad adaptativa (Y(t)), depende del EI con decir, oculto), el cual se obtiene ponderando o
actividad z(t), y conexión l, de los ECs con descontando del error de salida o EO los valores
actividad xi(t) y conexiones VSi y de las unida- asociativos que se obtuvieron una vez que se hizo
des ocultas con actividad wi(t) y conexiones VHj. el ajuste en las conexiones entre las unidades
Similarmente, se asume que la actividad de la sensoriales y la unidad de salida. Dicho de otro
unidad escondida Wj está regulada por la suma modo, el EH es el error que “sobra” una vez que
de sus conexiones con las unidades de entrada se ajustan los pesos de las conexiones entre las
ponderadas por sus respectivos niveles de acti- unidades de entrada y la unidad de salida, es
vación, es decir, Wj(t)= Σxi(t)Cij. decir, el error se propaga “hacia atrás” en la red
de neuronal.
El cambio en las conexiones de las unidades
sensoriales y las unidades ocultas con la unidad Schmajuk y DiCarlo (1992) implementaron
adaptativa está gobernado por la regla de apren- la noción de retropropagación asumiendo que
dizaje de Rescorla y Wagner. Es decir, variacio- EHij es una función del grado de activación de la
nes en la conexión entre cualquier unidad unidad adaptativa causado por las unidades ocul-
sensorial u oculta con la unidad adaptativa, es tas (Wi(t)VHi(t)) y del error de salida (EO). Ya
una función de la diferencia entre la activación que la actividad de las unidades ocultas es una
momentánea de la unidad adaptativa ocasiona- función de la actividad de las unidades sensoria-
da por el EI y la activación ocasionada por todas les EH se puede decir que EH ij = f(EOVHi
las unidades sensoriales y ocultas que se en- Σxi(t)Cij(t)). Formalmente, las conexiones entre
cuentran activas en el momento. Formalmente, las unidades sensoriales y las unidades ocultas
se tiene que: cambian de acuerdo a la siguiente ecuación:
∆VSi= θ1xi[z(t)λ(t)-(Σxi(t)VSi(t)+ Σwj(t)VHj(t))]1-VSi (6) ∆C ij=θ3X iEH(1-C ij) (8)
∆VHJ= θ2Wi[z(t)λ(t)-(Σxi(t)VSi(t)+ Σwj(t)VHj(t))]1-VHi (7) El parámetro de tasa de aprendizaje θ3 de la

ecuación 8 es mayor que sus equivalentes de las
En las ecuaciones 6 y 7, los factores 1-VSi ecuaciones 9 y 10, confiriéndole mayor rapidez
y 1-VHi se usan para mantener los valores al aprendizaje de Cij que de VSi y VHi. Nótese
asociativos entre –1 y +1, y θ1 y θ2 son parámetros que es necesario asignar ciertos valores iniciales
que determinan las tasas de aprendizaje. La diferentes de cero a Cij, de otro modo nunca
expresión [z(t)λ(t)-(Σxi(t)VSi(t)+ Σwj(t)VHj(t))] tam- ocurrirían cambios en estas conexiones.
bién puede ser descrita como el error de la
predicción o error de output (EO). Más allá de Conceptualmente, puede decirse que el su-
estas diferencias, puede apreciarse que en esta puesto central del modelo SD es que si el error de
parte, la red aprende según la regla de Rescorla predicción del EI no se puede reducir modifican-
y Wagner que señala que el aprendizaje que do las conexiones entre las unidades sensoriales
tiene lugar en una determinada unidad de proce- y la unidad adaptativa, entonces la red desarrolla
conexiones entre las unidades sensoriales y las dad oculta, la cual, a su vez, inhibe a la unidad
unidades ocultas. Es decir, la red genera confi- adaptativa.
guraciones sólo cuando estas son necesarias
para resolver un problema determinado. Por El modelo SD es capaz de dar cuenta de un
ejemplo, considérese el caso en el cual dos gran número de fenómenos de condicionamiento
estímulos condicionados son entrenados sepa- Pavloviano, incluyendo algunos de los más pro-
radamente hasta niveles asintóticos (A+, B+). Al blemáticos, tales como el “señalamiento de la
comienzo, se fortalecen las conexiones VSA y ocasión” (occassion setting), donde algunos
VSB de acuerdo a las ecuaciones 6 y 7. Además, estímulos más que desarrollar la capacidad par
ya que A y B tienen un valor inicial muy bajo de generar la RC, aparentemente desarrollan cierta
ClA y ClB , la presentación de cualquiera de ellos habilidad para modular la respuesta de otros
no alcanza para activar la unidad escondida (por estímulos condicionados (Ross & Holland, 198l).
lo tanto, los valores de wj también son bajos), lo El modelo SD explica estos fenómenos asu-
cual a su vez determina que la unidad oculta no miendo que un estímulo puede actuar como un
desarrolle fuerza asociativa significativa con la simple EC a través de sus conexiones directas
unidad de salida. Ya que las conexiones de las con la unidad adaptativa y como un señalador de
unidades sensoriales A y B con la unidad oculta la ocasión a través de sus conexiones con las
dependen de la actividad de la unidad oculta, CAj unidades ocultas (Schmajuk, Lamoureux &
y CBj permanecen bajos. En resumen, no se Holland, 1998).
forman conexiones con la unidad oculta porque
no se necesitan. Modelos con estímulos incondicionados
moduladores
A diferencia del ejemplo anterior, para resol-
ver el problema del patrón negativo (A+, B+, La mayor parte de los modelos descritos
AB-), sí se necesitan conexiones entre las unida- anteriormente tienen en común que asumen la
des escondidas y la unidad adaptativa. En este representación más simple posible del EI. En
caso, la red también desarrolla conexiones VSA rigor, todo lo que se asume es que los animales
y VSB fuertes. Sin embargo, cuando los dos deben procesar el EI con el fin de generar la
estímulos se presentan juntos activan moderada- entrada “maestra” a partir de la cual se calcula el
mente a la unidad escondida, con lo cual ésta error para ajustar las conexiones de los ECs con
queda disponible para modificar su conexión la unidad adaptativa. En esta sección se discute
con la unidad adaptativa. Sin embargo, durante una categoría de modelos en los cuales el EI
los ensayos compuestos, la unidad oculta recibe cumple una función moduladora además de su
un valor de EO fuertemente negativo, debido a tradicional rol de reforzamiento.
que A y B activan la unidad adaptativa sin que se
presente el EI (es decir, error negativo). El resul- Grossberg (1975) propuso uno de los prime-
tado es que VH adquiere un valor inhibitorio. Ya ros modelos modulatorios de aprendizaje, el
que durante los ensayos compuestos, VH y EO cual asume que el EC forma asociaciones tanto
son negativos, el valor de EH se torna positivo sensoriales como motivacionales con el EI.
(ver ecuación 8), con lo cual CAj y CBj se tornan Específicamente, se asume que al parear un EC
positivos. En resumen, cada vez que los estímu- con un EI, se produce un cambio en la asocia-
los se presentan por separado, activan sólo la ción entre la representación sensorial del EC y la
unidad adaptativa, generando la respuesta con- representación del EI, de manera tal que el EC se
dicionada, mientras que cada vez que se presen- transforma en un reforzador secundario y ad-
tan juntos, si bien tienden a activar la unidad quiere la capacidad de producir la repuesta. En
adaptativa a través de sus conexiones directas segundo lugar, se establece una asociación entre
con ésta, también la inhiben indirectamente, a la representación del EI y una representación
través de su acción mancomunada sobre la uni- secundaria del EC, de tal manera que el EI
adquiere la capacidad de modular el grado de nal condicionada (la supresión del beber) po-
actividad del EC o atención que se pone a éste. drían estar controladas por distintos aspectos del
El primer tipo de asociación se denomina “apren- EI y que la naturaleza de la asociación (excitatoria
dizaje por reforzamiento” para designar el he- o inhibitoria) puede depender de requerimientos
cho de que el EC adquiere la capacidad para temporales propios para cada tipo de asociación.
funcionar como si fuera el EI. El segundo tipo de
asociación, se denomina “aprendizaje de incen- Wagner, Brandon, y sus colegas (Brandon &
tivo-motivación” para designar el hecho de que Wagner, 1991; Brandon, Bombace, Falls &
el EC se transforma en un estímulo relevante al Wagner; 1991) realizaron una serie de experi-
cual el animal aprende a prestar atención. En mentos para determinar cuáles son las condicio-
resumen, un EC bien entrenado adquiere las nes bajo las cuales los ECs se asocian con los 2
propiedades motivacionales del EI, monopoliza aspectos del EI. La conclusión que obtuvieron es
la atención del animal, sirve como reforzador que las respuestas emocionales condicionadas
para otros EC potenciales y genera la RC. tienden a desarrollarse con mayor facilidad con
ECs extendidos o contextuales, mientras que las
De forma similar, Wagner y Brandon (1989) respuestas condicionadas discretas tienden a
propusieron una extensión del modelo SOP, desarrollarse mejor con ECs cortos. Además,
llamada AESOP, la cual asume que el EC forma Gewirtz, Brandon y Wagner (1998) sugirieron
asociaciones tanto con aspectos sensoriales como que las respuestas emocionales condicionadas
emotivos del EI. La asociación del EC con el no sólo modulan la expresión de las respuestas
aspecto sensorial es responsable de la genera- condicionadas discretas, sino que también influ-
ción de respuestas condicionadas discretas, cla- yen en su adquisición.
ramente distinguibles, mientras que la asociación
con el aspecto emotivo es responsable de la La modificación que se hizo a SOP para
generación de respuestas emocionales difusas explicar estos fenómenos, consistió en asumir
las cuales actúan modulando a las respuestas que el EI controla 2 unidades representacionales
discretas. Además, se asume que algunos ECs independientes, una para el aspecto sensorial y
podrían ser más proclives a un tipo de asociación la otra para el aspecto emocional. La asociación
que a otro, y que ello puede depender del arreglo del EC con el aspecto sensorial es la responsable
temporal de los estímulos. La incorporación de de la generación de la RC discreta, mientras que
un mecanismo emotivo/modulador al modelo la conexión del EC con la unidad emotiva es
SOP fue inspirada principalmente por un fenó- responsable de la generación de la respuesta
meno conocido como “divergencia de las medi- emocional condicionada. AESOP usa las mis-
das de respuestas” (Schneiderman, 1972), el mas reglas que SOP para la formación de asocia-
cual se refiere a que algunas veces no hay ciones y las diferencias entre RC discretas y
correlación entre las distintas formas en las que emocionales se obtienen por diferencias de
se mide la respuesta condicionada. Por ejemplo, parámetros. Esta diferencia de parámetros busca
Tait y Saladin (1986) demostraron que reflejar el hecho de que la representación emotiva
pareamientos retrospectivos de un choque eléc- dura más que la representación sensorial, ha-
trico en la mejilla con un EC auditivo en conejos ciéndola más efectiva con intervalos más bien
producían condicionamiento inhibitorio si se largos.
evaluaba a través de la respuesta de parpadeo y
condicionamiento excitatorio si se evaluaba a Tanto la teoría de Grossberg como el modelo
través de la respuesta emocional de supresión de AESOP son descripciones muy sofisticadas y com-
la conducta de beber. Una interpretación posible pletas de los fenómenos del condicionamiento,
para este hallazgo y otros similares (Brandon & abarcando áreas tan diversas como los fenómenos
Wagner, 1989), es que la respuesta condiciona- temporales y la competencia de estímulos. Pese a
da discreta (el parpadeo) y la respuesta emocio- esta sofisticación, y quizás precisamente a causa
de ésta, estos modelos no han promovido mucha un experimento de “bloqueo retrospectivo”, por
investigación empírica. ejemplo, se presenta un compuesto de dos estí-
mulos A y B (por ejemplo, huevo y tomate)
CUARTA GENERACIÓN: APRENDIZAJE seguidos por una reacción alérgica, con el resul-
CAUSAL EN HUMANOS tado de que el sujeto juzga que ambos estímulos
son “buenos predictores” de la reacción alérgica.
En un estudio típico de aprendizaje causal En una segunda fase, se presenta solamente el
humano se presenta a los sujetos información estímulo A (por ejemplo, huevo) seguido por la
acerca de una serie de eventos (como comer reacción alérgica. En una fase de prueba poste-
determinados alimentos) que son seguidos o no rior, los sujetos juzgan que el estímulo B (toma-
por una consecuencia (como desarrollar una te) es un mal predictor de la reacción alérgica. La
alergia), para luego preguntarles hasta qué nivel interpretación común es que en la fase 2 el sujeto
estiman que los eventos predicen tal consecuen- “reevalúa retrospectivamente” el valor causal o
cia o se relacionan con ella (cuáles alimentos predictivo del estímulo B, extinguiendo el valor
producen la alergia y cuáles no). Resulta fácil asociativo de B, aunque este estímulo no se
ver cómo este procedimiento puede considerar- encuentra presente (Chapman, 1991).
se análogo al utilizado en estudios de
condicionamiento pavloviano, si se asume que Además del bloqueo retrospectivo, se ha
los eventos predictores (por ejemplo, los alimen- demostrado la existencia de otros fenómenos
tos) juegan el rol de los ECs, que el evento a similares, tales como el desensombrecimiento
predecir (por ejemplo, la alergia) el del EI y que (Larkin, Aitken & Dickinson, 1998) y la inhibi-
la predicción es análoga a la RC. ción condicionada retrospectiva (Chapman,
1991). El principal problema de los modelos
Varios autores (Dickinson, Shanks & asociacionistas tradicionales para dar cuenta de
Evenden, 1984; Allan, 1993) han sugerido que estos fenómenos, es que asumen que los anima-
la analogía entre el aprendizaje causal humano y les solamente pueden aprender a partir de las
el condicionamiento clásico podría darse tam- claves físicamente presentes durante la situación
bién al nivel de los mecanismos que subyacen a de refuerzo. Por ejemplo, en el bloqueo retros-
ambos. La idea básica es que los eventos y pectivo la presentación de A durante la segunda
consecuencias de una tarea de juicios causales fase de entrenamiento no debería afectar la fuer-
pueden ser representados por los sujetos me- za asociativa de la clave ausente B.
diante unidades sensoriales similares a las de la
Figura 1 y la efectividad con que se juzga que un El descubrimiento de la reevaluación retros-
evento puede producir un resultado es reflejo de pectiva ha sido tomado como una de las princi-
la fuerza asociativa de la conexión entre ambos, pales evidencias en contra de la adecuación de
que se modifica según reglas de aprendizaje una explicación asociativa para el aprendizaje
similares a la de Rescorla y Wagner. Esta inter- causal humano. Sin embargo, en los últimos
pretación se ha visto fortalecida por hallazgos años se aprecian esfuerzos por explicar estos
que indican que los fenómenos típicos del fenómenos dentro de la perspectiva asocia-
condicionamiento clásico se producen también cionista. En las siguientes secciones presenta-
en el aprendizaje causal (Allan, 1993). mos 3 modelos asociativos que se han formulado
con estos fines.
Recientemente, sin embargo, se ha descu-
bierto un nuevo fenómeno, conocido como El modelo de Rescorla y Wagner modificado
“reevaluación retrospectiva”, en el cual los suje- (Van Hamme & Wasserman, 1994)
tos parecen reevaluar aquello que han aprendido
acerca de algunos estímulos en función de su El modelo de Rescorla-Wagner no entrega
experiencia con otros estímulos diferentes. En significación psicológica a los ECs ausentes
durante un ensayo de aprendizaje, asignándoles El modelo SOP modificado (Dickinson &

un valor de α igual a cero. Con el fin de explicar Burke, 1996)
la reevaluación retrospectiva, Van Hamme y
Wasserman (1994) propusieron que el parámetro En el modelo SOP original (Wagner, 1981),
α asuma un valor negativo en aquellos ensayos el aprendizaje de un EC sólo ocurre cuando su
en los que el EC no está pero existen expectati- representación se encuentra en un estado prima-
vas respecto a su aparición. Dichas expectativas rio de actividad A1, que se produce sólo después
podrían depender de la presencia de un estímulo de la presentación física del estímulo. Ya que la
previamente asociado con el EC ausente o de actividad secundaria del EC no produce apren-
instrucciones verbales. El modelo asume, ade- dizaje alguno, Dickinson y Burke (1996) propu-
más, que durante presentaciones de ECs com- sieron que otorgarle dicha propiedad podría ser
puestos se producen asociaciones entre sus la forma para dotar a SOP de un mecanismo de
elementos, con lo cual la presentación de uno de aprendizaje para EC ausentes. Para implementar
ellos activa automáticamente la representación esta idea, los autores suponen que dos estímulos
del otro. A y B que se presentan juntos terminan por
asociarse, y la presencia física de uno adquiere
Según este modelo, en la primera fase del la capacidad de generar actividad secundaria en
bloqueo retrospectivo (AB+), los ECs A y B se el otro. Además se extienden las reglas de apren-
asocian entre sí y con el EI. En la segunda fase dizaje del modelo, planteando que el aprendiza-
(A+), el estímulo A continúa ganando fuerza je excitatorio entre dos estímulos es proporcional
asociativa y el estímulo B, que no está presente al grado en que coinciden en el mismo tipo de
pero es “esperado” debido a su asociación con actividad (A1AA1B o A2AA2B) y el aprendizaje
A, presenta un valor αB negativo, con lo cual inhibitorio es proporcional al grado en que con-
pierde fuerza asociativa. Nótese que un EC curren distintos tipos de actividad (A1AA2B o
ausente también puede ganar fuerza asociativa A2 AA1 B).
cuando el valor negativo de α interactúa con un
valor negativo del término de error (l - SV). El Según el modelo, durante la primera fase del
principio general es que los estímulos ausentes, procedimiento de bloqueo retrospectivo se for-
pero esperados, cambian su fuerza asociativa en man asociaciones intracompuesto entre los ele-
dirección opuesta a los estímulos presentes. mentos del compuesto AB, las que determinan la
activación en A2 de los elementos del estímulo
En concordancia con la explicación que en- B cuando se presenta el estímulo A aisladamen-
tregan Van Hamme y Wasserman, varias inves- te, y viceversa. El bloqueo retrospectivo no sería
tigaciones han comprobado que las asociaciones una consecuencia necesaria de la contingencia
intracompuesto (Chapman, 1991; Larkin, Aitken AB+ A+, porque las presentaciones de A durante
& Dickinson, 1998) y la información verbal la segunda fase activarían una proporción de los
acerca de una clave ausente (Wasserman & elementos del EI al estado A2, mientras otra
Castro, 2005) pueden ser determinantes en la proporción es activada al estado A1 a través de
observación de reevaluación retrospectiva. Sin la presencia del EI mismo. De este modo, aún
embargo, se ha criticado a este modelo que no cuando los elementos del estímulo B se ven
explica satisfactoriamente cómo una asociación promovidos al estado A2 durante estos ensayos,
intracompuesto lleva a que el valor de α sea esto fortalece tanto las conexiones excitatorias
negativo para una clave ausente, y por qué el (por medio de A2BA2EI) como inhibitorias (por
mismo proceso no afecta a la representación medio de A2BA1EI) con el EI. La ocurrencia del
asociativamente activada del EI. El modelo que bloqueo retrospectivo dependerá de cuál de los
describimos en la sección siguiente fue formulados procesos tiene una mayor fuerza. Esta ambi-
do para resolver este problema. güedad no es necesariamente incorrecta, ya que
el fenómeno de bloqueo retrospectivo no siem- representados por una unidad configuracional

pre se obtiene (Larkin, Aitken & Dickinson, escondida independiente, la que a su vez esta-
1998). blece conexiones directas con las unidades de
salida. Las unidades escondidas son, en este
El modelo SOP modificado también predice contexto, unidades configuracionales que re-
que, bajo ciertas condiciones, es posible que se presentan un patrón particular de estimulación.
produzca aprendizaje completamente nuevo a El panel B de la Figura 3 muestra un ejemplo de
partir de estímulos ausentes. Por ejemplo, la la arquitectura de APECS para dos ECs y un EI.
activación simultánea de la representación de
dos estímulos ausentes debería llevar a un forta- En términos generales, las conexiones entre
lecimiento de las conexiones excitatorias entre las unidades configuracionales escondidas y la
ambos, dado que se ha producido una actividad unidad de salida (VHk), y las conexiones entre
del tipo A2-A2. Si bien esta predicción ha resul- unidades sensoriales y configuracionales (Cij) se
tado correcta en investigaciones del modifican de acuerdo con reglas de aprendizaje
condicionamiento clásico animal (Dwyer, por retropropagación como las propuestas por
Mackintosh & Boakes, 1998), Le Pelley y Rumelhart y col. (1986). Lo más interesante de
McLaren (2001) han sido incapaces de encon- este modelo es su proceso de memoria, en el cual
trar nuevo aprendizaje a partir de estímulos una representación configuracional se hace re-
ausentes con humanos. Esto les ha llevado a fractaria, protegiendo a sus asociaciones contra
plantear una alternativa, que se discute a conti- el desaprendizaje. Esta característica se obtiene
nuación. mediante dos mecanismos. Primero, la actividad
de cada unidad configuracional se encuentra
El modelo APECS de Le Pelley y McLaren modulada por una unidad de sesgo (las unidades
(2001) pequeñas adyacentes a cada unidad
configuracional en la Figura 3 B), que se mantie-
La dificultad que tuvieron Le Pelley y ne con un nivel de activación constante de 1, y
McLaren (2001) para encontrar nuevo aprendi- cuya conexión con la unidad configuracional
zaje a partir de estímulos ausentes, a pesar de que (VBj) se modifica de la misma manera que la
sí les fue posible modificar asociaciones conexión entre unidades sensoriales y
preexistentes, los ha llevado a plantear que la configuracionales (Cij). De este modo, la unidad
reevaluación retrospectiva no se debe a un pro- de error tiene una influencia continua sobre la
ceso de nuevo aprendizaje mediado por asocia- unidad configuracional, pero el monto de tal
ciones intracompuesto, sino a cambios en la influencia puede verse modificado. La influen-
capacidad para recuperar una representación cia de esta unidad de error sobre una representa-
previamente guardada en la memoria. ción configuracional es la que puede hacer que
tal representación sea más fácil o más difícil de
El modelo APECS originalmente fue diseña- activar a partir del patrón de estímulos físicos
do para proteger ciertas asociaciones del que le dio origen, lo que depende de la naturale-
desaprendizaje una vez que cambian las contin- za (excitatoria o inhibitoria) y magnitud de la
gencias que les dieron origen (por ejemplo, en la conexión entre la unidad de error y la unidad
extinción), simplemente dificultando su activa- escondida.
ción y no eliminando el aprendizaje original. El
modelo posee una arquitectura con unidades El segundo mecanismo especial del modelo
escondidas, pero asume un procesamiento com- APECS consiste en el congelamiento de algunas
pletamente configuracional de estímulos que no conexiones en la red cuando el valor del error de
incluye conexiones directas entre las unidades predicción es negativo, lo que permite mantener
sensoriales y las unidades de salida, sino que tales conexiones intactas aún bajo un cambio en
tanto estímulos aislados como compuestos son las contingencias que les dieron origen. De este
modo, una vez que se han desarrollado las no apela a la necesidad de asociaciones
asociaciones para poder predecir un refuerzo a intracompuesto para explicar la reevaluación
partir de una cierta configuración de estímulos, retrospectiva. Aún así, el modelo es capaz de
si posteriormente tal configuración lleva a una explicar algunos de los experimentos que han
predicción errónea acerca de la presentación del comprobado que tal relación sí existiría
refuerzo, se reducen automáticamente los (Dickinson & Burke, 1996), pero no todos ellos
parámetros de aprendizaje hasta un valor cerca- (Chapman, 1991). Su principal aporte es que, sin
no a cero para todas las conexiones previamente salir de la tradición de modelos cuantitativos
establecidas. Aún así, la red logra adaptarse a las asociacionistas, logra entregar una explicación a
nuevas contingencias debido a que las conexio- la reevaluación retrospectiva completamente
nes de la unidad de error no sufren del mismo distinta a la entregada por su competencia, basa-
proceso de congelamiento, y pueden modificarse da en un cambio en la facilidad para recuperar
para dificultar la activación de la unidad escon- una representación de la memoria.
dida cuando se presenta el patrón de estímulos
correspondiente. Ninguno de los modelos revisados en esta
sección ha logrado situarse sobre el resto en la
La explicación para los fenómenos de explicación del aprendizaje a partir de claves
reevaluación retrospectiva se funda en el carác- ausentes. Suelen entregar predicciones muy si-
ter configuracional del modelo APECS. Por ejem- milares que no permiten diferenciar claramente
plo, durante la primera fase del bloqueo entre ellos. Además todos presentan dificultades
retrospectivo (AB+) se formaría una representa- en la predicción de ciertos hallazgos tales como
ción configuracional de AB que puede luego la “reevaluación retrospectiva de orden supe-
activarse por la presentación de cualquiera de rior” (De Houwer & Beckers, 2002) y otros
sus componentes. De este modo, los ensayos fenómenos, como el precondicionamiento sen-
con A durante la segunda fase de entrenamiento sorial y el condicionamiento mediado, en los
activan la representación configuracional de AB, cuales se comprueba nuevo aprendizaje para
la que se ve sometida tanto a cambios por estímulos ausentes en la misma dirección que
aprendizaje (i.e., en su conexión con la unidad para los estímulos presentes, justo el resultado
de salida) como debidos a la interferencia retro- contrario a lo observado en fenómenos de
activa (i.e., cambios en el valor de la conexión reevaluación retrospectiva.
desde la unidad de error). Por último, toda
respuesta frente a B en una fase de prueba es La explicación de estos resultados contradic-
resultado de la activación de la unidad torios requiere un mayor conocimiento acerca
configuracional AB y, por lo tanto, depende de de las condiciones que llevan a uno u otro
los procesos de aprendizaje y memoria que han resultado, las cuales han comenzado a ser
afectado a esta unidad durante la segunda fase. estudiadas e incluidas en modelos matemáticos
recién en los últimos años. Algunos de estos
Las predicciones del modelo APECS con modelos explican gran parte de estos fenómenos
respecto a los fenómenos de reevaluación re- a través de mecanismos que incidirían en la
trospectiva son similares a las del modelo SOP ejecución de la respuesta más que en el aprendi-
modificado, pero el primero predice que no es zaje (Stout & Miller, 2005).
posible obtener nuevo aprendizaje a partir de
claves ausentes, mientras el segundo predice COMENTARIOS FINALES
que tal aprendizaje sí ocurrirá bajo ciertas condi-
ciones. En este aspecto, la evidencia experimen- En este artículo hemos intentado destacar
tal no es concluyente aún (Dwyer, Mackintosh algunos de los hitos del devenir de la tradición
& Boakes, 1998; Le Pelley & McLaren 2001). cuantitativa en las teorías del condicionamiento
Otro aspecto específico al modelo APECS es que Pavloviano. Con el fin de acotar la gran diversi-
dad de alternativas teóricas que se han propues- sis más bien molecular, ha resultado ser altamen-
to, hemos agrupado los modelos en 4 categorías te conveniente para describir e investigar acerca
o generaciones. Si bien cada nueva generación de los mecanismos neurobiológicos del aprendi-
representa un aumento en la complejidad de los zaje.
modelos, ello no significa necesariamente que
las últimas generaciones remplacen completa- Finalmente, el descubrimiento de similitu-
mente los niveles de análisis de las generaciones des empíricas entre el condicionamiento
anteriores. Pavloviano y el aprendizaje de relaciones de
causalidad en humanos, reactivó el interés por
En cada generación de modelos aún hay el condicionamiento en ámbitos de investiga-
abundante debate teórico y trabajo empírico por ción que generalmente miraban con desdeño
hacer. Por ejemplo, en el ámbito de los modelos los procedimientos de investigación animal y
de ensayo discreto quizá el tema más candente su potencial capacidad para aplicarla a los
hoy en día se refiera a si los estímulos compues- fenómenos humanos “cognitivos”. Sin embar-
tos deben representarse como configuraciones o go, la teorización en este ámbito es aún insipiente
como elementos separados. Los trabajos recien- y enfrenta grandes dificultades, tales como el
tes en los laboratorios de Allan Wagner y John fenómeno de la reevaluación retrospectiva, que
Pearce, muestran que este tema aún no se ha ha sido visto por algunos como una prueba de
resuelto. la inconveniencia de esta extrapolación. Otros
han comenzado a formular ciertas soluciones
Por otra parte, la sensibilidad temporal con la teóricas basadas en los modelos conexionistas
que se ha comenzado a analizar la topografía de tradicionales.
la respuesta en los nuevos paradigmas experi-
mentales, ha mostrado que la RC no es una mera Sin duda, el debate continuará en los próxi-
replica de la RI, sino que es altamente sensible a mos años, enriqueciendo aún más nuestro cono-
un número de parámetros relacionadas con los cimiento de uno de los fenómenos más largamente
EIs y ECs. En este ámbito, los investigadores se estudiados en Psicología experimental. A través
han visto en la necesidad de aceptar que la de esta revisión, esperamos haber mostrado que
asociación no ocurre entre un EC y un EI sino el condicionamiento Pavloviano es un fenómeno
entre componentes de los estímulos. Este análi- plenamente vigente en la actualidad.
REFERENCIAS
Allan, L. G. (1993). Human contingency judgements: Rule based or associative? Psychological Bulletin, 114, 436-448.
Aydin, A. & Pearce, J.M. (1995). Summation in autoshaping with short and long-duration stimuli. Quarterly Journal of Experimental
Psychology, 48B, 215-234.
Brandon, S. E., Bombace, J. C., Falls, W., & Wagner, A. R. (1991). Modulation of unconditioned defensive reflexes via an emotive
Pavlovian conditioned stimulus. Journal of Experimental Psychology: Animal Behavior Processes, 17, 312-322.
Brandon, S. E., Vogel, E. H., & Wagner, A. R. (2000). A componential view of configural cues in generalization and discrimination
in Pavlovian conditioning. Behavioural Brain Research, 110, 67-72.
Brandon, S.E., Vogel, E.H., & Wagner, A.R. (2003). Stimulus representation in SOP: I. Theoretical rationalization and some
implications. Behavioural Processes, 62, 2-26.
Brandon, S. E., & Wagner, A. R. (1991). Modulation of a discrete Pavlovian conditioning reflex by a putative emotive Pavlovian
conditioned stimulus. Journal of Experimental Psychology: Animal Behavior Processes, 17, 299-311.
Bush, R. R., & Mosteller, F. (1955). Stochastic models for learning. Nueva York: Wiley.
Chapman, G. B. (1991). Trial order affects cue interaction in contingency judgements. Journal of Experimental Psychology: Learning,
Memory and Cognition, 17, 837-854.
Coleman, S. R., & Gormezano, I. (1971). Classical conditioning of the rabbit’s (Orictolagus cuniculus) nictitating membrane response
under symmetrical CS-US intervals shifts. Journal of Comparative and Physiological Psychology, 77, 447-455.
De Houwer, J., & Beckers, T. (2002). Higher-order retrospective revaluation in human causal learning. Quarterly Journal of
Experimental Psychology, 55B, 137-151.
Desmond, J. E., & Moore, J. W. (1988). Adaptive timing in neural networks: The conditioned response. Biological Cybernetics, 58,
405-415.
Dickinson, A., & Burke, J. (1996). Within-compound associations mediate the retrospective revaluation of causality judgements.
Quarterly Journal of Experimental Psychology, 49B, 60-80.
Dickinson, A., Shanks, D., & Evenden, J. (1984). Judgement of act-outcome contingency: The role of selective attribution. Quarterly
Journal of Experimental Psychology, 36A, 29-50.
Donegan, N. H. (1981). Priming-produced facilitation or diminution of responding to a Pavlovian unconditioned stimulus. Journal
of Experimental Psychology: Animal Behavior Processes, 7, 295-312.
Donegan, N. H., & Wagner, A. R. (1987). Conditioned diminution and facilitation of the UR: A sometimes opponent-process
interpretation. En I. Gormezano, W. F. Prokasy, & R. F. Thompson (Eds.), Classical Conditioning. Hillsdale, NJ: Erlbaum.
Dwyer, D. M., Mackintosh, N. J., & Boakes, R. A. (1998). Simultaneous activation of the representation of absent cues results in the
formation of an excitatory association between them. Journal of Experimental Psychology: Animal Behavior Processes, 24, 163-
171.
Estes, W. K. (1950). Toward a statistical theory of learning. Psychological Review, 57, 94-104.
Gallistel, R., & Gibbon, J. (2000). Time, rate and conditioning. Psychological Review, 107, 289-344.
Gewirtz, J. C., Brandon, S. E., & Wagner, A. R. (1998). Modulation of the acquisition of the rabbit eyeblink conditioned response
by conditioned contextual stimuli. Journal of Experimental Psychology: Animal Behavior Processes, 24, 106-117.
Grossberg, S. (1975). A neural model of attention, reinforcement and discrimination learning. International Review of Neurobiology,
18, 263-327.
Grossberg, S., & Schmajuk, N. A. (1989). Neural dynamics of adaptive timing and temporal discrimination during associative learning.
Neural Networks, 2, 79-102.
Hall, G., & Pearce, J. M. (1979). Latent inhibition of a CS during CS-US pairings. Journal of Experimental Psychology: Animal
Behavior Processes, 5, 31-42.
Hull, C. L. (1943). Principles of behavior: An introduction to behavior theory. Nueva York: Appleton-Century-Crofts.
Kamin, L. J. (1968). “Attention-like” processes in classical conditioning. En M. R. Jones (Ed.), Miami Symposium on the Prediction
of Behavior: Aversive stimulation (pp. 9-33). Miami: University of Miami Press.
Larkin, M. W., Aitken, M. R., & Dickinson, A. (1998). Retrospective revaluation of causal judgements under positive and negative
contingencies. Journal of Experimental Psychology: Learning, Memory and Cognition, 24, 1331-1352.
Le Pelley, M. E., & McLaren, I. P. L. (2001). Retrospective revaluation in humans: Learning or memory? Quarterly Journal of
Experimental Psychology, 54B, 311-352.
Lubow, R.E. (1973). Latent inhibition. Psychological Bulletin, 79, 398-407.
Mackintosh, N. J. (1975). A theory of attention: Variations in the associability of stimuli with reinforcement. Psychological Review,
82, 276-298.
Marcos, J. L. (1997). Modulación condicionada de la respuesta incondicionada en el condicionamiento clásico humano. Psicothema,
9, 155-165.
Marcos, J. L., & Redondo, J. (2002). Efectos diferenciales de los mecanismos asociativos y de expectación sobre la disminución de
la respuesta incondicionada en el condicionamiento clásico electrodérmico. Psicothema, 14, 375-381.
McCormick, D. A., & Thompson, R. F. (1983). Cerebellum: Essential involvement in the classically conditioned eyelid response.
Science, 223, 296-299.
McLaren, I. P. L., & Mackintosh, N. J. (2000). An elemental model of associative learning: I. Latent inhibition and perceptual learning.
Animal learning and Behavior, 28, 211-246.
Medina, J. F., Garcia, K. S., Nores, W. L., Taylor, N. M., & Mauk, M. D. (2000). Timing mechanisms in the cerebellum: Testing
predictions of a large-scale computer simulation. The Journal of Neuroscience, 20, 5516-5525.
Millenson, J. R., Kehoe, E. J., & Gormezano, I. (1977). Classical conditioning of the rabbit’s nictitating membrane response under
fixed and mixed CS-US intervals. Learning and Motivation, 8, 351-366.
Moore, J. W., & Stickney, K. J. (1980). Formation of attentional-associative networks in real time: Role of the hippocampus and
implications for conditioning. Physiological Psychology, 8, 207-217.
Myers, K. M., Vogel, E. H., Shin, J., & Wagner, A. R. (2001). A comparison of the Rescorla-Wagner and Pearce models in a negative
patterning and a summation problem. Animal Learning and Behavior, 29, 36-45.
Pavlov, I. P. (1927). Conditioned reflexes. Londres: Oxford University Press.

Pearce, J. M. (1987). A model for stimulus generalization in Pavlovian conditioning. Psychological Review, 94, 61-73.
Pearce J. M. (2002). Evaluation and development of a connectionist theory of configural learning. Animal Learning and Behavior,
30, 73-95.
Pearce, J. M., & Hall, G. (1980). A model for Pavlovian learning: Variations in the effectiveness of conditioned but not unconditioned
stimuli. Psychological Review, 87, 532-552.
Rescorla, R. A. (1980a). Pavlovian second-order conditioning: Studies in associative learning. Hillsdale, NJ: Erlbaum.
Rescorla, R. A. (1980b). Simultaneous and successive associations in sensory preconditioning. Journal of Experimental Psychology:
Animal Behavior Processes, 6, 207-216.
Rescorla, R.A. (1997). Summation: Assessment of a configural theory. Animal Learning and Behavior, 25, 200-209.
Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and
non reinforcement. En A. H. Black, & W.F. Prokasy (Eds.), Classical Conditioning II: Current Theory and Research. Nueva
York: Appleton-Century-Crofts.
Ross, R. T., & Holland, P. C. (1981). Conditioning of simultaneous and serial feature-positive discriminations. Animal Learning and
Behavior, 9, 292-303.
Rumelhart, D. E., Hinton, G. E., & Williams, G. E. (1986). Learning internal representations by error propagation. En D. E. Rummelhart
& J. L. Mclelland (Eds.) , Parallel Distributed Processing: Explorations in the Microstructure of Cognition: Vol. 1, Foundations.
Cambridge, MA: Bradford MIT Press.
Schmajuk, N. A. (1997). Animal learning and cognition: A neural network approach. Cambridge: Cambridge University Press.
Schmajuk, N. A., & Dicarlo, J. J. (1992). Stimulus configuration, classical conditioning, and hippocampal function. Psychological
Review, 99, 268-305.
Schmajuk, N. A., & Moore, J. W. (1985). Real-time attentional models for classical-conditioning and the hippocampus. Physiological
Psychology, 13, 278-290.
Schmajuk, N. A., Lamoureux, J. A., & Holland, P. C. (1998). Occasion setting: A neural network approach. Psychological Review,
105, 3-32.
Schneiderman, N. (1972). Response system divergences in aversive classical conditioning. En A. H. Black, & W. F. Prokasy (Eds),
Classical conditioning II: Current theory and research. Nueva York: Appleton-Century-Crofts.
Siegel, S., & Domjan, M. (1971). Backward conditioning as an inhibitory procedure. Learning and Motivation, 2, 1-11.
Smith, M. C., Coleman, S. R., & Gormezano, I. (1969). Classical conditioning of the rabbit’s nictitating membrane response at backward,
simultaneous, and forward CS-US intervals. Journal of Comparative and Physiological Psychology, 69, 226-231.
Spence, K. (1945). An experimental test of continuity and non-continuity theories of discrimination learning. Journal of Experimental
Spence, K. W. (1960). Behavior theory and learning. Englewood Cliffs, NJ: Prentice-Hall.
Stout, S. C., & Miller, R. R. (2005). Sometimes competing retrieval: A formalization of the comparator hypothesis. Manuscrito enviado
para su publicación.
Sutton, R. S., & Barto, A. G. (1981). Toward a modern theory of adaptive networks: Expectation and prediction. Psychological Review,
88, 135-170.
Sutton, R. S., & Barto, A. G. (1990). Time-derivative models of Pavlovian reinforcement. En M. Gabriel, & J. W. Moore (Eds.),
Learning and computational neuroscience: Foundations of adaptive networks (pp. 497-534). Cambridge, MA: The MIT Press.
Tait, R. W., & Saladin, M. E. (1986). Concurrent development of excitatory and inhibitory associations during backward conditioning.
Animal Learning and Behavior, 14, 133-137.
Van Hamme, L. J., & Wasserman, E. A. (1994). Cue competition in causality judgements: The role of nonpresentation of compound
stimulus elements. Learning and Motivation, 25, 127-151.
Vogel, E. H., Brandon, S. E., & Wagner, A. R. (2003). Stimulus Representation in SOP: II. An application to inhibition of delay.
Behavioural Processes, 62, 27-48.
Wagner, A. R. (1981). SOP: A model of automatic memory processing in animal behavior. En N. E. Spear, & R. R. Miller (Eds.),
Information Processing in Animals: Memory mechanisms. Hillsdale, NJ: Erlbaum.
Wagner, A. R. (2003). Context-sensitive elemental theory. The Quarterly Journal of Experimental Psychology, 56B, 7-29.
Wagner, A. R., & Brandon, S. E. (1989). Evolution of a structured connectionist model of Pavlovian conditioning (AESOP). En S.
B. Klein, & R. R. Mowrer (Eds.), Contemporary learning theories: Pavlovian Conditioning and the Status of Traditional Learning
Theory. Hillsdale, NJ: Erlbaum.
Wagner, A. R., Logan, F. A., Haberlandt, K., & Price, T. (1968). Stimulus selection in animal discrimination learning. Journal of
Experimental Psychology, 76, 171-180.
Wagner, A. R. & Rescorla, R. A. (1972). Inhibition in Pavlovian conditioning: Application of a theory. En M. S. Halliday & R. A.
Boakes (Eds.), Inhibition and learning. San Diego, CA: Academic Press.
Wagner, A. R., Rudy, J. W., & Whitlow, J.W. (1973). Rehearsal in animal conditioning. Journal of Experimental Psychology, 97,
407-426.
Whitlow, J. W. (1975). Short-term memory in habituation and dishabituation. Journal of Experimental Psychology: Animal Behavior
Processes, 1, 189-206.
Wasserman, E. A., & Castro, L. (2005). Surprise and change: Variations in the strength of present and absent cues in causal learning.
Learning and Behavior, 33, 141-146.
Zimmer-Hart C. L., & Rescorla R. A. (1974). Extinction of pavlovian conditioned inhibition. Journal of Comparative and Physiological
Recepción: mayo de 2005

Aceptación final: junio de 2006

Modelos Matemáticos Del Condicionamiento

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Modelos Matemáticos Del Condicionamiento

Transféré par

Droits d'auteur :

Formats disponibles

Revista Latinoamericana de Psicología

2006, volumen 38, No 2, 215-243

MODELOS MATEMÁTICOS DEL CONDICIONAMIENTO

EDGAR H. VOGEL1, FABIÁN A. SOTO

MARÍA E. CASTRO Y PAOLA A. SOLAR

Key words: Associative learning, Pavlovian conditioning, classical conditioning, neural

Palabras clave: aprendizaje asociativo, condicionamiento Pavloviano, condicionamiento

INTRODUCCIÓN mor en ratas, y el condicionamiento palpebral en

Además, la década de los ochenta fue testigo El fenómeno de condicionamiento clásico se

EC1 EC2 EC3 EI

El operador lineal pareados con EI, aumentarán en su fuerza

El modelo configuracional de Pearce Aunque las posturas elementalista y

El modelo SOP intenta explicar varios fenó-

A21 A11 A22 A12

X111 X112 X113 X121 X122 X123 Z

ciones, donde la respuesta condicionada no es fortalecimiento de las conexiones excitatorias

∆VSi= θ1xi[z(t)λ(t)-(Σxi(t)VSi(t)+ Σwj(t)VHj(t))]1-VSi (6) ∆C ij=θ3X iEH(1-C ij) (8)

∆VHJ= θ2Wi[z(t)λ(t)-(Σxi(t)VSi(t)+ Σwj(t)VHj(t))]1-VHi (7) El parámetro de tasa de aprendizaje θ3 de la

durante un ensayo de aprendizaje, asignándoles El modelo SOP modificado (Dickinson &

el fenómeno de bloqueo retrospectivo no siem- representados por una unidad configuracional

Pavlov, I. P. (1927). Conditioned reflexes. Londres: Oxford University Press.

Recepción: mayo de 2005

Vous aimerez peut-être aussi