Académique Documents
Professionnel Documents
Culture Documents
Cristina Gil
Cristina Gil
tipo de aprendizaje que haba propuesto Thorndike, lo que le llevo a formular que la conducta se regula
tanto por el condicionamiento de los reflejos o condicionamiento respondiente como por el operante.
Skinner se centr en las relaciones funcionales entre la conducta y sus consecuencias. Para el, tanto el
condicionamiento operante como el respondiente deban solo prestar atencin al estudio de las relaciones
entre los eventos observables y la conducta.
Para describir los procedimientos utiliz los trminos condicionamiento operante y condicionamiento
instrumental. El termino operante refleja la capacidad que tiene el individuo para operar sobre su
ambiente, mientras que el termino instrumental tiene en cuenta el hecho de que la conducta del sujeto es
el instrumento para obtener el reforzador. La innovacin de los experimentos de Skinner fue utilizar en
ellos una respuesta que el sujeto poda ejecutar repetidamente sin intervencin del experimentador (en
ratas era presionar una palanca, en palomas picotear una tecla).
Por tanto el condicionamiento operante dispone al sujeto en unas circunstancias en las que alguna de sus
conductas da lugar a la aparicin de un evento, lo que produce un cambio de la probabilidad de emisin de
esa conducta en el futuro. El trmino operante se utiliza porque a diferencia de lo que ocurra en el CC el
sujeto interviene u opera en el medio.
Si el resultado del comportamiento es beneficioso para el animal la conducta se fortalecer, siendo ms
probable que se emita de nuevo en circunstancias parecidas. Si el resultado es perjudicial, dicha conducta
tender a desaparecer del repertorio del sujeto.
Con el condicionamiento operante, los organismos aprenden a obtener consecuencias favorables y a
eliminar consecuencias desfavorables del ambiente Este condicionamiento hace que los sujetos, no slo
aprendan a responder ante una nueva circunstancia con una respuesta que formaba parte de su
repertorio, sino que adems puede dar lugar a la aparicin de respuestas nuevas.
2
Cristina Gil
2.1.2. La respuesta
La respuesta operante en este condicionamiento se define por los efectos que provoca en el ambiente.
Cuando una respuesta produce el mismo efecto que otra respuesta (aunque sean diferentes) estaremos
hablando de la misma operante, porque producen los mismos efectos sobre el ambiente. La operante se
define por tanto por su funcin, y no por su forma.
En el caso de presionar la palanca, la ratita puede hacerlo con la pata o con el morro, pero ambas respuestas dan
una bolita de comida, por ello son ejemplos de una misma operante.
Skinner seal que El trmino enfatiza el hecho de que la conducta opera sobre el ambiente para generar
consecuencias. Las consecuencias definen las propiedades en funcin de las cuales las respuestas se
consideran similares. El trmino se usara como adjetivo (conducta operante) y como sustantivo que designa
la conducta definida por una consecuencia dada
3
Cristina Gil
Cuando hablamos de la conducta, esta puede ser muy compleja y adoptar distintas formas (topografa)
teniendo la misma funcin. Cuando hablamos de clase de respuesta nos estamos refiriendo a cualquier
forma de ejecutar una conducta con una funcin similar, en el ejemplo anterior la funcin sera obtener
comida. Estas respuestas pueden ser fsicamente parecidas pero no siempre tiene que ser as: por ejemplo
podemos hacer algo nosotros mismos o pedirle a otro que lo haga. Ambas sera la misma clase de
respuesta pero con una topografa o forma muy diferente.
2.1.3. El reforzador
Para el CO el trmino reforzador debe dar cabida a la gran variedad de estmulos y eventos que poseen la
capacidad de reforzamiento de una conducta. Se define por tanto en funcin de los efectos que tiene
sobre la conducta. Segn esta definicin funcional un reforzador es cualquier suceso o evento que al
hacerse contingente con una respuesta cambia la probabilidad de aparicin de esa respuesta en el futuro.
Reforzamiento condicionado
La conducta humana muchas veces no es controlada por reforzadores primarios como puede ser la
comida, sino por eventos cuyos efectos dependen de la historia del reforzamiento. Los elogios o crticas,
los juicios sobre nuestro comportamiento, o el dinero, son consecuencias que pueden fortalecer o debilitar
la ocurrencia de una conducta. Este tipo de eventos adquieren los efectos que producen debido a las
experiencias que la gente ha tenido con ellos a lo largo de sus vidas y ello hace que la misma consecuencia
pueda tener efectos distintos dependiendo de la experiencia personal del sujeto (por ejemplo para algunos
el dinero es muy importante, pero para otros lo es menos)
Como venimos sealando, un reforzador puede ser definido como un evento cuya entrega aumenta la
frecuencia de una respuesta con la que es contingente. El componente critico es la influencia en la tasa de
respuesta, no lo que el estmulo o evento es en realidad. Se puede producir el fenmeno del
reforzamiento condicionado, tambin llamado reforzamiento secundario: un estmulo o evento que
originalmente no es reforzante, como una luz o un sonido, puede adquirir capacidad de reforzamiento
mediante la asociacin repetida con otro que era previamente reforzante. Hablamos, entonces, de
reforzamiento condicionado cuando una conducta se fortalece debido a sucesos que tienen un efecto que
depende de la historia de reforzamiento de ese sujeto. Implica una correspondencia entre un evento
arbitrario y un reforzador que es efectivo en el momento actual. Cuando este evento arbitrario es capaz de
aumentar la frecuencia o la tasa de una respuesta, a este tipo de reforzamiento lo denominamos
reforzamiento secundario o reforzamiento condicionado.
Los resultados de laboratorio en el estudio del reforzamiento condicionado son contradictorios: en algunos
la extincin hace que los reforzadores condicionados pierdan efectividad, mientras que en otro se
mantienen en situaciones de muchas repeticiones. A pesar de estos resultados que no son concluyentes, la
experiencia en la vida diaria sugiere que eventos de este tipo pueden reforzar gran cantidad de conductas
sin extinguirse.
2.2. ACLARACIONES
2.2.1. Reforzador-reforzamiento
El evento sera el reforzador, y el procedimiento o proceso el reforzamiento. El reforzamiento produce
incrementos en la conducta, y los reforzadores son los eventos que hacen que el reforzamiento produzca
esos efectos. Cuando el procedimiento disminuye la conducta se denomina castigo y los eventos utilizados
cuando se presenta la conducta son de naturaleza aversiva. Hay que distinguir as entre consecuencia
apetitiva (reforzador) y consecuencia aversiva (castigo)
4
Cristina Gil
Cristina Gil
relacin entre esa conducta y otro acontecimiento ambiental. Cuando la probabilidad de que ocurra la
respuesta es muy baja (por ejemplo que una paloma picote una luz) hay ciertas soluciones para no tener
que esperar a que se d por casualidad, lo que nos llevara mucho tiempo. Una de las soluciones es el
automoldeamiento: hacer primero un procedimiento de CC que empareje el estmulo neutro, como la
tecla iluminada, con algo apetitivo, como la comida. Como ya sabemos la luz pasara tras varios ensayos a
ser un EC que provoca una respuesta por s misma al ser presentada en solitario. Una vez que la luz
provoca la RC, podemos someterla a control operante haciendo que solo aparezca la comida cuando la
paloma la picotea. De esta forma pasa de ser un EC a ser un estmulo discriminativo (Ed) que correlaciona
con el reforzador (la comida) cuando el animal presiona la tecla (respuesta operante). La luz en este caso
tiene doble funcin: es un Ed que seala la ocasin para el refuerzo, y es un EC porque elicita una conducta
condicionada clsicamente.
Hay que tener en cuenta que habitualmente se dan relaciones de interaccin entre CC y CO porque
Aunque analicemos de forma separada las respuestas condicionadas clsicamente de las respuestas
operantes, la influencia de estas contingencias tiene lugar sobre todo el organismo. Diferenciar ambos
tipos de aprendizaje puede entonces parecer algo artificial, pero ha sido necesaria la distincin prctica
para el desarrollo de la investigacin del aprendizaje, adems se ha sugerido que a nivel neurobiolgico
ambos tipos de aprendizaje podran estar mediados por diferentes mecanismos a nivel celular, lo que
seala que el cerebro los procesara de forma diferentes y por tanto seran fenmenos distintos (aunque
esto an se est discutiendo).
CONTINGENCIA
POSITIVA
CONTINGENCIA
NEGATIVA
Refuerzo positivo:
La conducta provoca consecuencias positivas
La conducta
AVERSIVO
Castigo positivo:
La conducta provoca consecuencias negativas
La conducta
Cristina Gil
Tambin hay que tener en cuenta que en el repertorio natural del animal exista la respuesta que queremos
medir. Si no es una conducta habitual en su medio natural, como presionar una palanca, se puede emplear
el moldeamiento o mtodo de aproximaciones sucesivas: reforzar respuestas o conductas que se vayan
aproximando a la respuesta final que queremos medir, y dejar de reforzarlas, es decir extinguirlas, segn
vamos consiguiendo respuestas ms parecidas a nuestro objetivo. Por ejemplo vamos dando comida
primero por permanecer en la caja, luego por acercarse cada vez ms a la zona de la palanca, y al final solo
reforzaremos cuando el animal la presione.
Escape y evitacin
Aqu eliminamos o detenemos un evento aversivo como resultado de una respuesta operante, por tanto la
fuerza de la conducta o respuesta aumenta: es el procedimiento de escape. Cuando en un procedimiento
similar, la respuesta impide que se presente el evento de naturaleza aversiva estamos hablando del
procedimiento de evitacin. En laboratorio es habitual que estos dos procedimientos funcionen de manera
conjunta, y que en principio se aprenda una respuesta de escape y luego de evitacin.
Si por ejemplo al presionar una palanca se detiene una descarga, en primer momento el animal presionar la
palanca cuando nota la descarga para detenerla (escape) y una vez aprenda ese comportamiento, la presionar
continuamente para que la descarga no llegue (evitacin).
Los dos procesos son conocidos como reforzamiento negativo, y en ambos casos la contingencia negativa
que se da, da lugar al fortalecimiento de la conducta.
3.2. DESTINADOS A DISMINUIR CONDUCTAS: CASTIGO Y ENTRENAMIENTO DE OMISIN
Castigo o castigo positivo
Es el procedimiento en el cual se aplica una consecuencia aversiva de forma contingente, es decir como
consecuencia, de la respuesta o conducta, y tiene como resultado una disminucin de la misma. Es decir la
consecuencia aversiva se presenta cuando el sujeto emite la respuesta operante, y no se presenta si no la
emite. En el anlisis funcional de la conducta, el castigo se define por su funcin y esto implica que cuando
el castigo no tiene efectos en la conducta se considera que este no ha ocurrido. Tenemos que sealar que
para poder castigar una respuesta antes ha tenido que ser reforzada, es decir, si pretendemos castigar la
presin de una palanca, para poder observar los efectos del castigo previamente debemos hacer que la
respuesta de presin de palanca ocurra con cierta probabilidad y para ello debemos llevar a cabo
anteriormente un entrenamiento de recompensa de la presin de la palanca. De esta forma el castigo
consistira en la disminucin de una respuesta previamente reforzada debido a la imposicin de una
contingencia de tipo aversivo sobre dicha respuesta.
7
Cristina Gil
Cristina Gil
repitan las conductas que funcionaron en el pasado y que adems el rango de respuestas ante esa
situacin aumente as como que se presenten con ms fuerza.
En el laboratorio, cuando la extincin sigue su curso, las respuestas emocionales comienzan a desaparecer
y la intensidad de la respuesta disminuye. Si el procedimiento es lo suficientemente largo la intensidad o la
tasa de la respuesta suele volver al nivel registrado antes de que la conducta fuese reforzada. A veces se
necesitan varias o muchas sesiones para llegar al nivel de la lnea base. La tasa de respuesta mostrada por
los sujetos durante la sesiones de extincin puede considerarse como un ndice de la resistencia a la
extincin. En contra de lo que cabra esperar, generalmente las respuestas operantes que han sido
reforzadas en pocas ocasiones se extinguen de forma lenta, sin embargo cuando una respuesta ha sido
reforzada en mltiples ocasiones muestra menor resistencia a la extincin, sobre todo cuando en la fase de
adquisicin se ha utilizado un programa de reforzamiento continuo. A este fenmeno se le ha denominado
efecto del sobreentrenamiento en la extincin. Asimismo, la resistencia a la extincin aumenta de forma
importante en el momento en que se utiliza un programa de reforzamiento parcial o intermitente. Se ha
demostrado que con igual nmero de respuestas reforzadas durante la adquisicin, el reforzamiento
intermitente es ms resistente a la extincin que el continuo.
El efecto del reforzamiento parcial se ha tratado de explicar cmo el resultado de dos procesos bsicos
como son el reforzamiento y la discriminacin: podra ser debido a que la discriminacin entre el
reforzamiento y la extincin es ms fcil y rpida si el programa es de reforzamiento continuo que si es
intermitente. Es decir, es ms fcil discriminar la diferencia entre un programa con una tasa estable y alta
de reforzamiento de un programa en el que el reforzamiento no existe (extincin), que entre un programa
de tasa baja e intermitente de reforzamiento y la extincin. Otro factor que podra estar operando es la
generalizacin de la situacin de reforzamiento intermitente a la de extincin, dando esto tambin lugar a
una mayor resistencia al cambio en los programas de reforzamiento intermitente. Por tanto, los factores
de discriminacin y generalizacin anularan el efecto producido por la mayor tasa de reforzamiento de los
programas de reforzamiento continuo, que segn la lgica nos llevara a pensar que a mayor tasa de
reforzamiento mayor resistencia al cambio, y no es as porque muestra una mayor resistencia al cambio los
animales que han tenido reforzamiento intermitente durante la fase de adquisicin. Tambin hay que
tener en cuenta el contacto con las contingencias: no es lo mismo darle a una rata por pulsar una palanca
una bolita siempre que pulsa (reforzamiento continuo) que solo cada 50 veces que la pulse (reforzamiento
parcial), porque en el primer caso con 10 pulsaciones ya tendra 10 bolitas de refuerzo mientras que en el
segundo para tener esas mismas 10 bolitas necesitar 500 pulsaciones.
Otras variables que influyen en la persistencia de la respuesta durante la extincin son la magnitud del
reforzador y la inmediatez de la recompensa empleadas durante la fase de adquisicin. En general,
cuando la magnitud de la recompensa durante la adquisicin es alta y se administra de forma continua
durante los ensayos de adquisicin, la resistencia a la extincin disminuye. Esto no ocurre as, sin embargo,
cuando las recompensas grandes se administran intermitentemente, tal y como sealbamos
anteriormente, como consecuencia del efecto del reforzamiento parcial. As, la resistencia a la extincin
ser baja cuando las recompensas grandes son administradas de forma continua, pero ser alta cuando las
recompensas grandes se administran de forma intermitente. En cuanto a la inmediatez de la recompensa
parece claramente demostrado que cuando la demora en la presentacin del reforzador es baja, es decir,
pasa poco tiempo entre la emisin de la respuesta y la obtencin del reforzador, la resistencia a la
extincin es mayor.
Es muy importante sealar que la disminucin de la respuesta que ocurre como resultado de la extincin
es muy diferente a lo que sucede como consecuencia del olvido. La extincin es un procedimiento en el
9
Cristina Gil
que una respuesta anteriormente reforzada ya no produce reforzamiento pero la posibilidad de emitir la
respuesta sigue disponible. Sin embargo, en el caso del olvido la disminucin de la respuesta ocurre
simplemente debido al paso del tiempo y la posibilidad de emitir la respuesta no est presente. La
extincin no revierte lo ocurrido durante la adquisicin, sino que implica un aprendizaje nuevo que de
alguna forma se superpone al anterior.
Adems de la recuperacin espontnea hay otros tres fenmenos que prueban que la extincin no es
olvido ni desaprendizaje total. La renovacin que en CO consiste en la recuperacin de la respuesta
extinguida en un contexto diferente al que se llev a cabo el procedimiento de extincin. La restauracin
de la conducta que se da cuando se vuelve a situar los sujetos en el contexto original de la extincin. Y el
restablecimiento que es un proceso en el que se puede ver como las respuestas extinguidas vuelven a
aparecer. En este caso, despus de extinguir la respuesta, el sujeto es expuesto de forma no contingente al
reforzador, lo que hace que la respuesta vuelva a aparecer sin que esta d lugar al reforzador.
Cristina Gil
tambin es habitual en los deportistas. Los comportamientos supersticiosos que muestran muchos
deportistas de elite tienen, con frecuencia, su origen en algn tipo de xito con el que esa conducta ha
tenido relacin en el pasado: como la prenda que llevaban cuando ganaron un ttulo y que se ponen
siempre desde entonces.
Herrstein diferencio la forma en que se adquieren determinadas supersticiones humanas estableciendo
principios diferentes para cada una de ellas: por una parte las supersticiones idiosincrticas que estn
motivadas por la experiencia propia anterior con situaciones de reforzamiento, y por otra las
supersticiones sociales tpicas mantenidas en el tiempo, que sugiri que eran un residuo de contingencias
de reforzamiento previas que ya no eran efectivas, pero que en su momento eran de gran relevancia.
4.2. LA DERIVA INSTINTIVA Y EL CONCEPTO DE RELEVANCIA O PERTINENCIA
En el CO existen situaciones en las que se observan relaciones de pertinencia o relevancia entre respuestas
y reforzadores, es decir hay respuestas que son ms difciles de condicionar cuando se utilizan ciertos tipos
de reforzamiento. Thorndike fue el primero en sealar la facilidad o dificultad para condicionar
determinadas respuestas y propuso el trmino de pertinencia, que se refiere a que algunas respuestas se
relacionaran de modo natural con el reforzador como consecuencia de la historia evolutiva del animal, por
lo que sern ms fciles de condicionar que otras dependiendo del reforzador que usemos.
Los Breland, dos estudiantes de Skinner que se dedicaron a entrenar animales, observaron que haba
ciertas respuestas naturales que se presentaban cuando el reforzador empleado era comida y que
competan con las respuestas que requera el entrenador. Llamaron deriva instintiva al desarrollo de estas
conductas relacionadas con la comida, que eran diferentes segn el animal. Por ejemplo los mapaches
tenan que introducir una moneda en una hucha para conseguir comida, pero los animales frotaban las
monedas sin llegar a depositarla.
4.3. LOS CAMBIOS EN LA CANTIDAD Y CALIDAD DE LA RECOMPENSA: EL FENMENO DEL CONTRASTE
CONDUCTUAL
El contraste conductual es un fenmeno, relacionado con la motivacin, que se basa en el hecho de que la
efectividad de un reforzador para controlar una conducta puede verse modificada por la experiencia previa
con el mismo reforzador cuando ste es de una magnitud o calidad diferente. Si aumenta o disminuye el
reforzador, en relacin a lo que percibamos antes, tiene consecuencias en nuestra conducta y emociones.
Los efectos que tienen los cambios en la eficacia del reforzador fueron ilustrados de forma clara por
Mellgren. En su experimento utiliz cuatro grupos de ratas a las que midi la velocidad de la carrera en una
recta. En la primera fase, al grupo A y al B les dio 2 bolitas de comida al llegar al final, mientras que los
grupos C y D recibieron 22 bolitas. En la segunda fase, el grupo A segua recibiendo 2 bolitas, mientras que
el B pas a recibir 22. De la misma forma el grupo C mantuvo su recompensa de 22 bolitas, pero el D pas a
obtener solo 2. Los resultados mostraron que los grupos a los que no se les vari la cantidad de comida
mostraron la misma velocidad; a los que aumentaron la cantidad de comida aumentaron su velocidad; y
los que pasaron de una recompensa grande a la recompensa pequea disminuyeron significativamente su
velocidad. Esto demuestra que los efectos de la recompensa dependen de la experiencia previa con otras
recompensas, y no de su valor absoluto. Las ratas que experimentaron una recompensa ms favorable que
la anterior corrieron ms rpido que las que tenan recompensa grande en ambas carreras, fenmeno
conocido como contraste conductual positivo. Las que recibieron la recompensa desfavorable en la
segunda fase respecto a la primera, corran ms lento que las que siempre haban tenido recompensa
pequea: contraste conductual negativo.
11
Cristina Gil
Tambin se ha propuesto que el fenmeno de contraste puede depender del estado afectivo previo, y
puede mostrarse de forma diferente dependiendo si es negativo o positivo. Por tanto la sensibilidad de un
individuo hacia la ganancia o prdida de recompensas tambin dependera del estado emocional en el que
se encuentre.
4.4. LA CONTROLABILIDAD DE LAS CONSECUENCIAS AVERSIVAS Y EL EFECTO DE INDEFENSIN
APRENDIDA
Martin E. P. Seligman y sus colaboradores descubrieron que cuando los animales son sometidos a
situaciones en las que tienen poco o ningn control, desarrollan una reaccin emocional en la que
manifiestan un comportamiento pasivo ante dichas circunstancias o circunstancias parecidas, y se piensa
que esta reaccin es similar a la depresin humana. Este efecto conductual, denominado indefensin
aprendida, ha sido confirmado en distintas ocasiones, por varios laboratorios y en diferentes especies, lo
que indica lo robusto y general que es el fenmeno.
En estos experimentos, en una primera fase (fase de preexposicin al entrenamiento escape/evitacin)
asignaron grupos de perros a tres condiciones experimentales: en la primera, el grupo de control, si el
animal emita la respuesta requerida poda detener o impedir la presentacin de una descarga, era un
entrenamiento de escape/evitacin. El segundo grupo, el experimental acoplado, reciba las mismas
descargas que el grupo anterior pero en este caso la conducta del animal no tena consecuencias sobre las
descargas. Se utiliz un segundo grupo de control, que estaba confinado en la misma situacin que los
dems grupos, pero no reciba descargas en esta fase. En la segunda fase del experimento (fase de
aprendizaje) todos los grupos de animales fueron sometidos a varios ensayos de entrenamiento
escape/evitacin. Observaron que el grupo acoplado, que haba recibido descargas inescapables durante la
preexposicin, mostraba un aprendizaje escape/evitacin mucho ms lento que los otros grupos. Tambin
demostraron que no haba diferencias entre los grupos de animales sometidos a descargas escapables y los
que no recibieron descarga en la fase de preexposicin.
12
Cristina Gil
Los investigadores concluyeron que el entrenamiento anterior con las descargas inescapables, generaba en
los animales la expectativa de que su conducta no tena ningn efecto sobre las consecuencias aversivas
que experimentaba, ya que aprendan que la aparicin de las descargas era independiente de su conducta.
A esta explicacin del fenmeno se la conoce como la hiptesis de la indefensin aprendida.
Seligman sugiri que el mejor tratamiento para la indefensin es ubicar al sujeto en una situacin en la que
no fuese posible fallar dado que ello generara de nuevo la expectativa de que la conducta toma control
sobre las consecuencias. Son tambin interesantes los estudios que demostraron que la indefensin
aprendida se puede, de alguna manera, prevenir. Seligman llamo inmunizacin al proceso que se
desarrolla cuando un sujeto tiene una primera experiencia con descargas escapables que bloquea el
desarrollo de la indefensin aprendida cuando se presentan descargas inescapables en una fase posterior
4.5. LOS EFECTOS DE LA DEMORA DEL REFORZADOR: EL PROCEDIMIENTO DE MARCADO
Una respuesta es difcil de reforzar cuando la entrega de la recompensa se demora en el tiempo, y muy
fcil reforzar una respuesta o conducta cuando la recompensa o reforzador se entrega inmediatamente. La
demora del reforzamiento ocurre cuando existe un periodo de tiempo entre la respuesta que da lugar al
reforzador y la entrega posterior del mismo. En funcin de las circunstancias, la demora del reforzamiento
puede disminuir o aumentar la conducta, o incluso no modificarla respecto al reforzamiento no demorado.
Adems, el mismo valor de demora puede tener diferentes efectos en funcin de otros parmetros, tanto
de dicha demora como de las condiciones del mantenimiento del reforzamiento. Hay que obtener una
lnea base de respuesta estable a partir de la cual poder observar los efectos de la presentacin demorada
del reforzador. Cuando la lnea base es estable y se impone una demora, normalmente esta da lugar a una
reduccin de la respuesta, sin embargo, incluso en estas condiciones no siempre eso es as, ya que en un
primer momento incluso puede ocurrir un aumento. Se trata de un proceso dinmico resultado de las
acciones directas o indirectas de distintas variables en la conducta. Una forma de evitar los efectos de la
demora en la entrega del reforzador consiste en marcar la respuesta haciendo que esta pueda
diferenciarse de otros eventos que ocurren durante el periodo de demora. La presentacin de un estmulo
contingente a la respuesta convierte esa respuesta en un evento significativo, es el procedimiento de
marcado.
En el experimento los animales se asignan a dos grupos por azar: grupo marcado (experimental) y grupo no
marcado (control). Si los animales pasaban por el brazo lateral negro del dibujo inferior, reciban comida en la
caja meta. En el momento en que elegan por qu brazo pasar, los animales del grupo marcado eran trasladados
a la caja de demora, pero a los del grupo control se les abra la puerta del brazo y les dejaban pasar libremente.
Los sujetos del grupo marcado mostraron un mayor nmero de elecciones correctas a lo largo de los ensayos.
La explicacin que dieron los autores a estos resultados es que la manipulacin de los animales posterior a
la respuesta de eleccin provoca un marcado de la respuesta de eleccin en la memoria de los sujetos y
que esto hace ms probable recuperar esta respuesta cuando los sujetos reciben la recompensa despus
de la demora.
13
Cristina Gil
14