Vous êtes sur la page 1sur 15

Psicologa del aprendizaje

Cristina Gil

TEMA 7: CONTROL AVERSIVO EN EL CONDICIONAMIENTO


OPERANTE
1. ESTIMULACIN AVERSIVA EN EL CO
1.1. Procedimientos de CO
Si clasificamos los procedimientos de CO segn su influencia sobre la conducta, ya sabemos que cuando
tiene como resultado un aumento de la probabilidad de emisin de la conducta se denomina
reforzamiento, y cuando reduce su probabilidad de denomina castigo.
Se puede aumentar la clasificacin segn la relacin de contingencia entre la respuesta y la consecuencia, y
la naturaleza de dicha consecuencia (apetitiva o aversiva). Cuando la correlacin es directa la contingencia
ser positiva, mientras que cuando es inversa ser denominada contingencia negativa. As tenemos los
cuatro procedimientos:

APETITIVO

AVERSIVO

Refuerzo positivo o entrenamiento de


recompensa

Castigo positivo o castigo

CONTINGENCIA
La conducta provoca consecuencias
POSITIVA
positivas (reforzador)
La probabilidad de emisin de la
conducta aumenta
Entrenamiento de omisin o castigo
negativo
CONTINGENCIA La conducta provoca la no aparicin o
retirada de algo bueno.
NEGATIVA
Reduce la probabilidad de emisin de la
conducta
Reforzamiento diferencial de otras
conductas.

La conducta provoca consecuencias


negativas, aversivas
Reduce la probabilidad de emisin de la
conducta
Reforzamiento negativo o entrenamiento
de evitacin/ escape
La conducta provoca la no aparicin o
retirada de una consecuencia aversiva
La probabilidad de emisin de la conducta
aumenta

La distincin entre estos procedimientos no es tan sencilla en nuestro ambiente natural. Si, por ejemplo,
en una calurosa tarde de julio encendemos el aparato de aire acondicionado, estaramos ante un caso de
reforzamiento negativo (el sujeto escapa del calor como estmulo aversivo) o positivo (reforzado por la
aparicin del fro)? Hineline defendi que no existe simetra absoluta entre el reforzamiento positivo y
negativo. Cuando un evento requiere de la emisin de una respuesta para su desaparicin, sta debe
producirse en su presencia. Sin embargo, las respuestas reforzadas positivamente tienen que emitirse
necesariamente antes de la aparicin del refuerzo.

1.2. Castigo, escape y evitacin


En un entrenamiento de escape la consecuencia aversiva est presente y no desaparece hasta la emisin
de la conducta operante. La operante, por tanto, es reforzada por la supresin del evento aversivo que
estaba en curso.

Psicologa del aprendizaje

Cristina Gil

En laboratorio las preparaciones de escape incluyen tanto respuestas locomotrices, en las que el sujeto se
desplaza fuera del lugar donde se halla el estmulo aversivo, como respuestas manipulativas que
interrumpen la emisin del estmulo. Generalmente la tcnica de desplazamiento consiste en pasar de un
compartimento a otro, en una caja doble dnde se electrifica uno de ellos, o correr a lo largo de un
corredor en una caja de salida y meta, dnde la salida y el corredor estn electrificados pero la meta no.
En la tcnica de manipular suelen consistir en accionar una palanca o picar una tecla.
En un entrenamiento de evitacin el sujeto es expuesto a la presentacin peridica de una consecuencia
aversiva, y la emisin de la operante impide o retrasa su aparicin. La diferencia con la anterior es que aqu
la operante no se emite mientras el estmulo aversivo se encuentra presente (ej. dar a la palanca para que
pare la descarga, sera escape) sino antes de que haya aparecido (ej. dar a la palanca antes de que llegue la
descarga para evitarla, que sabes que va a llegar porque la has sufrido antes) Existen diferentes variantes
de este procedimiento, que se explican ms adelante.
Respecto al castigo todos los procedimientos tienen el efecto de reducir la conducta a la que se aplica. Sin
embargo en un entrenamiento de omisin, la conducta del sujeto no mantiene ninguna relacin con la
aparicin de estimulacin aversiva (recordad que era omitir o retirar algo bueno). Por eso cuando
hablamos de castigo, nos referimos al castigo positivo, es decir a los procedimientos en los que la conducta
va seguida de la aparicin de un estmulo (consecuencia) aversivo.
Para poder aplicar un procedimiento de castigo a una conducta es necesario que sta se emita con cierto
grado de probabilidad, lo que determina su estudio en el laboratorio. La mayora de las preparaciones
experimentales empiezan con una fase previa en la que se refuerza la emisin de alguna conducta, para
poder aplicar castigo a esa misma respuesta en una fase posterior. El grado en el que se ve suprimida dicha
respuesta se considera un ndice de la efectividad del castigo. Como estmulos aversivos suelen utilizarse
ruidos fuertes o descargas, aunque la variedad es muy amplia.
Mediante los procedimientos de reforzamiento negativo (escape y evitacin) aumentamos la probabilidad
de la operante, mientras que con el castigo la reducimos. Sin embargo en ambos casos la conducta del
sujeto es moldeada para reducir al mximo su exposicin a la estimulacin aversiva, es decir, mediante el
aumento de los periodos de seguridad.

1.3. Procedimientos de CO y estados emocionales


El efecto elicitador, propio del condicionamiento clsico, de un EC o un EI no desaparece cuando est
funcionando como consecuencia en una contingencia operante.
Podemos reforzar una respuesta haciendo contingente su emisin con la aparicin de un EI apetitivo (o un
EC excitatorio apetitivo). Si este procedimiento aumenta la probabilidad de emisin de dicha respuesta,
podemos catalogarlo como reforzamiento positivo, y considerar por tanto que el EI o EC ha funcionado
como reforzador. La funcin del EI como reforzador no reemplaza ni su capacidad como elicitador de RI ni
su capacidad para condicionar otros eventos con los que mantenga contingencia y contigidad.
Si una orden como sintate la reforzamos con comida, convertimos la orden en un Ed+ para la conducta
de sentarse de nuestra mascota, pero adems, el uso de comida como consecuencia provocar la
salivacin del sujeto y convertir a los eventos antecedentes (la respuesta, la orden y hasta la persona que
la emite) en EC excitatorios apetitivos. Lo que hacen es cumplir otras funciones, adems de reforzador,
dentro de otras contingencias, como en este caso un condicionamiento clsico excitatorio apetitivo.

Psicologa del aprendizaje

Cristina Gil

Adems de esa RI especifica (como la salivacin producida por la comida) los estmulos elicitadores
provocan en los sujetos estados emocionales, estados que pueden asociarse al resto de los eventos
antecedentes (convirtindolos en ECs). Por regla general, suele considerarse que los EI apetitivos provocan
alegra, mientras que los aversivos generan miedo. El efecto emocional de los ECs suele etiquetarse as:
ECs excitatorios apetitivos suele etiquetarse como esperanza
ECs excitatorios aversivos como ansiedad
ECs inhibitorios apetitivos generan estados como tristeza
ECs inhibitorios aversivos como alivio
Por eso un entrenador que suela utilizar procedimientos de refuerzo positivo, no slo funciona como
discriminativo para segn qu conductas, sino que adems elicita un estado emocional parecido a la
alegra (esperanza o ilusin). En otras palabras, los eventos presentes durante el refuerzo, incluidos los
estmulos propioceptivos generados por nuestro comportamiento (que tambin se convierten en ECs), nos
hacen sentir bien, y por las mismas razones, no nos gustan los eventos presentes durante el castigo.
Podramos concluir que tanto los Ed+ (para respuestas reforzadas negativamente) como las conductas de
evitacin o escape generan estados de alivio en los sujetos, mientras que tanto los Ed- (para respuestas
castigadas) como las propias conductas castigadas producen estados de ansiedad. Pero, an ms
importante, la presencia de un EI aversivo provoca miedo, y esta poderosa reaccin es algo que hay que
tener siempre en cuenta para predecir el efecto del procedimiento que estamos usando.
El castigo tiene efectos emocionales que inhiben la conducta apetitiva y cualquier operante en general. Se
ha demostrado experimentalmente que, aunque la estimulacin aversiva independiente de la respuesta
pueda producir cierta supresin de la conducta instrumental, se da una supresin significativamente mayor
de la conducta si la estimulacin aversiva se produce por la ejecucin de la respuesta instrumental. Por
tanto es mucho ms eficaz para suprimir una conducta cuando la estimulacin aversiva es producida por la
respuesta que si es independiente de ella.
La Teora de la respuesta emocional condicionada propuesta por Estes es la ms relevante para explicar el
efecto en la conducta de los procedimientos de castigo. La idea bsica es que un EC excitatorio aversivo
provoca ciertas respuestas emocionales (como la paralizacin) por el hecho de estar emparejadas con una
descarga. Esas respuestas emocionales condicionadas son incompatibles con la respuesta de presin de
palanca (la rata no puede quedarse paralizada y al mismo tiempo presionar la palanca). Por tanto, la tasa
de presin de la palanca se suprime durante las presentaciones del EC. Pero los procedimientos de castigo
no suelen incluir, a diferencia del experimento de supresin condicionada, un EC explicito que seale que
va a darse la descarga. Estes sugiri que cumplen esta funcin diversos estmulos (visuales, tctiles y
propioceptivos) que el sujeto experimenta antes de dar la respuesta castigada, como los Eds, la postura de
su propio cuerpo antes de responder, la visin de la palanca, etc.

Psicologa del aprendizaje

Cristina Gil

2. CONDUCTA DE EVITACIN
La conducta de evitacin ha recibido mayor atencin que la de escape por parte de los investigadores
principalmente por dos razones: primero por el reto terico de explicar la aparicin y mantenimiento de
una conducta que tiene como consecuencia la ausencia de un estmulo aversivo; segundo porque ambos
comportamientos pueden simplemente representar extremos de un continuo que sera el reforzamiento
negativo.
Bechterev llev a cabo un estudio con humanos en el que pretendan asociar un estmulo neutro (futuro
EC) a una descarga (EI). Los sujetos inicialmente levantaban de forma refleja el dedo (RI) de la placa
metlica al recibir la descarga, pero despus de pocos ensayos empezaron a hacerlo (RC) tras la aparicin
del estmulo designado como EC, no recibiendo la descarga programada. Este experimento se consider de
aprendizaje asociativo hasta que algunos autores lo repitieron con animales no humanos y, lo ms
importante, aadiendo un grupo de control en el que el EI se presentaba en todos los ensayos
independientemente de la respuesta del sujeto. Los resultados mostraron que en el grupo experimental,
el que poda evitar la descarga, tanto la velocidad de adquisicin como la ejecucin de la supuesta RC eran
mucho mayores. Esto demostr que eran dos conductas diferentes.

2.1. Procedimientos de evitacin


2.1.1. Evitacin discriminada
La evitacin discriminada (o sealada) recibe este nombre debido a la existencia de claves que sealan el
acontecimiento aversivo (frecuentemente una descarga). Esta tcnica utiliza ensayos discretos, con el
consiguiente tiempo experimental e intervalo entre ensayos. Cada ensayo se inicia con la presentacin de
un evento neutro (como una luz o tono) al que se denomina seal, que si seguimos la terminologa
operante va a funcionar como Ed+. Despus, dependiendo de lo que haga el sujeto, hay dos posibilidades:
1. Si el sujeto no emite la respuesta requerida para la evitacin durante el intervalo entre la seal y el
EI aversivo, se presenta el EI programado y se mantiene hasta que la emite, despus de lo cual
tanto la seal como el EI cesan. En este caso, la respuesta instrumental se considerara una forma
de escape, ya que suprime la descarga elctrica en curso. Y, por tanto, este tipo de ensayo se
denomina ensayo de escape.
2. Si el sujeto emite la respuesta requerida, antes de que se presente el EI aversivo, la seal cesa y se
omite el EI en ese ensayo. Este s se considerara un ensayo de evitacin con xito.
Durante los primeros momentos del entrenamiento, la mayora de los ensayos son de escape, segn se va
desarrollando el entrenamiento empiezan a predominar los ensayos de evitacin, y por tanto, las
respuestas de evitacin.
En un ensayo de este tipo se barajan tres elementos: la seal de aviso, la respuesta operante y la
consecuencia aversiva, con sus contingencias entre ellos:
Contingencia Respuesta-Seal de aviso. La emisin de la respuesta operante conlleva la desaparicin de
la seal de aviso, lo que convierte su relacin en una contingencia de escape.
Contingencia Respuesta-Consecuencia. Aunque inicialmente se produce una contingencia de escape
(dar la respuesta implica hacer desaparecer la descarga que est producindose), cuando el
entrenamiento est ms avanzado la contingencia ser de evitacin (realizar a tiempo la conducta
apropiada impide la llegada de la consecuencia aversiva).
Contingencia Seal de aviso-Consecuencia. La contingencia entre estos dos eventos ambientales
tambin vara dependiendo (como hemos visto anteriormente) de la respuesta del sujeto. En los
4

Psicologa del aprendizaje

Cristina Gil

primeros momentos del procedimiento, antes de que el sujeto adquiera la respuesta de evitacin, la
seal de aviso y la consecuencia aversiva ocurren conjuntamente. Sin embargo, cuando el sujeto
consigue evitar con su respuesta la descarga programada, hace que se rompa esta contingencia, de
manera que ahora aparece nicamente la seal de aviso, pero no la consecuencia. Esto implica que
durante los ensayos de escape se produce un condicionamiento excitatorio aversivo entre la seal y la
descarga, condicionamiento que se somete a extincin en los ensayos de evitacin, en los que la seal
adquiere la funcin de Ed+ para la conducta de evitacin.
Un efecto muy robusto que se ha encontrado en la adquisicin de la conducta de evitacin discriminada es
la elevada cantidad de ensayos que requiere. Una misma conducta, como presionar una palanca, se
adquiere en muy pocos ensayos cuando es un procedimiento de reforzamiento positivo, y sensiblemente
ms lento cuando hay que adquirir esa misma respuesta como evitacin de una descarga. Algunos autores
explican esta diferencia como resultado de la interferencia de la conducta elicitada por la seal (la parlisis)
en la emisin de la operante requerida. Otros apuntan a que puede deberse a la especificidad de la
conducta de evitacin/escape en funcin de la especie. Para evitar una descarga corriendo por un
corredor, las palomas necesitaban unos 120 ensayos mientras que las ratas dos o tres para saltar de una
plataforma, lo que indica que la eleccin de la operante que se pretende reforzar determina el tiempo
necesario para adquirirla: cuanto ms se asemeje a la respuesta elicitada especfica de la especie mayor es
la velocidad de aprendizaje.
Se han propuesto diferentes teoras para explicar el efecto que el entrenamiento de evitacin discriminada
tiene sobre los individuos. La primera y ms influyente es la Teora Bifactorial de Mowrer, y est motivada
por la paradoja de que una conducta pueda ser reforzada por la ausencia de un evento. Sostiene que en el
aprendizaje de evitacin estn implicados dos procesos interdependientes: el condicionamiento clsico de
miedo al EC y el reforzamiento operante de la respuesta de evitacin a travs de la reduccin del miedo.
Este reforzamiento no es posible hasta que el miedo se condiciona al EC. En definitiva, desde esta posicin
se explica la conducta de evitacin en trminos de escape del miedo condicionado, ms que en trminos
de prevencin de la descarga. Es decir, la operante se refuerza por la reduccin del miedo (o
ansiedad) generada por el EC (seal), y no por impedir la aparicin del EI (descarga). Es como una
interaccin constante entre CC y CO con cambios cclicos en las repuestas de evitacin:
1. La seal se condiciona de forma excitatoria aversiva mientras el sujeto no emite la respuesta de
evitacin (ya que aparece el EI)
2. El sujeto emite la respuesta para escapar del miedo generado por el EC, impidiendo la aparicin del
EI y provocando que la funcin del EC se extinga (al no aparecer el EI)
3. Una vez se extingue el EC deja de emitir la respuesta, volviendo a presentarse el EI (lo que nos lleva
de nuevo al punto 1).
Sin embargo, el uso del miedo como una variable intermediaria en el aprendizaje de la evitacin ha sido
criticado por innecesario. Schoenfeld formul otra teora sobre la evitacin discriminada en la que no
apareca este concepto. Este autor propuso que la seal adquiere, por condicionamiento clsico, funciones
de consecuencia aversiva secundaria o condicionada. Los animales en la situacin de evitacin no pueden
huir de la descarga porque no est presente; lo que emiten es una respuesta de escape reforzada por la
retirada de la seal de aviso. As, en realidad la evitacin sera una situacin de reforzamiento negativo
secundario o condicionado. Aunque ambas teoras se basan en la interpretacin de la conducta de
evitacin discriminada como una forma de escape ante la seal, Schoenfeld no considera necesario aludir
al efecto emocional en proceso.
5

Psicologa del aprendizaje

Cristina Gil

2.1.2. Evitacin no discriminada de operante libre de Sidman


En estos procedimientos la descarga se programa para que ocurra peridicamente, sin aviso, (cada 10 seg
por ejemplo). Se establece como respuesta de evitacin una determinada conducta, y la aparicin de esta
respuesta impide la administracin durante un periodo fijo (30 seg, por ejemplo) de la descarga
programada. Los individuos aprenden a evitar las descargas aun cuando no existe un estmulo de aviso.
Aqu se permite que las respuestas de evitacin se den en cualquier momento, ya que, ocurran cuando
ocurran, reinician el intervalo R-EI. Por esta razn se denomina a este tipo de evitacin de operante
libre. Este procedimiento se construye a partir de dos intervalos de tiempo:
Intervalo E-E, Er-Er, o Reloj choque-choque: es el intervalo entre las descargas en ausencia de una
respuesta.
Intervalo R-E, R-Er, o Reloj respuesta- choque: que es el intervalo entre la respuesta y la descarga
programada, es decir, el perodo de seguridad.
Los resultados que se obtienen presentan ciertas diferencias respecto a la evitacin discriminada:
1. Implican generalmente perodos mucho ms largos de entrenamiento que los experimentos de
evitacin discriminada.
2. Con frecuencia, aun despus de un entrenamiento extenso, los animales no aprenden nunca a
evitar todas las descargas.
3. Distintos sujetos a menudo se diferencian enormemente en la forma de responder ante el mismo
procedimiento de evitacin de operante libre.
Entre las hiptesis explicativas destacan dos. La primera de ellas es la Hiptesis Propioceptiva de Sidman
Esta hiptesis sugiere que el papel de la seal de aviso (no existente explcitamente en este tipo de
procedimiento) lo ocupa la propia conducta del individuo. Todas las conductas que realiza el sujeto en la
situacin experimental (excepto la respuesta instrumental) quedan asociadas a la aplicacin de la
descarga, con lo que en el futuro, cuando el sujeto las est realizando, sufrir una ansiedad comparable a
la del sujeto al que, en un procedimiento de evitacin discriminada, se le presentara la seal de aviso. La
manera de escapar de esa ansiedad es emitiendo la operante reforzada.
Una segunda opcin es la Hiptesis Interoceptivo-temporal de Anger, segn la cual es el paso del tiempo
(a travs de la interiorizacin de los dos intervalos) el que producira la ansiedad que conduce al sujeto a
responder.
Estas dos hiptesis se centran en el escape del EC excitatorio aversivo como explicacin, pero existe otra
teora que seala al reforzamiento positivo como causa de la respuesta observada: la hiptesis de la Seal
de Seguridad. Segn esta teora los estmulos asociados a los periodos de seguridad provocados por la
respuesta de evitacin (fundamentalmente los que son resultado de la retroalimentacin de desplazarse
hacia una zona de la caja, saltar a una plataforma o pulsar una palanca) se convierten en estmulos
condicionados inhibitorios aversivos por su contingencia negativa con la descarga, y acaban funcionando
como un reforzador de la respuesta de evitacin. Ha recibido bastante apoyo emprico. Por un lado se ha
comprobado que aquellos estmulos que se han condicionado de forma inhibitoria aversiva a lo largo de un
procedimiento de evitacin funcionan de forma eficaz como consecuencias apetitivas para otras
conductas. Por otro lado, se ha demostrado que la inclusin de estmulos explcitos (como una luz o un
tono) que sigan a la emisin de la respuesta de evitacin acelera su adquisicin

Psicologa del aprendizaje

Cristina Gil

2.1.3. Evitacin de descarga aleatoria de Herrnstein-Hineline


Los autores de este procedimiento introdujeron a ratas en una caja de Skinner que contaba con una
palanca y dos mquinas dispensadoras de descargas (A y B) conectadas al suelo de rejilla metlica de la
caja (aunque slo una a la vez). Las descargas de cada mquina eran intensas, breves y programadas en
perodos de tiempo irregulares. La nica diferencia entre ambas es que la mquina A las dispensaba segn
un orden ms rpido (mayor frecuencia) que la B. Al principio se conectaba la maquina A, una presin de la
palanca la desconectaba y conectaba la B, que se mantena activa hasta dispensar una descarga, entonces
se volva a conectar A. Es decir ejecutar la operante tena como consecuencia la suspensin del programa
de descargas frecuentes, y activaba el de descargas poco frecuentes, que operaba hasta la siguiente
administracin.
En estas condiciones era posible que inmediatamente despus de accionar la palanca, la mquina B
produjese la descarga. As, el apretar la palanca no prevena necesariamente del estmulo aversivo. Todo lo
que se poda hacer era cambiar las condiciones para decrecer la tasa total de descargas (mantener una
frecuencia baja de administracin de descargas).
Los resultados obtenidos por estos autores mostraron un aumento de la probabilidad de emisin de la
presin de la palanca (conducta de evitacin). Herrnstein explic el reforzamiento de la conducta de
evitacin no tanto como el resultado de omitir o retardar la presentacin de la estimulacin aversiva, sino
como el debido a la reduccin de su frecuencia total o densidad, entendida sta como una contingencia
molar negativa entre las tasas de respuesta y de consecuencias aversivas.

2.2. Variables que afectan al reforzamiento negativo


En general, cuanto mayor es la intensidad de la estimulacin aversiva, mayor es la velocidad de adquisicin
de la conducta reforzada negativamente. En el caso de la conducta de escape, la intensidad tambin
determina de la misma forma la rapidez con la que se emite. Pero hay que tener en cuenta que la
habituacin (en los EI) y la extincin (en los EC) pueden tambin reducir la efectividad de las consecuencias
aversivas, tanto para la adquisicin de conductas (evitacin/escape) como para su supresin (castigo).
Adems de la intensidad de los estmulos aversivos, existen otros parmetros que determinan el
reforzamiento negativo, principalmente en los procedimientos de evitacin libre y de descargas aleatorias.
En el procedimiento de evitacin libre de Sidman la tasa de respuestas est determinada por los intervalos
E-E y R-E. Cuanto mayor es la frecuencia de las descargas en ausencia de respuestas (menor intervalo E-E) y
mayores sean los perodos de seguridad (mayor intervalo R-E), mayor ser la probabilidad de que el animal
aprenda la respuesta de evitacin. Esta relacin tambin se cumple teniendo en cuenta los valores
relativos, es decir, adems de su valor absoluto, el hecho de que el intervalo R-E sea mayor que el E-E
tambin mejora la adquisicin de la respuesta de evitacin.
En la evitacin de descarga aleatoria esta relacin tambin se da, no obstante, hay que tener en cuenta
que, dada la naturaleza del procedimiento, la evitacin no ser nunca absoluta. Es ms, algunas respuestas
pueden ir inmediatamente seguidas de descargas.

3. CASTIGO
Existen diferentes aproximaciones tericas al estudio del castigo, vamos a centrarnos en tres. La primera es
de Thorndike: propuso que el reforzamiento positivo y el castigo implican procesos simtricamente
opuestos, as como el reforzamiento positivo fortalece la conducta, el castigo la debilita. Es decir, las

Psicologa del aprendizaje

Cristina Gil

consecuencias negativas de una conducta debilitan la asociacin entre dicha conducta y los estmulos
presentes en la situacin.
Otra explicacin es la Teora de la respuesta emocional condicionada, explicada en el apartado 1.3
La ltima que vamos a ver es la Teora de las respuestas competitivas reforzadas negativamente Esta
teora explica el castigo en trminos de la adquisicin de respuestas de evitacin incompatibles con la
respuesta castigada. La supresin de la conducta no se considera un reflejo del debilitamiento de la
respuesta castigada, ms bien, se explica en trminos del fortalecimiento de aquellas respuestas
competitivas que evitan eficazmente la estimulacin aversiva.

3.1. Variables que afectan al castigo


El procedimiento bsico en el castigo positivo (recordad, positivo se refiere a la contingencia entre
conducta y consecuencia) consiste en presentar un estmulo aversivo contingente despus de una
respuesta especfica. El resultado esperable del procedimiento es la supresin (reduccin de su
probabilidad de emisin) de la respuesta en cuestin. Para poder aplicar un castigo sobre una determinada
respuesta, su aparicin en ausencia del castigo debe resultar probable. Esta es la visin estndar del
castigo, pero Premack demostr que, al igual que el reforzamiento, el castigo no es absoluto sino relativo.
Ms concretamente, si tras establecer una jerarqua de preferencias, en funcin de la frecuencia en la
ocurrencia de diferentes respuestas, hacemos contingente la emisin de una conducta menos preferida
con el acceso a otra ms preferida, la primera es reforzada. Pero si forzamos al sujeto a emitir una
respuesta tras la emisin de una ms preferida, el efecto es el contrario: la que se emiti en primer lugar
ve reducida su probabilidad de emisin en el futuro, es decir, es castigada.
En los estudios de laboratorio, normalmente en lugar de aplicar castigo sobre alguna respuesta que el
sujeto ya emite con alguna probabilidad, suelen comenzar con la adquisicin de alguna operante mediante
reforzamiento positivo para luego superponer una contingencia de castigo (que suele ser un estmulo
aversivo como una descarga). La mayora de la investigacin sobre el castigo se ha realizado siguiendo este
esquema, lo que implica que: a) no parten de la concepcin relativista de Premack, b) los resultados son la
suma del efecto del castigo y del reforzamiento (ya que se aplican simultneamente).
Estas son las variables de las que depende la efectividad del castigo para suprimir la conducta:
Intensidad del estmulo aversivo: cunto ms intenso, ms eficaz resultar para suprimir las
respuestas, de hecho, en las condiciones adecuadas, puede hacerlo totalmente. Cuando esto pasa y la
respuesta se suprime por completo, puede darse un fenmeno paradjico: que la conducta reaparezca
ms tarde. Esto se debe a que tras la supresin repentina de la respuesta el sujeto deja de tener
contacto con la consecuencia aversiva y, tras un tiempo, la emisin de la misma se realiza cuando la
contingencia de castigo ya no est activa (parecido a la Recuperacin Espontnea tras la extincin)
Inmediatez y demora del estmulo aversivo: La alta contigidad es un elemento favorecedor. Por
ejemplo el aumento del intervalo R- Er produce una menor supresin de la conducta. Aunque hay
datos que indican que los resultados son parecidos independientemente de si el castigo se aplica de
manera demorada o inmediatamente tras la respuesta, parece que, con el tiempo suficiente, el castigo
demorado suprime en menor medida la conducta.
Cambios graduales en la intensidad del estmulo aversivo: La forma en la que se introduce la
consecuencia aversiva es un factor muy importante. Si primero introducimos un aversivo suave y
vamos aumentando gradualmente la intensidad, se producir mucha menos supresin que si
inicialmente utilizamos un castigo de alta intensidad. As, la exposicin inicial a una suave estimulacin
8

Psicologa del aprendizaje

Cristina Gil

aversiva que no altera mucho la conducta reduce los efectos de un castigo intenso posterior. Por el
contrario, la exposicin inicial a una estimulacin aversiva intensa aumenta los efectos supresores de
un castigo suave posterior.
Experiencia previa: Si la fase de reforzamiento previo fue muy larga y el volumen de reforzamiento
muy grande, los efectos del castigo sern menores.
Efectos discriminativos del estmulo aversivo: Si la respuesta se castiga en presencia de un estmulo
discriminativo, pero no cuando el estmulo est ausente, a esto se le llama Castigo Discriminativo (y al
discriminativo estmulo delta o discriminativo negativo). Con una exposicin continuada al
discriminativo, los efectos supresores del castigo se limitan a la presencia de dicho estmulo.
Programa de castigo: El castigo puede suministrarse despus de un nmero fijo de respuestas
(Programa de Castigo de Razn Fija) o variable (Programa de Castigo de Razn Variable), as como
tambin puede programarse la aparicin de la consecuencia aversiva tras la emisin de la primera
respuesta tras un intervalo de tiempo (Programa de Castigo de Intervalo, Fijo o Variable). En trminos
generales, los programas de castigo continuos son ms efectivos que los intermitentes.
Programa de reforzamiento compuesto. Toda tcnica de castigo es una tcnica mixta, ya que castigar
una conducta requiere que esa conducta haya sido reforzada o est siendo reforzada a la vez. As,
podemos encontrarnos estos tres casos:
- Castigo sobre lneas-base apetitivas: aqu actan simultneamente el castigo y el reforzamiento
positivo sobre la misma respuesta.
- Castigo sobre lneas-base defensivas: concurren el castigo y el reforzamiento negativo
(escape/evitacin).
- Castigo sobre lneas-base de extincin: se castiga una respuesta que previamente ha sido reforzada,
pero que en el momento de aplicar el castigo est siendo extinguida.
La eficacia del castigo se ver reducida por la eficacia relativa del procedimiento con el que est
compitiendo (en el caso del reforzamiento positivo y negativo) o aumentada por la eficacia de proceso
de extincin de la misma conducta.

Existencia de una conducta alternativa reforzada. En muchos experimentos, la respuesta castigada es


tambin la nica respuesta que el sujeto puede realizar para obtener un reforzamiento positivo. La
disponibilidad de una fuente alternativa de reforzamiento aumenta enormemente la supresin de las
respuestas producida por el castigo
Manipulaciones motivacionales. Aunque no es un parmetro propio de la contingencia de castigo, se
ha demostrado que su eficacia para suprimir una conducta es mayor si se reduce la motivacin para
realizar esa respuesta

3.2. La eficacia relativa del castigo para suprimir la conducta


Si gritamos y regaamos a nuestro hijo cuando rompe uno de sus juguetes puede que no vuelva a hacerlo.
La reprimenda est funcionando como consecuencia aversiva en este caso, pero slo porque
efectivamente su contingencia positiva con la conducta est reduciendo su probabilidad de emisin futura.
Esta es una cuestin importante, ya que en el lenguaje comn suele utilizarse el trmino castigo sin tener
en cuenta el efecto de la consecuencia sobre la conducta (funcin del estmulo), sino atendiendo
nicamente a aspectos morfolgicos de la misma (topografa del estmulo). Slo podemos hablar de
castigo cuando efectivamente la consecuencia suprime la conducta (lo que implica que, por definicin,
siempre funciona). El uso de supuestas consecuencias aversivas secundarias (como la reprimenda) conlleva
un gran riesgo ya que su topografa no supone necesariamente una funcin concreta. Puede que al
9

Psicologa del aprendizaje

Cristina Gil

reprender al nio (en nuestro ejemplo) no slo no estemos suprimiendo su conducta sino reforzndola. La
reprimenda puede haberse asociado en mayor medida con la atencin (que suele ser un poderoso
reforzador generalizado) que con otros estmulos aversivos (como un azote).
Los primeros trabajos experimentales sobre el castigo (aos 30-40) concluyeron que su capacidad para
modelar la conducta no slo era muy reducida sino tambin poco estable en el tiempo. Tuvieron que pasar
ms de treinta aos desde esas primeras afirmaciones para que otros trabajos experimentales defendieran
lo contrario. Desde entonces, la investigacin sobre el castigo ha demostrado que con los parmetros
adecuados la conducta puede ser suprimida de manera absoluta y en muy pocos ensayos, pero tambin
que si no se controlan estos parmetros la supresin puede no ser total y/o reaparecer la conducta en el
futuro.
En definitiva, el uso del castigo conlleva ventajas y desventajas que hay que valorar antes de su puesta en
prctica como tcnica para la supresin de la conducta. Por un lado, provoca una reduccin de la conducta
a corto y largo plazo, pero, sobre todo, con un alto grado de inmediatez. Adems, esta reduccin
demuestra una alta resistencia a un posterior recondicionamiento. Pero, por otro lado, genera una serie de
efectos colaterales que pueden no ser deseables, tales como ansiedad, agresin, neurosis o una
redistribucin no prevista de la conducta del sujeto.
En una contingencia operante los eventos antecedentes que mantienen una contingencia positiva con el
castigo de una conducta se convierten en Eds para esa conducta, pero tambin en ECs excitatorios
aversivos, cuyo efecto es elicitar un reflejo al que suele denominarse ansiedad. Por tanto, cuando
aplicamos algn procedimiento de castigo, la intensidad del estmulo aversivo determina la efectividad del
procedimiento pero tambin aumenta las probabilidades de que el contexto ambiental en el que se est
aplicando adquiera la capacidad de provocar ansiedad en el sujeto. Este ambiente, susceptible de
convertirse en ansigeno, puede ser muy amplio, abarcando desde el lugar dnde se aplica el castigo hasta
el propio agente que lo aplica, como a estmulo propioceptivos del sujeto A esta cantidad y diversidad de
eventos condicionables hay que aadir la posibilidad de que el efecto se extienda a otros estmulos que
nunca estuvieron presentes, a travs de fenmenos de generalizacin. El resultado es que con el uso
extendido del castigo, sobre todo cuando se utilizan consecuencias de magnitudes elevadas, se corre un
riesgo considerable de ampliar los estmulos generadores de ansiedad para el sujeto, con el consiguiente
desarrollo de trastornos del comportamiento.
La presencia de eventos ansigenos suele disminuir la tasa general de respuesta operante, provocando que
ciertas conductas, que en ausencia de estos estmulos se emitiran con una alta probabilidad, no
aparezcan. Esta redistribucin no deseada del comportamiento no solo produce la supresin de ciertas
conductas sino tambin el aumento de tasa de otras.
Por otro lado, podemos suprimir una conducta mediante castigo, pero de esa forma no alteramos una
importante variable causal: su motivacin (privacin/saciedad). En estos casos es altamente probable que
aparezcan otras respuestas (ya existentes en el repertorio del sujeto o fruto de la variacin conductual) y
que stas sean reforzadas por la consecuencia que reduce el estado de privacin. Por ejemplo, podemos
suprimir mediante castigo que un nio nos interrumpa cuando hablamos con otro adulto, pero puede que
se fortalezcan otras respuestas como pegar a su hermano pequeo o subir a un lugar peligroso (conductas
reforzadas por nuestra atencin).

10

Psicologa del aprendizaje

Cristina Gil

El ltimo efecto colateral sera la agresin. Como hemos visto, la propia presentacin de estimulacin
aversiva (en funcin del contexto, la intensidad, la especie, etc.) puede generar agresin como respuesta
refleja, lo que suele denominarse como agresin elicitada. Cuando se sita a dos organismos juntos y se
les aplica estimulacin aversiva suelen atacarse entre ellos, fenmeno que se ha encontrado en multitud
de especies, incluida la humana. La agresin tambin puede ser operante. Cuando la presencia de un
organismo (el domador, el adiestrador, o el educador, por ejemplo) correlaciona con la presentacin de
estimulacin aversiva, la agresin dirigida hacia ese organismo puede verse reforzada como conducta de
escape/evitacin si llega a suprimir dicha estimulacin.

3.3. Fenmenos paradjicos en el castigo


3.3.1. La conducta masoquista
El Ed- asociado al castigo est muy relacionado con algunas situaciones en las que ste no es eficaz para
suprimir la conducta. La bsqueda del castigo puede aparecer en una situacin en la que el reforzamiento
positivo slo est disponible cuando se castiga la operante. En tales circunstancias, el castigo puede
convertirse en una seal, o estmulo discriminativo, para la disponibilidad del reforzamiento positivo. Por
ejemplo si a un nio que hace algo malo, tras una reprimenda se le dan muestras de cario, del que
normalmente esta privado, aunque se presente estimulacin aversiva contingentemente a la conducta el
resultado es un aumento de la tasa, en lugar de una reduccin.
Otra forma de adquirir esta conducta masoquista es mediante el contracondicionamiento de la
consecuencia aversiva. Si condicionamos un estmulo (un EC o un EI) asocindolo a otro con un efecto
inverso pero ms fuerte podemos cambiar el tipo de respuesta elicitada por dicho estmulo y, por tanto, su
funcin cmo reforzador o consecuencia aversiva. Por ejemplo, podemos empezar emparejando descargas
de poca intensidad (EI aversivo) con mucha comida (EI apetitivo de mayor intensidad) para ir
paulatinamente aumentando las descargas y disminuyendo la comida. As la descarga terminar
adquiriendo propiedades de EC excitatorio apetitivo, lo que le convertir en un reforzador para las
conductas operantes, y su presentacin contingente funcionar como reforzamiento positivo en lugar de
como castigo.
3.3.2. Crculo vicioso
Cuando se entrena una conducta de escape (por ejemplo saltar al otro compartimento de la caja
lanzadera) ante un evento aversivo (una descarga, por ejemplo), el propio evento adquiere funciones
discriminativas positivas para esa conducta. Es decir, una vez se ha adquirido la conducta de escape, la
presencia del estmulo aversivo aumenta las probabilidades de emisin de dicha conducta. Esto implica
que el uso de dicho estmulo como consecuencia aversiva para esa conducta (en un procedimiento de
castigo) no tendr como efecto la supresin de la respuesta sino todo lo contrario. A este fenmeno,
efecto de utilizar un discriminativo positivo como consecuencia aversiva para la misma conducta, se le
denomina crculo vicioso.

3.4. Otras estrategias de supresin de conducta


3.4.1. Entrenamiento de omisin
El entrenamiento de omisin consiste en establecer una contingencia negativa entre una determinada
respuesta y la administracin de un reforzador. En trminos probabilsticos diramos que la probabilidad de
que se presente un reforzador es menor si el sujeto emite la respuesta que si no la emite. As, la forma que
tiene el sujeto de conseguir el reforzador es omitiendo (no dando) la respuesta, ya que si la emite no se

11

Psicologa del aprendizaje

Cristina Gil

presenta el reforzador que habra aparecido si no hubiera respondido. Este procedimiento, como ya
sabemos, resulta en una disminucin de la tasa de respuesta.
Se puede establecer un paralelismo entre el entrenamiento de omisin y la evitacin de Sdiman: en ambos
hay contingencia negativa, y en ambos hay intervalos entre consecuencias y tambin entre respuesta y
consecuencia. El intervalo consecuencia- consecuencia (E-E) nos indica la frecuencia con la que se van a
presentar las consecuencias cuando el sujeto no emite la respuesta. Por contra, el intervalo respuestaconsecuencia nos indica el tiempo que va a transcurrir entre que el sujeto emite la respuesta y el retraso
aadido en la presentacin de la prxima consecuencia.
Para que se produzca aprendizaje en los procedimientos de entrenamiento de omisin, es decir, para que
desaparezca la respuesta con la que estamos trabajando, los intervalos de presentacin de la consecuencia
en ausencia de respuestas (intervalos E-E) deben ser de menor duracin que los de entrega de la
consecuencia tras la respuesta del sujeto (intervalos R-E). Se debe empezar por valores pequeos del
intervalo R-E, para, paulatinamente y teniendo en cuenta la ejecucin del sujeto, ir aumentado el criterio
de pausa.
El entrenamiento de omisin tiene como efecto inmediato sobre la tasa de conducta un mantenimiento
residual de la respuesta. Se sigue observando durante un plazo de tiempo relativamente corto una tasa
pequea de respuestas motivadas por la presencia del propio reforzador. Esa tasa residual acaba por
desaparecer a largo plazo, llegando a la total eliminacin de la conducta y a una extrema resistencia al
recondicionamiento.
3.4.2. Modificacin de la fuerza de las conductas alternativas
Cualquier comportamiento, por simple que sea, es una conducta de eleccin, siempre hay alguna
alternativa de comportamiento posible.
Recordando lo que vimos sobre la conducta de eleccin, podemos manipular desde el intervalo R-Er
(demora del reforzamiento) de las alternativas, variables relacionadas con la consecuencia como la
intensidad, la calidad o la cantidad. En definitiva, cualquier modificacin que convierta a la alternativa en
ms atractiva reducir la probabilidad de emisin de la conducta objetivo.
Otra forma de suprimir una determinada conducta relacionada con lo anterior es fortaleciendo alguna
respuesta cuya emisin sea incompatible con la anterior. Existen respuestas que son topogrficamente
contrarias, no se puede subir y bajar al mismo tiempo, ni chillar y estar callado, etc. Si reforzamos una
conducta (R1) que no puede emitirse a la vez que otra (R2) inevitablemente reduciremos la tasa de
conducta de sta ltima (R2). Por ejemplo, podemos suprimir la conducta de levantarse del asiento
durante una clase aplicando un procedimiento de castigo (cada vez que se levanta se le reprende), pero
podemos obtener el mismo efecto reforzando la conducta de estar sentado.
3.4.3. Extincin
Otro procedimiento alternativo al castigo es extinguir la propia operante. Romper la contingencia positiva
respuesta-consecuencia (en las conductas reforzadas positivamente) o la contingencia negativa respuestaconsecuencia (en las reforzadas negativamente, entrenamiento de evitacin/escape) en presencia de los
respectivos discriminativos resultar en un descenso de la operante (frente a estos discriminativos).
Extinguir el control de los Eds+ es muy eficaz para suprimir la operante, pero requiere identificarlos y tener
control sobre ellos. La extincin, como ya sabemos, no es desaprendizaje ni olvido, es un nuevo
aprendizaje que sustituye al anterior siempre que se mantengan determinadas circunstancias. Un cambio
en el contexto (respecto al que ha estado presente durante la extincin), un tiempo sin contacto con el
12

Psicologa del aprendizaje

Cristina Gil

discriminativo extinguido, incluso la exposicin al reforzador (sin que se haya emitido la operante), pueden
provocar la restauracin de la capacidad de control de los discriminativos que habamos extinguido y, por
tanto, la emisin de la conducta que habamos suprimido.
3.4.4. Modificaciones motivacionales
Que una determinada operante se emita a una tasa alta se debe, al menos, a la interaccin de variables
como el estado motivacional, la historia de reforzamiento y castigo del sujeto, y la estimulacin presente
en ese momento, todo ello eventos anteriores a la propia emisin de la conducta. La manipulacin de
cualquiera de estas variables por separado puede reducir por s misma la fuerza (probabilidad de emisin)
de dicha operante.
La motivacin es un constructo que suele referirse, en trminos generales, a la fuerza de una determinada
conducta, y dicha fuerza depende de todo lo que acabamos de nombrar. La motivacin suele
operativizarse principalmente atendiendo o bien al grado de privacin/saciedad respecto al reforzador, o
bien al valor del propio reforzador. En situaciones de reforzamiento negativo o de castigo, el concepto de
motivacin est relacionado casi exclusivamente con el valor del estmulo aversivo (intensidad, grado de
habituacin, etc.).
Es posible suprimir una conducta sin aplicar el castigo mediante la manipulacin de variables relacionadas
con la motivacin. Si una conducta se emite es porque en algn momento ha sido reforzada, y si
identificamos el evento responsable de su mantenimiento podemos reducir su emisin saciando al sujeto
respecto a ese reforzador. Si a una paloma la damos comida cada vez que pulsa una tecla, y despus la
dejamos acceso libre a la comida, de forma que este saciada cuando la ponemos delante de la tecla, la tasa
de respuesta bajara.
Si una conducta est siendo mantenida por reforzamiento secundario podemos reducir su tasa de emisin
saciando al sujeto respecto al reforzador primario del que depende el secundario. En otras palabras, una
sobreexposicin al EI con el que se condicion el EC reduce la capacidad reforzante del EC.
Tambin podemos devaluar el reforzador primario (EI) para reducir la tasa de respuesta, asocindolo por
ejemplo a un estmulo aversivo. En el caso de un reforzador secundario (EC) podemos anular su capacidad
reforzante a travs de la extincin (ya sabis, lo presentamos muchas veces solo sin emparejarlo al EI) y el
contracondicionamiento (cambiarle de signo positivo a negativo).
La saciedad y la extincin no son efectivos cuando estamos ante conductas mantenidas con reforzadores
secundarios generalizados. Consideramos a un reforzador secundario como generalizado cuando se ha
condicionado con diferentes reforzadores (primarios y/o secundarios). Dos de los ejemplos ms claros son
el dinero, que esta emparejado con multitud de reforzadores primarios y secundarios, y la atencin (de
otros individuos) que tambin asociamos a proteccin, contacto con otros, comida El efecto de estos
reforzadores generalizados sobre la conducta no depende de una nica privacin ni de su contingencia con
un solo evento, lo que les convierte en muy resistentes a la saciedad y a la extincin. (ejemplo: aunque
estemos muy saciados de ropa y comida, el dinero est relacionado con otros eventos reforzantes).
Una estrategia con la que s podemos disminuir la tasa de una operante sin la presentacin de estimulacin
aversiva, es con la reduccin de la intensidad del reforzador (independientemente de que este sea
primario secundario o generalizado). Cuando se presentan reforzadores menos intensos que los que se han
utilizado en el pasado para mantener la misma conducta, se produce un descenso de la tasa de respuesta.

13

Psicologa del aprendizaje

Cristina Gil

4. PROGRAMAS CONCURRENTES Y ESTIMULACIN AVERSIVA


4.1. Conducta de eleccin
La investigacin de laboratorio sobre la denominada conducta de eleccin se ha llevado a cabo
principalmente mediante el anlisis del comportamiento de los sujetos ante programas de reforzamiento
concurrentes (dos o ms programas simples disponibles a la vez)
Desde los primeros trabajos en esta lnea se comprob que la eleccin de los sujetos, medida como la
localizacin de sus respuestas en una u otra opcin, en funcin de la frecuencia relativa de reforzamiento
de cada una de las alternativas disponibles.
Los resultados de estos experimentos llevaron a definir la denominada Ley de Igualacin: (B1/B2) = (r1/r2),
donde 1 se refiere a una de las alternativas y 2 al sumatorio, B son las elecciones, y r el valor del reforzador
(frecuencia, principalmente, aunque tambin puede ser magnitud o calidad).
4.1.1. Eleccin y reforzamiento negativo
Baum comprob cmo se ajustaba la Ley de Igualacin a la conducta controlada por escape, usando
descargas como evento aversivo y el tiempo de estancia en una localizacin de la caja como conducta de
eleccin. El experimento consisti en reforzar con 2 de tiempo fuera y la desactivacin de una descarga de
7-mA a 4 palomas por situarse en el punto A o en el B de la caja. Cada punto aplicaba el reforzamiento bajo
un programa IV diferente que fue varindose: 0.5-8, 0.5-4, 1-2, 2-2, 4-2, 8-2, 8-1, 8- 0.5. El ajuste
de la eleccin de los sujetos a la frecuencia de reforzamiento de cada alternativa fue aumentando a lo
largo del experimento, siendo los datos de las ltimas cuatro semanas los ms tiles para comparar los
resultados con los de experimentos anteriores con reforzamiento positivo. Se comprob que la reduccin
de la tasa de refuerzo negativo funcionaba de la misma forma que la reduccin de reforzamiento positivo.
No obstante, esta conclusin slo es apoyada por dos de las cuatro palomas, ya que el resto mostraron
elecciones contrarias consideradas por los autores como aberrantes.
Hutton, Gardner y Lewis (1978) entrenaron a tres palomas a responder a dos teclas mediante
reforzamiento positivo, para despus mantener esa respuesta en un programa concurrente, primero sin y
luego con periodos de descarga. La fase experimental empez con un programa concurrente IV1- IV1 de 1
minuto sin descarga como reforzador, y luego continu a travs de 8 condiciones en las que se variaba la
frecuencia de reforzamiento de cada alternativa (0.33, 0.11, 0.33, 1.00, 3.00, 9.00, 3.00). Los resultados
mostraron un importante ajuste a la Ley de Igualacin en funcin de la frecuencia relativa de
reforzamiento negativo de cada alternativa. Aunque este ajuste no fue perfecto, al igual que en ciertas
preparaciones con reforzamiento positivo (Myers y Myers, 1977), ya que se observ cierta infraigualacin,
probablemente por la baja discriminabilidad entre pequeas diferencias en las frecuencias.
La replicacin de estos resultados con ratas conlleva una problemtica aadida para conseguir que el
sujeto emita alguna operante mientras es expuesto a la descarga, ya que la respuesta tpica de esta
especie frente a este tipo de estmulos es la parlisis.
4.1.2. Eleccin y castigo
El efecto del castigo en programas concurrentes no ha sido tan estudiado como el del reforzamiento,
aunque se han realizado algunos trabajos que indican que los sujetos son capaces de ajustar su eleccin a
ciertas caractersticas del castigo.
Holz comprob que, aunque la tasa de respuesta general decrece (una vez se ha adquirido por
reforzamiento positivo), la tasa relativa se ajusta a la frecuencia relativa de castigo en cada alternativa.
14

Psicologa del aprendizaje

Cristina Gil

Deluty ( llev a cabo un experimento en el que entren a tres ratas a presionar la palanca mediante una
consecucin de programas concurrentes IR-IR (Intervalo aleatorio, similar al IF pero con un grado de
probabilidad del refuerzo), pasando de 15-15 a 30-30, 1-1 y terminando en 1.5-1.5, intervalo que se
sigui usando para mantener la respuesta. Tras este entrenamiento se aadi a cada alternativa otro
programa IR pero de castigo. De esta manera, cada alternativa ofreca la misma frecuencia de
reforzamiento pero diferente de castigo. Los resultados mostraron que el incremento de la tasa relativa de
castigo en una alternativa reduca la tasa relativa con la que era elegida. Se encontraron efectos muy
similares usando programas mltiples en lugar de programas concurrentes

4.2. Conducta auto-controlada e impulsiva


La conducta auto-controlada, en contraposicin a la conducta impulsiva, se ha concebido tradicionalmente
como la eleccin de la alternativa con mayor valor relativo de reforzamiento pero ms demorada. Esto
implica que se han utilizado programas concurrentes (con dos componentes, principalmente) en los que se
ha manipulado el tiempo entre la emisin de la respuesta y la aparicin de la consecuencia (demora del
reforzamiento), y el valor del reforzador (en cantidad, frecuencia, duracin o calidad), es decir, mediante
contingencias de reforzamiento positivo. Se considera, por tanto, comportarse de manera impulsiva la
eleccin de la alternativa con un reforzamiento de menor valor relativo pero ms inmediato.
El uso o no de estimulacin aversiva no afecta a la conceptualizacin de ambos comportamientos, siempre
que los componentes del programa apliquen un procedimiento de reforzamiento. En concreto, el uso de
procedimientos de reforzamiento negativo conllevara que la conducta impulsiva o auto-controlada sera
una conducta de escape (o evitacin), pero, de la misma forma, se considerara como impulsivo elegir el
escape del evento aversivo con menor valor relativo (menor tiempo de desaparicin del evento aversivo,
menor reduccin de la intensidad del evento aversivo, etc.) pero ms inmediato. Gran parte de los estudios
que han evaluado este tipo de comportamientos se han realizado con humanos y usando ruidos molestos
como evento aversivo, encontrando una mayor proporcin de elecciones impulsivas.
Cuando el procedimiento usado es de castigo, sin embargo, se hace necesario un cambio en la
consideracin del papel de la demora. Se considerara una respuesta impulsiva la eleccin del castigo con
mayor valor (intensidad o duracin) pero ms demorado, mientras que elegir el castigo ms leve e
inmediato se considerara un comportamiento auto-controlado.
En un estudio pionero, evalu la conducta de cuatro ratas expuestas a una situacin de autocontrol que
involucraba procedimientos de castigo. En el primer experimento mantuvo constante la intensidad de la
descarga (0.3 mA) y su duracin (1.0) para ambas alternativas variando su demora de aparicin: 30-30,
30-40, 40-30, 50-5, 5-50, 20-5, 5-20, 20-10, y 10-20. No se encontr ajuste a la Ley de
Igualacin en ningn caso, los sujetos siempre eligieron la alternativa ms demorada (impulsiva).
En el segundo experimento, sin embargo, se manipul la duracin de la descarga. Los sujetos eligieron de
manera consistente las alternativas con menor duracin de descarga, adems, se observ una considerable
infraigualacin. En el tercer y ltimo experimento se manipul tanto la demora como la duracin de la
descarga (estudio de autocontrol). La alternativa 1 ofreca siempre 1 de descarga, mientras que la 2
ofreca 2.
Los resultados mostraron como la preferencia por la alternativa 1 (1 de descarga) iba aumentando en
funcin del aumento de la demora. Es decir, cunto mayor era la demora mayor era el nmero de
elecciones auto-controladas.

15

Vous aimerez peut-être aussi