Vous êtes sur la page 1sur 13

CONDUCTISMO

1. CONDUCTISMO Y ANALISIS CONDUCTUAL


Buena parte de las ideas referentes al aprendizaje de la psicologa moderna arraigan
en la obra de Jhon Watson (1878-1958). Watson fund la escuela de la psicologa del
conductismo. Durante casi 50 aos. La psicologa estadounidense estuvo dominada
por la corriente conductista declarada en el libro de Watson de 1919, Psycbology from
the Standpoint of a Bebaviorist. Watson afirm que la introspeccin (los informes
verbales de sensaciones, imgenes y sentimientos) no constitua un medio aceptable
para estudiar la conducta porque era demasiado subjetiva. Cmo podran verificar los
cientficos la exactitud de esas experiencias privadas? Pero si se rechaza la
introspeccin, Cul debera ser la materia de la psicologa? La respuesta de Watson,
estados de la conciencia como el llamado fenmeno de la espiritualidad no son
verificables de forma objetiva y por esta razn no pueden convertirse nunca en datos
para la ciencias (Watson, 1919, p. 1). Watson tambin defina el objetivo principal de
la psicologa como la prediccin y el control del comportamiento (Watson, 1913, p.
158).
B.F.Skinner (1904-1990) adopt la causa de Watson y extendi su programa. Con el
paso del tiempo, Skinner aceptaba que la evolucin dot a cada especie de un
repertorio de conductas. En especial afirmaba, en su popular libro Ms all de la
libertad y la dignidad (1972), que todas las conductas aparte de este repertorio deban
entenderse
como
productos
de
formas
simples
de
aprendizaje.
Skinner comenz la investigacin que lo llevara a fijar su posicin cuando, despus de
leer el libro de Watson behaviorismo, comenz su posgrado en psicologa en Harvard.
Skinner hizo suya la objecin de Watson a los estados internos y a los hechos
mentales. Se enfoc no tanto en su validez como datos, sino en su legitimidad como
causas de la conducta (Skinner, 1990). En opinin de Skinner, los hechos mentales,
como el pensamiento y la imaginacin, no son causa de la conducta, sino que son
ejemplos de esta, originados por estmulos del ambiente. Supongamos que privamos a
una paloma de comida durante 24 horas, la situamos en un aparato en el que puede
obtener comida si pica un pequeo disco y nos encontramos con que eso es lo que
hace. Skinner argumentara que el comportamiento del animal se explica por completo
con base en los sucesos del entorno: la falta de comida y su uso como reforzador. La
sensacin subjetiva de hambre, que no se observa ni se mide directamente, no es la
causa de la conducta, sino el resultado de la falta de comida. No aade nada a nuestra
explicacin decir que el ave pico el disco porque tena hambre o porque quera obtener
comida. Para explicar lo que hace el ave, no hay que entender todo acerca de sus
estados internos; slo hay que entender los principios sencillos del aprendizaje con los
que la paloma estableci la asociacin entre la conducta y el premio. Tal es la esencia
de la versin del conductismo de Skinner (Delprato y Migley, 1992)
Esta forma de conductismo iniciada por Skinner fue la piedra filosofal original del
anlisis de la conducta, el campo de la psicologa que se ocupa de descubrir las
determinantes ambientales del aprendizaje y el comportamiento (Grant y Evans,
1994). En general, con el anlisis de la conducta se pretende encontrar en el
aprendizaje regularidades universales, que ocurran en todas las especies animales,
incluyendo a los seres humanos, en situaciones equivalentes. Estos investigadores
suponen que los procesos elementales del aprendizaje se repiten entre las especies,

es decir, que en todas las especies animales las caractersticas bsicas de estos
procesos son equivalentes. Por eso los estudios con otras especies animales han sido
tan importantes para el progreso en el campo. Las formas complejas del aprendizaje
son combinaciones y elaboraciones de procesos ms simples y no fenmenos
cualitativamente diferentes.

2. Qu es el aprendizaje?
La mayor parte de nuestras actividades diarias son totalmente aprendidas o bien son
influidas por el aprendizaje.
Imagine qu pasara si de pronto olvidara todo lo que ha aprendido. Qu podra
hacer? Sera incapaz de leer, escribir o hablar. No podra alimentarse solo, encontrar
el camino a casa, maneja un automvil, tocar el fagot o parrandear.
No es necesario decir que estara incapacitado por completo.
(Y aburrido tambin!).
Es obvio que el aprendizaje es importante. Cul es la definicin formal?

2.1.

El aprendizaje

Es un cambio relativamente permanente en el comportamiento debido a la


experiencia. Tome en cuenta que esta definicin excluye cambios temporales
causados por la motivacin, la fatiga, la maduracin, la enfermedad, las heridas o los
frmacos. Cada una de estas causas puede modificar el comportamiento, pero
ninguna clasifica como aprendizaje.

El aprendizaje es resultado de la prctica?


Eso depende de lo que se entienda por prctica. El hecho de simplemente repetir una
respuesta no siempre producir aprendizaje. El reforzamiento es la clave para el
aprendizaje en el condicionamiento clsico y operante. Por reforzamiento se entiende
cualquier evento que aumente la probabilidad de que una respuesta ocurra de nuevo.
Una respuesta es cualquier comportamiento identificable. Las respuestas pueden ser
acciones observables, como parpadear, comer un dulce o girar la manija de la puerta;
pueden ser internas, como cambios en el ritmo cardiaco.
Si queremos ensearle un truco a un perro, podramos reforzar las respuestas
correctas dndole algo de comida cada vez que se para de patas. Del mismo modo,
podemos ensearle a un nio a ser limpio si lo premiamos por levantar sus juguetes.
El aprendizaje puede ocurrir tambin en formas muy diferentes a las que indican estos
ejemplos. Por ejemplo, si una abeja pica a una nia, tal vez ella aprenda a temer a las
abejas. En este caso, el dolor que sinti la nia inmediatamente despus ver a la abeja
reforzar su miedo.

2.2.

Antecedentes y consecuencias.

El descubrimiento de los secretos del aprendizaje comienza por notar lo que pasa
antes y despus de una repuesta. A los eventos que preceden a una respuesta se les
llama antecedentes. Los efectos que siguen a una respuesta son las consecuencias.
Prestar atencin cuidadosa al antes y despus del aprendizaje es una clave para
entenderlo.

2.3.

Cambio en la conducta real o potencial

Es obvio que ha tenido lugar un aprendizaje cuando uno es capaz de mostrar los
resultados, como al manejar un coche o al operar un horno de microondas. No
podemos observar el aprendizaje en s, pues de ordinario no vemos los cambios en el
cerebro; pero se manifiesta en el mejoramiento del desempeo. Sin embargo, muchas
veces el desempeo no exhibe todo lo que aprendimos. Asimismo, en otras ocasiones
adquirimos actitudes generales (como la capacidad de apreciar el arte moderno o de
comprender la filosofa oriental) que no son evidentes en nuestros actos mensurables.
En tales casos, adquirimos el potencial de obrar un cambio en la conducta, porque
asimilamos valores y actitudes que influyen en los libros que leemos o en el destino
que damos al tiempo libre. Se trata de un ejemplo de la distincin entre el aprendizaje
y desempeo: la diferencia entre lo que se ha aprendido y lo que se manifiesta o
ejecuta como conducta ostensible.
2.4.

Cambio constante

Para que un cambio en la conducta real o potencial se considere aprendido, debe ser
constante en diversas ocasiones. As, cuando uno aprende a nadar, siempre podr
hacerlo. Observe que los cambios constantes no siempre son permanentes. Por
ejemplo, digamos que usted se convirti en un buen lanzador de dardos cuando
practico todos los das. Pero si renuncia al deporte sus habilidades se deterioran hasta
volver al nivel original. Pero si una vez aprendi a ser un campen lanzador de dardos,
tiene que serle fcil aprenderlo por segunda vez. Algo se converso de la experiencia
antigua. En ese sentido, el cambio puede ser permanente.
2.5.

Proceso basado en la experiencia

El aprendizaje slo ocurre a travs de la experiencia. La experiencia incluye tomar


informacin (evaluarla y transformarla) y dar respuestas que incidan en el ambiente. El
aprendizaje consiste en una respuesta marcada por las lesiones de la memoria. La
conducta aprendida no incluye los cambios operados por la maduracin fsica o el
desarrollo cerebral que sobreviven con los aos ni los cambios duraderos en la
conducta requieren una experiencia que siga a un estado de madurez. Por ejemplo,
consideremos la cronologa que determina cuando un nio est listo para arrastrarse,
ponerse de pie, caminar, correr y controlar los esfnteres. No hay suficiente
entrenamiento ni practica que den lugar a esas conductas antes de que el nio no
haya madurado bastante. A los psiclogos les interesa descubrir que aspectos del
comportamiento pueden transformarse mediante la experiencia y como se producen
estos cambios.

3. CONDICIONAMIENTO CLSICO
El condicionamiento clsico est basado en lo que sucede antes de una respuesta.
Empezamos con un estmulo que con toda seguridad provoca una respuesta. Por
ejemplo, imagine que se dirige un soplo de aire (el estmulo) a sus ojos, lo que siempre
le hace parpadear (una respuesta). El parpadeo es un reflejo (respuesta automtica no
aprendida). Ahora, supongamos que omos una bocina (otro estmulo) justo antes de
que el soplo de aire golpee su ojo. Si la bocina y el soplo de aire ocurren juntos
muchas veces, qu pasa? Pronto la sola bocina har que parpadee. Cmo
sabemos que ha ocurrido un aprendizaje? Porque antes de que se le condicionara, la
bocina no lo haca parpadear. Del mismo modo, si se le hace agua la boca cada vez
que come una galleta, puede aprender a salivar con solo ver una galleta, la imagen de
unas galletas, una tazn para galletas u otros estmulos que han precedido a la
salivacin.
En el condicionamiento clsico, un estmulo que no produce una respuesta se asocia
con un estmulo que da lugar a una respuesta (por ejemplo, una bocina se asocia con
el soplo de aire en el ojo). Despus de muchas asociaciones, el estmulo que antes no
tena efecto comienza a producir una respuesta.
Cmo ocurre el condicionamiento clsico?
Muchos psiclogos creen que tiene lugar cuando procesamos informacin que podra
ayudar a la supervivencia. De acuerdo con este enfoque informativo, el
condicionamiento clsico ocurre cuando detectamos asociaciones entre
acontecimientos. Con esto, se crean nuevas expectativas mentales en relacin con la
forma en que se relacionan los eventos.

4. El condicionamiento afecta a las emociones?

4.1.

Respuestas emocionales condicionadas

Tal vez tengan mayor importancia las formas ms sutiles en que nos afecta el
condicionamiento. Adems de los reflejos simples, es posible condicionar respuestas
emocionales, o viscerales, ms complejas a nuevos estmulos. Por ejemplo, si se
ruboriza como parte de reaccin emocional cuando se le castiga de nio, tal vez se
sonroje ahora cuando se siente avergonzado o apenado. O piense en los efectos de
asociar el dolor con el consultorio de un dentista durante su primera visita. En visitas
posteriores su corazn se acelerara y sus palmas sudaran antes de que el dentista
comenzara?
El condicionamiento clsico vincula muchas respuestas involuntarias y autnomas del
sistema nervioso (reflejos de pelear o huir) a estmulos y situaciones nuevos

(Mazurski y cols 1993). Por supuesto, esto tambin se aplica a los animales. Uno de
los errores ms comunes que comete la gente con las mascotas (en especial con los
perros) es golpearlos si no vienen cuando se les llama, porque entonces llamarlos se
vuelve un estmulo condicionando para el miedo y la huida. No se sorprenda de que
las mascota desobedezca cuando la llame en futuras ocasiones. Los padres que
menosprecian, gritan o abusan fsicamente de sus hijos comenten el mismo error.

5. CONDICIONAMIENTO OPERANTE
En el condicionamiento operante, el aprendizaje se basa en las consecuencias de la
respuesta. Cada vez que se da una respuesta, es posible que la siga un reforzador
(como la comida). O un castigo. O nada. Estos resultados determinan si es probable
que una respuesta se d otra vez. Por ejemplo, si viste una camisa o blusa en
particular y obtiene muchos cumplidos (reforzamiento), es probable que la use con
ms frecuencia. Si la gente se re disimuladamente, lo insulta, llama a la polica o grita
(castigo), es probable que la vista con menos frecuencia.
Como se afirm antes, en el condicionamiento operante aprendemos a asociar las
respuestas con sus consecuencias. El principio bsico del condicionamiento operante
(o aprendizaje instrumental) es simple: los actos que son reforzados tienden a
repetirse. El terico y pionero del aprendizaje Edward L. Thorndike llam a esto ley del
efecto (la probabilidad de una respuesta es determinada por el efecto que tiene). De
acuerdo con Thorndike, el aprendizaje se fortalece cada vez que una respuesta le
sigue un estado de cosas satisfactorio. Piense en el ejemplo anterior de la mquina
expendedora automtica. Como patear la maquina tuvo el efecto de producir comida y
dinero, las probabilidades de repetir la respuesta de patear se incrementaron.
Como hemos visto, el condicionamiento clsico tiende a ser pasivo e involuntario. Solo
le pasa al aprendiz cuando un El sigue de cerca a un EC. En el condicionamiento
operante, el aprendiz opera activamente sobre el ambiente. Por tanto, el
condicionamiento operante se refiere sobre todo al aprendizaje de respuestas
voluntarias. Por ejemplo, alzar la mano en clase para obtener la atencin del maestro
es una respuesta operante aprendida, que se refuerza al conseguir la intencin del
maestro.
Sin duda, la ida de que las recompensas afectan al aprendizaje no es nueva para los
padres (y otros entrenadores de animales pequeos). Sin embargo, padres, maestros,
polticos, supervisores, e incluso usted, tal vez usen la recompensa en formas
impredecible, inexactas o poco afortunadas. Viene al caso el trmino recompensa.
Para ser correcto, es mejor decir reforzador Por qu? Las recompensas no siempre
incrementan la respuesta. Si intenta darle un dulce de regaliz a un nio como
recompensa por buen comportamiento, solo funcionara si al nio le gusta la regaliz.
Lo que sirve como reforzador para una persona tal vez no sirva para otra. Como una
regla emprica prctica, los psiclogos definen un reforzador operante como
cualquier evento que sigue a una respuesta e incrementa su probabilidad.

5.1.

Adquisicin de una respuesta operante

La mayor parte de los estudios de laboratorio del aprendizaje instrumental tiene lugar
en una cmara de condicionamiento, un aparato diseado para el estudio del
condicionamiento operante en animales. A este dispositivo algunas veces tambin se
le llama caja de Skinner, en honor a B.F. Skinner, quien la invent.
Las aventuras de la rata Mickey
Se coloca una rata hambrienta en una pequea caja, parecida a una cmara. Los
muros estn descubiertos, con excepcin de una la palanca de metal y una bandeja en
que se pueden administrarse trozos de comida conocidos como pellas.
Francamente no hay mucho que hacer en una caja de Skinner. Esto aumenta las
probabilidades que nuestro sujeto d la respuesta que deseamos reforzar, que es
oprimir la palanca, el hambre tambin asegura que el animal estar motivado para
buscar comida y para emitir en forma activa, o producir libremente, una variedad de
respuestas. Ahora echemos otro vistazo a nuestro sujeto.
Nuestro sujeto camina por un rato, se acicala, olfatea las esquinas o se para sobre sus
patas traseras: todos estos son comportamientos tpicos de una rata. Entonces
sucede. Coloca su pata en la palanca para obtener una mejor vista de la parte superior
de la jaula. Clic! La palanca desciende y una pella cae en la bandeja. La rata camina
hasta la bandeja, come la pella., luego se acicala. Al explorar la jaula de nuevo, se
apoya en la palanca. Clic! Despus de un viaje a la bandeja de comida, regresa a la
barra y olfatea, luego pone su pata en ella. Clic! Pronto la rata sigue un patrn
montono de opresin frecuente de la barra.
Tome en cuenta que la rata no adquiri una nueva habilidad en esta situacin. Ya era
capaz de oprimir la palanca. La recompensa slo modifica la frecuencia con que la
oprime. En el condicionamiento operante, el reforzamiento se utiliza para cambiar la
frecuencia de las respuestas, o para modelarlas para dar paso a nuevos patrones.

Suponga que una nia que est aprendiendo a hablar seala su mueca
favorita y dice mueca, eca o eca cuando la quiere. En la seccin da 1
se muestra el nmero de veces que la nia usa cada palabra para pedir la
mueca. Al principio, usa todas las palabras en forma intercambiable para
acelerar el aprendizaje, sus padres deciden darle su mueca slo cuando la
pide de manera correcta. Entonces el comportamiento de la nia cambia a
medida que se aplica el reforzamiento operante. Para el da 20, mueca se
ha vuelto la respuesta ms probable.

5.2.

Reforzamiento contingente

El reforzamiento operante funciona mejor cuando es contingente a la respuesta. Es


decir solo debe darse despus de que ha ocurrido una respuesta deseada.

5.3.

La inmediatez del reforzamiento

El reforzamiento operante es ms efectivo si sigue rpidamente a la respuesta


correcta. Las ratas de la caja de Skinner aprenden muy poco cuando la demora entre
oprimir la palanca y recibir la comida llega a 50 segundos. Si la recompensa
alimenticia se demora ms de 90 segundos, no ocurre aprendizaje. En general, tendr
ms xito si presenta un reforzador inmediatamente despus de una respuesta que
desea cambiar. Por tanto, debe elogiarse de inmediato por su buen comportamiento a
un nio que es servicial o corts.
Digamos que trabajo duro todo el semestre en una clase para obtener 10 o MB. La
demora del reforzamiento impedir que aprenda algo?
No por varias razones. En primer lugar como ser humano puede anticipar la
recompensa futura. En segundo lugar, se le refuerza con las calificaciones de los
exmenes durante todo el semestre. En tercer lugar, un solo reforzador a menudo
puede mantener una larga cadena de respuestas (una serie de acciones vinculas que
conducen al reforzamiento).
Muchas de las cosas que hacemos cada da se relacionan con cadenas de respuesta
similares. Por ejemplo, la larga serie de hechos necesaria para preparar una comida
ofrece su premio al comerla al final. Un fabricante de violines puede pasar tres meses
llevando a cabo miles de pasos para obtener la recompensa final de or la primera nota
de su instrumento. Marcar un nmero telefnico es una cadena de respuestas corta
pero familiar.
5.3.1. Conducta supersticiosa
Los reforzadores no slo afectan la respuesta a la que siguen, si no tambin otras
respuestas que ocurren poco antes. Esto ayuda a explicar el aprendizaje de muchas
supersticiones humanas. Si un golfista golpea su palo en la tierra tres veces y luego
hace un tiro inusualmente bueno, el tiro exitoso no slo refuerza el balanceo correcto
si no tambin los tres golpes. Durante el entrenamiento operante, los animales a
menudo desarrollan respuestas innecesarias similares. Si una rata rasca su oreja justa
antes de oprimir la palanca por primera vez, tal vez siga rascndose antes de volver a
oprimir la palanca cada vez. Presiona la palanca es todo lo que necesita para obtener
comida, pero tal vez el animal siga rascando su oreja supersticiosamente, como si
esto fuera necesario
Los comportamientos supersticiosos se repiten porque, al parecer, producen,
reforzamiento, aunque en realidad sean innecesarios. Si obtiene la mitad ms larga de
una espoleta (hueso en forma de horquilla de una ave) y poco despus tiene buena
suerte, puede atribuir su suerte a la espoleta. Si pasa bajo una escalera y luego se
rompe una pierna, tal vez evite las escaleras en el futuro. Cada vez que evita una
escalera y no pasa nada malo, su accin supersticiosa se refuerza. La creencia en la
magia tambin puede explicarse de acuerdo con esto. Es muy probable que los
rituales para atraer la lluvia, detener enfermedades o producir cosechas abundantes
hayan despertado la fe de los participantes porque en ocasiones parecan tener xito.
Adems, es mejor prevenir que lamentar!

5.4.

Moldeamiento

Cmo se pueden reforzar respuestas que rara vez ocurren?


An en una aburrida caja de Skinner, podra pasar un largo tiempo antes de que la rata
oprima accidentalmente la palanca y coma una pella. Podramos esperar una
eternidad para que ocurran respuestas ms complicadas. Por ejemplo, tendra que
esperar mucho tiempo para que un pato accidentalmente saliera de su jaula,
encendiera una luz, tocara un piano de juguete, apagara la luz y regresara a su jaula,
si esto es lo que quiere recompensar, nunca tendra la oportunidad.
Entonces cmo se ensea a realizar trucos complicados a los animales de la
televisin y los parques de diversiones?
La respuesta est en el modelamiento, que consiste en modelar gradualmente
respuestas para llegar a un patrn deseado. Veamos de nuevo a nuestro sujeto, la rata
Mickey.
La rata Mickey se moldea
Suponga que la rata an no ha aprendido a oprimir la palanca ni muestra signos de
inters en ella. En vez de esperar a que oprima por primera vez la palanca de forma
accidental, podemos modelar su conducta. Al principio, slo requerimos que vea la
palanca, as que cada vez que voltee en su direccin se le refuerza con un trozo
pequeo de comida. Pronto Mickey pasa mucho tiempo viendo la palanca. A
continuacin, la reforzamos cada vez que da un paso en direccin a la palanca.
Cuando voltea hacia la palanca y luego se aleja, no pasa nada. Pero cuando voltea
hacia la palanca y da un paso hacia adelante, clic! Su respuesta ha empezado a
moldearse.
Al cambiar las reglas de lo constituye una respuesta exitosa, podemos entrenar
gradualmente a la rata para que se acerque a la palanca y la oprima. Podemos
recompensar respuestas que se aproximen cada vez ms al patrn final deseado
hasta que ocurra. El principio del moldeamiento, entonces, es que se refuerzan las
aproximaciones sucesivas (correspondencias cada vez ms cercanas) a la
respuesta deseada B.F. Skinner una vez enseo a dos pichones a jugar tenis de mesa.
El modelamiento tambin se aplica a los seres humanos. Digamos que se quiere
estudiar ms, limpiar la casa con ms frecuencia o hacer ms ejercicio. Se ayudar a
tener xito en cada caso si establece una serie de metas graduales diarias y se premia
usted mismo por cada pequeo paso en la direccin correcta (Watson y Tharp, 1996).

5.5.

Extincin operante

La rata dejara de oprimir la palanca si deja de obtener comida?


S, pero no de inmediato. Si una respuesta aprendida no se refuerza, gradualmente
deja de realizarse, proceso llamado extincin operante. As como adquirir una
respuesta operante toma tiempo, lo mismo sucede con la extincin. Por ejemplo, si un
programa particular de televisin lo aburre constantemente, es probable que con el

tiempo deje de ver el programa, aunque la extincin parezca completa, la respuesta


previamente puede regresar. Si se saca a una rata de una caja de Skinner despus de
la extincin y se le da un pequeo descanso, la rata oprimir de nuevo la palanca
cuando regrese a la caja de Skinner. Del mismo modo, unas cuantas semanas
despus de que dej de comprar billetes de lotera, mucha gente es tentada a probar
de nuevo.
La extincin requiere tanto tiempo la segunda vez?
Si el reforzamiento todava se niega, la presin de la palanca por la rata se extinguir
de nuevo, por lo general ms rpido. La breve reaparicin de una respuesta operante
despus de la extincin de otro ejemplo de recuperacin espontanea (mencionada
antes en relacin con el condicionamiento clsico) la recuperacin espontanea parece
muy adaptiva. Despus de un periodo de descanso, la rata responde de nuevo a una
situacin que produca comida en el pasado ! Slo revisaba si las reglas han
cambiado!
El reforzamiento y la extincin a menudo se combinan para cambiar el
comportamiento. Por ejemplo, la atencin y la aprobacin de los padres son
reforzadores muy poderosos para el nio. Como resultado, los padres con frecuencia
refuerzan la bsqueda negativa de atencin (mala conducta usada para obtener
atencin), sin darse cuenta. Por lo general, se ignora a los nios cuando estn jugando
tranquilamente. En cambio, obtienen atencin a medida que hacen ms ruido, cuando
gritan oye, mami! a todo lo que dan sus pulmones, cuando hacen berrinches,
alardean o rompen algo. Por su puesto que la atencin que obtiene a menudo es un
engao, pero an es atencin y refuerza la bsqueda negativa de atencin. Los
padres reportan mejoramientos significativos cuando ignoran el comportamiento
inadecuado de sus hijos y elogian o atienden a un nio que esta callado o juagando en
forma constructiva.

5.6.

Reforzamiento negativo

Hasta ahora, hemos puesto nfasis en forzamiento negativo, que ocurre cuando un
evento placentero o deseado sigue una respuesta. Pero, De qu otra manera podra
reforzarse el aprendizaje operante? a llegado el momento de considerar el otro lado
de la moneda del condicionamiento operante: el reforzamiento negativo ocurre
cuando una respuesta elimina un evento desagradable. Como el reforzamiento
positivo, el negativo tambin incrementa la respuesta. Sin embargo, lo hace al acabar
con el malestar. Digamos que tiene un dolor de cabeza y toma una aspirina. Tomar la
aspirina se reforzara de manera negativa si el dolor de cabeza cesa. As mismo, puede
ensearse a una rata a oprimir una palanca para obtener comida (reforzamiento
positivo); o a presionarla para determinar r una descarga elctrica moderada
(reforzamiento negativo). De cualquier forma, aumentara la presin de la palanca.

Por qu? Porque conduce a un estado de cosas deseado (comida o la terminacin


del dolor). A menudo, se combinan el reforzamiento positivo y el negativo. Si esta
incmodo por el hambre, comer se refuerza por el buen sabor de la comida
(reforzamiento positivo) y por el final del hambre punzante (reforzamiento negativo).

5.7.

Castigo

Muchas personas confunden el reforzamiento negativo con el castigo. Sin embargo, el


castigo es cualquier evento que sigue a una respuesta y que disminuye la
probabilidad de que ocurra de nuevo. Se seal, el reforzamiento negativo incrementa
la respuesta. La diferencia puede verse en un ejemplo hipottico. Digamos que vive en
un departamento y el aparato de sonido de su vecino est a un volumen tan alto que le
lastima los odos. Si golpea la pared y el volumen baja repentinamente (reforzamiento
negativo), ser ms probable que en el futuro golpee la pared. Pero si la golpea y el
volumen aumenta (castigo), o si el vecino viene y lo golpea a usted (ms castigo), ser
menos probable que golpee el muro.
Como otro ejemplo, imagine a un drogadicto sometido a abstinencia. Consumir droga
terminara temporalmente los angustiosos sntomas de la abstinencia. Por tanto se
refuerza el consumo de drogas en forma negativa. Por otra parte, si la droga empeora
el dolor (castigo), el adicto dejar rpidamente de tomarla.
Tambin es castigo retirar privilegios, dinero u otros elementos positivos por realizar
una respuesta en particular?
S. Tambin ocurre el castigo cuando se elimina un reforzador o estado de cosas
positivo, como la prdida de privilegios. A este segundo tipo de castigo se le llama
castigo negativo o costo de respuesta (Cautela y Kearney, 1986). Los padres que
encierran a sus hijos adolescentes por el mal comportamiento estn aplicando el
costo de respuesta. Las multas por estacionarse en lugar prohibido y otras multas
tambin se basan en el costo de respuesta. Para su comodidad en la tabla.

5.8.

Reforzadores primarios

Los reforzadores primarios son naturales, o no aprendidos. Como resultado, son


efectivos casi universalmente para una especie en particular. Por lo general estn
arraigados en la biologa y producen comodidad, fin de la incomodidad o satisfacen
una necesidad fsica inmediata. Comida agua y sexo son reforzadores primarios
obvios. Cada vez que abre el refrigerador, va a la cafetera, enciende la calefaccin
o hace un viaje a la nevera, sus acciones reflejan un reforzamiento primario.
Adems de los ejemplos obvios, hay otros reforzadores primarios menos naturales.
Uno de los ms inusuales (y poderosos) es la estimulacin intracraneal (EIC). La
EIC se relaciona con la activacin directa de centros de placer en el encfalo
(Olds y Fobes, 1981).

Alambrado de una rata para el placer


El uso de la estimulacin del encfalo como premio requiere la implantacin
permanente de pequeos electrodos en reas especficas del encfalo. Es posible
entrenar a una rata alambrada para el placer para que oprima la palanca de una
caja de Skinner y obtenga estimulacin elctrica a su propio encfalo. Algunas
ratas oprimirn la palanca miles de veces por hora para obtener dicha
estimulacin. Despus de 15 o 20 horas de oprimir en forma constante, algunas
veces los animales se colapsan por agotamiento. Cuando se reaniman, empiezan
a oprimirla de nuevo. Si el circuito de recompensa no se apaga, un animal ignorara
la comida, el agua y el sexo por oprimir la palanca.
Muchos reforzadores primarios naturales activan las mismas vas del placer en el
encfalo, lo que hace tan poderosa a la EIC. Causa escalofros la idea de lo que
pasara si los implantes cerebrales fueran fciles y prcticos de hacer.

5.9.

Reforzadores secundarios

En algunas sociedades tradicionales, el aprendizaje est vinculado


frecuentemente con la comida, el agua y otros reforzadores primarios. Sin
embargo, la mayora respondemos a un rango muchos ms amplios de
recompensas y reforzadores. Dinero, elogios, atencin, aprobacin, triunfo
afecto, calificaciones y premios similares, todo sirve como reforzadores
secundarios premios.
Cmo obtiene un reforzador secundario su capacidad para promover el
aprendizaje?
Algunos reforzadores secundarios simplemente se asocian con un reforzador
primario. Esto puede mostrarse de la siguiente manera.
La rata que oprime un botn
Una rata encerrada en una caja de Skinner ha aprendido a travs del
condicionamiento operante a oprimir la palanca para obtener pellas. Cada opresin
de palanca recompensada tambin es seguida por un breve tono audible. Despus
de un periodo de entrenamiento en que se asocian la opresin de la palanca, la
comida y el tono, se cambia a la rata a una jaula nueva. Esta jaula no tiene
palanca, pero tiene un botn instalado en una de las paredes. Si la rata oprime el
botn, el tono suena, pero no se entrega comida. Aunque no se ha dado un
reforzamiento primario (comida) la rata aprender a oprimir el botn para activar el
tono. Como se le asoci con comida, el tono ha llegado a ser un reforzador
secundario.

Los reforzadores secundarios que piden cambiarse por reforzadores primarios


obtienen su valor de manera ms directa. Obviamente el dinero tiene poco valor

por s mismo. No puede comerlo, beberlo ni dormir con l. Sin embargo, puede
cambiarlo por comida, agua, hospedaje y otras necesidades.
En una serie de experimentos clsico se ense a chimpancs a trabajar a trabajar
por fichas. Una ficha es una reforzador secundario tangible como dinero estrellas
doradas, fichas de pker y cosas por el estilo. Primero se entren a los
chimpancs para que pusieran fichas de pker en una mquina expendedora
automtica Chimp-O-Mart que entregaba unas cuantas uvas o pasas por cada
ficha. Una vez que los animales haban aprendido a cambiar fichas por comida,
deban aprender nuevas tareas para ganar fichas. El valor de las fichas se
mantuvo al permitir ocasionalmente que los chimpancs usaran la mquina (Wolfe,
1936; Cowles, 1937).
Un problema con lo reforzadores primarios es que la gente y los animales que los
reciben se sacian con rapidez. (Saciarse significa estar satisfecho por completo o
reducir el deseo.) Por ejemplo, si desea usar dulces para reforzar a un nio
retardado para que llame correctamente a las cosas por su nombre, el nio puede
mostrar inters slo mientras est hambriento. Una ventaja importante de las
fichas es que no pierden su valor reforzante con rapidez como los reforzadores
primarios. Por esto las fichas han sido tiles para trabajar con nios, adolescentes
y adultos problemticos en programas especiales, as como para educar a los
mentalmente retardados.
Incluso, las fichas se usan a veces en salones de escuelas elementales. En cada
caso la meta es proporcionar una recompensa inmediata para el aprendizaje. Por
lo general, las fichas pueden cambiarse por comida, bienes deseados, privilegios
especiales o salidas al cine, parques de diversiones, etc.

Vous aimerez peut-être aussi