Vous êtes sur la page 1sur 4

CASTIGOS Y REFUERZOS

EI aprendizaje es "Ia reclasificacin de las respuestas en una situacin compleja"; el


condicionamiento es "el fortalecimiento de la conducta a resultas del reforzamiento"
(Skinner, 1953, p. 65). Hay dos formas de condicionamiento, el tipo S y e l tipo R. EI
tipo S es el pavloviano, caracterizado por el apareamiento del estmulo reforzador
(incondicionado) y otro estimulo (condicionado). Este tipo llama la atencin sobre la
importancia del estmulo que origina una respuesta del organismo, conocida como
conducta respondiente. Aunque el condicionamiento del tipo S explica tales
comportamientos como reacciones emocionales condicionadas, casi todas las
conductas humanas son emitidas en presencia de estmulos, antes que provocadas
automticamente por ellos. Las respuestas son controladas por sus consecuencias, no
por los estmulos que las anteceden. Esta forma de comportamiento, que Skinner
llamaba de tipo R para subrayar el aspecto de respuesta, es operante en el sentido de
que opera en el medio para producir un efecto. La extincin y el condicionamiento tipo
R se explican como sigue:
Si la ocurrencia de una conducta operante es seguida por la presentacin de
un estmulo reforzador, aumenta la fuerza (...) Si la ocurrencia de una conducta
operante ya fortalecida por condicionamiento no es seguida por el estmulo
reforzador, la fuerza decae. (Skinner, 1938, p. 21)
A diferencia de las conductas respondientes, que no se presentan sin
condicionamiento, la probabilidad de ocurrencia de las operantes nunca es de cero,
porque se necesita la respuesta para que haya refuerzo, el cual cambia la probabilidad
o la tasa de ocurrencia de la respuesta. Las operantes actan sobre el entorno y,
merced al refuerzo, su probabilidad de ocurrir se vuelve mayor o menor.

Refuerzo
EI refuerzo es el proceso responsable del fortalecimiento de las respuestas, el que
incrementa su tasa o hace que sea ms probable que ocurran. EI reforzador (o
estimulo reforzante) es el estmulo o acontecimiento que sigue a la respuesta y la
fortalece: "La nica caracterstica definitoria del estmulo reforzador es que refuerza"
(Skinner, 1953, p. 72). En trminos tcnicos, los reforzadores no se determinan de
antemano, sino que dependen de sus efectos:
EI nico modo de saber que cierto acontecimiento refuerza a cierto organisl11o
en determinadas condiciones es hacer una prueba directa. Observamos la
frecuencia de una respuesta elegida, Io hacemos contingente un evento y
vemos si cambia la frecuencia, en cuyo caso clasificamos al acontecimiento
C0l110 reforzador del organismo en las condiciones presentes. (Skinner, 1953,
pp. 72-73)
Los reforzadores son especficos de las situaciones: se aplican a individuos
momentos particulares y en determinadas condiciones. Lo que refuerza a
estudiante en un momento quiz no lo haga una hora despus. Lo que lo refuerza
la clase de lectura tal vez no lo haga en la de matemticas. A pesar de

en
un
en
su

especificidad, es posible predecir, hasta cierto punto, los estmulos y acontecimientos


que refuerzan la conducta (Skinner, 1953):
Tenemos algn xito en la estimacin de los poderes del refuerzo slo porque,
en cierta forma, hemos hecho una investigacin somera; hemos calculado el
efecto reforzante del estmulo en nosotros mismos y suponemos que tendr el
mismo efecto en los dems. Tenemos xito slo cuando nos parecemos al
organismo en estudio y hemos supervisado correctamente nuestro propio
comportamiento. (p. 73)
Habitualmente, los sucesos que refuerzan a los estudiantes son los encomios de los
maestros, el tiempo libre, los privilegios o las altas calificaciones. Sin embargo, es
imposible saber de cierto si las consecuencias de una conducta son reforzantes hasta
que se presentan en forma contingente con una respuesta y observamos si el
comportamiento cambia en consecuencia.
Contingencia de tres trminos: El modelo de condicionamiento operante bsico es la
contingencia de tres trminos:
SD ---7 R ---7 SR
Un estmulo discriminativo (SD) brinda la ocasin para una respuesta (R) seguida de
un estmulo reforzador (SR), que es cualquier estimulo (acontecimiento,
consecuencia) que aumenta la probabilidad de que la respuesta se produzca en el
futuro, cuando se presente e l estimulo discriminativo.

Refuerzo positivo y negativo


Hay dos formas de refuerzo: el refuerzo positivo consiste en presentar un estmulo o
aadir algo a una situacin, contingente a la respuesta, que aumente la probabilidad
de que esta ocurra en ese contexto. Un reforzador positivo es un estmulo que,
cuando sigue a la respuesta, incrementa la probabilidad de que ocurra de nuevo en la
misma situacin. Los estmulos que suelen hacer las veces de reforzadores positivos
son la comida, el agua, los elogios, las pegatinas, los privilegios y las buenas notas.
EI refuerzo negativo comprende la remocin del estmulo o de algo de la situacin,
contingente a la respuesta, que aumenta la posibilidad de que esta ocurra otra vez en
ese contexto. EI reforzador negativo es el estmulo que, cuando lo elimina la
respuesta, incrementa la probabilidad de que esta ocurra en el futuro en el mismo
contexto. Algunos estmulos que funcionan a menudo como reforzadores negativos
son las luces brillantes, los ruidos fuertes, las crticas y las bajas calificaciones; la
desaprobacin y la crtica social, las reprimendas, los sentimientos de decepcin por
parte de otro, la realizacin de actividades poco preferidas por la persona (p.ej.,
determinadas tareas domsticas, ciertos ejercicios), el tener que corregir el mal
causado, los olores desagradables y los ruidos fuertes. Tanto el refuerzo positivo como
el negativo tienen el mismo efecto: aumentan la probabilidad de que la respuesta
ocurra en el futuro. La tabla es un esquema de esos procesos.
Supongamos que un maestro se encuentra en una sesin de preguntas y respuestas
con su clase. Formula una pregunta (SD), pide que algn alumno se ofrezca a dar la
respuesta correcta (R) y lo elogia (SR). Si este alumno incrementa o mantiene su nivel
alto, el encomia opera como reforzador positivo y, por lo tanto, se trata de un ejemplo

de refuerzo positivo. Ahora digamos que el maestro plantea una pregunta (SD), pide
algn voluntario para contestarla (R) y la elimina de la tarea de esa tarde (SR)
Si el estudiante se mantiene o incrementa su nivel elevado, la remocin de la pregunta
opera como refuerzo negativo. La aplicacin 3.1 explica otras opciones de refuerzo
positivo y negativo.

Extincin
La extincin consiste en la mengua de la fuerza de la respuesta merced a la falta de
refuerzo Las ratas que recorren el laberinto y consiguen alimento, acabaran por no
hacerlo si deja de haber comida. Los estudiantes que levantan la mano en clase pero
nunca se les pregunta, dejaran de hacerlo. Cuando alguien escribe muchas cartas a la
misma persona y no recibe respuestas, al final dejara de escribir.
La rapidez de la extincin depende del historial de refuerzo (Skinner, 1953). Ocurre
con prontitud si fueron reforzadas apenas unas cuantas respuestas anteriores. Si el
historial de refuerzo es mayor, las respuestas son ms duraderas. Extincin no es lo
mismo que olvido: las respuestas extintas se mantienen en el repertorio de
comportamientos del individuo, pero no se dan por la falta de consecuencias
reforzantes. En los ejemplos anteriores, las ratas siguen sabiendo como recorrer el
laberinto, los estudiantes como levantar la mana y la gente como escribir cartas. Por el
contrario, el olvido consiste en la perdida verdadera de condicionamiento al cabo de
un tiempo en el que no se han presentado las ocasiones para cierta conducta.

Reforzadores primarios y secundarios


Se denomina reforzadores primarios o incondicionados a aquellos estmulos que no
requieren de experiencias de aprendizaje para funcionar como reforzadores; como el
alimento, el agua y el abrigo porque son necesarios para la supervivencia. Buena
parte de la conducta humana que se mantiene durante periodos prolongados est
asociada indirectamente con ellos.
Los reforzadores secundarios o condicionados son aquellos que adquieren su
capacidad reforzante mediante la asociacin con otros reforzadores primarios o
secundarios o mediante la asociacin con la retirada de estmulos aversivos. El tazn
favorito de un nio se convierte en reforzador secundario gracias a su vinculacin con
la leche (el reforzador primario). EI reforzador secundario que se aparea con ms de
uno primario es un reforzador generalizado. As, la gente trabaja largas horas para
ganar el salario (un reforzador generalizado) que destinan a la alimentacin, el alquiler
y otros bienes.
Los reforzadores generalizados explican buena parte de la conducta social. Son
reforzadores condicionados asociados con diferentes reforzadores primarios y/o
secundarios, ejemplos son la aprobacin, el afecto, la atencin, la sumisin, el dinero
y los puntos en una economa de fichas. Uno de estos reforzadores es la atencin: los
nios se comportan de formas que "Llaman la atencin" de los adultos. Es un
reforzador porque esta apareada con los reforzadores primarios que provienen de los
adultos (comida, agua, proteccin). Son fciles de administrar y especialmente
eficaces porque permiten acceder a una variedad de reforzadores y, por tanto, no
dependen de un estado especfico de privacin como cuando se utiliza un nico

reforzador primario o secundario. En ocasiones siguen siendo eficaces aun cuando ya


no sean acompaados por los reforzadores en que se basan. Los reforzadores
generalizados importantes para la educacin son los elogios de los maestros, las
calificaciones elevadas, los privilegios, los cuadros de honor y los ttulos. A menudo,
estn apareados can otros reforzadores generalizados, como la aprobacin (de
padres y amigos) y el clinero (un ttulo de una escuela de prestigio asegura un empleo
mejor).

Castigo
Efectos EI castigo disminuye la probabilidad de que ocurra una respuesta en
presencia de un estmulo. Consiste en el retiro de un reforzador positivo, o bien en la
presentacin de uno negativo contingente a la respuesta. Supongamos que durante
una sesin de preguntas y respuestas un alumno molesta repetidamente a otro
cuando el maestro no 10 observa (el maestro no observa = S); mala conducta = R). EI
maestro se percata y dice al nio: "Deja de molestarlo" (SH). Si obedece, el regao del
profesor habr sido un reforzador negativo, y este ser un ejemplo de castigo.
Advirtamos que el acto del maestro funge para el cmo reforzamiento negativo, puesto
que su respuesta logro que cesara el mal comportamiento y, como fue eficaz, es
probable que el docente la repita en e l futuro. Supongamos ahora que, en lugar de
regaar al alumno, el maestro le dice: "No saldrs hoy al descanso". Si se detiene la
conducta indeseable, la prdida del descanso es la remocin del reforzador positivo, y
este es tambin un ejemplo de castigo. EI castigo suprime la respuesta pero no la
elimina y, si la amenaza de castigo desaparece, la conducta sancionada puede volver.
En un clsico experimento, Estes(1944) entreno ratas para que presionaran una
palanca y obtuvieran refuerzo alimenticio. Enseguida, se provoc la extincin: se dej
de entregar comida cuando se oprima la palanca. Algunas ratas reciban un choque
cuando accionaban el dispositivo en los primeros ensayos de extincin y, aunque al
principio daban me nos respuestas que las otras, una vez que el castigo (el choque)
fue descontinuado, respondieron mis que aquellas.
Los efectos del castigo son complejos. A menudo, suscitan respuestas incompatibles
con la conducta castigada y que son lo bastante fuertes para suprimirla (Skinner,
1953). Zurrar a un nio por comportarse mal puede causar sentimientos de culpa y
miedo. Si el chico se porta mal de nuevo, la culpa y el miedo condicionados
reaparecern y lo harn detener de inmediato ese comportamiento. EI castigo tambin
condiciona respuestas que llevan a escapar o a evitarlo. Los alumnos cuyo maestro
critica las respuestas incorrectas aprenden pronto a no levantar la mano para evitar el
castigo. EI castigo puede condicionar conductas mal adaptativas, porque no ensea a
comportarse en formas ms productivas, y puede aadir ms trabas al aprendizaje al
crear un conflicto tal que el alumno vacile entre una u otra manera ele responder. Si e l
maestro censura las respuestas incorrectas unas veces y otras no, los estudiantes
nunca saben cundo se aproxima una crtica. Esa conducta variable puede tener
subproductos emocionales -miedo, enojo, quejas- que interfieren con el aprendizaje.

Vous aimerez peut-être aussi