INTRODUCCIN Casi al mismo tiempo que Pavlov descubra los principios bsicos del Condicionamiento Clsico en Rusia, un psiclogo americano, Thorndike, descubra los del Condicionamiento Operante. Thorndike introdujo a unos gatos hambrientos en una especie de caja rompecabezas. Fuera de la caja haba comida que los gatos podan ver y oler, pero no podan conseguirla a menos que salieran de la caja. Los gatos realizaron comportamientos diferentes mientras estaban en la caja, por ejemplo, empujar un lado, araar, estirar una cuerda Y era precisamente este ltimo comportamiento el que les permita salir de la caja y obtener la comida. Los gatos aprendieron la Respuesta requerida por un proceso de ENSAYO-ERROR. Esto es, aprendan, tras realizar varias respuestas, cul de ellas era la que iba seguida de una recompensa (comida). Esto es lo que bsicamente define la Ley del Efecto: los animales aprendern a emitir una respuesta con mayor frecuencia que otras si a esa respuesta le sigue el efecto deseado. A partir de los descubrimientos de Thorndike, un psiclogo conductista llamado SKINNER se interes por este tipo de aprendizaje, el llamado condicionamiento Operante. Segn Skinner, la conducta est en funcin de sus consecuencias, siendo estas consecuencias lo que conocemos por el nombre de refuerzos y castigos. La fuerza del condicionamiento operante Los mtodos operantes ayudan a lograr ciertos objetivos teraputicos. El primero consiste en REFORZAR la conducta deseable: para esto, se tiene que esperar que sta ocurra y luego proporcionar algo agradable para el sujeto o bien eliminar algo desagradable para l. El segundo consiste en DISMINUIR una actividad indeseable: el procedimiento ms usado es retirar o dejar de proporcionar un estmulo deseado por el sujeto tras la emisin de la conducta inadecuada. Ti pos de Ref uerzos y Cast i gos Los refuerzos son aquellos estmulos que, presentados o eliminados despus de una conducta o respuesta aumentan la probabilidad de que esa respuesta se realice con mayor frecuencia. Los castigos son aquellos estmulos que, presentados o eliminados despus de una conducta o respuesta disminuyen la probabilidad de que esa respuesta se realice.
Los refuerzos y castigos (tanto positivos como negativos) han sido y son utilizados con bastante frecuencia para elaborar programas dirigidos a disminuir o eliminar conductas violentas o agresivas y conseguir comportamientos adecuados. Ambos estmulos, para que sean efectivos, deben presentarse inmediatamente despus de la respuesta que deseamos aumentar o disminuir. REFUERZO POSITIVO: Es aquel estmulo agradable o apetitivo que, presentado (como consecuencia) tras la emisin de una conducta determinada, permite el incremento de la misma. Son lo que conoceramos con el nombre de recompensas: materiales, comestibles, tangibles, cambiables, de actividad y sociales. 5 REFUERZO NEGATIVO: Es aquel estmulo desagradable o aversivo que, eliminado tras la emisin de una conducta determinada, permite el incremento de la misma. Tipos: respuesta de escape y respuesta de evitacin. El refuerzo negativo a menudo es errneamente interpretado como castigo. Se presta demasiada atencin a la palabra negativo y no la suficiente al refuerzo. La palabra negativo se percibe como connotativa de lo indeseable -actitudes negativas, nmeros negativos, balances negativos en los talonarios de cheques...-, pero siempre hay que tener claro que el refuerzo negativo NUNCA es un castigo. CASTIGO POSITIVO: Es aquel estmulo desagradable que, presentado (como consecuencia) tras la emisin de una conducta determinada, disminuye la probabilidad de que esa respuesta se realice. Los castigos fsicos, sin embargo, traen consecuencias tan nocivas que su aplicacin resulta inaceptable. Cuando se usan frecuentemente, lo que estamos haciendo no es ensear, por ejemplo, a un nio a no realizar determinados comportamientos sino que, en lugar de ello, creamos sentimientos de temor y odio. Por otro lado, puesto que los castigos positivos son aversivos, las personas aprenden conductas no deseables para escapar de ellos (respuestas de evitacin). Imaginar a un nio que trae malas notas, si simplemente nos limitamos a aplicar un castigo positivo, no conseguiremos con ello que sus notas mejoren sino que, por el contrario, probablemente aprenda conductas no deseables, como mentir o fugarse, con el fin de evitar momentneamente el castigo. Adems, el castigo modela el comportamiento agresivo. Los nios aprenden (por observacin) que hacer dao es algo aceptable, lo que en algunos casos explica porqu los nios maltratados pueden convertirse en adultos maltratadores. CASTIGO NEGATIVO: Es aquel estmulo agradable que, eliminado tras la emisin de una conducta inapropiada, disminuye la probabilidad de que esa respuesta se realice. A su vez, dentro de lo que llamamos castigo negativo existiran dos categoras: el coste de respuesta y el tiempo fuera: a) Coste de respuesta: la respuesta no deseada hace que se retire o que no se pueda obtener el reforzamiento. Por ejemplo, estarse quieto es incompatible con hablar o levantarse en clase. Cuando se est quieto se recibe el refuerzo, pero no cuando uno habla o se mueve. Por ejemplo, a una nia se le quitaban 50 pesetas de su asignacin semanal cada vez que no llevaba las gafas puestas, logrndo modificar de esta manera la conducta de no ponerse las gafas. b) Tiempo fuera: consiste en un perodo de tiempo durante el cual el reforzamiento no est disponible. Es decir, no consistira en no obtener un refuerzo, sino en retirarlo cuando se hace una conducta inapropiada. Por ejemplo un chico al que se le enva a su habitacin despus de comportarse mal es un ejemplo de tiempo-fuera, o un soldado que es enviado al calabozo por ausentarse del cuartel sera otro ejemplo. Otras tipologas del castigo lo dividen en: a) Castigo primario: aquel que es directo, como por ejemplo un golpe; b) Castigo secundario: sera aquel que es aprendido por condicionamiento. No causa dao directo. Por ejemplo, educamos al nio para que por 100 puntos pueda conseguir una bicicleta, los puntos se le dan cuando el nio se porta bien, pero cuando el nio tiene una conducta inapropiada se le quita puntos, este sera un castigo secundario, ya que no causa dao directo; y c) Castigo social: cuando involucra situaciones sociales como ridculo, la risa La i mport anc i a del Ref uerzo en l a c onduc t a La mayor parte de las conductas, especialmente las conductas sociales se pueden considerar como pautas de respuestas voluntarias, instrumentales u "operantes". Los refuerzos que siguen a estas conductas pueden alterar la posibilidad de aparicin futura de acciones similares. Los eventos, casi ilimitados, que se pueden identificar como refuerzos incluyen tanto gratificaciones sencillas (caramelos, juegos...) como gratificaciones cognitivas ms complicadas (escuchar con atencin, prestar atencin, reconocimiento de las capacidades y los xitos...). Cualquier condicin que altere los refuerzos a los cuales conduce habitualmente una respuesta, cambia tambin la probabilidad de que ocurra esta conducta en otras ocasiones similares. Esto 6 queda claramente demostrado en estudios diseados para cambiar sistemticamente la conducta de los nios. Algunos de los pasos que hay que tener en cuenta en el uso de reforzadores son: 1) definir cuidadosamente la conducta que ha de recompensarse de manera que el reforzador pueda seguir a la respuesta apropiada; 2) conocer la importancia real de los reforzadores que se van a usar para el sujeto en cuestin; 3) cuando la conducta aparece, debe mantenerse en un programa adecuado de reforzamiento. Programas de Ref orzami ent o Refuerzo de razn fija: el refuerzo se aplica cuando el sujeto ha emitido un nmero determinado de respuestas. Por ejemplo, damos comida a una paloma cuando presiona la palanca cuatro veces seguidas. Refuerzo de razn variable: el refuerzo se aplica de forma variable pero en torno a una media de respuestas. Es decir, siguiendo el ejemplo anterior, unas veces cuando presiona la palanca cuatro veces seguidas, otras cuando la presiona diez veces, etc. De esta forma la paloma aprender a presionar la palanca muchas veces. Refuerzo de intervalo fijo: en este caso se refuerza el tiempo. Por ejemplo, damos comida a una paloma cada cinco minutos si presiona la palanca. No recibe refuerzo, cada vez que la presiona sino slo si lo hace tras el intervalo que nosotros deseamos. Refuerzo de intervalo variable: en este caso se refuerza con tiempos variables pero en torno a una media. Los programas de razn o intervalo variable son ms resistentes a la extincin que los fijos, ya que el sujeto o animal puede recibir el refuerzo en cualquier momento, por lo que emitir la respuesta con mayor frecuencia.
ACTIVIDAD PROPUESTA OBJETIVOS El objetivo general de esta prctica consiste en facilitar al alumno/a la compresin de los conceptos ms bsicos del condicionamiento operante (tipos de refuerzo, de castigo, de programas) mediante la aplicacin del mismo a supuestos concretos. TAREAS A REALIZARI Teniendo presentes las nociones y principios del condicionamiento operante, contesta las preguntas que aparecen tras cada ejemplo. EL REFUERZO: CARACTERSTICAS Y TIPOS DE REFORZAMIENTO 1) A Federico le han comprado una bicicleta por haber sacado buenas notas. De qu tipo de reforzamiento se trata: positivo o negativo? Comestible, tangible, intercambiable, de actividad, social...? Cmo podemos saber si realmente ha funcionado como refuerzo?
I Los casos presentados en esta prctica han sido elaborados en colaboracin con la Prof. Gemma Pastor y el Prof. Francisco Alonso 7 2) Luca ha sido aplaudida durante un largo rato despus de su intervencin en pblico. De qu tipo de reforzamiento se trata: positivo o negativo? Comestible, tangible, intercambiable, de actividad, social...?
3) Mara se ha tomado una aspirina porque le duele la cabeza. De qu tipo de conducta instrumental se trata: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo? Cmo podemos saber si realmente ha funcionado como refuerzo?
4) Qu tipo de conducta instrumental constituye la accin de apagar el despertador que no para de sonar: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo?
5) Qu tipo de conducta instrumental constituye la accin de salir de la sala de cine cuando la pelcula que estn proyectando es tremendamente aburrida: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo?
6) Podras poner otro ejemplo del tipo de conducta instrumental que caracteriza a los tres casos anteriores?
7) Qu tipo de conducta instrumental constituye la accin de ponerse bajo techo ante un cielo gris cubierto de nubes que amenaza tormenta: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo?
8) Qu tipo de conducta instrumental constituye la accin de apagar el despertador antes de que comience a sonar: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo?
9) Podras poner otro ejemplo del tipo de conducta instrumental que caracteriza a los dos casos anteriores?
10) Qu tipo de conducta instrumental constituyen en general las conductas de prevencin: evitacin o escape? De qu tipo de reforzamiento se trata: positivo o negativo?
8 11) Un nio que ha pegado a su hermano pequeo recibe una fuerte reprimenda de sus padres por su mal comportamiento. Sin embargo, a partir de entonces el nio comienza a pegar a su hermano pequeo con ms frecuencia. Qu tipo de estmulo consideras que ha sido la reprimenda: refuerzo o castigo? Cmo explicaras este aumento de la frecuencia en la conducta del nio de pegarle a su hermano pequeo?
12) Luisita es una nia de 6 aos que llora cada vez que entra en el supermercado con sus padres porque quiere que le compren una chocolatina que al principio siempre le niegan. Sus padres algunas veces le compran la chocolatina y otras veces no. Y Manolita es una nia de 6 aos que llora cada vez que entra en el supermercado con sus padres porque quiere que le compren una chocolatina que al principio siempre le niegan. Sus padres siempre terminan comprndole la chocolatina. Qu tipo de reforzamiento recibe cada una de las nias: continuo o intermitente? En cul de los dos casos se producir ms rpidamente la adquisicin de la conducta instrumental de llorar? En cul de los dos casos la conducta instrumental de llorar ser ms resistente a la extincin? Puesto que se trata de una conducta no deseable, Cmo crees que se podra eliminar?
13) A Juanito, de 9 aos, su profesora le felicita delante de sus compaeros cada vez que lleva hechos los deberes a clase. Sin embargo, a Pepito, de 9 aos, slo le felicita algunas veces cuando lleva hechos los deberes. Qu tipo de reforzamiento recibe cada uno de las nios: continuo o intermitente? En cul de los dos casos se producir ms rpidamente la adquisicin de la conducta instrumental de llevar hechos los deberes cada da? En cul de los dos casos esa conducta instrumental ser ms resistente a la extincin? Puesto que se trata de una conducta deseable, Qu crees que se podra hacer para mantenerla a largo plazo?
14) Lee este caso de adquisicin de una respuesta por condicionamiento operante y responde a las cuestiones planteadas al final del mismo. "Deja de charlar, Miguel!", increpa la profesora en la clase de ingls. El xito es moderado. "Miguel, cuntas veces tengo que decirte que no molestes a tus compaeros con tu parloteo?" Como hay que escribir a lpiz, hay que preparar y sacar punta a los lapiceros, Miguel deje caer la esfera de su sacapuntas, que, como era de esperar, se abre de golpe vaciando su contenido por el suelo. "Caramba, Miguel! Tenas que hacer eso? Recoge los papeles y pon todo en orden". Arrastrando los pies se retira y al cabo de un rato regresa sin los tiles de escribir. "Ni las cosas ms sencillas se te pueden decir...". Con todo ello la atencin de los alumnos y alumnas hace ya mucho que no est centrada en la gramtica; la interrupcin es perfecta.... Ahora se hacen preguntas orales sobre vocablos. "Disfrutar?, pregunta la profesora. Los alumnos levantan sus manos. "To enjoy", destaca la respuesta de uno de ellos. "Sorber?, es la pregunta inmediata de la profesora. Y todo discurre como de carrerilla, hasta que Miguel levanta la mano. Para poner de relieve su 9 aplicacin chasquea los dedos, agita la mano en el aire, de un lado para otro, y subraya cada movimiento con suspiros profundos... -" Miguel!" -"Eh? Por favor cul era la palabra?". Se oyen carcajadas. -"Ahora presta, por fin ms atencin! Mascar!" -"Mascar, ah s... Eh?..." -"Presta ms atencin la prxima vez, de lo contrario no lo sabrs el prximo mircoles! Mascar?" -" To chew! -"Chupar? ..." Naturalmente esta secuencia de instruccin contiene una serie de procesos, de conexiones estmulo- reaccin, que se han formado en razn de unas circunstancias perfectamente definidas. En nuestro ejemplo podemos suponer que Miguel parlotea de una forma totalmente espontnea. En tales reacciones se trata de un comportamiento operante, segn la terminologa de Skinner. Y lo caracterstico al respecto es que la profesora reacciona al mismo. 1. Por qu crees que Miguel se comporta de esta manera?
2. Cual es el estmulo reforzador para Miguel?
3. Que hace Miguel con el objetivo de conseguir el estmulo reforzador?
4. Qu consigue la profesora con sus reacciones ante la conducta de Miguel?Por qu?
5. En que se diferenciara este proceso del proceso del condicionamiento clsico.