Vous êtes sur la page 1sur 60

CONDICIONAMIENTO

OPERANTE o
INSTRUMENTAL

Antecedentes Histricos
La Teora Motivacional de Hull
En su Teora de la Motivacin Adquirida
introdujo variables intermedias, no
estrictamente conductuales, lo que permiti
que el modelo se ampliara.

Su modelo tuvo influencia entre 1930 y 1960 y


fue al que se acogi Skinner para proponer el
Condicionamiento Operante.

Antecedentes Histricos
Hull, adems introdujo el concepto de
Motivacin del incentivo
(consecuencias).
El incentivo motiva y aumenta la
probabilidad de producir respuestas. Esta
recompensa puede ser material o
afectiva
La magnitud de la recompensa
aumenta la intensidad de la motivacin.

Antecedentes Histricos
Hay respuestas que no tienen incentivo y,
por lo tanto, se inhiben debido a que
evitamos los acontecimientos frustrantes.
(Modelo de Desesperanza Aprendida,
David Seligman))
Hull sugiere que la ausencia de
recompensa da lugar, por medio de la
inhibicin de conducta habitual, al
fortalecimiento de otras conductas.

Condicionamiento
Instrumental u Operante
Proceso de aprendizaje que implica la
manipulacin de las consecuencias de
una respuesta, en forma tal que se
incremente o disminuya la probabilidad
de dicha respuesta.

Condicionamiento Instrumental
u operante
Los procedimientos de condicionamiento
instrumental se pueden emplear para
incrementar la probabilidad de que se den
las respuestas instrumentales (orientadas
a una meta).
Al mismo tiempo, dichos procedimientos
pueden emplearse para disminuir la
probabilidad de otras respuestas
irrelevantes o indeseables

Condicionamiento Instrumental
u operante
Al condicionamiento instrumental, tambin
se le llama Condicionamiento Operante, ya
que las respuestas que implica pueden
verse como operaciones del sujeto sobre
el ambiente para asegurar el refuerzo.

Condicionamiento Instrumental
u operante
Distincin entre Condicionamiento
Instrumental y Operante:
C. Instrumental: Cuando el ambiente
limita las posibilidades de
recompensa (investigaciones de
laboratorio).
C. Operante: Implica situaciones en
las que no hay limitacin en la
cantidad de reforzamiento que puede
obtenerse (Klein, 1997, p148).

Thorndike y el Impacto de las


consecuencias

Edward Lee Thorndike, Psiclogo


estadounidense.
Experimentos: Gatos / Jaulas
Problema.

Primeras investigaciones del


Condicionamiento Instrumental
Edward Thorndike (1874-1949)
Trabaj con gatos y trat de demostrar, no
que pensaban, sino que respondan por
reacciones al medio (emitan una
respuesta a consecuencia de algo).
Interaccionismo o Conexionismo de
Thorndike: Bastaba que hubiera
interaccin con el medio para que se
produjera una respuesta.

Antecedentes del Condicionamiento


Instrumental
Edward Thorndike (1874-1949)

Demostr cmo los animales, que


inicialmente operaban por ensayo y error,
al tocar los mecanismos de apertura en
forma accidental, aprendan la conexin
decisiva, mejorando su actuacin en
ocasiones posteriores.
Los animales no tenan alma ni inteligencia,
por lo tanto slo respondan a determinados
estmulos del medio a travs de su capacidad
fsica.

Antecedentes del Condicionamiento


Instrumental
Aprendizaje por Ensayo y Error (Thorndike):

El sujeto no es pasivo, como ocurre con los


perros de Pavlov.
Los organismos aprenden a actuar sobre el
ambiente de manera tal de obtener una
recompensa. Este sera un estado de
satisfaccin.
Los gatos de Thorndike y las personas se
adaptaran lentamente al ambiente, y esta
clase de respuesta no sera refleja.

Las 3 leyes de Thorndike


1. Ley del Efecto
Thorndike dedujo que los actos son
eliminados o fijados en funcin de sus
consecuencias:
Los que conducen a un estado
satisfactorio son aprendidos,
Los
que
llevan
a
un
estado
insatisfactorio, son eliminados.

Dadas las implicancias mentalistas y


subjetivas
de
los
conceptos
de
satisfaccin o insatisfaccin, la Ley del
Efecto fue modificada por la Ley Emprica
del Efecto: Si en presencia de un E se da
una R que va seguida de un refuerzo, al
presentarse nuevamente el E aumentar
la probabilidad de que se d la R. Si una
R va seguida de un no-refuerzo, la R
tiende a ser eliminada.

2. Ley del Ejercicio


Implica que cuando ms repeticiones
hagamos de un acto, ste va a ser
ejecutado de mejor forma.
La prctica mejora la posibilidad de
conectar una conducta con una
consecuencia.

3. Ley de la Disposicin
Hace referencia a la posesin, por parte
del organismo, de las capacidades y
condiciones
necesarias
(atencin,
motivacin y desarrollo) para realizar el
aprendizaje.
Ha tenido una gran influencia en la
prctica
educativa, sealando las
etapas y momentos ms adecuados
para cada aprendizaje.

Frederic Skinner
(1904-1990)
Psiclogo, Padre del
Condicionamiento Operante.
Premio Nacional de Ciencias, EEUU, 1968.
Sistematizacin, divulgacin y aplicaciones
del Condicionamiento Operante o
Instrumental.
Las leyes generales del aprendizaje son las
mismas para todos los organismos,
cualquiera sea su especie.

Experimentos de Laboratorio
Distingui
entre
Condicionamiento
Operante
(CO)
y
Respondiente
o
clsico(CC), el que a su juicio,
comparado con el operante, se
reduce a una parte mnima de
la
conducta
total
del
organismo.

Experiment con palomas y ratas:


Los animales aprenden a presionar una
palanca con el fin de obtener
alimento.

Experimentos de Laboratorio
En condiciones de laboratorio, un ratn en la caja
de Skinner no obtiene un premio o recompensa, o
no logra librarse de una situacin de castigo, a
menos que ejecute (o se abstenga de ejecutar) una
determinada respuesta o conducta

En la primera situacin (condicionamiento


Apetitivo), el ratn (sin comer por algn
tiempo) obtiene comida slo si logra apretar
una palanca.
En la segunda situacin (de condicionamiento
aversivo) el animal puede escapar de una
situacin de castigo (piso de la jaula
electrificado) slo si logra saltar al
compartimiento contiguo.

Experimentos de Laboratorio
En ambos casos se llega a
establecer
una
conexin
entre
una
Respuesta
(presionar la palanca o saltar)
y un determinado EstmuloConsecuencia
(K)
gratificante
(alimento
o
escape del castigo.)
Conexin R-E
A estas situaciones experimentales, se puede
agregar una clave o estmulo discriminativo
(luz, sonido, etc) que seala al organismo la
oportunidad de ejecutar u omitir la respuesta.

Estmulo discriminativo ( ED )
Respuesta ( R )
Estmulo consecuencia o reforzador
( ER )
ED

ER

Contingencia de tres tiempos:


Un estmulo discriminativo da la ocasin para
emitir una respuesta que es seguida por un
estmulo reforzador (K: consecuencia).
A diferencia del C.C., en que la conexin que
se logra es E-R (EC-RC), ac es R-E (R-EK)

Estmulo
Discriminativo
No es similar a un Estmulo Condicionado
del Condicionamiento Pavloviano, ya que
ac las respuestas u 'operantes' no estn
mediadas por el SNA, sino por el SNC. No se
trata de respuestas reflejas involuntarias.
Esto no quita que el sujeto de experimento,
aparte de realizar la operante (apretar la
palanca o saltar), pueda al mismo tiempo
tener RC clsicamente, tales como:
secreciones glandulares y otros.

Contingencia
Relacin entre dos hechos, de manera
tal que, si ocurre uno de ellos, ocurrir
el otro.
Concepto muy usado por los tericos del
Condicionamiento Operante para
describir las relaciones ConductaReforzador o Conducta- Consecuencias
(K).

Refuerzo o Reforzamiento
Trmino genrico para referirse
al procedimiento general de
utilizacin de premios o
castigos, con el fin de afianzar
determinados
comportamientos.

Refuerzo o Reforzamiento
Reforzadores
o
Estmulos
Consecuencia (EK):
Cualquier estmulo que aumenta la
probabilidad de una respuesta.
El organismo aprende que la aparicin
de un reforzador es contingente a que se
presente la respuesta en primer lugar.
Ejemplo: Felicitaciones, reconocimiento
en dinero, buenas calificaciones, etc.,
tras haber ejecutado una respuesta que
se considera esperada.

Clasificacin de Estmulos
Reforzadores
Primarios, con valor natural o innato
reforzante, y Secundarios con valor reforzante
adquirido por su asociacin previa con
reforzadores primarios.
Ej: alimento, agua, sexo y descanso (primarios).
Dinero, diplomas, calificaciones (secundarios).
Tangibles o concretos v/s Simblicos o
tokens. Estrellitas, fichas o diferentes smbolos
que generalmente usan los educadores.

Clasificacin de Estmulos Reforzadores


No sociales v/s sociales
(felicitaciones, abrazos, besos, muestras
de aprecio, prestar atencin, etc., son
todos reforzadores sociales).
Generalizados v/s no generalizados:
los primeros siempre funcionan como
reforzadores sin depender de un estado
de privacin o necesidad de parte del
organismo (ej. dinero, que nos presten
atencin). Los no generalizados (ej.
alimento, agua), operan como
reforzadores en tanto el organismo
experimenta hambre o sed (segn ej.).

Reforzamiento Positivo y
Negativo
R. Positivo:
Estmulo que se aade al entorno.
Incrementa la respuesta precedente.
R. Negativo:
La realizacin de una accin elimina un
elemento negativo del ambiente.
Incrementa la respuesta precedente.

Esquema de Accin
Reforzamiento Positivo
Estmulo
Discriminativo

Respuesta
Deseada

Presentacin
Estmulo
Reforzador

Seala la situacin en
que debe emitirse la
respuesta

Respuesta que se
desea fortalecer

Estmulo que se presenta


contingente a la
respuesta deseada

Esquema de Accin
Reforzador Negativo
Estmulo
Discriminativo

Seala la situacin
en que debe emitirse
la respuesta

Respuesta
Deseada

Respuesta que se
desea fortalecer

Eliminacin o
evitacin del
Estmulo

No presentacin o
eliminacin de un
estmulo aversivo

Dos tipos de Refuerzo


Negativo
Condicionamiento de Escape:
Se fortalecen conductas para terminar
sucesos que se estn presentando y que
el organismo considera desagradables.
Condicionamiento de Evitacin:
Se fortalecen conductas que posponen o
previenen algo que el organismo prev
que
puede
ser
desagradable.
A
diferencia del Escape, aqu se puede
identificar
un
estmulo
o
clave
discriminativa.

Reforzamiento Positivo y Negativo


Ambas situaciones aumentan a futuro la
probabilidad de ocurrencia de la
respuesta.
En casos muy frecuentes de interaccin
humana, suelen ocurrir ambas
situaciones (Ref.+ y -) al mismo tiempo,
potencindose mutuamente: ej, pataletas
de nio en el supermercado.

El Castigo
Distinto al reforzamiento negativo
Estmulos Aversivos: Estmulos
desagradables o dolorosos que se agregan
al ambiente despus de una determinada
conducta.
Disminuye probabilidad de que la conducta
se repita.
Positivo (Presentacin estmulo
desagradable).
Castigo
Negativo (Retiro de un
reforzador positivo,
estmulo placentero).

Desventajas del Castigo


No es constructivo.
No es permanente en sus efectos, salvo
en el dao que produce.
No ensea a las personas a comportarse.
Provoca clera, frustracin y reacciones
agresivas.
Los lugares y personas que los aplican se
asocian aversivamente.

Esquema de las 4 situaciones bsicas


del C. Operante
El estmulo
es aplicado

+
Estmulo
reforzador
positivo
(agradable)
Estmulo
negativo
(nocivo,
desagradable)

El estmulo
es removido

REFUERZO

CASTIGO

POSITIVO

(Por omisin de
recompensa)

(recompensa)
CASTIGO

REFUERZO

(Por aplicacin de
estmulo
aversivo)

NEGATIVO
(escapeevitacin)

En estos casos aumenta a futuro la


probabilidad de ocurrencia de la conducta.

Entrenamiento en
Discriminacin
Si el sujeto recibe los
reforzadores positivos al ejecutar
la respuesta correcta, solamente
cuando est presente un
estmulo o clave
discriminativa y no en otras
ocasiones, tendremos el
entrenamiento de discriminacin.

Entrenamiento de
Omisin
Se define como una situacin en la que
la respuesta impide la presentacin de
un estmulo reforzador positivo.
En trminos conductistas, el
reforzamiento positivo es contingente a
no responder.
Si el sujeto se abstiene de responder no
pierde privilegios o estmulos
reforzadores.

Mtodo de Aproximaciones
Sucesivas
Estrategias de reforzamiento positivo
tambin llamada Moldeamiento.
(Diferenciacin de respuestas).
Conducta que se desea desarrollar es
reforzada en sus intentos.
Se refuerzan conductas ms acertadas.
Selectividad en los refuerzos de acuerdo a
su aproximacin al objetivo.

Encadenamiento de
Respuestas
Skinner sostiene que muchos actos son una
secuencia de movimientos en los que cada
segmento proporciona estmulos de
retroalimentacin (externos e internos), que se
vuelven discriminativos para el siguiente
segmento.
Nota: Seguir una carrera y, finalmente, ejercer una
profesin, estn marcadas por complejas cadenas ED-RER. Con ello se asegura la disponibilidad ulterior de
estmulos reforzadores primarios.

Encadenamiento de Respuestas
Operante
Operanten
n
11

Estmulo
Estmulodiscriminativo
discriminativo
Localizacin
Localizacinde
dela
lapalanca
palanca

22

Palanca
PalancaVisual
Visual

33

Palanca
Palancatctil
tctil

Respuesta
Respuestade
dela
larata
rata
La
Larata
ratase
seacerca
acerca
al
frente
de
la
caja.
al frente de la caja.
Se
Sealza
alzasobre
sobrelas
laspatas
patas
traseras,
traseras,coloca
colocalas
las
patas
delanteras
patas delanterassobre
sobre
la
palanca.
la palanca.
Presiona
Presionapalanca
palancaque
queactiva
activa
el
dispensador
de
comida.
el dispensador de comida.

44

Ruido
Ruidodel
delaparato
aparato

Baja
Bajalas
laspatas
patasdelanteras
delanterasal
al
comedero.
comedero.

55

Bolita
Bolitade
dealimento
alimentovisibl
visibl

Toma
Tomala
labolita
bolitacon
conlos
los
dientes
y
patas
delanteras.
dientes y patas delanteras.

66

Bolita
Bolitade
dealimento
alimentoen
enel
el
hocico
hocico

Mastica
Masticala
labolita.
bolita.

Programas de Reforzamiento
Especificaciones o reglas relativas
la
aplicacin de los reforzadores: en qu
circunstancias y de acuerdo a qu
criterios deben otorgarse.
Programas de Reforzamiento continuo.
Programas Simples de Reforzamiento
Intermitente
Programas
Concurrentes:
Eleccin
compleja.

Programas de Reforzamiento
Aplican factores temporales y de
frecuencia adoptando formas especficas
de entrega de refuerzos, con lo cual se
aumenta la conducta deseada.
Dos tipos:
P. Reforzamiento Continuo: La
conducta es reforzada toda vez que se
presenta.
P. Reforzamiento Parcial: La conducta
se refuerza slo en algunas ocasiones.

Programas de Reforzamiento
P. R. Continuo:
Se aprende ms rpido.
Menos resistentes a la extincin (la
extincin se produce rpido).
P. R. Parcial:
Ms duradero, al mantener el desempeo
por ms tiempo.
Programas de Razn
Se dividen
Programas de Intervalos

Fija

Variable
Fija
Variable

Programas de Razn
El reforzador se administra despus de un
nmero de respuestas. Se generan tasas de
respuestas ms elevadas.
Programas de Razn Fija: El reforzamiento
se aplica solamente despus de un
determinado nmero de respuesta.
Ej: Por cada tres goles al futbolista se le
da un bono en dinero.
Programas de Razn Variable: El
reforzamiento se proporciona despus de un
nmero variable de respuestas correctas.
Ej: Venta v/s ofertas del producto.

Programas de Razn

Programas de Razn Variable v/s


Fija
P. R. V. promueven un alto grado de
respuesta. La incertidumbre de
desconocer cuando llegar el prximo
reforzador hace que el organismo
trabaje en forma constante.
P. R. F. menos resistente a la extincin
que el variable.

Programas de Intervalo
Dependen del transcurso del tiempo.
Se dividen:
Programas de Intervalo Fijo: se
proporciona un reforzamiento a
intervalos de tiempos establecidos.
Ejemplo: Exmenes de fin de ao.
Programas de Intervalo Variable: el
tiempo trascurrido entre los
reforzamientos vara. Ejemplo:
Exmenes sorpresa.

Programas de Intervalo
Programas de Intervalo Fijo v/s Variable:
P. I. F. producen una tasa desigual de
respuestas. Despus del reforzador la
frecuencia de conducta es baja,
incrementa durante el intervalo y
alcanza un nivel elevado justo antes del
reforzamiento.
P. I. V. tasas ms estables de
respuestas.

PROGRAMAS SIMPLES DE REFUERZO


INTERMITENTE
Razn
fija

Razn
variable

Intervalo
fijo

Intervalo
variable

Ejemplo de registros acumulativos de los distintos programas de


reforzamiento intermitente.

Programas de Refuerzo
Con una conducta inestable habr que
comenzar con un programa de refuerzo
continuo, pasando posteriormente a
programas parciales, que son los ms
efectivos para la conservacin de la
conducta.

Posibilidades en el repertorio
conductual del sujeto
A) El sujeto no posee en su repertorio
conductual la conducta que se espera
(mutismo selectivo, falta de hbitos, timidez)
B) La conducta est presente, pero es dbil e
inconsistente (no termina tareas, llega tarde,
poco colaborador)
C) El sujeto posee con gran intensidad
conductas inadecuadas en su repertorio
(agresividad, impulsividad, berrinches)

Procedimientos segn el caso


A) moldeamiento-aproximaciones sucesivas
o Modeling o imitacin.
B) Programas de Refuerzo, al comienzo
continuos y posteriormente intermitentes.
C) Extincin, Refuerzo de conductas
incompatibles, Saciedad, Eliminacin de
estmulos discriminativos, castigos, etc.

Otras Tcnicas de modificacin


conductual.
Moldeamiento o mtodo de
aproximaciones sucesivas (shaping):
Consiste en crear una conducta nueva a
partir de conductas ya existentes, que de
alguna manera, se relacionan con ella.
Se refuerzan gradualmente slo aquellas
respuestas que ms se parecen a la
conducta final.

Otras Tcnicas de modificacin


conductual
Extincin:
Consiste en suspender los
reforzadores, es decir, suprimir las
consecuencias que mantienen en
accin conductas desadaptativas.

Otras Tcnicas de modificacin


conductual
Reforzamiento de Conductas
incompatibles o alternativas:
Mtodo para suprimir conductas, sin
necesidad de utilizar castigos o refuerzo
negativo que generen rechazo. Consiste en
reforzar positivamente conductas opuestas
o diferentes a la indeseable.

Otras Tcnicas de modificacin


conductual
Saciedad:
Se basa en el uso del propio reforzador,
pero otorgado en exceso: el sujeto recibe
tantos reforzadores, que llega a perder su
motivacin por obtenerlos.

Otras Tcnicas de modificacin


conductual
Eliminacin de Estmulos
Discriminativos:
Exige identificar, en primer lugar, los
estmulos o situaciones que desencadenan
la conducta indeseable. Luego se ordenan
las cosas del tal manera que el nio no se
vea expuesto a tales estmulos.

Otras Tcnicas de modificacin


conductual
Refuerzo Negativo:
Organizar las cosas de tal modo que pueda
salir de una situacin levemente aversiva o
incmoda, con slo mejorar su conducta.

ETAPAS PROGRAMA DE
MODIFICACIN CONDUCTUAL
Definir operacionalmente la conducta que
se quiere fomentar o eliminar
Determinar los posibles reforzadores de
acuerdo a la edad y caractersticas del
sujeto
Dedicar un periodo de tiempo a una
cuidadosa observacin de la conducta
Aplicar el programa
Evaluar

Similitudes y Diferencias entre


C. Clsico y C. Operante
Los procesos de discriminacin y
generalizacin tienen lugar en ambos.
En el C. Clsico, el estmulo incondicionado
antecede a la respuesta.
En el C. Operante, la respuesta se emite
antes del reforzamiento.
C. Clsico = Respuesta involuntaria.
C. Operante = Respuesta voluntaria.

Comparacin entre Conductas


Respondientes y Operantes
RESPONDIENTE

OPERANTE

E-R
Est.condic R.condic

R-E
Resp estim.
consec

Provocada por el
estmulo
(automticamente)

Emitida por el
organismo
activante

Autonmico

Central

Viscerales

Esquelticas

Control voluntad

No

Si

Asociacin que se
refuerza

De estmulos: E - E

De respuesta y
estmulo: R - E

Refuerzo

Presentacin del EI
muy cercano en el
tiempo.

Presentacin o
eliminacin de
estmulos

Relacin
fundamental que
se logra
Origen y control de
la respuesta
Sistema nervioso
Respuestas

Vous aimerez peut-être aussi