Vous êtes sur la page 1sur 25

Comportamento Respondente:

Condicionamento

A. Reflexos Condicionais O condicionamento respondente é um tópico


Tipos de Condicionamento que tem dominado a Psicologia da Aprendiza-
Condicionamento e Contigüidade gem de tal maneira que compõe o capítulo de
Combinações de Estímulo no Condicionamento abertura de muitos livros-texto sobre aprendiza-
Sombreamento e Bloqueio
gem. Além da expressão condicionamento res-
Estímulos Inibitórios em Compostos
Pré-condicionamento Sensorial e Condicionamento pondente, esse tópico tem sido referido por no-
de Segunda Ordem mes como condicionamento clássico e condicio-
Contigüidade e Conseqüências namento pavloviano. A linguagem dos reflexos
Automodelagem e Automanutenção condicionados, em alguma medida, penetrou no
vocabulário do cotidiano (embora, no uso popu-
B. Interações Operante-Respondente: Emoção
Condicionamento e Emoção lar, haja confusão freqüente com instâncias de
Estímulos Pré-aversivos e Pré-apetitivos comportamento operante).
O termo condicionado, da expressão russa
C. Limites Biológicos da Aprendizagem para reflexos condicionados, uslovnyi refleks,
Limites Sensoriais
poderia ter sido melhor traduzido como condi-
Limites Motores
Limites sobre as Conseqüências cional, porque o termo foi aplicado para desig-
Preparação nar reflexos condicionais a relações entre estí-
mulos ambientais. O condicionamento respon-
dente é uma instância de controle de estímulo
aplicado a operações de apresentação de estímulo
em vez de a contingências envolvendo opera-
O vocabulário relativo à emoção inclui inúme-
ros grupos etimológicos. Por exemplo, eager (dese- ções de conseqüenciação. Em outras palavras,
joso), anger (cólera) e anxiety (ansiedade) compar- em vez de sinalizar as conseqüências do respon-
tilham as mesmas raízes com choleric (colérico), der, um estímulo simplesmente sinaliza a apre-
melancholy (melancolia), glad (alegre) e glee (re- sentação de um outro estímulo. O condiciona-
gozijo), wrath (ira) e worry (preocupação) e sad (tris- mento, por Pavlov, de reflexos de salivação, for-
te) e satisfy (este último par está relacionado a sati-
ate, saciar). A palavra fear (medo), do indo-euro- nece o exemplo prototípico: quando uma sineta,
peuper- (tentar, arriscar, impulsionar, empurrar para repetidamente, sinalizava a colocação de comi-
frente ou liderar), tem um extenso grupo de paren- da na boca de um cão faminto, a salivação, que
tesco que inclui experiment (experimento) e appa- era eliciada pela comida, passou a ser eliciada
ratus (aparato), probability (probabilidade) e oppor- também pelo estímulo sinalizador. (Ironicamente,
tunity (oportunidade), approach (abordagem) e de-
privation (privação), e dois sinônimos contemporâ- é possível que Pavlov nunca tenha usado uma si-
neos de behavior (comportamento), comportment neta em seus experimentos; sua rara menção a si-
(comportamento) e performance (desempenho). netas ocorre somente em trabalhos posteriores e,
neste caso, provavelmente, referem-se a dispositi- camos o comportamento respondente através de
vos operados eletricamente. As onipresentes refe- modificações em tais estímulos. Por exemplo, di-
rências à sineta de Pavlov podem ter se originado ferentes concentrações de ácido na boca (p. ex.,
a partir do uso comum, nos escritos de J. B. Wat- diluições de vinagre) eliciam diferentes quanti-
son e outros, de exemplos sobre a salivação diante dades de saliva. Isso significa que há limites na
de um toque de sineta que avisa às pessoas que o extensão pela qual podemos modificar o com-
jantar está pronto. Pavlov possuía de fato uma si- portamento respondente. Podemos criar novos
neta, mas a deixava sobre a escrivaninha, usando- operantes através da modelagem, mas as proprie-
a, provavelmente para chamar seus auxiliares.) dades dos respondentes são determinadas por
Ao discutir sobre o comportamento operan- seus estímulos eliciadores, de modo que não há,
te, falamos de classes de respostas, em vez de para o comportamento respondente, um proce-
instâncias individuais, porque as respostas indi- dimento análogo à modelagem. Mas podemos
viduais nunca são repetidas exatamente. Proble- alterar os efeitos eliciadores dos estímulos. Exa-
mas similares existem com o comportamento minemos, com mais detalhes, o procedimento de
eliciado. Por exemplo, as eliciações sucessivas Pavlov (1927)
de saliva pela comida podem diferir em latên- Comecemos com um cão preso em arreios,
cia, quantidade, viscosidade e outras proprieda- com um de seus dutos salivares conectados a um
des. Portanto, é apropriado estender a linguagem sistema que registra a salivação. Usamos dois
de classes de modo a abranger também as res- estímulos: o som de uma campainha e comida,
postas definidas pelos estímulos que as produ- esta última em uma forma que possa ser deposi-
zem. Essas classes, denominadas respondentes, tada diretamente na boca do cão. Primeiro, exa-
correspondem ao comportamento anteriormen- minemos os efeitos de cada estímulo separada-
te denominado eliciado ou reflexo. Assim, a sa- mente. Quando tocamos inicialmente a campai-
livação produzida pela comida na boca é uma nha, o cão levanta as orelhas e vira a cabeça em
classe respondente; ela deve ser distinguida da direção ao som. Isso tem sido chamado de uma
salivação produzida pelo ácido na boca, que é resposta de orientação. Ela diminui à medida que
uma classe respondente diferente, e também da a campainha é repetidamente acionada, tornan-
salivação espontânea. Esta última não é de modo do-se, talvez, até mesmo impossível de detectar;
algum uma classe respondente, uma vez que não ela pode ser restabelecida se esperarmos algum
há um estímulo eliciador (a salivação espontâ- tempo antes de soar novamente a campainha (cf.
nea é emitida, e não eliciada; se pudéssemos iden- habituação, Capítulo 4). Quando a comida é co-
tificar um estímulo eliciador não diríamos que locada na boca, o cão engole e saliva. Essas res-
ela é espontânea). postas podem diminuir um pouco à medida que
Daremos início a este capítulo, discutindo o a comida é repetidamente colocada, mas a mag-
comportamento gerado por vários tipos de con- nitude delas permanece substancial durante o
dicionamento pavloviano ou respondente. De- curso de uma sessão.
pois, vamos considerar como tal comportamen- Suponhamos agora que a campainha passe a
to pode interagir com o comportamento operan- sinalizar a comida, tocando por 5 s antes de cada
te. Veremos que essas interações são relevantes apresentação de comida. Depois de um número
para o tópico da emoção. Terminaremos o capí- de tentativas, a salivação passa a iniciar-se, al-
tulo com uma seção sobre as restrições biológi- gumas vezes, no período de 5 s entre a campai-
cas sobre a aprendizagem. nha e a comida, e, algumas vezes, a campainha é
seguida por salivação até mesmo em uma tenta-
tiva ocasional em que a comida for omitida. Em
nenhum desses dois casos, podemos atribuir a
Seção A Reflexos Condicionais salivação à ação da comida como estímulo eli-
ciador: no primeiro caso, a salivação teve início
Produzimos comportamento respondente antes que a comida fosse apresentada, e no se-
através da apresentação de estímulos e modifi- gundo caso a comida nem mesmo chegou a ser

A p re n d iz a g e m 211
apresentada. Na medida em que a campainha ad- A diferença entre um estímulo condicional e
quiriu o poder de eliciar a salivação, dizemos um estímulo incondicional não é simplesmente
que criamos uma nova classe respondente, a sa- qual dos dois vem primeiro. Se invertessemos a
livação eliciada pelo som da campainha. Nós de- ordem deles, os efeitos eliciadores da comida
nominados a relação entre a campainha e a co- quando seguida pela campainha não seriam
mida de reflexo condicional, porque essa rela- muito diferentes dos efeitos da comida quando
ção é condicional a uma relação prévia entre a apresentada sozinha. De fato, podemos ser ca-
campainha e a comida. pazes de predizer a eficácia relativa de estímu-
A seqüência de eventos é ilustrada na Figura los como CSs e USs, a partir das probabilidades
12.1. A campainha inicialmente elicia respostas de que estes estímulos eliciem suas respectivas
de orientação, mas elas desaparecem com as respostas (cf. Capítulo 5 sobre a relatividade do
apresentações repetidas; neste ponto, a campai- reforço). Consideremos, por exemplo, a saliva-
nha é um estímulo neutro (NS). A comida elicia ção eliciada pela comida na boca de um cão e a
a salivação, em um reflexo incondicional; nessa flexão da perna produzida por um choque na
relação, a comida é um estímulo incondicional, perna do cão. Um choque brando pode tornar-
ou US, e a salivação é uma resposta incondicio- se um estímulo condicional, eliciando a saliva-
nal, ou UR. O condicionamento se inicia quan- ção, se a sua apresentação for sistematicamente
do a campainha prediz com fidedignidade a co- seguida por comida, mas isso provavelmente não
mida; neste ponto, a campainha ainda não tem acontecerá com um choque forte. Por outro lado,
efeito sobre a salivação e pode continuar a ser a comida pode tornar-se um estímulo condicio-
considerada como um estímulo neutro. Depois nal, eliciando a flexão da perna, se a sua apre-
de um período de condicionamento, cria-se um sentação for sistematicamente seguida por um
reflexo condicional', a campainha elicia a saliva- choque forte, mas isso provavelmente não acon-
ção antes que a comida seja apresentada (a) ou tecerá com a comida seguida por um choque fra-
mesmo quando a comida é omitida em uma tenta- co. As diferenças são consistentes com as pro-
tiva ocasional (b). A campainha é agora um estí- babilidades relativas de que a comida elicie a
mulo condicional ou CS, e a salivação eliciada pela salivação e de que o choque forte ou brando pos-
campainha é uma resposta condicional, ou CR. sa eliciar a flexão da perna.

Estímulo Neutro J Sineta |


NS (OR)
' s%- (Resposta de Orientação)

Reflexo Incondicional iC om idal US *- UR


” v.
^ Salivação

Condicionamento
| Sineta | |ComidaJ M C u s » IIP
Salivação


a. | Sineta | |com idaj
" C S *-C R — U S *-U R
Condicionamento ^-S alivação Salivação
Reflexo ou

b. J Sineta C S ------------------► CR
*- Salivação

Tempo — —►

FIGURA 12.1 Relações entre estímulos e respostas no condicionamento respondente. Um estímulo inicialmente
neutro (SINETA: NS) é seguido por um estímulo incondicional (COMIDA: US) que elicia a salivação. Se o estímulo
neutro começa a eliciar respostas como aquela eliciada pelo estímulo incondicional, o estímulo neutro passa a ser
denominado estímulo condicional (CS). OR = resposta de orientação; UR = resposta incondicional; CR = respos-
ta condicional. (As siglas foram mantidas como no original, em inglês).

212 A . C h a r l e s C a ta n ia
As diferenças entre a CR e a UR não são ape- insulina. Suponhamos, agora, que você tenha
nas de ordem temporal. Por exemplo, a forma acabado de deixar de beber refrigerantes com
ou topografia de uma flexão condicional de per- açúcar, mudando para suas versões dietéticas,
na tipicamente difere da forma de uma flexão sem açúcar. Como um CS, o sabor doce do refri-
incondicional eliciada por um choque elétrico. gerante elicia a liberação de insulina, que é ordi-
De modo geral, uma CR não é meramente uma nariamente utilizada à medida que você digere o
UR eliciada por um novo estímulo; em outras açúcar. Mas agora o seu refrigerante não contém
palavras, o condicionamento respondente não açúcar, de modo que você pode esperar sentir-se
pode ser interpretado como substituição de estí- fraco ou tonto à medida que a insulina produz
mulo; no caso clássico de Pavlov, por exemplo, um decréscimo substancial no seu nível de açú-
a campainha não substitui a comida (o cão não car no sangue (hipoglicemia). Esse efeito era
tenta comer a campainha). Um CS pode afetar especialmente comum, quando os refrigerantes
uma ampla faixa de respostas, além daquelas que sem açúcar foram inicialmente introduzidos e as
se assemelham à resposta eliciada pelo US. pessoas só tinham familiaridade com as versões
Muitos reflexos condicionais diferentes têm padrão. O efeito é menos notado hoje em dia,
sido criados por meio de procedimentos respon- porque uma substituição apenas ocasional de um
dentes (p. ex., ver Hull, 1934). O condiciona- refrigerante sem açúcar por um convencional
mento salivar de Pavlov é provavelmente o mais pode enfraquecer substancialmente o efeito.
familiar, mas outros estudos demonstraram con- Outros efeitos de condicionamento têm sido de-
dicionamento, usando relações incondicionais monstrados com uma variedade de respostas fi-
tais como o movimento de joelho, eliciado por siológicas (p. ex., reações do sistema imunoló-
uma batida no tendão patelar (Twitmyer, 1902/ gico: Ader & Cohen, 1985).
1974) e a retirada de um membro, eliciada por Com alguns tipos de USs, o condicionamen-
choque elétrico (Bechterev, 1933). O condicio- to respondente leva a CSs que eliciam respostas
namento também funciona com piscadas de olho compensatórias, ou seja, respostas que agem
eliciadas por um jato de ar sobre o olho (p. ex., contrariamente aos efeitos do US, em vez de res-
Gormezano, 1972), mas o condicionamento da postas similares àquelas eliciadas pelo US. Tais
constrição pupilar eliciada por luz no olho, que casos apresentam ainda um outro tipo de evidên-
já havia sido considerado factível, não tem sido cia de que o condicionamento respondente não
obtido (Young, 1958). A literatura especializa- é uma mera substituição de estímulo. Um exem-
da russa inclui uma variedade de demonstrações plo ocorre no condicionamento respondente com
de condicionamento (p. ex., Bykov, 1957). Por opiáceos tais como morfina ou heroína (Siegel,
exemplo, um cão foi colocado por vários dias 1977). Dentre os efeitos destas drogas está a anal-
em uma área de espera com temperatura neutra, gesia, ou seja, um limiar elevado para a dor. Com
antes de ser levado a uma sala aquecida, e seu doses continuadas, os eventos que conduzem à
metabolismo e consumo de oxigênio começaram administração da droga (p. ex., preparar a serin-
a decrescer na área de espera assim como na área ga) têm probabilidades de se tornarem CSs, que
aquecida. De modo inverso, quando a estadia na eliciam uma CR. Mas esta CR não fortalece a
área de espera era seguida por transporte para analgesia e outros efeitos das drogas; em vez
uma sala fria, o metabolismo e consumo de oxi- disso, ela age em sentido contrário a estes efei-
gênio do cão começava a aumentar na área de tos (por exemplo, ela produz hiperalgesia, um
espera, assim como na área fria (Bykov, 1957, limiar rebaixado para a dor, isto é, em outras
pp. 183-210). palavras, o oposto da analgesia). Como resulta-
Consideremos um outro exemplo. A libera- do, doses cada vez maiores da droga passam a
ção de insulina pelo pâncreas é uma UR produ- ser necessárias para produzir os efeitos originais
zida pelo US do açúcar no intestino (Deutsch, (esses são alguns dos fatores envolvidos no de-
1974). Esse US é sistematicamente precedido senvolvimento de tolerância à droga). Resumin-
pelo sabor de açúcar, o que toma provável que do, o US é a droga na corrente sangüínea, e um
esse sabor torne-se um CS para a liberação de componente da UR é a analgesia; o CS é qual-

A p r e n d iz a g e m 213
quer evento que precede com fidedignidade a ad- O efeito de omissões ocasionais do US tem
ministração da droga, e a CR é uma resposta fi- ramificações teóricas. Em uma terminologia que
siológica que age em sentido contrário à analge- vem-se tomando rara, as apresentações do US
sia e a outros efeitos da droga. no condicionamento respondente eram denomi-
Os viciados em heroína, freqüentemente, to- nadas reforço e, portanto, o procedimento no qual
mam suas drogas no mesmo lugar e com os com- este estímulo era omitido em tentativas ocasio-
panheiros usuais, usando um ritual consistente nais era denominado reforço parcial. Assim, al-
de droga. Consideremos agora um viciado que, guns argumentos a favor de uma distinção entre
por uma razão qualquer, toma a droga em algum condicionamento operante e respondente foram
outro lugar e em companhia diferente. A dose é propostos, com base no chamado efeito de re-
grande, mas muitos dos CSs que, usualmente, a forço parcial, ou PRE: o reforço parcial gerava
precedem estão ausentes, de tal modo que uma quantidades substanciais de responder quando
CR bem menor do que a usual é eliciada. O efei- comparado com o reforço de todas as respostas,
to da droga ocorre, mas desta vez não é contra- como vimos no Capítulo 10, enquanto o proce-
balançado pela resposta compensatória usual. dimento análogo no condicionamento respon-
Sob tais circunstâncias, uma dose de droga que dente parecia reduzir o responder (ver, no en-
seria ordinariamente tolerada pode vir a ser fatal tanto, Gibbon e col., 1980). Agora que o termo
(Siegel e col., 1982); internações hospitalares e/ reforço tornou-se mais restrito em seu âmbito,
ou mortes por overdose de heroína são especial- essa comparação não mais parece relevante. Há
mente prováveis quando os viciados tomam a algum tempo atrás, no entanto, ela forneceu uma
droga em condições diferentes daquelas que são das bases mais convincentes para que se distin-
usuais ou familiares. guisse entre os dois tipos de condicionamento.
Alguns arranjos de CSs e USs são contrasta-
dos com o condicionamento simultâneo na Fi-
TIPOS DE CONDICIONAMENTO gura 12.2. Tanto no condicionamento de traço
quanto no condicionamento com atraso, um in-
As relações temporais entre dois estímulos tervalo relativamente longo de tempo transcorre
podem ser programadas de várias maneiras. As entre o início do CS e o início do US; esses dois
situações nas quais o início do CS precede o iní- arranjos de condicionamento distinguem-se por-
cio do US por não mais do que 5 s são algumas que num deles o CS desaparece e no outro ele
vezes arbitrariamente agrupadas em conjunto fica presente ao longo deste intervalo. (O tempo
como instâncias de condicionamento simultâneo. entre o início do CS e do US pode variar inde-
Essa convenção é baseada, talvez, em duas cir- pendentemente da superposição temporal entre
cunstâncias: o intervalo ótimo entre um CS e um CS e US. Por exemplo, no condicionamento com
US é aproximadamente de meio segundo (p. ex., atraso, o CS pode terminar no momento do iní-
Kimble, 1947) e omissões do US algumas vezes cio do US ou pode terminar no momento do tér-
reduzem a fidedignidade da manutenção do con- mino do US; esse aspecto do tempo de apresen-
dicionamento respondente. Intervalos curtos, tais tação de CS e US não é relevante para as distin-
como meio segundo, dão pouca oportunidade ções de procedimento apresentadas na Figura
para que se observe o responder condicional. A 12.2.). Tanto no condicionamento de traço quanto
escolha, então, era a de omitir o US em algumas no com atraso, o responder condicional de iní-
tentativas ou aumentar o intervalo entre o início cio ocorre pouco após o início do CS, mas, ao
dos estímulos. Uma vez que o condicionamento longo de tentativas sucessivas, ele gradualmen-
tornava-se menos fidedigno com as omissões de te se move de modo a situar-se mais perto do
estímulos, o prolongamento do intervalo entre o momento em que o US virá a ser apresentado. O
início dos estímulos veio a ser preferido em re- condicionamento de traço adquiriu seu nome a
lação a omissões ocasionais do US, e a distinção partir da suposição de que o CS, para ser efeti-
entre simultaneidade estrita e esses atrasos relati- vo, precisava deixar algum traço no sistema ner-
vamente pequenos acabou sendo negligenciada. voso do organismo.

214 A . C h a r l e s C a t a n ia
Condicionamento CS
Simultâneo

US J ío m id ^

<5s

C S ______ I Sinetal
Condicionamento
de Traço
US

CS I Sineta
Condicionamento
de Atraso
US

Condicionamento
Temporal
[ US_

Intervalos constantes entre as apresentações de


comida

Condicionamento
CS.
Reverso
L us

Condicionamento
Diferencial

US

Tempo

FIGURA 12.2 Representação esquemática da apresentação de vários procedimentos respondentes, mostrando


uma sineta como CS e a comida como US. No condicionamento simultâneo, a sineta é seguida por comida em
menos de 5 s. Relações temporais diferentes são ilustradas para o condicionamento de traço, condicionamento
atrasado e condicionamento temporal, e a ordem do estímulo é invertida no condicionamento reverso. No condi-
cionamento diferencial, a sineta é seguida por comida, mas um tom não é. CS = estímulo condicional; US =
estímulo incondicional.

Mas apresentações sucessivas do próprio US A reversão da ordem dos dois estímulos é


a intervalos regulares (por exemplo, a cada meia denominada condicionamento reverso. Por ra-
hora), também produzem um responder condi- zões teóricas, considerou-se, por longo tem-
cional; esse procedimento é denominado condi- po, que esse arranjo era ineficaz para a pro-
cionamento temporal, e diz-se, às vezes, que o dução do responder condicional. Ele é fre-
responder é condicionado ao tempo como um es- qüentemente menos eficaz do que outros pro-
tímulo (o condicionamento temporal envolve a cedimentos de condicionamento, mas tem sido
apresentação repetida de um estímulo e, portan- ocasionalmente demonstrado, particularmen-
to, é equivalente a algumas operações de apre- te, com CSs aversivos:
sentação de estímulo descritas no Capítulo 4).

A p r e n d iz a g e m 215
...o senso comum nos leva a esperar que os animais de possuírem elementos comuns ou ocorrerem
tenham a habilidade de responder defensivamente a juntas no tempo. Um passo seguinte foi sugerir
um estímulo novo detectado depois de um evento
aversivo súbito. Um animal que tenha visto um pre-
que as idéias podiam ser interpretadas como res-
dador não-familiar depois de um ataque malsucedi- postas geradas por eventos ambientais, de tal
do, seguramente não se submeterá a um novo ata- modo que a lembrança de um evento no passado
que (i.e., a um pareamento entre predador e presa, despertaria outras lembranças com as quais a
nesta ordem) antes de reagir defensivamente. (Spe- primeira tivesse ocorrido.
tch, Wilkie, & Pinei, 1981, p. 163; cf. reações de
defesa específicas da espécie, no Capítulo 6)
Não precisamos lidar com os detalhes. Mes-
mo aqueles segmentos da Psicologia da Apren-
Finalmente, um procedimento no qual um dizagem contemporânea que ainda podem ser
estímulo torna-se um CS por meio de sua rela- denominados associacionistas evoluíram consi-
ção com o US, enquanto um segundo estímulo deravelmente em relação às antigas formulações.
não se toma CS, porque nunca precede o US, é Já observamos que o condicionamento respon-
denominado condicionamento diferencial. Os dente não pode ser interpretado como simples-
estímulos são algumas vezes denominados estí- mente tornar um estímulo um substituto para
mulos condicionais positivo e negativo (CS+ e outro. Para o presente, o ponto é que o condicio-
CS-). namento respondente foi considerado como o
Em todos esses casos, o CS deve produzir a processo que estava na raiz de toda a aprendiza-
CR por causa de sua relação com o US e não por gem, e foi assumido que ele ocorria meramente
outras razões. Por exemplo, se um estímulo vi- através d acontigüidade temporal de eventos, ou
sual e um choque traumático ocorrem juntos, uma seja, de sua ocorrência conjunta no tempo. Deba-
futura resposta de susto diante do estímulo vi- tes teóricos giraram em tomo da primazia do con-
sual pode não significar necessariamente que este dicionamento respondente e outros processos, dan-
tenha tornado-se um CS. Uma resposta de susto do-se atenção particular à busca de maneiras de
pode ser eliciada por uma variedade de estímu- interpretar o comportamento instrumental ou ope-
los inócuos, após um choque traumático, mes- rante, como uma instância de comportamento ge-
mo que esses estímulos nunca tenham ocorrido rado por princípios respondentes (para as várias
juntamente com o choque. Esses são os casos de posições dessa discussão, ver Guthrie, 1935; Hull,
pseudocondicionamento (cf. Ison & Hoffman, 1943; Konorski, 1948; Mowrer, 1960; Schlosberg,
1983, e sensitização, no Capítulo 4). 1937; Skinner, 1935b; Smith, 1954).
Parte do problema era que as contigüidades
entre os estímulos não eram adequadamente dis-
CONDICIONAMENTO E tinguidas das contingências estímulo-estímulo.
CONTIGUIDADE A contigüidade é definida por pareamentos en-
tre estímulos, ou seja, o número de vezes que os
Algo da atenção que historicamente foi de- estímulos ocorrem juntos. Contudo, mesmo
dicada ao condicionamento respondente pode ter quando o número de estímulos permanece cons-
dependido do quão facilmente ele podia ser re- tante, as relações de contingência entre CSs e
lacionado ao conceito de associação, um princí- USs podem variar. Por exemplo, vamos assumir
pio de aprendizagem com precedentes substan- que a campainha (Sl) e a comida (S2) sejam ar-
ciais na história da Filosofia e da Psicologia. A ranjadas dentro de tentativas, e que podemos ig-
aprendizagem, dizia-se, tem lugar através da as- norar os estímulos que demarcam as tentativas.
sociação de idéias, e os reflexos condicionais As fileiras na Figura 12.3 apresentam amostras
pareciam representar um exemplo primitivo da de 10 tentativas, de três diferentes procedimen-
formação de tais associações. Se as idéias eram tos de condicionamento. Em cada uma delas, S 1
associadas, argumentava-se, então uma podia é pareado com S2 nas tentativas 2, 5 e 7. Na fi-
conduzir a outra. Em um tipo de química men- leira de cima, somente essas tentativas incluem
tal, supunha-se que as idéias tornavam-se asso- S2, o qual é, portanto, perfeitamente correlacio-
ciadas através de propriedades tais como o fato nado com Sl; a probabilidade de S2 é 1,0 dado

216 A . C h a r l e s C a t a n ia
1 2 3 4 5 6 7 8 9 10 p(S2/S1) p<S2/noS1)
s i ------------n ---------------------- " ~
1.0 O
S2 -------- ----- I ~ 1

51
52 1.0 1.0

s i--- n — n_ — j~i_ j - i_____n_


.50 .75
S2

FIGURA 12.3 Relações condicionais entre dois estímulos, SI e S2. Aí linhas representam as amostras de 10
tentativas de três procedimentos de condicionamento. Cada um envolve exatamente três emparelhamentos de SI e
S2 (nas tentativas 2, 5 e 7), mas o SI prediz o S2 somente no procedimento superior. Na procedimento do meio, o S2
é igualmente provável dado SI e em ausência de Sl, e no procedimento embaixo o S2 é menos provável dado S I do
que na ausência de Sl. Aí probabilidades de S2 dado S l e em ausência de S l são mostradas à direita e são
representadas, respectivamente, como A, B e C na Figura 12.4. (Cf. Rescorla, 1967)

Sl, mas é zero na ausência de S l, de modo que


Sl prediz perfeitamente a ocorrência de S2. Na
fileira do meio, S2 ocorre em todas as tentativas
e, portanto, S 1 é irrelevante em relação à ocor-
rência de S2: a probabilidade de S2 é 1,0, quer
Sl ocorra ou não. Na fileira de baixo, Sl ocorre
em 6 tentativas, mas em apenas metade delas é
seguido por S2, enquanto S2 ocorre em três quar-
tos das tentativas, nas quais Sl não é apresenta-
do: a probabilidade de S2 é mais baixa quando
S1 é apresentado (0,5) do que quando não é apre-
sentado (0,75).
A Figura 12.4 mostra estas três condições no
interior de um espaço de contingência para rela-
FIGURA 12.4 Um espaço de contingência estímulo-
ções estímulo-estímulo. Somente no primeiro estímulo. O quadrado unitário mostra as probabilida-
procedimento é provável que S 1 torne-se um CS des condicionais do estímulo S2 dado o estímulo S l e
efetivo; no último procedimento, S l pode até em ausência do estímulo Sl. Os três pontos, A, B e C,
mesmo reduzir a probabilidade de responder correspondem aos três procedimentos da Figura 12.3.
condicional eliciado pelos estímulos da tentati- (Cf. Figuras 4.2 e 5.9)
va. A base apropriada para classificar os proce-
dimentos de condicionamento é a relação condi-
cional entre os dois estímulos (contingência), e não-usual tem maior probabilidade de tornarem-
não o número de pareamentos (contigüidade) se efetivos do que um estímulo familiar em uma
(Rescorla, 1967, 1988). situação familiar. Às vezes, o próprio contexto
pode tomar-se efetivo como um CS. Por exem-
plo, um rato pode aprender que um CS é segui-
COMBINAÇÕES DE ESTÍMULO NO do por um US quando ele está na câmara experi-
CONDICIONAMENTO mental, mas não quando ele está em sua câmara
viveiro. A câmara experimental é, com efeito,
O fato de um estímulo tornar-se ou não um um estímulo em cuja presença a contingência CS-
CS efetivo depende do contexto de estímulos em US opera (como resultado, o rato pode não res-
que ele aparece (Kamin, 1969); um estímulo não- ponder ao CS quando este for apresentado em
usual ou um estímulo familiar em uma situação sua câmara viveiro). No contexto do condicio-

A p r e n d iz a g e m 217
namento respondente, tais estímulos têm sido de- dicionais sejam observadas, poderemos verifi-
nominados estabelecedores de ocasião, no sen- car que a luz, e não o tom, tomou-se um CS efe-
tido de que eles estabelecem a ocasião na qual a tivo, mesmo que o tom tenha precedido o cho-
contingência estímulo-estímulo operará (p. ex., que com tanta fidedignidade quanto a luz. Quan-
Rescorla, 1988). Tais estímulos não eliciam o do um estímulo deixa de se tornar um CS efeti-
responder; eles modificam os efeitos eliciadores vo por ser apresentado juntamente com um ou-
de outros estímulos (o vocabulário de estabele- tro estímulo que já é efetivo, dizemos que o estí-
cimento de ocasião é, às vezes, aplicado tam- mulo com história anterior bloqueou o condicio-
bém a CSs individuais, no sentido de que eles namento para o novo estímulo. Esse procedimen-
estabelecem a ocasião em que um US poderá ser to é mostrado, esquematicamente, como bloqueio
apresentado). O estabelecimento de ocasião é na Figura 12.5. (Fenômenos análogos podem
uma das muitas possíveis funções de estímulo ocorrer em discriminações operantes e lembram-
que podem ser produzidas por combinações de nos que discriminações operantes e condiciona-
e stím u lo s no c o n d ic io n a m e n to resp on d e nte. mento respondente são, ambos, instâncias de
Consideremos, agora, exemplos de algumas ou- controle de estímulo.)
tras funções.

Estímulos Inibitórios em Compostos


Sombreamento e Bloqueio
Os estímulos podem sinalizar tanto omissões
Vamos supor a apresentação simultânea de quanto apresentações de outros estímulos (cf. C
um tom alto e uma luz fraca, seguidos por um na Figura 12.4). Os estímulos que sinalizam a
US, tal como um choque que elicia uma flexão omissão de outro estímulo podem adquirir, às
de pata. Depois que o responder condicional a vezes, a capacidade de reduzir a efetividade de
esse par de estímulos se desenvolve, poderíamos outros CSs e são descritos como inibitórios. Um
apresentar cada estímulo separadamente e veri- exemplo é mostrado na Figura 12.6, que ilustra
ficar que o tom tomou-se um CS muito mais efe- um procedimento de condicionamento envolven-
tivo do que a luz. (O conceito de atenção, como do a salivação eliciada pela comida em um cão.
na discriminação operante, é relevante para o Prim eiro, uma cam painha torna-se um CS
condicionamento respondente; poderíamos dizer (CSA+). Uma vez que a campainha elicie a sali-
que o organismo estava atentando mais para o vação com fidedignidade, um tom passa a ser
tom do que para a luz ou que o tom era mais apresentado, seja sozinho ou juntamente com
saliente do que a luz; cf. Rescorla & Wagner, uma luz, em tentativas que se altemam irregu-
1972). larmente. Quando o tom (CSB+) é apresentado
O exemplo do tom mais a luz assume que o sozinho, ele é seguido por comida. Quando ele é
organismo não tenha história de condicionamen- apresentado juntamente com a luz (CSX-), a co-
to com qualquer dos estímulos do composto. O mida é omitida. Eventualmente, o tom sozinho
procedimento é mostrado esquematicamente vem a eliciar a salivação condicional, mas o pa-
como sombreamento na Figura 12.5. Quando os reamento de tom com luz não o faz. Poder-se-ia
estímulos de um composto não se tomam igual- supor que o cão simplesmente discrimina o tom
mente efetivos como CSs, diz-se que o estímulo apresentado sozinho de sua apresentação com-
mais efetivo sombreia o menos efetivo. Mas um binada com a luz. Mas o efeito inibitório da luz
tal efeito pode ocorrer também quando um dos pode ser demonstrado quando as apresentações
dois estímulos já têm uma história de condicio- posteriores da campainha acompanhada da luz
namento. Suponhamos, por exemplo, que a luz eliciam menos salivação condicional do que ape-
fraca já seja ela própria um CS antes de passar- nas as apresentações da campainha.
mos a apresentá-la juntamente com o tom. Se a Em um outro procedimento, poderíamos fa-
apresentação simultânea da luz e do tom vier ago- zer com que a combinação tom-luz fosse segui-
ra a ser seguida pelo choque até que flexões con- da pelo US, sendo este, no entanto, omitido após

218 A. C h a r l es C a t a n ia
SOMBREAMENTO Teste Teste

Condicionamento (Composto)

S1 Tom S1

Sem CR
S2

US _phõqü^_ S1 Sombreou S2

BLOQUEIO
Condicionamento (Composto)
Condicionamento

S1 51 Luz

k Sem CR
US JChoqu4_ 52 Tom

US JÔhõqü(J_ Choque S1 Bloqueou S2

FIGURA 12.5 Ilustrações equemáticas de sombreamento e bloqueio. No sombreamento, nenhum dos dois estímu-
los de um composto (S l e S2) tem uma história prévia de condicionamento, mas somente um deles se torna efetivo
como um CS (ou um toma-se mais efetivo do que o outro). No bloqueio, um estímulo é estabelecido como um CS
efetivo, e essa história impede que o outro se torne efetivo quanto os dois são apresentados juntos como um
composto (ou o primeiro reduz a efetividade do segundo). US = estímulo incondicional; CR = resposta condicio-
nal.
CSA* 1Sineta I________
CR à Sineta
US |comida)

CS„ _J Tom J_ CS„


J Tom |_
CR ao Tom
Sozinho, mas não
a Tom + Luz

CS, J Sineta [_
CR Reduzida à Sineta
(Luz é inibitória)
cs -.
FIGURE 12.6 Ilustração esquemática de um procedimeto para demonstrar um componente inibitório de um com-
posto de estímulo. Primero, a sucessão de sineta e comida produz a salivação condicional à sineta. A seguir, o tom
sozinho é seguido por comida, mas o tom acompanhado pela luz não é; a salivação condicional ocorre para o tom
sozinho, mas não para o tom acompanhado da luz. Finalmente, quando a luz é apresetitada com a sineta, a sineta
elicia menos salivação do que se fosse apresentada sozinha.

a apresentação isolada do tom ou da luz . Nesse Pré-Condicionamento Sensorial e


caso, eventualmente verificaríamos que a com- Condicionamento de Segunda Ordem
binação de tom e luz elicia uma CR, enquanto a
apresentação isolada desses estímulos não o faz. Temos considerado até aqui alguns casos de
Em outras palavras, como essa demonstração condicionamento respondente baseados em USs,
revela, os organismos podem responder diferen- que servem, em outras situações, como reforça-
cialmente não apenas a estímulos individuais, dores (p. ex., comida) ou punidores (p. ex., cho-
mas também a relações entre eles. que). Mas o condicionamento pode ocorrer tam-

A p r e n d iz a g e m 219
bém quando estímulos relativamente neutros, tais tom. Nesse caso, a questão é se o CS criado na
como as luzes ou os sons servem como USs? O primeira fase pode funcionar como um US para
problema é que é difícil verificar o condiciona- um outro estímulo, na segunda fase. A dificul-
mento na ausência de respostas eliciadas. Dois dade é que o tom perde sua efetividade como CS
procedimentos que dizem respeito aos efeitos de à medida que é apresentado repetidamente, sem
tais estímulos são ilustrados na Figura 12.7, para ser seguido por choque, na segunda fase, mas é
flexões condicionais da pata em cães: opré-con- justamente durante esse tempo que a campainha
dicionamento sensorial e o condicionamento de deve adquirir suas propriedades condicionais.
segunda ordem. Um procedimento alternativo, no qual, em todas
Consideremos inicialmente o pré-condicio- as tentativas, a campainha seria seguida pelo tom
namento sensorial (Brogden, 1939). Na primei- e este pelo choque, seria ambíguo; não sabería-
ra fase, de pré-condicionamento, um estímulo mos se as flexões de pata eliciadas pela campai-
sinaliza um segundo estímulo. No exemplo da nha ocorreriam por causa da relação entre cam-
Figura 12.7, uma campainha é consistentemente painha e tom ou por causa da relação entre a cam-
seguida por um tom. Na segunda fase, um refle- painha e o choque.
xo condicional é criado, com o segundo estímu- Se o CS for apresentado sozinho depois do
lo tornando-se um CS. Na figura, o tom é segui- pré-condicionamento sensorial, extinguindo o
do por um choque. Uma vez que o reflexo con- reflexo condicional, o estímulo envolvido no pré-
dicional tenha sido criado, de tal maneira que o condicionamento também deixará de eliciar uma
tom elicie a flexão da pata, os efeitos eliciadores CR. Em outras palavras, no exemplo da Figura
da campainha são testados. A flexão da pata à 12.7, a apresentação, após a fase do condiciona-
campainha é tomada como indicador de que a mento, do tom sozinho, até que este não mais
campainha tomara-se um CS relativo ao tom du- elicie as flexões de pata, também fará com que a
rante o pré-condicionamento. (Por conveniên- campainha perca sua efetividade como CS. Mas
cia, foram omitidos grupos de controle usa- o procedimento comparável depois do condici-
dos para contrabalançar os estímulos e elimi- onamento de segunda ordem nem sempre extin-
nar a possibilidade de sensibilização; cf. Ca- gue o reflexo condicional de segunda ordem
pítulo 4.) (Rizley & Rescorla, 1972; mas ver também Ho-
No condicionamento de segunda ordem, a lland&Ross, 1981). No exemplo da Figura 12.7,
ordem das fases é revertida (cf. Rescorla, 1980). a apresentação do tom sozinho até que ele não
No exemplo da Figura 12.7, primeiro é criado mais elicie as flexões de pata pode não eliminar
um reflexo condicional no qual o tom elicia a as flexões condicionais à campainha, criadas du-
flexão da pata, apresentando-se o tom seguido rante a fase de condicionamento de segunda or-
pelo choque. Depois, a campainha é seguida pelo dem.

PRÉ-CONDICIONAMENTO SENSORIAL

Pré-condicionamento Condicionamento Teste

OS ______J Sineta |_____________ I Tom I_____________ ISineta I

US I Tom 1 bhoquej ______________ CR?

CONDICIONAMENTO DE SEGUNDA ORDEM

Primeira Ordem Segunda Ordem Teste


CS I Tom I_____________ I Sinetal_____________ [ Sineta 1

u s ____________ IChoquej I Tom I _____________ CR?

FIGURA 12.7 Um diagrama esquemático das fases dos procedimentos de pré-condicionamento sensorial e condi
cionamento de segunda ordem, empregando sineta e tom como CSs e flexões da perna eliciadas por choque, em un
cachorro, como a UR.

220 A. C h a r le s C a ta n ia
Esse resultado é paradoxal. Consideremos meçaram a ocorrer na presença do rato e tam-
uma história de caso humana que seja análoga. bém de outras estímulos que tinham proprieda-
Um jovem vê sangue em circunstâncias doloro- des em comum, tais como o algodão. Watson e
sas, e a visão de sangue torna-se um CS que eli- Rayner chamaram essas respostas de reações
d a as respostas emocionais que denominamos emocionais condicionadas. Contudo, os detalhes
medo. Posteriormente (de modo análogo à fase do procedimento experimental mostram que as
de condicionamento de segunda ordem), ele vê marteladas iniciais sobre a barra de aço não eram
sangue em um elevador e, desse modo, adquire independentes do comportamento:
um medo de elevadores. Então, ele passa a tra-
balhar em um hospital e, nesse contexto, gradual- 1. Um rato branco foi repentinamente tirado do ces-
to e apresentado a Albert. Ele começou a tentar
mente supera seu medo de ver sangue. De acor- pegar o rato com sua mão esquerda. Assim que a
do com os resultados de Rizley e Rescorla, essa mão dele tocou o animal, a barra foi martelada ime-
mudança não reduziria o medo que ele tem de diatamente atrás da cabeça dele. O menino pulou
elevadores, apesar desse medo ter sido baseado violentamente e caiu para a frente, escondendo sua
na visão de sangue. Este é um caso hipotético e face no colchão. Todavia, ele não chorou.
devemos ser cautelosos ao generalizar situações 2. Assim que a mão direita tocou o rato, a barra foi
experimentais para a vida real. Mas a análise de golpeada outra vez. Novamente, a criança pulou
tais contingências respondentes é relevante para violentamente, caiu para a frente e começou a
as terapias comportamentais que se propõem a choramingar. A fim de não perturbar a criança
muito seriamente, não foram feitos mais testes
eliminar certos medos ou fobias através da ex- durante uma semana. (Watson & Rayner. 1920,
tinção de respostas adquiridas a estímulos aver- p. 4)
sivos condicionais. Alguns exemplos incluem a
terapia implosiva, que envolve a exposição a ver- Portanto, pelo menos no início, o experimento
sões intensas do estímulo aversivo, usualmente de Watson e Rayner usou a punição da resposta
por uma duração longa, e a de sensibilização sis- de tentar pegar o rato, e não simplesmente as
temática, que envolve o esvanecimento gradual apresentações de um estímulo independentes do
do estímulo aversivo (p. ex., Wolpe, 1958,1990). responder. Isso era presumivelmente importante
De qualquer modo, tais descobertas demonstram para fazer com que Albert prestasse atenção no
que o condicionamento respondente não é ape- rato branco, mas isso também significa que não
nas a substituição de um estímulo por outro. podemos atribuir inequivocamente as respostas
do pequeno Albert ao condicionamento. Nem se-
quer podemos descartar as conseqüências das
CONTIGÜIDADE E CONSEQÜÊNCIAS respostas de Albert aos golpes na barra; afinal,
essas respostas levaram os experimentadores a
As instâncias de condicionamento, baseadas interromper o procedimento por uma semana.
em estímulos aversivos, tais como o choque elé- O problema, contudo, não se restringe a Wat-
trico, foram denominadas condicionamento de- son e Rayner. Uma vez que estejamos alertas à
fensivo, na suposição de que as respostas elicia- possibilidade de conseqüências para respostas
das por tais estímulos ocorriam, porque elas ti- em supostos procedimentos de condicionamen-
nham alguma função defensiva natural (cf. Ca- tos, freqüentemente as encontraremos. Por exem-
pítulo 6 sobre as reações defensivas específicas plo, as demonstrações iniciais de retirada da pata
de espécie). Um exemplo freqüentemente cita- eliciadas por um choque eram indiferentes ao
do é um experimento com um bebê chamado método de ligação dos eletrodos. Contudo, se
Albert (Watson & Rayner, 1920). O estímulo ambos os eletrodos são fixados à pata de um cão,
aversivo era um som, atrás do pequeno Albert, uma flexão não pode evitar a aplicação do cho-
de uma martelada sobre uma barra de aço sus- que, enquanto se um ou ambos os eletrodos fo-
pensa. Esse som produzia choro ou respostas de rem ligados ao chão, sobre o qual repousam as
susto e esquiva. Quando o som se seguia a apre- patas do cão, uma flexão evitará ou terminará o
sentações de um rato branco, essas respostas co- choque, pois interromperá o circuito elétrico. De

A p re n d iz a g e m 221
fato, o reflexo defensivo clássico de Bechterev cebidas anteriormente. O passo seguinte foi ob-
(1933) normalmente tinha ambos os eletrodos servar que respostas autonômicas, tais como a
sobre uma superfície que o organismo tocava, salivação e a constrição ou dilatação de vasos
de modo que uma resposta evitava ou terminava sangüíneos, eram freqüentemente acompanhadas
o choque; portanto, Bechterev estava provavel- de respostas somáticas (p. ex., contrações mus-
mente estudando o comportamento de fuga e de culares que produzem o movimento esqueléti-
esquiva, em vez do condicionamento responden- co). Era possível argumentar, portanto, que as
te. O reconhecimento das implicações de ambos respostas autonômicas no condicionamento res-
os métodos de colocação dos eletrodos foi um pondente eram artefatos, acompanhantes inciden-
passo importante na evolução da distinção entre tais do comportamento gerado por processos ins-
o comportamento operante e respondente (cf. trumentais (Smith, K., 1954; cf. os spandrels do
Schlosberg, 1937; Skinner, 1935b; ver também Capítulo 3). Portanto, o statiis do condiciona-
Kimmel, 1976). mento respondente veio a depender de demons-
Uma vez que as conseqüências tenham sido trações de condicionamento que não pudessem
implicadas em uns poucos casos de presumível ser interpretadas com base nas conseqüências do
condicionamento respondente, tornou-se tenta- responder.
dor buscá-las em todos os casos. Por exemplo, Uma abordagem era verificar se o responder
será que as flexões não teriam conseqüências condicional podia ser modificado por contingên-
mesmo quando ambos os eletrodos estivessem cias arranjadas explicitamente. Se tais conse-
ligados à pata do cão, no condicionamento de- qüências fossem inefetivas, então, o argumento
fensivo? Suponhamos que uma campainha pre- de que novas relações reflexas dependiam de
ceda o choque com fídedignidade. Como pode- outras conseqüências não-identificadas deixaria
remos saber se o choque que passa através de de ser convincente. Assim, Sheffield (1965) adi-
uma pata flexionada é tão aversivo quanto o que cionou algumas conseqüências à salivação con-
passa através de uma pata não-flexionada? No dicional gerada pela situação pavloviana clássi-
condicionamento defensivo, as flexões condici- ca. Especificamente, um tom (CS) precedia a co-
onais são ordinariamente mais lentas do que as mida, mas a comida era omitida se o cão salivas-
flexões incondicionais e têm magnitude diferen- se em uma dada tentativa. (O procedimento é um
te. Talvez, isso aconteça porque um cão cuja pata exemplo de punição negativa, às vezes, referida
já esteja flexionada não precise ajustar tanto sua como treino de omissão.) Em outras palavras,
postura, quando o choque for aplicado, quanto esse arranjo convertia o procedimento pavlovia-
precisaria se o choque fosse apresentado com ele no padrão em outro no qual a conseqüência de
apoiado sobre todas as quatro patas e precisan- salivar seria a ausência de comida, e a con-
do deslocar o peso para as três patas restantes, seqüência de não-salivar seria comida.
quando a flexão fosse eliciada (Wagner, Thomas, A salivação não foi modificada por suas con-
& Norton, 1967). Claramente, a salivação tam- seqüências nesse procedimento. Consideremos
bém tem suas conseqüências; ela afeta o gosto e, a performance da cadela Vicki. No início do trei-
no caso de comida seca, a deglutição, além da no, a salivação condicional ainda não havia co-
diluição, no caso de ácido na língua (p. ex., Hebb, meçado, de modo que o tom era seguido consis-
1956). tentemente pela comida. Esta contingência pro-
O lugar do condicionamento respondente na duziu uma salivação condicional, mas quando
Teoria da Aprendizagem começou com as tenta- Vicki salivava em uma tentativa, a comida era
tivas de reduzir todas as instâncias de aprendi- omitida, de modo que a salivação condicional
zagem operante a casos especiais de condicio- decrescia. Uma vez que a salivação condicional
namento respondente, mas esses novos argumen- decrescesse, o tom passava a ser novamente se-
tos reviraram a situação ao contrário. Argumen- guido consistentemente por comida, de modo que
tou-se que todas as instâncias de condicionamen- a salivação condicional reaparecia. Vicki repe-
to respondente podiam ser interpretadas em ter- tiu esse ciclo de salivação condicional, omissão
mos de conseqüências que não haviam sido per- de comida, decréscimo de salivação, reestabele-

222 A. C h a r le s C a ta n ia
cimento da comida e retorno à salivação condi- impacto paralelo ocorreu com a demonstração
cional muitas vezes ao longo de 40 dias (800 ten- de que as respostas somáticas ou esqueléticas po-
tativas). Embora ela pudesse ter recebido comi- diam ser afetadas por procedimentos responden-
da em todas as tentativas, se não salivasse du- tes. Ambas as demonstrações implicaram em que
rante a apresentação do tom, ela não aprendeu a os processos operantes e respondentes não po-
fazer isso e, portanto, recebeu comida em ape- diam ser distinguidos com base em critérios fi-
nas algumas tentativas a cada dia. siológicos de definição de tipos de respostas; a
Seria prematuro concluir que isso resolveu a diferença crítica, ao contrário, residia nas res-
questão. Uma conseqüência efetiva como refor- pectivas contingências resposta-estímulo e estí-
çador para uma resposta pode não ser efetiva para mulo-estímulo.
outra (Capítulo 5). A comida elicia a salivação, Discutimos anteriormente a ambigüidade de
de modo que não é surpreendente que a saliva- experimentos sobre as flexões da pata condicio-
ção seja inefetivamente reforçada pela comida. nada ao choque. O problema era a impossibili-
A redução de salivação pela omissão de um re- dade de planejar procedimentos em que as fle-
forçador tem sido demonstrada com um reforça- xões da pata não tivessem conseqüências. Tal-
dor como água, que por si mesmo não elicia a vez em parte por essa razão, a demonstração do
salivação (Miller & Carmona, 1967; cf. Capítu- condicionamento respondente de uma outra res-
lo 7). A salivação, eliciada em algumas circuns- posta esquelética, bicar um disco iluminado, por
tâncias, pode ser modificada por suas conseqüên- pombos, recebeu atenção especial em um pro-
cias em outras circunstâncias. A questão não cedimento denominado automodelagem (Brown
mais se coloca como a redução da aprendizagem & Jenkins, 1968). Visto que a resposta de bicar
operante ao condicionamento respondente ou um disco iluminado é comum em estudos de res-
vice-versa, porque a distinção entre ambos é ba- ponder conseqüencial, era importante determi-
seada em muitas linhas de evidência. Por exem- nar a medida na qual os processos respondentes
plo, as instâncias operantes requerem respostas, participavam de tal tipo de desempenho.
mas o condicionamento respondente pode ocor- A automodelagem surgiu como uma alterna-
rer sem respostas, como ocorre quando as con- tiva conveniente à modelagem de respostas de
tingências estímulo-estímulo são programados bicar através de aproximações sucessivas (Ca-
durante a paralisia por curare e afetam o com- pítulo 7). Ela começa com um pombo que come
portamento após a recuperação da paralisia (cf. regularmente em um alimentador, mas ainda não
Solomon & Tumer, 1962). A questão crucial, ao bicou o disco. De tempos em tempos, o disco é
contrário, ao lidar com casos operantes e respon- iluminado e, alguns segundos mais tarde, o ali-
dentes, é ser capaz de distinguir qual é qual. mentador é operado independentemente do com-
portamento do pombo. Assim, o disco ilumina-
do torna-se um estímulo que sinaliza a comida.
AUTOMODELAGEM E A comida ocasiona o comer, que no pombo in-
AUTOMANUTENÇÃO clui o bicar. Podemos, desse modo, dizer que a
comida é um US e que bicar a comida é uma
Os casos de condicionamento respondente de UR. Depois de umas poucas apresentações de
que tratamos até o momento incluíram tanto as um disco iluminado, seguidas pela operação do
respostas autonômicas (p. ex., salivação) quan- alimentador, o pombo começa a virar-se para o
to as respostas somáticas ou esqueléticas (p. ex., disco e a mover-se em direção a ele quando ilu-
flexão de pata). Os Capítulos 4 e 7 considera- minado. Após um número de tentativas que pode
ram o quanto essas duas classes contribuíram ser menor do que dez e raramente excede 100, o
para as distinções teóricas entre o comportamento pombo passa a bicar o disco quando ele estiver
operante e o respondente. A demonstração de que iluminado. Depois que o bicar é gerado por au-
respostas autonômicas, tais como a salivação, po- tomodelagem, a continuação do procedimento é
diam ser modificadas por suas conseqüências denominada automanutenção. Os termos auto-
teve impacto considerável sobre tais teorias. Um modelagem e automanutenção apenas distin-

A p r e n d iz a g e m 223
guem entre as mudanças de comportamento que através de sua correlação com a comida. A co-
levam à primeira bicada e o comportamento mida é o US e elicia uma UR, o bicar. Como em
mantido após essa primeira bicada. outros casos, a relação contingente entre a luz do
Na automodelagem e na automanutenção, disco e a comida, e não o pareamento entre elas, é
apresentações de comida ocorrem independen- que determina se o bicar automodelado ocorrerá.
temente do comportamento. É, portanto, difícil Um aspecto distintivo da automodelagem é a
atribuir o bicar automodelado a suas con- natureza dirigida da CR: bicadas geradas pela
seqüências. Ainda assim, depois que o bicar se luz do disco poderiam ocorrer em qualquer pon-
inicia, ele é freqüentemente seguido por comi- to da câmara (no ar, nas paredes, em volta do
da. Desse modo, um argumento baseado apenas alimentador); em vez disso, são dirigidas ao dis-
na observação de que não há conseqüências ób- co. A relação inversa também ocorre: os pom-
vias para o bicar pode não ser convincente. Por- bos tendem a se afastar dos estímulos correla-
tanto, foram estudadas as bicadas automantidas cionados com a ausência de comida (Wasserman,
em procedimentos de omissão análogos ao ex- Franklin, & Hearst, 1974). Por exemplo, se um
perimento que Sheffield conduzira com a sali- disco verde precede a comida, mas um disco ver-
vação: a comida era apresentada depois da ilu- melho não, bicadas automodeladas ocorrem
minação do disco, mas somente nas tentativas quando o disco é iluminado com o verde, mas o
em que o pombo não bicava o disco (Williams & pombo move-se para o lado oposto da câmara
Williams, 1969). Do mesmo modo que havia ocor- quando o disco é iluminado com o vermelho. A
rido com a salivação, as bicadas freqüentemente natureza dirigida do bicar automodelado tem sido
ocorriam em uma proporção substancial de tenta- denominada rastreamento de sinal (Hearst &
tivas, mesmo quando elas causavam a omissão de Jenkins, 1974). Uma resposta deve ser emitida
comida. O bicar se estabilizava, presumivelmen- antes para que possa ser reforçada, e algumas
te, em um nível no qual um número suficiente de vezes é o fato da resposta ter sido eliciada que a
tentativas sem bicadas (e, portanto, com comida) faz ser emitida. Talvez, então, as relações com-
ocorria para manter o bicar em outras tentativas. portamentais que ocorram na automanutenção
Quando a comida é repetidamente apresen- sejam protótipos dos processos a partir dos quais
tada para um pombo faminto, o bicar torna-se o comportamento operante evolui.
um componente dominante de seu comportamen- O Capítulo 11 considerou o contraste com-
to entre as apresentações de comida (cf. Capítu- portamental, o aumento na taxa de respostas em
lo 4). As bicadas automodeladas do pombo po- um componente inalterado de um esquema múl-
dem, portanto, ser interpretadas como compor- tiplo, quando a taxa de reforço no outro compo-
tamento gerado pelas apresentações repetidas de nente sofre um decréscimo. Uma explicação do
comida. Elas ocorrem, principalmente, durante contraste comportamental é a de que as bicadas
o período em que o disco está iluminado e po- automodeladas, geradas pela correlação diferen-
dem ser dirigidas tão fortemente ao disco que cial, com a comida, dos estímulos do esquema
acabam por atingi-lo. Uma vez que o bicar auto- múltiplo, sejam adicionadas às bicadas operan-
modelado se inicia, ele pode ser mantido indefi- tes. Alguns experimentos têm distinguido entre
nidamente por repetidas apresentações do disco essas duas classes de bicadas ao disco com base
iluminado e de comida, mesmo que o bicar não na duração e na topografia (p. ex., Keller, 1974;
tenha conseqüências óbvias (de fato, o pombo Schwartz & Williams, 1972). A topografia das
pode retardar seu acesso à comida ao bicar o dis- bicadas automodeladas é afetada mais pelo US
co mais do que se mantiver sua cabeça dentro ou do que pelas contingências (Jenkins & Moore,
próxima do alimentador). A produção do bicar o 1973). Por exemplo, a bicada do pombo a grãos
disco na automodelagem tem os aspectos críti- é mais breve e tem forma diferente do que a bi-
cos que definem o condicionamento responden- cada para beber. As bicadas automodeladas pro-
te, de modo que o vocabulário respondente é duzidas pela luz do disco e pela comida asseme-
apropriado. A luz do disco é um CS. Ela adquire lham-se a bicadas para comer (quando as bica-
sua capacidade de eliciar uma CR, bicar o disco, das automodeladas são baseadas em comida, o

224 A. C h a r le s C a ta n ia
pombo dá a impressão de estar comendo o dis- forço alimentar. Algumas vezes descrevemos os
co), enquanto as bicadas produzidas pela luz do comportamentos comparáveis em humanos com
disco e pela água assemelham-se a bicadas para base no medo ou na ansiedade; assim, procedi-
beber (quando as bicadas são baseadas em água, mentos como esses são freqüentemente consi-
o pombo dá a impressão de estar bebendo o dis- derados como relevantes para a emoção.
co). Por outro lado, a automodelagem pode ocor-
rer mesmo quando o US elicia comportamentos
sem relação com o bicar. Por exemplo, os pom- CONDICIONAMENTO E EMOÇÃO
bos podem vir a bicar um disco iluminado se a
luz do disco for, sistematicamente, seguida não Os estímulos que sinalizam a apresentação
por comida, mas, ao contrário, por acesso a uma de outros estímulos podem ser superpostos so-
área social (Peele & Ferster, 1982). bre linhas de base de comportamento operante.
Em nossa visão geral sobre o condicionamen- Por exemplo, suponhamos que pressões à bar-
to respondente, cobrimos um amplo território. ra, por um rato, sejam mantidas por um reforço
Nosso tratamento dos componentes básicos, CS alimentar; de tempos em tempos um tom é apre-
e US, e CR e UR, foi seguido por uma breve sentado; o tom termina com a apresentação de
cobertura dos tipos de condicionamento, incluin- um choque. Em tais circunstâncias, o tom tipi-
do o condicionamento simultâneo, de traço, com camente reduz as pressões à barra, especialmen-
atraso, temporal e reverso. Também distingui- te, à medida que se aproxima o tempo de libera-
mos entre os pareamentos ou as contiguidades, ção do choque. Esse fenômeno, originalmente,
por um lado, e, por outro lado, as contingências demonstrado por Estes e Skinner (1941), tem
estímulo-estímulo, definidas por probabilidades recebido nomes diversos: ansiedade, supressão
condicionais. Também examinamos as descober- condicionada e resposta emocional condiciona-
tas com várias combinações de estímulos no con- da ou CER (do inglês, Conditional Emotional
dicionamento, incluindo o sombreamento e o Response). O fenômeno é ilustrado na Figura
bloqueio, os estímulos inibitórios em compos- 12.8, que mostra o desenvolvimento da supres-
tos de estímulos, o pré-condicionamento senso- são e a recuperação subseqüente (Geller, 1960).
rial e o condicionamento de segunda ordem. Con- As pressões à barra pelo rato eram mantidas por
cluímos com um exemplo de condicionamento um esquema de VI 2 min, com reforço por co-
de uma resposta esquelética, o bicar do pombo, mida; um breve choque era apresentado em se-
na automodelagem e automanutençao. Agora guida a apresentações de um tom, que duravam
estamos prontos para considerar as maneiras 3 min. Depois que o tom passou a suprimir o
pelas quais os processos respondentes podem ser responder, o choque foi descontinuado, e as pres-
relevantes para o comportamento operante. sões à barra durante o tom recuperaram os ní-
veis anteriores.
O procedimento é uma instância de condi-
cionamento respondente: um estímulo, o tom,
Seção B Interações Operante- sinaliza um outro estímulo, o choque. (Presume-
Respondente: Emoção se que o choque seja aversivo, de modo que o
tom é denominado um estímulo pré-aversivo.)
Os processos operantes e respondentes po- Este é um outro caso em que o comportamento
dem interagir, quando os procedimentos respon- produzido pelo CS difere do comportamento pro-
dentes são combinados com os procedimentos duzido pelo US. O tom suprime o comportamen-
operantes. Por exemplo, um estímulo que prece- to reforçado de pressionar a barra, mas o pressi-
da sistematicamente ou sinalize um choque pode onar recomeça assim que o choque tenha sido
não apenas eliciar as flexões de pata; pode tam- apresentado.
bém interferir no comportamento que esteja sen- Se olharmos mais de perto para o comporta-
do mantido por suas conseqüências como, por mento do rato durante o tom, veremos que essas
exemplo, o pressionar a barra mantido por re- contingências afetam muitas outras classes de

A p r e n d iz a g e m 225
Desenvolvimento da Recuperaçao da
Supressão Supressão

FIGURA 12.8 Desenvolvimento de uma supressão durante um estímulo pré-aversivo e recuperação da supressão.
As respostas de pressão à barra por um rato, reforçadas com comida, eram mantidas por um esquema de V I2 min
(os reforçadores não são mostrados nos registros acumulados). Os registros da esquerda mostram os efeitos da
superposição de um tom, por 3min, seguido por um choque elétrico sobre a linha de base de pressão à barra. Os
deslocamentos para baixo no registro, entre as linhas verticais pontilhadas, sinalizam os períodos com o tom. Na
tentativa 27, as respostas de pressionar a barra haviam sido quase que completamente suprimidas pelo tom. Os
registros da direita mostram a recuperação da supressão quando o tom deixou de ser seguido pelo choque. (Adap-
tado de Geller, 1960, Figura 3)

respostas além do pressionar a barra (p. ex., taxa guém está agindo de uma dada maneira. Pode-
cardíaca, respiração; cf. Blackman, 1977; Res- mos responder que a pessoa está triste ou depri-
corla & Solomon, 1967). Nós estamos mais pro- mida. Se nos perguntarem como sabemos, po-
pensos a invocar a linguagem da emoção quan- deríamos responder que podemos saber pela
do um evento afeta uma faixa ampla de classes maneira como a pessoa age. Mas, então, não fi-
de respostas diferentes; por isso, ficamos tenta- zemos mais do que dizer que a pessoa está agin-
dos a falar do medo ou da ansiedade, por parte do de uma dada maneira, porque ela está agindo
do rato. Se o fizermos, precisaremos reconhe- daquela maneira. Seria mais útil saber que a pes-
cer que tais termos não explicam o comporta- soa está agindo daquela maneira por causa de
mento do rato. Não seria justificável dizer, de- algum evento específico, tal como a perda do
pois, que o rato parou de pressionar durante o emprego ou o fim de um caso amoroso.
tom, porque estava com medo; o efeito do tom Uma aplicação prática de nossa compreen-
sobre o pressionar pelo rato é o que em primei- são dos estímulos pré-aversivos é fornecida pelo
ro lugar nos leva a falar em medo no rato. tratamento de crianças sob cuidados intensivos,
Nossa linguagem de emoções é complicada. como em unidades hospitalares de atendimento
Falamos de nossas emoções e das dos outros com a vítimas de queimaduras (Derrickson, Neef, &
base tanto em situações quanto no comportamen- Cataldo, 1993). Essas crianças são submetidas a
to que ocorre nessas situações (cf. Ortony & Tur- eventos aversivos imprevisíveis e incontroláveis
ner, 1990). Por exemplo, poderíamos falar do a qualquer momento do dia ou da noite: inje-
comportamento produzido por estímulos pré- ções, mudanças de curativos, alimentação intra-
aversivos com base no medo ou na ansiedade, venosa, etc. Um resultado típico do atendimen-
mas se também observássemos o comportamen- to prolongado é que elas se tornam letárgicas e
to agressivo, estaríamos mais inclinados a falar “ausentes”; elas não reagem aos eventos à volta
de raiva. De qualquer modo, deve ficar claro que delas (cf. Capítulo 9 sobre desamparo aprendi-
tais nomes para efeitos comportamentais não do). Para essas crianças, o ambiente hospitalar
constituem explicações desses efeitos. Conside- acabou por tornar-se um enorme estímulo pré-
remos, por exemplo, a questão de por que al- aversivo.

226 A. Ch a r l es C a t a n ia
Podemos ajudar essas crianças, dando a elas, A descoberta de que o responder positivamen-
pelo menos, algum controle sobre parte do seu te reforçado pode ser suprimido por estímulos pré-
ambiente por algum tempo (p. ex., em interações aversivos foi mais tarde suplementada pela desco-
sociais com visitantes ou uma equipe hospitalar, berta de que a esquiva, que é um responder nega-
em escolhas de refeições quando for possível, e tivamente reforçado (cf. Capítulo 6), pode ser for-
etc.), mas os requisitos do atendimento hospita- talecida por tais estímulos (Sidman, Herrstein, &
lar podem limitar a exeqiiibilidade dessa abor- Conrad, 1957). Em outras palavras, um rato cujas
dagem. Uma outra alternativa é sugerida pela pressões à barra evitam choque pode aumentar em
nossa análise baseada nos estímulos pré-aversi- vez de diminuir suas pressões durante um estímu-
vos. Se acendermos uma luz vermelha sobre o lo que precede um choque inevitável ou inescapá-
leito da criança pelo menos 10 minutos antes do vel. Esse responder fortalecido tem sido denomi-
início de qualquer procedimento aversivo, a luz nado facilitação condicional ou aceleração con-
vermelha torna-se um estímulo pré-aversivo. O dicional. Uma vez que tal responder fortalecido se
acender da luz toma-se um estímulo aversivo desenvolva durante o responder negativamente
também, mas apesar disso, a ausência da luz tam- reforçado, ele pode continuar como um responder
bém se toma um sinal de segurança, um tempo positivamente reforçado. Por exemplo, o pressio-
durante o qual a criança está a salvo de procedi- nar uma barra por macacos rhesus, mantido por
mentos médicos aversivos. A segurança pode ser suco de laranja como reforçador, foi originalmen-
relativa, uma vez que a criança pode sentir dor te suprimido durante um ruído de cliques que pre-
em alguns períodos e podem ocorrer emergênci- cedia um choque; depois que os macacos adquiri-
as que não dêem tempo para o uso da luz verme- ram uma história de pressionar a barra para evitar
lha, mas uma segurança relativa é melhor do que o choque e foram retomados ao procedimento ini-
nenhuma. Durante os períodos seguros, enquanto cial, contudo, as pressões à barra durante os cli-
a luz vermelha estiver ausente, haverá um rela- ques não foram mais suprimidas, e sim fortaleci-
xamento das reações fisiológicas da criança às das (Hermstein & Sidman, 1958).
condições que sinalizam eventos aversivos; será As situações foram então estendidas de modo
mais provável, então, a manutenção do compor- a superpor os estímulos pré-apetitivos, em vez
tamento que é seguido por eventos reforçado- dos estímulos pré-aversivos, sobre uma linha de
res; isso pode acelerar a recuperação da criança, base de comportamento operante. Por exemplo,
bem como reduzir a letargia e a “ausência” por uma luz de disco que precedia apresentações de
parte dela. comida independentes de resposta aumentou as
bicadas ao disco por um pombo, quando foi su-
perposta sobre o bicar mantido por reforço em
ESTÍMULOS PRÉ-AVERSIVOS E DRL (Hermstein & Morse, 1957). Por analogia
PRÉ-APETITIVOS ao rótulo de ansiedade, dado à supressão duran-
te estímulos pré-aversivos, era tentador falar de tais
Embora a linguagem das emoções seja im- efeitos fortalecedores dos estímulos pré-apetitivos
portante em nossas interações com outras pes- baseando-se na alegria. O fortalecimento do res-
soas, ela não se tem demonstrado muito útil para ponder positivamente reforçado e a supressão do
uma análise comportamental dos efeitos de estí- comportamento negativamente reforçado por es-
mulos pré-aversivos. Ao contrário, as interações tímulos pré-apetitivos parecia paralelo à supres-
entre o condicionamento respondente e o com- são do responder positivamente reforçado e forta-
portamento operante, por exemplo, quando estí- lecimento do responder negativamente reforçado
mulos pré-aversivos ou pré-apetitivos são super- pelos estímulos pré-aversivos (p. ex., Azrin &
postos sobre o responder reforçado, têm sido Hake, 1969; Leitenberg, 1966). Mas as contingên-
analisadas de modo mais efetivo com base em cias são complicadas (p. ex., elas algumas vezes
parâmetros experimentais, tais como o esquema permitem que as bicadas automodeladas se com-
de reforço da linha de base, a taxa de respostas binem com os efeitos dos estímulos pré-apetitivos),
na linha de base, etc. e o estudo continuado dos estímulos pré-aversi-

A p r e n d iz a g e m 227
vos e pré-apetitivos mostrou que essa abordagem te de FI, a taxa de respostas decresceu consis-
era supersimplifícada (Blackman, 1977). tentemente com aumentos no nível do choque.
Como exemplo, a Figura 12.9 mostra que o No componente de DRL, contudo, a taxa de res-
nível de choque e a taxa de respostas na linha de postas aumentou com baixos níveis de choque e
base determinam conjuntamente se os estímulos decresceu somente com níveis maiores de cho-
pré-aversivos suprimirão ou fortalecerão as res- que. A Figura 12.9 (direita) mostra os mesmos
postas de pressionar a barra, por um rato, refor- dados convertidos para uma razão de supressão:
çadas com comida (Blackman, 1968). Durante a mudança na taxa de respostas expressa em ter-
as apresentações de luz vermelha e ruído, as pres- mos relativos à taxa de respostas na linha de base.
sões à barra eram reforçadas segundo um esque- Os desempenhos diferentes em FI e DRL
ma de DRL 15 s, com uma contenção limitada mostram como os efeitos comportamentais po-
(limited hold) de 5 s (i.e., uma pressão era refor- dem variar como função das condições de linha
çada somente se fosse emitida em um intervalo de base. A superposição de estímulos pré-aver-
de 15 a 20 s após a última pressão); durante as sivos sobre o responder reforçado é um procedi-
apresentações de luz branca, sem ruído, um es- mento respondente que tem efeitos opostos de-
quema de FI 20 s operava, com uma contenção pendendo do desempenho de linha de base sobre
limitada de 5 s. Nesse esquema múltiplo DRL o qual ele é superposto. Tipos similares de inte-
FI, os componentes de DRL mantinham as taxas ração são críticos para a psicofarmacologia, ou
de respostas mais baixas do que as de FI. Pos- seja, a análise do efeito das drogas sobre o com-
teriormente, foram acrescentadas apresentações portamento; aqui, novamente, o efeito de uma
ocasionais de um tom, com duração de 1 min, que droga pode variar, consideravelmente, dependen-
precediam choques breves. O nível do choque foi do do desempenho de linha de base.
variado, para determinar a relação entre a mag- Os efeitos de estímulos pré-aversivos são de-
nitude do choque e o grau da supressão. A Figu- terminados não apenas pelas propriedades do de-
ra 12.9 (esquerda) mostra as taxas de resposta sempenho de linha de base, mas também pelas
durante o tom (o estímulo pré-aversivo) como propriedades do esquema de apresentação do es-
uma função do nível do choque. No componen- tímulo. Por exemplo, a supressão varia em fun-

Nível do Choque (miliamperes) Nível do Choque (miliamperes)

FIGURA 12.9 Taxas de respostas (esquerda) e razões de supressão (direita) durante um estímulo que precede o
choque. Os efeitos do estímulo pré-aversivo dependeram conjuntamente do nível do choque e do esquema que
mantinha o responder. Os dados são de pressões à barra, por um rato, mantidas por esquemas múltiplos DRL FI de
reforço por comida. O estímulo pré-aversivo suprimiu o responder em todos os níveis de choque, sob o esquema de
FI; no esquema DRL, baixos níveis de choque aumentaram a freqüência de respostas e altos níveis suprimiram o
responder. (Adaptado de Blackman, 1968, Figura 2)

228 A. C h a r l es C a t a n ia
ção da duração de um estímulo pré-aversivo e tiv o : diz-se que o estímulo pré-aversivo tem um
de sua freqüência de apresentação. O grau de valor preditivo quando a probabilidade de cho-
supressão também depende em parte do quanto que na presença desse estímulo difere da proba-
a redução na taxa de respostas afeta a taxa de bilidade de choque na sua ausência; diz-se que o
reforço: menos supressão ocorre quando a re- estímulo não tem valor preditivo quando essas
dução no responder reduz muito o número de probabilidades são iguais; cf. Figura 12.4).
reforçadores obtidos por sessão do que quando O responder na presença de um estímulo si-
a supressão afeta pouco o número de reforçado- nalizador é afetado pela sua relação com o estí-
res obtidos por sessão (Smith, 1974). mulo que ele sinaliza. No caso pavloviano clás-
Assim como em outros casos respondentes, sico, parecia de início que um estímulo funcio-
os efeitos dos estímulos pré-aversivos e pré-a- nava como um substituto do outro, mas com os
petitivos sobre o comportamento operante de- estímulos pré-aversivos e pré-apetitivos vimos
pendem de contingências estímulo-estímulo, e novamente que os fenômenos respondentes não
não de pareamentos estímulo-estímulo. Esse pon- podem ser tratados como uma substituição do es-
to é ilustrado na Figura 12.10 (cf. Figura 12.3), tímulo. Como sempre, é apropriado lembrar que
que mostra como várias combinações de proba- os estímulos têm múltiplas funções, e seria prova-
bilidades de choque, na presença ou ausência de velmente inevitável que tivéssemos que levar tais
um estímulo pré-aversivo, suprimem as pressões funções em conta ao lidar com situações que com-
à barra positivamente reforçadas, por um rato binam os procedimentos operantes e os respon-
(Rescorla, 1968). Por exemplo, se 40% dos estí- dentes (cf. Hoffman & Fleshler, 1962).
mulos pré-aversivos são pareados com um cho-
que (probabilidade de choque, dado CS = 0,40),
uma gama de efeitos, que variam da completa
supressão à total ausência de supressão pode ser Seção C Limites Biológicos da
obtida, dependendo da probabilidade de que Aprendizagem
ocorra o choque quando o estímulo pré-aversi-
vo estiver ausente. (Podemos falar das diferen- O Capítulo 3 examinou as origens conjuntas,
tes contingências com base em seu va lo r p red i- filogenéticas e ontogenéticas, do comportamen-

FIGURA 12.10 Supressão das pressões à barra por um rato durante um estímulo pré-aversivo (CS), como função
de diferentes probabilidades de choque durante sua presença e sua ausência. Por exemplo, com uma probabilida-
de de choque de 0,4, ou p(CHOQUE/CS) = 0,4, durante o CS, a supressão dependeu da probabilidade de choque
em sua ausência, ou p( CHOQUE/N AO CS). Os efeitos variaram da supressão completa, quando a última probabi-
lidade era zero, a nenhuma, quando ela era igual a p(CHOQUEZCS). Os mesmos dados são representados nas
duas metades da figura: à esquerda, o parâmetro é pf CHOQUE/CS) e à direita, o parâmetro é p(CHOQUE/NÃO
CS). Nessa razão de supressão, a linha de base é igual a 0,5. (Adaptada de Rescorla, 1968, Figura 3)

A p r e n d iz a g e m 229
to e da aprendizagem. Ambas as origens podem CS em um procedimento pavioviano, a saliva-
impor restrições ou limites não apenas sobre os ção que se segue pode depender do odor, em vez
estímulos e as respostas que entram nas contin- de depender da contingência CS-US.
gências operantes e respondentes, mas também Certas restrições podem envolver as confi-
sobre as relações que podem ser estabelecidas gurações de estímulo, assim como as dimensões
entre os estímulos e as respostas. Esta seção con- simples de estímulo. Por exemplo, no bocejo con-
sidera alguns exemplos. tagioso, uma pessoa elicia bocejos nas outras. A
efetividade do bocejo como um estímulo elicia-
dor é determinada por uma combinação comple-
LIMITES SENSORIAIS xa de aspectos faciais, que incluem os movimen-
tos dos olhos assim como os da boca (Provine,
Algumas das restrições mais óbvias sobre a 1989b). Em humanos, as propriedades das faces
aprendizagem dependem dos sistemas sensoriais que estão envolvidas em bocejos, sorrisos e fran-
do organismo. Por exemplo, um pombo tem zidos tornaram-se importantes através de uma
maior probabilidade de responder a estímulos longa história filogenética de comportamento
visuais do que um morcego, enquanto um mor- social (Provine & Fischer, 1989). Se for neces-
cego tem maior probabilidade do que um pom- sário que essas propriedades sejam aprendidas,
bo de responder a estímulos auditivos. Se as ca- elas o serão mais facilmente do que configura-
pacidades sensoriais de um organismo não fo- ções geométricas arbitrárias.
rem levadas em consideração, os experimentos
de aprendizagem podem produzir resultados en-
ganosos. Por exemplo, as freqüências de som nas LIMITES MOTORES
quais a sensibilidade é máxima são muito maio-
res para os ouvidos de ratos do que para ouvidos Os limites anatômicos sobre o responder não
humanos. O experimentador que usar estímulos apresentam problemas. Nós não esperamos que
auditivos que sejam facilmente audíveis por ra- o vôo seja similar em pombos, morcegos e abe-
tos poderá ser incapaz de saber se os estímulos lhas (e nem sequer consideramos a possibilida-
estão presentes ou não, mas aquele que usar es- de de vôo no rato). As diferenças entre espécies
tímulos auditivos que sejam facilmente audíveis em relação às capacidades motoras têm maior
por humanos pode estar apresentando ao rato probabilidade de suscitar questões quando elas
sons que este tenha dificuldade em ouvir e po- não têm uma base anatômica clara.
derá concluir incorretamente que o rato aprende Em um estudo sobre os movimentos das per-
lentamente e com dificuldade. nas na primeira infância, Thelen e Fisher (1983)
Os experimentadores precisam ficar alertas registraram os intervalos de tempo e a topogra-
para a possibilidade de que os estímulos aos quais fia com os quais bebês de 3 meses chutavam um
eles próprios sejam insensíveis sejam, não obs- mobile. As conseqüências visuais do chutar va-
tante, estímulos discriminativos importantes para riavam: alguns bebês viam o móbile mover-se
o organismo que eles estão estudando. Por exem- quando eles chutavam, enquanto outros viam o
plo, os resultados de estudos antigos sobre apren- móbile mover-se quando não o chutavam. Es-
dizagem em labirinto devem ser interpretados sas conseqüências afetaram a taxa e o vigor do
com cautela, porque os ratos têm uma sensibili- chutar, mas não as coordenações temporais en-
dade olfativa aguçada. Se um labirinto não for tre as fases de flexão e extensão envolvidas no
muito bem limpo depois da retirada de um sujei- chutar. Em outras palavras, alguns aspectos da
to, o desempenho de outro pode vir a ser basea- resposta de chutar eram modificáveis, enquanto
do em pistas de odor, deixadas por outros ratos, outros aspectos não eram. De modo similar, as
em vez de depender do que cada animal apren- contingências podem afetar a direção na qual
deu em suas passagens anteriores pelo labirinto. uma pessoa anda, mas não as coordenações de-
De modo similar, se o odor de um US alimentar talhadas de seus músculos e juntas quando ela
chega a um cão durante a apresentação de um anda.

230 A. C h a r l es C a t a n ia
A locomoção apresenta componentes tanto ponto, comparando um rato caçando um camun-
filogenéticos quanto não ontogenéticos, e os de- dongo em um ambiente natural com uma vaca
talhes das coordenações motoras não surgem das que seja ensinada a caçar:
contingências entre as respostas e os estímulos.
As coordenações no andar envolvem as relações ...dada uma presa que esteja relacionada a uma vaca,
entre os músculos da perna e entre as pernas e baseados na velocidade e na estimulação mútua, de
modo similar à relação de um camundongo para um
outras partes do corpo. (p. ex., o relaxamento de gato, não deveria ser difícil estabelecer as contin-
um músculo, à medida que um músculo oposto gências sob as quais uma vaca irá “caçar”, isto é,
se contrai). Muitos aspectos dessas coordenações aproximar-se vagarosamente, de modo a não alertar
operam independentemente do ambiente (cf. a presa e, quando estiver próxima desta, mover-se
Gallistel, 1980; Gray, 1953); geralmente, eles são rapidamente para capturá-la. A presa deveria ser algo
como um feixe de milho animado. (Skinner, 1977,
denominados programas motores. Um treinador p. 1011)
de cavalos não tem que modelar os detalhes do
passo ou a ordem dos movimentos das pernas, à Skinner observa, então, que esse caçar pela
medida que um cavalo acelera do andar para o vaca, pareceria, em velocidade e outras caracte-
trote, e daí para a corrida e para o galope. Um rísticas, muito diferente do caçar por parte do
cavalo de exibição pode aprender tipos especiais gato. Apesar disso, as propriedades funcionais
de passadas, tais como o rodopiar, mas, mesmo do comportamento da vaca e do gato seriam si-
nesses casos, a nova topografia modula os pa- milares, mesmo que tais comportamentos dife-
drões já existentes. rissem consideravelmente em detalhes estrutu-
Um outro exemplo é o vôo nos pássaros. De rais.
que maneira as asas vêm a bater em sincronia? É
necessário que o pássaro venha a voar para des-
cobrir que ele não pode permanecer no ar baten- LIMITES SOBRE AS CONSEQÜÊNCIAS
do apenas uma asa ou trazendo uma para baixo,
enquanto eleva a outra? Pintinhos foram priva- Podemos estender nossos exemplos para
dos das experiências de bater as asas e voar, logo abranger a capacidade de vários estímulos, para
após terem saído do ovo, por restrições sobre os reforçar ou servir como USs. Assim como as ca-
movimentos das asas ou por outros meios, e sua pacidades sensoriais e motoras, essas também di-
coordenação das asas foi testada em vários está- ferem entre as espécies. Nem precisaríamos di-
gios posteriores (p. ex., Provine, 1981). O bater zer que a efetividade dos reforçadores tem uma
as asas mostrou-se sincronizado desde o início, base filogenética. Um organismo para o qual nem
demonstrando que esse aspecto do voar não de- comida nem água fossem efetivas como refor-
pendia das contingências ambientais. Muitos as- çadores provavelmente não viveria o suficiente
pectos da coordenação do voar constituem um para passar seus gens para a geração seguinte.
circuito que já vem com as conexões prontas ao Mas as propriedades mais sutis do ambiente tam-
nascimento; elas são pré-programadas (pre-wi- bém podem ser importantes, tais como as con-
red)\ esses aspectos já vêm construídos no com- seqüências sensoriais que mantêm o comporta-
portamento do pássaro. Mesmo assim, o ambien- mento exploratório ou as conseqüências novas
te permanece sendo importante. A evolução do que podem tornar um organismo cauteloso ao
vôo nos pássaros dependeu dos ambientes aero- provar uma comida desconhecida ou uma comi-
dinâmicos de seus ancentrais. E sejam quais fo- da conhecida em um lugar desconhecido (cf. ne-
rem os detalhes da coordenação de movimentos ofobia\ p. ex., Mitchell, Scott, & Williams, 1973).
no vôo, quando e para onde um pássaro voa são Antes que a relatividade do reforço fosse re-
determinados por seu ambiente momentâneo. conhecida, era difícil lidar com as descobertas
As espécies diferem de várias maneiras, e as nas quais os reforçadores-padrão para uma dada
restrições sobre a topografia das respostas não espécie deixavam de ter seus efeitos caracterís-
devem ser confundidas com certas restrições nas ticos. Breland e Breland (1961) usaram vários
funções dessas respostas. Podemos ilustrar este desses casos para argumentar contra a generali-

A p r e n d iz a g e m 231
dade do reforço como um processo comporta- deramos outros exemplos no tratamento das
mental. reações de defesa específicas da espécie, no
Em uma demonstração com racuínos, a co- Capítulo 6. Por exemplo, a facilidade com a
mida era apresentada quando um racum pegava qual o responder de esquiva era adquirido de-
moedas do chão e as depositava em um recipien- pendia das relações específicas da espécie entre
te. Depois de algumas repetições desse procedi- os vários tipos de respostas de esquiva e os estí-
mento, o racum começava a esfregar persisten- mulos aversivos.
temente as moedas umas nas outras, em vez de Algumas relações entre os estímulos discri-
depoisitá-las no recipiente. Os Brelands e ou- minativos e as respostas podem ser mais fáceis
tros viram esse resultado como invalidando o de aprender do que outras. Por exemplo, será
princípio do reforço. Mas um aspecto relevante vantajoso para a aprendizagem que os estímulos
do comportamento do racum é que os membros e as respostas compartilhem de propriedades co-
dessa espécie normalmente esfregam e lavam sua muns, tais como responder à esquerda a um estí-
comida antes de comê-la. As moedas aparente- mulo situado à esquerda e à direita para um estí-
mente forneciam uma oportunidade melhor para mulo situado à direita, em vez de responder à
esse comportamento do que a comida que su- esquerda para um estímulo verde e à direita para
postamente funcionava como reforçador. Em um vermelho? No primeiro caso, as posições
outras palavras, a comida não era efetiva como eram propriedades relevantes tanto dos estímu-
reforçador, porque esfregar havia se tornado los como das respostas; no segundo caso, as qua-
substancialmente mais provável do que comer. lidades dos estímulos eram correlacionadas com
É provável que uma oportunidade para esfregar as posições das respostas (p. ex., Miller & Bowe.
tivesse sido efetiva como reforçador para outras 1982). Seria uma mudança de posição para qua-
respostas, talvez até mesmo para a resposta de lidade mais fácil ou mais difícil de dominar do
comer. que uma mudança de posições (lembrar da adap-
Dado que as relações de reforço são basea- tação de Stratton aos prismas invertidos, no Ca-
das em probabilidades relativas de respostas, as pítulo 5; veja também a discussão de transferên-
diferentes hierarquias comportamentais de dife- cia no Capítulo 17)? Tais relações podem ser cru-
rentes espécies inevitavelmente limitam o que ciais no planejamento de sistemas homem-má-
elas podem aprender. Quando um procedimento quina ou no domínio de habilidades motoras (p.
experimental é aplicado, não há garantia de que ex., Bauer & Miller, 1982; Glencross, 1977:
ele vá ser efetivo. Um procedimento que leve à Mazur, 1986, Capítulo 12).
aprendizagem com uma resposta ou com um or- Consideramos até aqui os casos envolvendo
ganismo pode não ser efetivo com outras res- relações entre os estímulos discriminativos e as
postas ou com outros organismos, e uma respos- respostas e entre as respostas e os reforçadores.
ta ou um organismo que forem afetados por um As contingências filogenéticas podem ter pre-
procedimento podem não ser afetados por ou- parado os organismos para aprender apenas al-
tros. Uma parte essencial da análise da aprendi- gumas das muitas relações possíveis entre os
zagem é explorar tais limites. estímulos e as respostas nos procedimentos ope-
rantes e respondentes. O conceito de prepara-
ção surgiu a partir da observação de que a apren-
PREPARAÇÃO dizagem discriminativa pode ser uma função do
contexto de respostas e reforçadores dentro dos
Certas restrições podem envolver também as quais ela ocorre (Seligman, 1970; Schwartz.
relações entre os estímulos e as respostas que 1974). A signifícância desse conceito foi esta-
entram em contingências operantes e responden- belecida através da análise de um fenômeno de-
tes. Tais relações estavam implícitas nos exem- nominado hesitação diante de uma isca ou
plos sobre as restrições e conseqüências, uma vez aprendizagem de aversão gustativa; essa é uma
que os tratamos em termos das probabilidades variedade de aprendizagem discriminativa, ba-
relativas de respostas reforçadas e das respostas seada na punição diferencial (mas ver Rozin &
ocasionadas pelos reforçadores. Também consi- Kalat, 1971).

232 A . C h a r l e s C a ta n ia
Em experimentos sobre aversão gustativa, um ber era acompanhado por sons e luzes, mas o
rato pára de comer uma determinada comida se fato da água ser adocicada não afetou o beber.
mais tarde, depois de comer, ele fica doente (Re- Em outras palavras, quando o estímulo aversivo
vusky & Garcia, 1970). A náusea ou outras con- era a conseqüência sistêmica da aplicação de
seqüências sistêmicas do comer podem punir o raios X, os ratos aprenderam apenas a sua rela-
comer, mesmo que essas conseqüências ocorram ção com o gosto da água anteriormente consu-
após um considerável intervalo de tempo. Em mida, mas quando a estimulação aversiva era o
um estudo do papel dos estímulos discriminati- choque, os ratos aprenderam apenas a sua rela-
vos (Garcia & Koelling, 1966), ratos sedentos ção com os sons e as luzes que a precediam. Os
beberam água adoçada com sacarina; o beber foi efeitos atrasados da irradiação com raios X pu-
acompanhado por sons de clique e por flashes niram o beber água adocicada, e os efeitos ime-
de luz acionados eletronicamente pelas lambi- diatos do choque puniram o beber água acom-
das do rato à agua. Em outras palavras, a água panhada por sons e luzes. Não é suficiente dizer
que os ratos beberam era barulhenta e brilhante, que os ratos aprenderam alguns estímulos ou al-
além de açucarada. Em um grupo, o beber foi gumas respostas mais facilmente do que outros
seguido por irradiação com raios X, que fazia estímulos ou outras respostas; eles estavam pre-
com que os ratos ficassem doentes mais tarde. dispostos a aprender relações diferentes entre os
Em um segundo grupo, o beber foi acompanha- estímulos discriminativos e as contingências
do por choques. Depois, o beber de cada grupo nessas diferentes situações.
de ratos foi medido quando uma solução adoci- Revusky e Garcia (1970) discutem essas des-
cada era apresentada e quando o beber era acom- cobertas no contexto de um experimento imagi-
panhado por ruído e luz. nário, no qual você encontra R$ 100,00 que lhe
A Figura 12.11 apresenta os resultados. Os foram deixados
ratos que haviam sido irradiados com raios X
beberam menos água adocicada, mas o beber não por um insano experimentador bilionário porque, no
foi afetado pelo ruído e pela luz; os ratos que almoço, duas horas atrás, você comeu torta de fram-
boesas de sobremesa, em vez de sua costumeira tor-
levaram choques beberam menos quando o be- ta de maçã. O experimentador pretendia aumentar a
probabilidade futura de que você comesse torta de
frambroesas. É muito pouco provável que esse ex-
perimento venha a ser bem-sucedido... Centenas de
eventos forçosamente irão ocorrer durante as duas
horas que se passam entre o consumo da torta e o
recebimento dos R$ 100,00. Haveria grandes pro-
babilidades de que você associasse algum desses
eventos intervenientes com os R$ 100,00... Os re-
sultados de nosso experimento imaginário são real-
mente chocantes. Selecionamos uma recompensa
arbitrária bastante poderosa e uma resposta da qual
você provavelmente estava bem ciente... [e] chega-
mos à conclusão de que a natureza do ambiente im-
pediu a associação com um atraso de duas horas
Raios-X Choque (Revusky & Garcia, 1970, p. 20).
Punidor

FIGURA 12.11 Porcentagem da ingestão normal de lí- Esses investigadores sugeriram, então, um
quidos, em ratos, quando beber água açucarada era experimento imaginário alternativo: em vez de
acompanhado por cliques e luzes. Em um grupo, a in- encontrar dinheiro, você ficava doente.
gestão de líquido era seguida por irradiação; em um
segundo, a ingestão era seguida por choque elétrico. Uma vez que a torta de framboesas era nova para
Quais estímulos se tomaram discriminativos efetivos você, você concluiria, provavelmente, que a torta
para reduzir o responder, o gosto ou a combinação som- causou a doença. Aqui, a associação com um atraso
luz, dependeu da natureza do punidor. (De Garcia & de duas horas está de acordo com nossa experiência
Koelling, 1966, como apresentado em Revusky & Gar- cotidiana... Mas, por que motivo a modificação da
cia, 1970, Figura 9) conseqüência de R$ 100,00 para uma de ficar doen.

A p r e n d iz a g e m 233
te mudou a situação?... Parece haver apenas uma náusea, e o apetite do paciente pode decrescer,
resposta razoável.... O fato de que organismos in- afetando a palatabilidade dos alimentos ingeri-
fra-humanos também podem associar, ainda que com
atrasos longos, sugere fortemente que há uma asso- dos nas horas que antecedem o tratamento.
ciação seletiva inata de sabores com pós-efeitos fi- Pode ser apropriado planejar os tratamentos
siológicos e, o que é mais importante, uma falha de tal modo que esses efeitos permaneçam
seletiva na associação de estímulos irrelevantes com confinados a uma pequena faixa de ambien-
a toxicose. (Revusky & Garcia, 1970, p. 21) tes e dietas.
Temos considerado, principalmente, as con-
Tais experimentos são, por certo, complica- tribuições fílogenéticas às restrições à aprendi-
dos por outras diferenças entre os dois tipos de zagem. As questões podem ficar ainda mais com-
conseqüências. Por exemplo, o choque elétrico plicadas se considerarmos as contribuições on-
tem início mais abrupto do que os sintomas gás- togenéticas, além das fílogenéticas. Por exem-
tricos da irradiação com raios X. Além disso, plo, o comportamento sexual e maternal adulto
pode-se argumentar que esses experimentos en- de macacos depende não apenas das contingên-
volvem relações respondentes em vez de, ou além cias evolucionárias que selecionaram os aspec-
das, relações operantes. Se as contingências res- tos de acasalamento e a criação de organismos
pondentes podem ser programadas com o sabor jovens. Ele depende também de contingências
como um CS de traço e a náusea como um US, é de desenvolvimento precoce que envolvem o
provável que o sabor adquira sua aversividade contato com a mãe e a interação com compa-
como resultado de sua relação contingente com nheiros da mesma idade. A privação de contatos
a náusea, mesmo que essa contingência opere maternais nas primeiras semanas de vida de um
com atraso. macaco pode limitar seu comportamento pelo
De qualquer modo, esse é um outro fenôme- resto de sua vida (p. ex., Harlow & Harlow, 1966).
no com considerável significância prática. Quan- A análise do comportamento preocupa-se em iden-
do a radiação é usada em procedimentos médi- tificar as origens de instâncias particulares de com-
cos, como em alguns tratamentos de câncer, as portamento. Tanto com as contingências operan-
contingências são análogas àquelas dos grupos tes quanto as respondentes, nossas conclusões
com raios X da Figura 12.11. Assim, a própria sobre o que é aprendido devem levar em conta
situação de tratamento pode começar a eliciar a tanto a filogênese quanto a ontogênese.

234 A . C h a r le s C a ta n ia