Académique Documents
Professionnel Documents
Culture Documents
Per
Tr t P
ia D
l F
Neste livro, o Professor Fred1 .
uma introdução simples e breve l
em termos da teoria do reforço. I___________ ,___
e breve, identifica e esclarece todos os princípios
fundamentais e indica suas interrelações e possí
veis extensões. É, por isso, mais do que uma pura
exposição de uma teoria da aprendizagem; ofe
rece um ponto de vista de teoria da aprendizagem
F
para toda a Psicologia.
ia D
Milhares de experimentos foram realizados na
Tr t P
área da teoria e prática da Psicologia. Os termos
básicos e os conceitos-chave, assim como o es
quema daí resultantes constituem a principal
er
F
TEORIA DO REFORÇO
ia D
Tr t P
er
l
P
eX
F
ia D
Tr t P
FICHA CATALOGRÁFICA
er
l
(Preparada pelo Centro de Catalogação-na-fonte,
Câmara Brasileira do Livro, SP)
P
eX
APRENDIZAGEM:
TEORIA DO REFORCO
F
3
ia D
Tr t P
Tradução de
Rodolpho Azzi
er
Lea Zimmerman
l
Luiz Octávio de Seixas Queiroz
P
eX
Tradução brasileira da 2.a edição americana:
Learning: reinforcement theory, second edition, 1969,
Copyright © 1954, 1969 by Random House, Inc.
F
ia D
Tr t P
er
l
P
eX
© E.P.U. - Editora Pedagógica e Universitária Ltda., São Paulo, 1974. Todos os direitos reservados.
A reprodução desta obra, no todo ou em parte, por qualquer meio, sem autorização expressa e por
escrito da Editora, sujeitará o infrator, nos termos da lei n° 6.895, de 17-12-1980, à penalidade
prevista nos artigos 184 e 186 do Código Penal, a saber: reclusão de um a quatro anos.
E. P. U. - Telefone (0++11) 3168-6077 - Fax. (0++11) 3078-5803
E-Mail: vendas@epu.com.br Site na Internet: http://www.epu.com.br
Rua Joaquim Floriano, 72 - 6o andar - conjunto 65/68 - 04534-000 São Paulo - SP
Impresso no Brasil Printed in Brazil
ÍNDICE
F
Prefácio da Segunda E d iç ã o ..........................................
Prefácio ............................................................................
ia D
Agradecimentos ...............................................................
Tr t P
1. Introdução .....................................................
2. Comportamento operante e respondente . . .
3. Condicionamento respondente.....................
er
6 . Extinção .....................................................
7. Reforçamento interm itente...........................
eX
F
college, leigos interessados e professores que sentiam a necessidade
de uma apresentação sumarizada, eu fiquei amedrontado. Despido
ia D
do acompanhamento usual de curvas e tabelas, sem pormenores ex
perimentais e indicação bibliográfica especializada, com pouca ou ne
Tr t P
nhuma referência às fontes históricas e às questões discutíveis, seria
o resumo algo que valesse a pena ser lido? O que restasse seria su
ficiente para envolver o interesse dessa audiência ou de qualquer
er
outra? (
l
Parece agora que esses temores eram infundados. A apresenta
ção abreviada aparentemente mostrou-se útil em vários níveis de en
P
1
eX
P er
Tr t P
ia D
l F
Prefácio
F
£ muito difícil exagerar a importância dos processos de apren
dizagem na definição do comportamento humano. Estudantes de psi
ia D
cologia nem sempre alcançaram uma compreensão adequada desse im
portante campo. “Escolas” teóricas diferentes sugeriram pontos de
Tr t P
vista diversos, e integraram seus conceitos numa tentativa de unificar
a compreensão do comportamento humano. Nos últimos anos, porém,
nota-se ujn número crescente de esforços sistemáticos para elaborar a
er
í
l
teoria da aprendizagem como o ponto de partida para compreender o
homem. Uma das contribuições mais estimulantes é a comumente
P
3
ver o esotérico deste ponto de vista — e assim torna possível a um
maior grupo de pessoas compreender, criticar, ampliar e auxiliar a
desenvolver este importante campo de investigação.
Eugene L. Hartley
The City College, New York
F
ia D
Tr t P
er
l
P
eX
4
Agradecimentos
F
nas que seguem mas, qualquer leitor psicólogo rapidamente reconhe
ia D
cerá meu débito geral ao Professor B. F. Skinner e a seus colabo
radores pela formulação da teoria do reforço aqui apresentada. Ele
Tr t P
também encontrará exemplos de débitos específicos a pesquisadores
cuja orientação teórica, provém do Professor Clark L. Hull. Identifi
cará alguns velhos amigos que, de nenhuma forma, estão ligados a
uma teoria./Minha razão para omitir referências pessoais é a mesma
er
l
em cada calso. Este e um livro para os que se iniciam. Se eles fo
rem incentivados a prosseguir nos seus estudos, poderão sanar a falta
P
Fred S. Keller
5
eX
P er
Tr t P
ia D
l F
1. Introdução
1
F
algumas de suas formas. Aprendemos, em criança, a distinguir uma
face de outra, ou uma voz amiga de outra zangada. Aprendemos,
ia D
talvez, que algumas vezes se consegue coisas com manha — e, mais
tarde, que não. Aprendemos que certos objetos cortam, queimam,
Tr t P
picam ou machucam os dedos se não forem manejados corretamente.
Aprendemos a patinar, a dançar e a esquiar. Aprendemos boas ma
neiras à mesa, jeitos de falar e mesmo maneiras de demonstrar emo
r
7
São perguntas difíceis e não são, de forma alguma, as únicas
que se pode fazer acerca da aprendizagem. E são perguntas que não
podem ser respondidas com uma palavra, nem com uma sentença,
nem mesmo com um livro. Ainda estamos aprendendo a respeito da
aprendizagem e ainda, por algum tempo, não se terá escrito toda a
história.
Enquanto isso, não seria certo concluir que a situação é deses-
peradora. Na verdade, o que ocorre é o contrário, e nunca estivemos
tão esperançosos. Alguns princípios ou leis gerais emergiram recen
F
temente nos estudos modernos da natureza humana. Estes princípios e
leis não são difíceis de serem entendidos e, se bem compreendidos,
ia D
constituem um poderoso instrumento na análise de comportamentos de
todos os tipos. Com este auxílio, será possível focalizar com nitidez
Tr t P
quase todos os casos de aprendizagem que você tenderá a encontrar
na vida diária. Inclusive todos os exemplos de aprendizagem men
cionados acima, por mais complexos que pareçam ser.
er
l
2. Comportamento operante e respondente
P
8
O comportamento respondente (reflexo) inclui todas as respos
tas dos seres humanos, •e de muitos organismos, que são eliciadas
(“produzidas”) por modificações especiais de estímulos do ambiente.
Manifesta-se sempre que as pupilas dos olhos se contraem ou se dila
tam em resposta a modificações na iluminação do ambiente; sempre
que a boca se enche d’água ao degustar algum petisco; sempre que
uma lufada de ar frio arrepia a pele; sempre que se derramam lágri
mas ao descascar cebolas; sempre que se perde o fôlego ao receber
no rosto um inesperado jato d’água; e em muitas outras maneiras,
F
algumas das quais serão mencionadas mais tarde.
O comportamento operante (voluntário) abrange uma quantida
ia D
de maior da atividade humana — desde o espernear e balbuciar do
bebê de colo até as mais sublimes perfeições das habilidades e do
Tr t P
poder de raciocínio adulto. Inclui todos os movimentos de um orga
nismo dos quais se possa dizer que, em algum momento, têm um efeito
sobre ou jazem algo ao mundo em redor. O comportamento operante
er
opera sobre o mundo, por assim dizer, quer direta, quer indiretamente.
l
Quando se apanha um lápis ou quando simplesmente se pede a alguém
P
que no-lo dê; quando se faz sinal para o ônibus, ou nele se sobe,
quando se fala ao telefone; quando se trauteia uma melodia, ou se
eX
9
guém foi instigado para a ação de discar o número do telefone; e, antes
que alguém comece a falar sozinho, é necessário que a fala tenha tido
algum efeito sobre o comportamento dos outros, ou jamais teria sido
adquirida.
O comportamento respondente, como já foi mencionado, é auto
maticamente eliciado por estímulos especiais. Uma luz forte, proje
tada no olho acostumado ao escuro, produzirá inevitavelmente uma
contração pupilar. O comportamento operante, entretanto, não é
assim tão automático, tão inevitável, nem tão específico com relação,
F
aos estímulos. Suponhamos que se queira fazer com que uma pessoa
atravesse uma sala, levante a mão acima da cabeça ou que apanhe
ia D
um lápis da mesa. Como se faria para eliciar estas respostas? Em-
pregar-se-ia uma ordem, um pedido ou uma súplica? Tentar-se-ia
Tr t P
fazê-la executar o ato, usando força se necessário? Usar-se-iam atra*
tivos ou incentivos especiais? E ter-se-ia a mesma certeza dos resul
tados como quando se projeta luz nos olhos de alguém? E se a pes
er
10
na Seção 12, e como estas ligações se estabelecem, mas, mesmo en
tão, será justificado dizer que os operantes e os respondentes relacio
nam-se com os estímulos de modo diferente.
3. Condicionamento respondente
F
Caso I: Suponha que, numa sala aquecida, sua mão direita seja
mergulhada numa vasilha de água gelada. Imediatamente a tempera
ia D
tura da mão abaixar-se-á, devido ao encolhimento ou constrição dos
vasos sangüíneos. Isto é um exemplo de comportamento responden
Tr t P
te. Será acompanhado de uma modificação semelhante e, mais facil
mente mensurável, na mão esquerda, onde a constrição vascular tam
bém será induzida. Suponha agora que a sua mão direita seja mer
er
ratura poderá ser eliciada apenas pelo som — isto é, sem necessi
dade de molhar uma das mãos.
Caso II: Imagine agora uma pessoa sentada diante de uma pe
quena tela de cinema em uma sala silenciosa. Na tela, durante perío
dos de um minuto, aparece projetada em intervalos irregulares uma
palavra em letra de forma. Durante o mesmo período de um minuto,
chumaços de algodão serão colocados debaixo da língua da pessoa,
de modo que se embebam de certa quantidade de saliva, que será
exatamente determinada pela diferença de peso do algodão no come
ço e no fim de cada minuto. Depois, na mesma sala, mas sem chuma
ços de algodão que atrapalhem, convidar-se-á a pessoa para uma série
de petiscos (sanduíches, pastéis e outros bocados) durante os quais a
palavra continua a ser intermitentemente projetada na tela em frente.
Finalmente, sem mais nada que comer, mas com os chumaços de al
11
godão outra vez no lugar, a palavra intermitente será outra vez pro
jetada por outro minuto — período de teste — e a salivação será
medida como antes. Resultado: a palavra projetada elicia agora mui
to mais saliva do que antes.
Caso III: Imagine ainda outro sujeito humano numa sala de
laboratório. Desta vez, está usando fones no ouvido e tem elétrodos
presos à mão esquerda, de modo a permitir a aplicação de um cho
que elétrico. Outros elétrodos, presos ao tórax e à perna esquerda,
estão ligados a um cardiógrafo, para prover um registro das batidas
F
do coração. Quando tudo estiver pronto, um som de altura e tona
lidade moderadas chegará ao ouvido do sujeito durante o período de
ia D
um segundo. Seis segundos mais tarde, um choque elétrico estimu
lante será aplicado à sua mão. Esta combinação de som seguido de
Tr t P
choque será repetida onze vezes, em intervalos de um ou dois minu
tos. Lá pelo décimo primeiro pareamento, o batimento cardíaco do
sujeito cairá de quinze a vinte batidas por minuto dentro de um se
er
gundo mais ou menos depois de ter ouvido o som, e antes que o cho
l
que seja sentido.
P
F
experimento, etc. Vê-se, portanto, que há mais coisas no condicio
ia D
namento do que pode ser dito no enunciado de uma sentença.
Nossa definição é inadequada ainda sob outro aspecto. A cigar
Tr t P
ra, a palavra projetada e o som, nos nossos três exemplos, só eram
“neutros” em um sentido relativo — só por que não tinham, ao co
meçar, o mesmo efeito sobre o comportamento que seus associados:
a água gelada, o alimento e o choque elétrico. Cada um deles tinha,
er
l
provavelmente, algum efeito sobre o comportamento antes da asso
ciação, alguma influência sutil que podemos mesmo não ser capazes
P
13
Pavlov reconhecia tudo isso. O terceiro reflexo era o seu refle
xo condicionado, e referia-se aos dois reflexos sobre os quais se ba
seava como “incondicionados”. Referia-se, do mesmo modo, a estí
mulos condicionados e incondicionados. O alimento foi denominado
estímulo incondicionado para a salivação do cachorro e o estímulo
(um som), com o qual era associado, tornava-se o estímulo condicio
nado para a mesma resposta. (E deveríamos acrescentar, naturalmen
te, que o som era um estímulo incondicionado para alguma outra
resposta — por exemplo, um sobressalto — antes do condicionamen
F
to ser iniciado.)
Um outro termo de Pavlov se tornou muito importante na psi
ia D
cologia moderna. Ao descrever o efeito do alimento no condicio-
mento de um cachorro a salivar ao som de uma campainha, referiar
Tr t P
-se a ele como “reforçador”. O alimento reforçava a conexão entre
o estímulo neutro e a salivação. É como o efeito da água gelada e
do choque elétrico nos nossos Casos I e III. Hoje, de certo modo,
er
comportamento operante.
O princípio de Pavlov, como ele o formulara, aplica-se especial
eX
14
4. Condicionamento operante
F
a criança volta-se para o outro lado. À medida que seu olhar vagueia
pela sala, de repente ilumina-se ao cair sobre um novo aspecto; Atra
ia D
vés de uma estreita fresta da cortina que separa a sala de visitas da
de jantar, projeta-se uma pequena maçaneta em forma de T. Logo
Tr t P
abaixo da maçaneta há uma pequena vasilha, ao alcance da criança.
Aproximando-se rapidamente destes objetos, mas prudentemente, a
criança toca a maçaneta com o dedo, e olha dentro da vasilha.
er
e animal. Em essência, esta lei enuncia que um ato pode ser alterado
na sua força pelas suas conseqüências. O ato, no nosso exemplo, foi
o de pressionar a maçaneta; o reforçamento deste ato foi observado
no aumento da freqüência de seu aparecimento, e a conseqüência do
ato foi, naturalmente, o pedaço de chocolate que caía na vasilha.
15
Muito conhecidos entre os próprios estudos de Thorndike são
aqueles em que gatos famintos conseguiam acesso a pedacinhos de
alimento sempre que manipulassem o fecho, alavanca, ou dispositivo
apropriado que abria a porta da “gaiola-problema” em que estavam
aprisionados. O progresso dos gatos nesta tarefa foi medido pela
diminuição do tempo que demoravam para escapar e chegar até o
alimento em sucessivas ocasiões de confinamento. Assim, quando o
gato resolvia o problema, o número de segundos que precisava para
operar o mecanismo de escape ia diminuindo gradualmente, até que
seu desempenho se aproximava da perfeição.
F
Hoje, falamos comumente desta “aprendizagem por efeito” como
ia D
condicionamento “instrumental” ou operante e, freqüentemente, me
dimos a sua força em termos da freqüência com que ocorre no tem
Tr t P
po quando o organismo (animal ou humano) é livre para responder
à vontade. No caso da nossa criança, esperaríamos uma resposta de
vez em quando, mesmo na ausência de qualquer recompensa especial.
r
16
ver-se-á que a R do nosso diagrama se relaciona com estímulos do
meio e examinaremos as condições em que esta relação se estabelece.
F
minados reforços “positivos”. Esta família inclui todos aqueles estí
mulos que, quando apresentadôs, atuam para fortalecer o comporta
ia D
mento que os precede. Sob condições apropriadas de carência, mui
tos outros alimentos (ou bebidas), e talvez mesmo certos sons e luzes,
Tr t P
podem aumentar a freqüência do pressionar a barra do mesmo modo
que o chocolate.
Mas isto não é tudo. Assim como há reforços positivos, há re
er
17
que enfraquece a resposta que o produz. Suponha-se, por exemplo,
que a criança que mencionamos tivesse recebido, depois de cada
pressão à barra, um choque elétrico em vez de um pedaço de cho
colate; é fácil adivinhar o que teria acontecido. A freqüência do pres
sionar a barra teria sido drasticamente afetada. Cairia bem abaixo
do nível de sua ocorrência incondicionada, isto é, da freqüência com
que ocorreria naturalmente, na ausência de qualquer efeito especial.
Ao menos esta é a conclusão a que se poderia chegar na base do senso
comum e dos estudos com animais em que as respostas operantes
foram seguidas de estimulação intensa. De um modo geral, foi de
F
monstrado que choques fortes, luzes intensas, sons agudos, etc., efe
ia D
tivamente suprimem todo o comportamento que os produz. A supres
são poderá não durar muito, especialmente se o organismo for deixado
Tr t P
na mesma situação depois de ter sido interrompido o reforço nega
tivo, mas não se põe em dúvida a sua existência. (Voltar-se-á a este
problema na seção 10.)
er
l
6. Extinção
P
18
uma mudança no batimento cardíaco foi condicionada a um som de
um segundo de duração. Tudo isso já foi descrito. Entretanto, não
foi mencionado o fato de que, depois de cada experimento, a respos
ta condicionada foi extinguida. No primeiro caso, a cigarra foi toca
da repetidamente, mas a mão não foi mergulhada na água; no se
gundo, a palavra foi várias vezes projetada, mas nenhum alimento a
acompanhou; e, no último caso, uma série de sons foram apresenta
dos, mas não foram seguidos de choque. O resultado em cada um
dos casos foi o mesmo. A força da resposta condicionada declinou,
até que o efeito da associação se perdesse e o estímulo condicionado,
F
outra vez, se tornasse “neutro”.
ia D
Estes são exemplos de extinção respondente, mas a mesma regra
fundamental se mantém para a extinção operante. Se o reforço for
Tr t P
retirado, a resposta voltará, eventualmente, à sua freqüência original
incondicionada (algumas vezes denominada nível operante). Em al
guns experimentos, como no caso da criança que ganhava chocolate
er
19
Provavelmente as coisas não são assim tão ruins. Por exemplo,
o alegado fracasso em obter extinção de uma contração pupilar, de
uma secreção salivar, ou de qualquer outro respondente condiciona
do, pode ter uma explicação diferente. Sabemos que o comporta
mento operante pode, às vezes, produzir efeitos respondentes incon
dicionados. Isto é freqüentemente citado como o controle voluntário
da ação involuntária. Assim, distendendo ççrtos músculos pode-se
prover o estímulo incondicionado para uma mudança na freqüência
do pulso, na constrição de vasos sangüíneos, etc. Pode bem ser que
tal controle operante do comportamento respondente, estabelecido ao
F
mesmo tempo que o respondente, tenha sido condicionado e se possa
ia D
manter mesmo depois que o estímulo condicionado para o responden
te tenha perdido todo o efeito. Em outras palavras, antes de termos
Tr t P
certeza de que o respondente não se extinguirá, devemos estar certos
de que o nosso sujeito não tenha descoberto, sem o sabermos e sem
ele mesmo saber, seu próprio operante especial para produzir o mes
mo efeito em uma base incondicionada — isto é, produzindo em si
er
l
mesmo a estimulação que irá eliciar a mesma mudança respondente.
Também os operantes condicionados podem resistir à extinção,
P
20
7. Reforçamento intermitente
F
mos cada cinco minutos, breves períodos de não-resposta alternar-se-
-ão regularmente com períodos mais longos nos quais o pombo acelera
ia D
rapidamente até uma freqüência duas ou três vezes maior por segun
do e continua neste ritmo até a ocorrência do próximo reforçamento.
Tr t P
O pombo parece “contar o tempo”. Nunca responde diretamente de
pois de comer (nunca foi reforçado por responder nessa ocasião),
mas volta a bicar intensamente quando se aproxima do momento do
er
outro reforçamento.
l
Os que trabalham em laboratório referem-se a este esquema como
P
21
ê
F
Os efeitos desses esquemas de reforço diferentes podem ser no
tados, como se disse no início desta seção, no total de respostas que
ia D
ocorrem quando o reforçamento for completamente descontinuado —
quando ocorre a extinção. Depois de um procedimento de reforça
Tr t P
mento contínuo, quando cada resposta é reforçada, pode-se esperar
que a extinção reduza rapidamente a freqüência de respostas com
sinais claros de distúrbios, tal como foi descrito na seção 6. O refor
er
22
nos que o organismo possa perceber a diferença entre as duas condi
ções, a freqüência do responder continuará a mesma de antes. Se
esta conclusão for admitida, deve-se pensar que o comportamento
operante está mais ligado do que foi sugerido antes nestas páginas
com os estímulos ambientais. Este é um ponto importante e ao qual
voltaremos em seções mais adiante.
8. Comportamento supersticioso
F
Em todos os esquemas de reforço descritos na seção 7, o sujeito
ia D
experimental, o pombo, tinha de bicar uma chave antes de poder
obter seus grãos; o reforçamento, dizemos, foi contingente a um tipo
Tr t P
específico de resposta. Isto, talvez, é o que ocorre normalmente em
nossas vidas, bem como em experimentos com pombos; usualmente
temos de fazer alguma coisa para obter algo. Mas nem sempre. Às
er
vezes parece que somos pagos por não fazer nada. Que efeito, se é
l
que existe algum, tem o reforçamento sobre nós?
P
23
te os grãos. A resposta parece ter sido “colhida” pelo reforçamento
que ocorreu depois da sua primeira emissão. Antes que tivesse tempo
de se extinguir, um outro reforço foi dado; e assim uma completa
“superstição” foi estabelecida, não diferente do comportamento de um
jogador que fala com suas fichas ou dá voltas ao redor da mesa para
mudar' a sorte.
Para que os resultados sejam como estes, o reforçamento não-
-contingente deve ser freqüente no princípio. Quando isto não se ve
rifica, a resposta acidentalmente reforçada será suficientemente extin
F
ta para ser substituída por outra que, por sua vez, pode ser substituí
da por uma outra, destruindo deste modo o efeito ritualístico. O
ia D
comportamento supersticioso desenvolver-se-á, entretanto, rapidamen
te quando se começa com reforçamento pouco espaçado. Esse inter
Tr t P
valo pode ser gradualmente aumentado, sem causar uma modificação
no comportamento, quando este já estiver firmemente estabelecido.
No caso do tempo entre os reforçamentos ser sempre o mesmo, de-
er
24
moedas e um cronômetro. Ele acabou de instruir o menino para
“pronunciar palavras” ao microfone, na velocidade que quisesse, po-
dendo repetir a mesma palavra se quisesse, evitando sentenças ou
outras seqüências significativas. A estas instruções, o experimentador
acrescentou: “De vez em quando, quando você estiver fazendo isso,
eu depositarei uma moeda na xícara. Quando o experimento termi-
minar, todas as moedas que obtiver serão suas. Tudo o que tem a
fazer é pronunciar palavras”.
Depois de alguma hesitação as palavras começaram a aparecer:
F
microfone, árvore, grama, mesa, jantar, papel de parede... nomes
de objetos na sala ou fora dela, e palavras de referência mais pessoal.
ia D
Uma das palavras, jloresy é tomada ao acaso pelo experimentador
como a ocasião para dar a moeda. Imediatamente é repetida, e no
Tr t P
vamente reforçada, até cinco moedas terem sido distribuídas em rápida
sucessão. A resposta do menino é condicionada; pode então ser ten
tado o controle da freqüência. De agora em diante, jlores será refor
er
25
“encadeamento supersticioso”. Imediatamente depois de receber uma
moeda, essas palavras eram previsíveis mas, quando se aproximava o
momento do próximo reforçamento, as mesmas palavras sempre apa
reciam na ordem: navio, mar, bonito, vermelho, flores. Parece que
temos aqui um outro caso de reforçamento não-contingente, desde
que só a última resposta na cadeia era exigida para obter a recom
pensa.
Mas, há mais do que isso. O menino, neste experimento, apre
sentou uma excelente “discriminação de tempo”. Raramente respon
F
dia, depois do reforçamento, em menos de dez segundos, e raramente
ultrapassava mais do que dois ou três segundos. E, no entanto,
ia D
ele não tinha nenhuma idéia de que o experimento envolvia tempo!
Ele “pensava” que tinha de aprender uma série de respostas e, quan
Tr t P
do o experimento terminou, desculpou-se por não ter sido bem suce
dido, dizendo: “Sinto muito, mas eu não pude dizer todas as pala
vras que você queria que eu dissesse”. Tais resultados colocam ques
er
26
10. Extinção e reforço negativo
F
do chocolate, e se você tivesse agora de extinguir a resposta tão rá
ia D
pido quanto possível, você não sugeriria uma maneira de encurtar o
processo, como um leve choque ou um tapinha na mão? Não seria
Tr t P
isso psicologicamente aconselhável? Não foi dito, na página 17 deste
livro, que o comportamento da criança ficaria enfraquecido se a cada
resposta à barra um choque fosse aplicado? E não foram os refor-
er
27
rante, como o pressionar a baira, é diminuir a sua freqüência de ocor
rência. Isto é verdade se o estímulo for aplicado durante o reforça-
mento positivo regular, durante o reforçamento positivo intermitente,
durante a extinção ou antes que tenha ocorrido qualquer condiciona
mento de operante. Além disso, dentro de certos limites, quanto mais
forte for a punição, maior será o efeito sobre a freqüência operante.
Em segundo lugar, se o animal punido for deixado na mesma
situação de punição por um período de tempo suficientemente longo
em qualquer uma daquelas condições, mas sem o choque ou outro
F
agente punitivo, recobrar-se-á dos efeitos. A recuperação será apa
rentemente mais rápida se a resposta punida continuar a receber re
ia D
forço positivo, quer regular quer intermitente, do que se estiver sob
extinção ou em uma situação aparentemente “neutra”. Em um estu
Tr t P
do com animais, em que ratos brancos foram punidos com choque
durante os primeiros dez minutos de extinção da resposta de pressio
nar a barra, o efeito da punição desapareceu quase que inteiramente
er
28
antes que o choque fosse aplicado. Se ainda estiver em vigor o refor
çamento positivo intermitente, o animal volta à freqüência anterior;
se as condições de extinção ainda estiverem presentes, retoma mais
uma vez o responder não reforçado. A punição poderá ter adiado o
responder, mas não terá alterado permanentemente a freqüência ope
rante, nem acelerado o processo de extinção operante.
Só se deve esperar este efeito transitório da punição se os estí
mulos punitivos não forem mais aplicados e apenas se o sujeito per
manecer na situação punitiva por um período de tempo suficiente
mente longo — isto é, até que o efeito dos estímulos condicionados
F
emocionais tenham tido oportunidade de se extinguir. Se, entretanto,
o animal, depois de ter sido punido, tiver oportunidade de escapar
ia D
para um ambiente diferente, no qual não receba mais punição e no
Tr t P
qual todas as suas necessidades forem satisfeitas, então o efeito da
punição pode parecer não ser transitório. O resultado da punição
será então a esquiva, tópico sobre o qual versará a seção 16.
er
l
11. Generalização
P
29
derá ter ocorrido em tudo isso uma pequena quantidade de condicio
namento operante, e o macaco poderá, num teste futuro, alcançar mais
rapidamente o objetivo. Mas o aspecto marcante da solução que deu
ao problema é o restabelecimento de dois atos que tinham sido pri
meiramente condicionados na presença de estimulação semelhante.
Estes restabelecimentos de respostas previamente condicionadas
foram tratados por Thorndike, alguns anos atrás, como exemplos de
“respostas por analogia”, uma lei básica do comportamento. Enun
ciava a lei simplesmente: “A qualquer situação nova o homem res
F
ponde como o faria a uma situação semelhante, ou a um elemento
semelhante dela”. Pavlov, pensando exclusivamente no comportamen
ia D
to reflexo, e mais em cachorros do que em seres humanos, chegou
independentemente a uma lei similar, que denominava generalização.
Tr t P
Hoje usamos o termo Pavlov e não o de Thorndike, mas o aplicamos
tanto a respondentes como a operantes e reconhecemos, mais do que
qualquer um desses pesquisadores, sua importância teórica.
er
30
zar. Tons, por exemplo, generalizarão ao longo da escala de freqüên
cia de vibrações sonoras (tonalidade), de uma escala de energia
(altura) e possivelmente de outras escalas. Um contínuo comparável
existe na visão, no tato e nos outros sentidos.
Na vida diária, exemplos de generalização são tão comuns que
passam despercebidos. São talvez mais óbvios nas crianças, nas quais
às vezes são divertidos. Os pais sorriem quando a criança diz “au-au”
à vista de um cavalo, de uma vaca, ou de qualquer outro quadrúpe
de; ou podem rir quando ouvirem uma criança dizer que a gasosa
F
“tem um gosto de quando o meu pé está dormindo”. Podem deixar
de perceber que o mesmo princípio está envolvido quando as respos
ia D
tas são muito mais comuns e menos dramáticas. Podem não ver que
a “galinha” de uma criança diante de uma codorna é, essencialmente,
Tr t P
o mesmo que o “passarinho” de outra. O fato é este: uma criança
ou um adulto, que foram condicionados a responder de uma certa
maneira a uma dada situação, responderão ainda da mesma maneira
er
31
(
nhnm dos lugares produzirá efeito algum e se poderá então dizer que
a “generalização da extinção” já está completa.
12. Discriminação
F
crita, não iria uma pessoa passar a vida toda respondendo da mesma
ia D
maneira a todos os estímulos visuais, e de outra a todos os estímulos
auditivos, e assim por diante? Não iriam todos os estímulos visuais
Tr t P
generalizar-se até certo ponto uns com os outros? E isto não seria
igualmente verdade para todos os outros sentidos?
Sabemos, é claro, que isto não acontece. A pergunta é tola. No
er
por que os criadores de cães são capazes de ver muito mais diferen
ças do que nós podemos?
eX
32
nação da sala, no fundo visual da barra e da vasilha, ou na aparência
da própria barra não perturbariam apreciavelmente o seu comporta
mento. Isto é, haveria uma considerável generalização de estímulos.
Mas, se o pressionar a barra fosse reforçado somente com grande
iluminação, somente quando o fundo visual fosse de um certo padrão,
ou somente quando a barra fosse de um certo tamanho, cor ou lumi
nosidade ter-se-ia então formado uma discriminação: a resposta ter-
-se-ia extinguido em todas as situações, exceto num conjunto muito
restrito de condições de estímulos.
O caso respondente é similar. O cão, no laboratório de Pavlov,
F
condicionado a salivar na presença de um som de 1.000 ciclos, sali
ia D
vará também a sons de outras freqüências, devido à generalização.
Mas se estes outros sons forem apresentados repetidamente, sem se
Tr t P
rem acompanhados de alimento, e se o reforço continuar acompa
nhando o som de 1.000 ciclos, chegará o momento em que não mais
eliciarão a salivação, embora o som de 1.000 ciclos continue a eliciá-la.
Isto é um relato super-simplificado do processo de discriminação,
er
l
e objeções já devem ter ocorrido ao leitor. Por exemplo, e a genera
lização da extinção mencionada na última seção? No caso do cão de
P
33
consigo uma história complicada da função discriminativa. Não é
sempre que se pode começar do início e romper uma generalização.
Os estímulos discriminativos da vida diária, em geral, já se adianta
ram aos nossos procedimentos experimentais. Alguma melhoria pode
ser possível; poder-se-á talvez provocar um ligeiro aumento na per
centagem das respostas que serão reforçadas. Raramente se tem a
possibilidade de limitar suficientemente a amplitude dos valores do
estímulo que produzirão uma dada resposta.
Pode-se, naturalmente, testar ainda a capacidade final do sujeito
em discriminar. Pode-se determinar, por exemplo, qual a menor dife
F
rença que pode existir entre dois estímulos antes que a probabilidade
ia D
da resposta correta seja menor que 50 por cento. Esta é, há muitos
anos, a preocupação de um ramo da psicologia denominado psicofí-
Tr t P
sica, que tem como sua principal esfera de atividades o estudo da
sensitividade a diferenças entre estímulos no ser humano adulto. Oca
sionalmente tem preocupado também aqueles que estudam o compor
tamento de animais e de crianças — às vezes com resultados sur
er
l
preendentes. Em um experimento hoje famoso, Pavlov treinou um
cão a discriminar visualmente entre um círculo e uma elipse. Passo
P
34
Há muito mais coisas que poderiam ser aqui incluídas a respeito
da discriminação. Livros inteiros foram escritos sobre este tópico, em
geral com o título de “sensação” ou “percepção”. De um ponto de
vista científico, este tópico está provavelmente mais adiantado do que
qualquer outro tópico em psicologia. No momento, contudo, o nosso
principal objetivo é compreender a “aprendizagem”, e o leitor pode
ver agora que a discriminação desempenha um papel bastante impor
tante nesta história. Milhares, talvez centenas de milhares de discri
minações devem ser feitas por cada um de nós para enfrentar as exi
gências do mundo exterior. O comportamento operante, para o qual,
F
no início, não se pode encontrar um estímulo eliciador, mais tarde
ia D
passa a ser quase que completamente controlado pelos estímulos. E
isto se verifica apenas porque se dão reforços na presença de um es
Tr t P
tímulo e se retiram reforços na presença de outro.
Talvez o leitor lembre que, na seção 3, sobre Condicionamento
Respondente, e outra vez na seção 4, sobre Condicionamento Operan
te, foi apresentado um diagrama simples, com o fim de tornar esses
er
l
princípios mais claros. Vejamos agora que espécie de quadro se po
deria usar para representar a discriminação. O leitor já sabe anteci
P
35
çar um som e extinguir outros, da maneira já descrita. O diagrama
que pode indicar esta outra etapa terá a seguinte aparência:
sA
F
plo, o som de 1.000 ciclos) que foi selecionado entre os outros sons
para ser reforçado. SA (lê-se esse-delta) representa os sons que não
ia D
são seguidos de alimentos e que perdem, portanto, as conexões com
a resposta.
Tr t P
Do mesmo modo, pode-se representar uma discriminação ope-
rante da seguinte maneira:
er
sA
l
so-------------------— -----r--------
sA
P
36
presença de outro, mas também pelo padrão diferente de freqüência
de resposta sob duas (ou mais) condições de estímulo. O estímulo
A, por exemplo, pode ser apresentado sob um esquema de reforço de
intervalo fixo; o estímulo B pode ser apresentado sob razão fixa; e o
estímulo C pode ser apresentado sob razão variável. Depois de algum
tempo, o organismo responderá, em cada condição diferente de estí
mulo, com o padrão de respostas apropriado ao determinado esque
ma de reforço presente naquele momento.
F
13. Diferenciação (Modelagem)
ia D
Ao tratar dos princípios do condicionamento operante e respon
Tr t P
dente, da extinção e da discriminação, discutimos, em certo sentido,
diversas espécies de aprendizagem. A extinção, quando considerada
em si mesma, poderia parecer mais uma questão de desaprender, mas
r
pusemos a explorar já foi coberta. Mas também que ainda não o ex
ploramos todo. A seção que agora iniciamos aumentará considera
velmente nossa habilidade de lidar com os exemplos que ainda faltam
e as seções que seguem a aumentarão ainda mais.
A palavra diferenciação não é muito boa para nosso presente
propósito, pois é freqüentemente usada como se significasse discrimi
nação. Habilidade talvez fosse uma palavra melhor, se não incluísse
coisas demais, abrangendo tanto a diferenciação como a discrimina
ção. Modelagem do comportamento é o termo (o termo mais ade
quado para isto seria mudança) usado mais comumente, mas ele tam
bém encerra problemas, quando às vezes é usado para significar uma
mudança no controle de estímulo de alguma resposta. Assim, vamos
preferir o termo diferenciação e tentar fazer com que o seu sentido
fique tão claro que não seja confundido com nenhuma outra coisa.
37
Comecemos outra vez com um exemplo. Imagine-se um labora
tório no qual a principal peça de equipamento seja uma destas má
quinas de parque de diversões, cujo funcionamento consiste em puxar
e soltar a mola que impulsiona uma bolinha de aço, que vai sendo
desviada no seu trajeto sobre um plano inclinado por uma série de
pinos, até que emboque em uma das diversas cavidades que indicam
a contagem obtida. Este aparelho, entretanto, é um aparelho especial.
Um biombo oculta do operador o curso da bola e o impede de ver
o quanto puxa a mola antes de soltá-la. Outro anteparo o impede
de ver dois “quimó;*rafos” nos quais são registradas (1) a freqüên
F
cia com que puxa a mola e (2) a distância de cada puxão. Nem
ia D
pode ver a escala de 15 divisões que fica paralela ao cabo da mola e
que permite outras tantas 15 conexões elétricas, que controlam o apa
Tr t P
recimento de uma luz vermelha através de uma janela na extremidade
do aparelho. (Cada intervalo dessa escala está separado do seguinte
por 2,8 milímetros e pode ser disposto de modo a que um puxão na
r
mola até um ponto entre qualquer par das divisões da escala — por
l
Pe
que ele verá uma luz vermelha piscar na pequena janela sempre que
sua resposta for correta.
A primeira tarefa do sujeito, depois de receber instruções, será
a de puxar a mola durante 5 minutos. Ser-lhe-á dito que use para
puxar a mola uma força e uma freqüência que lhe pareçam naturais
e confortáveis. Cumprindo estas instruções responderá, por exemplo,
com uma freqüência de vinte e dois puxões por minuto, isto é, pouco
mais de uma vez cada três segundos. A distância média de cada
puxão (nossa medida da força da sua resposta) será, aproximadamen
te, de 32 milímetros, mas alguns puxões serão maiores e outros me
nores. Em outras palavras, haverá um certo grau de variabilidade
na resposta, mesmo trabalhando com uma freqüência e uma força
ótimas.
38
Quando este nível tiver sido determinado, diremos ao sujeito que
a luz agora passará a funcionar e disporemos os interruptores de
modo que só puxões que levem a posições entre 2 e 5 da escala pro
duzam o aparecimento da luz vermelha. Isto lhe dá uma amplitude
de 8,4 milímetros, dentro da qual as respostas serão corretas. Deixa
remos que o sujeito trabalhe até que tenha assegurado vinte reforços,
o que conseguirá facilmente em trinta e um puxões. Então, sem que
tenha conhecimento, mudamos a disposição do interruptor de 2-5 para
10-13. A amplitude é exatamente a mesma que antes, mas colocada
F
mais acima ao longo da escala. Exigirá cerca de 179 puxões, mais
de cinco vezes do que na primeira vez, para obter os vinte reforços.
ia D
Assim, parece que o domínio da primeira disposição atrapalha o do
mínio da segunda. Entretanto, com repetidas mudanças de 2-5 para
Tr t P
10-13, o sujeito melhora a rapidez com que se reajusta. O não-re-
forço, depois de uma série de reforçamentos, passa a ser sinal para
tentar algo diferente.
r
tão bem nesta nova disposição quanto antes e assim, outra vez, mu
damos a exigência, agora para 4-6. Quando a luz tiver acendido vinte
vezes, mudamos outra vez para 5-6. O número de respostas exigidas
para obter vinte reforços na disposição 3-6 foi de 32, o número exi
gido em 4-6 foi 47, e o número em 5-6 foi 93. Isto é, o número de
respostas aumenta à medida que a amplitude do movimento se torna
cada vez mais restringida.
Finalmente, o sujeito coloca-se em novas sessões na disposição
2-5, sob diferentes esquemas de reforço: (1) regular, em que cada
uma das respostas será reforçada se satisfizer corretamente o requisito
da distância; e (2) intermitente, no qual (nosso caso) não obterá re
forços até que tenha emitido 10 respostas corretas. Depois de cada
sessão, suspende-se completamente o reforçamento e se conta o nú
mero de respostas dadas antes que o sujeito mude para um novo
39
nível de força. Resultado: o sujeito muda mais facilmente depois de
um período de reforçamento regular, como seria de se esperar, do
que depois de um período de reforçamento intermitente — na reali
dade, com uma facilidade quatro vezes maior.
O que foi narrado é apenas uma pequena parte de um experi
mento efetivamente conduzido com quatorze sujeitos e vários outros
procedimentos adicionais, mas a amostra já é suficiente para iniciar
mos nossa discussão. Alguns dos principais aspectos da diferencia
ção já podem ser nitidamente percebidos. Há, por exemplo, uma
F
variabilidade inicial da resposta, sem a qual não poderia ocorrer ne
nhuma diferenciação. Isto ficou patente nos cinco minutos prelimina
ia D
res de puxões “naturais”, mas ocorreu também no começo da sessão
de teste do sujeito na disposição do interruptor 2-5. A variabilidade
Tr t P
apareceu principalmente na distância em que a mola era puxada e
ocorreu também em relação à freqüência, e poderia ter ocorrido em
relação à duração de cada puxão se isto tivesse sido medido. Pode
er
40
Em terceiro lugar, quando o experimentador reduz a amplitude
das respostas bem sucedidas de uma faixa ampla para uma estreita,
através de pequenos passos de 2-6 para um de 5-6, ele ilustra a im
portância das aproximações sucessivas no processo de modelagem. Se
tivesse passado abruptamente de uma faixa ampla para uma estreita,
da “fácil” para a “difícil”, ele teria aumentado consideravelmente os
erros e o tempo necessários para os seus sujeitos resolverem seus
problemas. Reforçando seletivamente pequenos progressos na direção
correta, reduz as chances de insucesso e alcança seu objetivo sem
atraso desnecessário.
F
Através das aproximações e no nível mais simples, ratos de la
ia D
boratório podem ser ensinados a erguer grandes pesos, andar sobre
as patas traseiras, mostrar um tempo de reação curto, e assim por
Tr t P
diante; crianças podem ser treinadas com maior eficiência a escrever,
falar, e a desempenhar muitas outras funções básicas, até mesmo a
exercer “autocontrole”; e peritos em cada campo de arte e de habili
er
41
O exemplo experimental é um dos muitos que poderiam ter sido
escolhidos. Há abundantes estudos na literatura psicológica sobre
arremessos de bola e de dardos, traçado de linhas, ao lado de outros
estudos de movimento em várias situações práticas. Muitos desses
casos são de diferenciação pura. Há também uma quantidade de ha
bilidades da vida diária que se baseiam no mesmo processo. O gol-
fista que impulsiona a bola com o seu taco, o cestobolista que arre
messa à cesta, o arqueiro, o jogador de malha, de boliche — são só
algumas de nossas atividades que podem ser aperfeiçoadas em situa
ções inalteradas de estímulos. Menos notórias, mas na verdade mais
F
importantes, são as diferenciações presentes no domínio de habilidades
ia D
universais tais como andar, falar, escrever, cantar e danças.
O processo básico, em todos estes casos, pode ser retratado,
Tr t P
embora de maneira não muito correta, assim:
r*
RD--------+ s
R*
er
42
Quando chegamos à idade adulta, cada um de nós adquiriu um
número enorme de respostas diferenciadas que podem ser dadas ou
não a um número ainda maior de sinais discriminativos. Além disso,
cada um de nós tem a habilidade de mudar suave e rapidamente de
uma resposta para outra diante de um campo de estímulos sempre
mutável. Observa-se isto de uma maneira bem viva quando se olha
os participantes de esportes como box, tênis ou futebol, nos quais
movimentos com a rapidez de um raio são necessários para acompa
nhar as variações de estímulos produzidos pelos movimentos do opo
F
nente. Mas se pode observar a mesma coisa, se se atentar para isso,
em praticamente todas as esferas da atividade humana, em interiores
ia D
ou ao ar livre, verbais ou não-verbais, no entretenimento ou no tra
balho. O músico que acompanha a partitura, o telegrafista que copia
Tr t P
o código Morse, a estenógrafa que toma um ditado ou datilografa
os símbolos abreviados que escreveu, o operário na linha de monta
gem — nestes exemplos, e em tantos outros, pode ser visto o pro
er
cesso.
l
Nenhuma disposição de linhas e letras pode aspirar a represen
tar o rápido intercâmbio de estímulo e resposta que ocorre nos casos
P
ra
SD---------------------------- R O ------- * 5
14. Encadeamento
43
“aprendizagem”, ele não teria dito nada sobre condicionamento, ex
tinção, generalização, discriminação, diferenciação ou reforçamento.
Pavlov, que nos deu todos estes termos, estava naquela época exami
nando a atividade digestiva de cães, e ainda faltavam dez anos para
que ganhasse, por estes trabalhos, o Prêmio Nobel. Thorndike só
tinha vinte anos de idade, e pelo menos ainda dois tinham de se pas
sar antes que se engajasse nos estudos com a gaiola-problema que
levariam à sua famosa Lei do Efeito.
Em lugar destes tópicos e desenvolvimento ter-se-ia ouvido o
professor de psicologia discorrer muito sobre a “associação de idéias”
F
e sobre as “leis” que governam aquelas associações, particularmente
ia D
na forma descrita pelos eminentes filósofos ingleses dos séculos XVIII
e XIX. Poder-se-ia também ter ouvido o relato de algum longo e
Tr t P
trabalhoso experimento alemão sobre a “memória” e o “esquecimen
to” — experimentos em que os sujeitos tinham de memorizar séries
de “sílabas sem sentido” (mib, gop, ruz, ved, etc.) em condições
r
44
damos, entretanto, que Watson estava essencialmente certo ao tentar
explicar tais formações de hábitos referindo-se a coisas mais funda
mentais. E vemos, também, que estas coisas fundamentais são dife
renciação, discriminação e generalização, que dependem, por sua vez,
do condicionamento e da extinção.
Formulamos a noção de encadeamento, hoje, enunciando sim
plesmente que uma resposta pode produzir o estímulo para a seguinte.
E reconhecemos, talvez mais do que antes, que é excepcional o caso
em que as respostas não ocorrem em cadeias. Ê raro que uma única
F
resposta ou conexão estímulo-resposta não conduza a outra ou não
se origine de uma anterior.
ia D
O enunciado essencial do que ocorre em um encadeamento pode
ser suficientemente bem delineado dobrando o diagrama discutido na
Tr t P
última seção.
sA gA sA rA
r
sp-------------------- rd—►sD-------------------- R° —
l
Pe
$A s A. RA
minativo para outra resposta diferenciada que conduz, por sua vez,
ao reforço.
Tomemos como exemplo de encadeamento, não a aprendizagem
de um labirinto ou de uma série de sílabas sem sentido, mas o com
portamento de um rato branco chamado Plínio, da Universidade de
Minnesota! * Plínio nada fez que um coati, um macaco ou uma crian
ça não pudessem fazer melhor, mas o fato de que era um rato, não
tão complicado ou diversificado em suas maneiras como estes outros,
ajudará a esclarecer o que é essencial no processo de encadeamento.
O que Plínio fazia resumia-se nisto. Primeiro, puxava uma cor-
dinha que pendia do teto de sua gaiola. O puxar fazia com que uma
45
bolinha de vidro, colocada numa calha acima, caísse na gaiola. Quan
do a bolinha caía no chão, Plínio apanhava-a com as patas diantei
ras e a carregava pela gaiola até um pequeno tubo que se projetava
verticalmente a cerca de 2,5 cm acima do chão da gaiola. Levantava
então a bolinha até a borda do tubo e deixava-a cair dentro dele, o
que fazia com que uma pelota de alimento fosse automaticamente des
carregada num recipiente acessível. Plínio então se aproximava do
recipiente, apanhava a pelota, comia-a e voltava outra vez a repetir a
seqüência de atos. Desta maneira, Plínio ganhava a vida, dia após dia.
F
Aqui há, pois, uma cadeia de operantes, cada um induzido pelo
seu próprio sinal específico. (Vê-se com menos freqüência respon-
ia D
dentes encadeados, razão pela qual não serão tratados aqui.) Os es
tímulos visuais ou táteis, provindos da cordinha e circunvizinhanças,
Tr t P
provavelmente iniciam a resposta de puxá-la. Puxar o cordel coloca
em ação outros estímulos, evocados pelo aparecimento da bolinha.
Estes constituem o sinal para as respostas de apanhá-la e carregá-la,
r
46
podia distinguir onde acabava uma resposta e começava a outra.
Como acontece em muitas ações humanas, especialmente na lingua
gem, as unidades originais, bem distintas de início, agrupam-se em
unidades maiores, reduzindo perceptivelmente o número de elos na
cadeia.
Também é difícil especificar os sinais que estiveram em ação no
controle do comportamento de Plínio na cadeia final. É bastante
provável que o número tenha diminuído com a prática — e que Plínio
tenha, no fim, respondido a meros fragmentos dos compostos iniciais.
F
Outros experimentos indicam que esta redução pode ocorrer. Mas,
na ausência de verificações especiais, não temos meios de dizer que
ia D
elemento da situação estimuladora, em qualquer estágio da seqüên
cia, foi o que desencadeou a resposta.
Tr t P
O encadeamento de Plínio, ao contrário dos que ocorrem na
maioria dos estudos humanos, requereu um longo treino de diferen
ciação para vários elos. As respostas empregadas em carregar, levan
er
47
Através dos anos, muitas questões foram propostas sobre a apren
dizagem serial. A maioria delas foram questões acerca do domínio
de séries de sílabas sem sentido. Perguntou-se, por exemplo, como a
velocidade dessa aprendizagem se relaciona com o número de itens
da lista que deve ser aprendida. Ou sobre o tipo de itens da lista —
por exemplo, o seu grau de semelhança com palavras reais ou partes
de palavras. Ou ao lugar dos itens na lista, isto é,'se uma parte da
lista é aprendida mais depressa do que outra. Ou ao domínio anterior
de outras listas, tendo o mesmo conteúdo ou conteúdo diferente. Estes
são alguns dos problemas formulados. Cada um deles foi submetido a
F
muita investigação, discussão e teorização. Mas só muito recentemen
ia D
te a sugestão de John Watson foi seriamente seguida e se fez a ten
tativa de relacioná-los com os princípios básicos de condicionamento,
Tr t P
extinção, discriminação, etc. Estas tentativas foram, no geral, bastante
fecundas e pode valer a pena examinar alguns exemplos.
Tomemos o assunto do número de itens da lista que deve ser
er
ser alcançado! Parece, entretanto, que o tempo que tem de ser gasto
com cada sílaba aumenta apreciavelmente à medida que o número de
eX
48
plementa de algum modo as sílabas, fazendo com que wof-pes vire
algo como wolf-pest.
A generalização pode também desempenhar um papel na explica
ção das dificuldades que temos em dominar uma longa série de núme
ros. Só se dispõe de 10 algarismos, de 0 a 9, para construir tais
séries e, se não fosse pelos agrupamentos comuns, como 1492, 5280,
31416, e 1776, bem como vários outros mais pessoais (números de
telefone, de chapas de automóvel, etc.), teríamos muito mais dificul
dades com eles do que com as sílabas sem sentido. O agrupar pode
auxiliar por algum tempo, mas com o tempo esgotam-se as diferenças
F
entre os grupos. Finalmente, chega uma hora em que nenhurii acrés
ia D
cimo pode ser feito sem que haja uma perda correspondente. Até
chegarmos àquele diretor de faculdade, que era também ictiólogo, e
Tr t P
se queixava de que cada vez que memorizava o nome de um aluno
esquecia o nome de um peixe!
Pesquisas com animais contam uma história parecida sobre a
er
49
há mudanças externas que digam quando virar à direita em vez de à
esquerda, e há tão pouca diferença nas maneiras de responder na
primeira e na segunda volta que o animal não pode identificar facil
mente sinais vindos de seu próprio comportamento, o que poderia
acontecer se se lhe permitisse emitir quatro respostas distintas em
cada volta pelo ponto de escolha. É uma discriminação tão delicada
que poucos ratos conseguem desenvolver com êxito a seqüência es-
querda-esquerda-direita-direita.
O que foi descrito é apenas uma introdução ao problema do en
cadeamento. Um relato mais amplo teria de incluir uma exposição
F
dos famosos “experimentos de associação”, algumas vezes usados na
ia D
detecção de mentiras e na psicoterapia, e nos quais se pede ao sujeito,
que responda uma palavra com outra tão depressa quanto puder.
Tr t P
Ter-se-ia de tratar com a questão dos encadeamentos ou elos de ca
deias que não podem ser observados, que são encobertos, e que figu
ram proeminentemente na análise do “pensamento”, do “significado”
e da “percepção”. Abrangeria a discussão de dúzias de conceitos e
r
l
resultados de experimentos, e incluiria muitos pontos altamente dis
Pe
50
choque elétrico e outras formas de estimulação intensa têm, desde o
início, a propriedade de reprimir o comportamento (ou de reforçar o
comportamento que as remove). De todos estes se diz que são re-
forçadores primários.
De outro lado, é bastante claro que estes estímulos constituem
apenas uma pequena parte do conjunto das coisas que reforçam. De
fato, só muito raramente observam-se condicionamentos, especialmente
ao nível humano, em que bebida ou choque elétrico desempenham
algum papel. Com muito mais freqüência, aparentemente, as respos
tas são reforçadas ou enfraquecidas pela aprovação ou desaprovação
F
de outras pessoas, por promessas ou ameaças, por “Certo!” ou “Erra
ia D
do!”. E estes são eventos que devem ter adquirido o seu poder re
forçador. Nós os chamamos de reforços secundários ou, algumas
Tr t P
vezes, reforços condicionados.
O modo pelo qual os reforços secundários adquirem seu poder
foi sugerido por Pavlov nos primeiros anos deste século. Observou
r
51
diferenças entre as espécies, por que não começar com uma amostra
do comportamento dos chimpanzés?
Nosso sujeito é um macho de cerca de seis anos. Seu nome é
Moos, e vive em uma pequena colônia de macacos em uma estação
de pesquisas com antropóides, onde já há mais de dois anos tem par
ticipado de experimentos psicológicos. No experimento a que nos
referimos, há outros cinco animais, todos mais jovens e menos tra-
quejados. Moos e os outros já passaram por vários estágios de trei
namento. Em primeiro lugar, Moos aprendeu a inserir fichas na
fresta de uma destas máquinas de vender coisas que há nos Estados
F
Unidos. As fichas eram brancas e a inserção de uma ficha seguia-se
ia D
imediatamente ao aparecimento de um bago de uva no recipiente da
máquina de vender. Por causa de sua história anterior de sujeito ex
Tr t P
perimental, Moos aprendeu isso facilmente — bastou que o experi-
mentador demonstrasse uma vez o processo. Logo depois, Moss apa
nhou uma ficha do chão e, meio sem jeito, inseriu-a na fresta. Mais
algumas tentativas e sua habilidade aumentou consideravelmente. Isto
er
l
é, sua resposta diferenciou-se na direção de um movimento rápido,
suave e sem esforço para obtenção da recompensa. Em segundo lur
P
duas espécies de fichas em pares sobre uma bandeja que ele podia al
cançar de dentro de sua jaula. Se apanhava uma ficha branca (SD)
para usar na máquina de vender, obtinha uma uva; mas se) escolhesse
uma amarela (SA) e as colocava na fresta, não aparecia uva alguma.
Moos resolveu o problema em quatro sessões de 20 escolhas cada
uma, durante as quais fez um total de 10 erros, isto é, 10 respostas
em SA.
Por esta altura, uma nova peça de equipamento foi colocada na
jaula de Moos: uma máquina de trabalho. Suas características prin
cipais eram (1) uma barra e (2) um reservatório de fichas. O mover
um dos extremos da barra para cima, descrevendo um arco de 90
graus, fazia com que as fichas viessem a ficar ao alcance do opera
dor. Com a máquina em posição e com Moos atento, o experimentador
52
coloca uma ficha branca conspicuamcnte no reservatório e afasta-se.
O chimpanzé aproxima-se da máquina e começa a sacudi-la e agitá-la
repetida e vigorosamente, até que o experimentador o interrompe por
um breve período. Depois da pausa, Moos volta à máquina, desta
vez empurrando e puxando a barra. Não se passa muito tempo antes
que consiga descrever um arco de 90 graus, depois do que pega a
ficha do reservatório e usa-a imediatamente para conseguir uma uva
na máquina de vender. Em seguida, rapidamente retoma a resposta
de puxar a barra, obtendo fichas (e uvas) sem nenhuma dificuldade.
Dois aspectos deste experimento são especialmente dignos de nota.
F
Primeiro, formou-se, no segundo estágio do experimento, uma nítida
ia D
discriminação em que o SD era uma ficha branca e o Sá uma ficha
amarela. Na presença da primeira, a resposta manipuladora de Moos
Tr t P
produzia uma uva; na presença da segunda, não. Em segundo lugar,
a ficha branca tornou-se um reforçador secundário que, sozinho, foi
capaz de fortalecer a resposta de puxar a barra (mesmo quando,
como se demonstrou em um estágio posterior deste experimento, as
er
l
fichas não podiam ser trocadas por uvas senão depois de um certo
tempo). Assim, parece que um estímulo discriminativo para uma
P
duzidos também com ratos, gatos, cachorros e crianças, para não citar
com pintinhos, e o resultado foi sempre o mesmo. Ê hoje quase certo
que, se um estímulo deve tornar-se um reforçador condicionado, é
necessário que, antes, se torne um estímulo discriminativo. Não é
bastante dizer que um estímulo que esteve meramente presente em
todas as ocasiões em que a resposta foi reforçada tornar-se-á ele
próprio reforçador; o estímulo deve também ter estado ausente todas
as vezes em que a resposta não foi reforçada.
Talvez se possa ver agora, melhor do que antes, como se for
mam os encadeamentos. Na seção 14, observou-se que um encadea
mento não é mais do que uma fileira de relações SD ------------ R á,
mas não se fez nenhuma menção direta ao papel desempenhado pelo
reforçamento. Agora deve ter ficado claro que o sinal discriminativo
53
para uma resposta que obtém reforço primário torna-se reforçador
para a resposta que produz este sinal. Em outras palavras, cada SD
na cadeia torna-se um reforçador secundário para a resposta que o
produz.
Isto significa que, em certo sentido, os encadeamentos são esta
belecidos de trás para diante — que o primeiro elo é o último a ser
adicionado ao encadeamento. Recordemos o comportamento de Plí
nio, o rato. O primeiro elo da cadeia, puxar o cordel, não poderia
ter sido fortalecido antes que a bolinha de vidro tivesse se tornado
recompensadora; manipular a bolinha de vidro, carregá-la e levantá-
F
-la não poderia ter sido fortalecido a menos que o tubo tivesse, de
ia D
algum modo, se tornado também reforçador; deixar cair a bolinha
não poderia ter sido fortalecido sem o som do alimentador; e, final
Tr t P
mente, o comportamento de aproximar-se do recipiente de alimento
dependia da presença do reforçador primário, o alimento.
O reforçamento condicionado explica também o porquê de as
primeiras respostas da série tornarem-se fortes quando o reforçamen
er
l
to primário, final, fica tão distante no tempo. Ou, para dizê-lo de
outra maneira, explica porque o reforço primário pode ser “retarda
P
sá RA S* rA
S D ------------------ RD — p sro---------------- . R D — t SR
SA R* SA
54
estímulo discriminativo para a resposta diferenciada seguinte no en
cadeamento; e esta última conduz, finalmente, ao reforçador primá
rio. O primeiro SD seria, naturalmente, um Sr para qualquer elo adi
cional que se quisesse somar aos elos já ligados.
A influência tremenda do reforço condicionado sobre o compor
tamento humano pode ser observada mais conspicuamente no caso
daqueles estímulos ou dos compostos de estímulos que foram comu-
mente acompanhados, sem que houvesse distância muito grande do
reforço primário. Os mais interessantes, talvez, são os compostos
F
providos pelo comportamento de outra pessoa. Por exemplo, desde
o nascimento até a morte, o comportamento “atento” dos outros é
ia D
comumente a preliminar de reforçadores primários tais como alimen
to, bebida, e alívio do desconforto. A atenção torna-se, portanto, para
Tr t P
a maioria de nós, uma importante recompensa secundária, e pode ser
a reforçadora de toda uma série de atividades — desde o simples
“Olha, papai!” da primeira infância até o recital de achaques e de
er
55
xo). Os “sinais de afeição”, isto é, o próprio comportamento afetivo
também não são exatamente os mesmos de pessoa a pessoa.
Muitas pessoas em nossa sociedade são reforçadas pelo “ceder”
dos outros, por fazer as coisas “a seu modo”. Esta submissão ou
comportamento submisso é ainda mais difícil de identificar como
um padrão especial do que o padrão de estímulos da afeição ou da
aprovação, mas qualquer um pode lembrar-se de muitos exemplos. “De
pois do senhor!”, “Posso lhe ser útil, senhora?”, “Pode ficar com o
meu pirulito, Joãozinho.”, “Por aqui, senhor, tenho uma mesa reser
F
vada para o senhor!”, “Você pode ficar de centro-avante”, “Não foi
nada, não doeu muito”. Todas estas expressões derivam seu poder
ia D
reforçador do fato de elas, ou respostas como elas, terem algumas
vezes sinalizado recompensas mais concretas, ou a remoção de obs
Tr t P
táculos do caminho que leva a elas. Encorajam o desenvolvimento
de um estilo de vida dominante, de auto-afirmação, “masculino” .por
parte das pessoas a quem se dirige.
r
vores àqueles que lhes dão prioridade. Aquele que se afasta para o
outro passar pode, pelo menos, receber um agradecimento ou ser en
corajado a acompanhar; o caixeiro será elogiado pela sua delicadeza;
Pedrinho terá uma chance de dar uma volta no velocípede do João
eX
56
recompensas. Ê difícil superestimar o seu poder reforçador em nossa
sociedade. Mas existem outros, algo menos negociáveis, que são fá
ceis de destacar. Abrangem desde as estrelinhas douradas, boletins,
prêmios, bolsas de estudo, menções honrosas e diplomas, até as lin
das taças, medalhas, citações, condecorações e notícias nos jornais
sobre as nossas realizações. Não são, em geral, ocasiões para o re
forço primário imediato, mas nos levam pela estrada que a isso con
duz! Não são estas as únicas espécies de reforço “generalizado”*
que poderiam ser mencionadas aqui; nem foram tratadas tão porme
norizadamente quanto se poderia desejar. Se, contudo, ao fazer um
F
retrospecto desta seção, o leitor concordar que deu um passo adiante
na compreensão da conduta humana, isto terá sido bastante. Se pu
ia D
der ver que o reforço condicionado se baseia no estabelecimento de
uma discriminação, e que a ficha branca de Moos não dista muito
Tr t P
do valor de recompensa do “dinheiro, força, idade, títulos, hierarquia
e posições” (p. 6) nos negócios humanos, não há necessidade de
acrescentar mais nada.
r
l
Pe
57
John Watson adotou esta técnica em 1916 e, desde então, tem
sido muito popular nos laboratórios norte-americanos, tanto em pes
quisas com seres humanos como com animais. Só recentemente, en
tretanto, foi plenamente reconhecido o que ali ocorria. Watson acre
ditava, como Bechterev e Pavlov tinham acreditado antes dele, que o
procedimento era o mesmo que o empregado no condicionamento da
resposta salivar no cão. Pois não era a associação de um estímulo
neutro com um estímulo incondicionado? O estímulo neutro não pas
sava a eliciar a resposta. Segundo todas as aparências, a resposta é
Sim, mas havia algumas considerações perturbadoras.
F
Uma delas eram as comunicações que regularmente vinham de
ia D
vários laboratórios empenhados em investigações com animais de que
as respostas de flexão ao estímulo condicionado eram bem diferentes
Tr t P
das respostas ao estímulo incondicionado, o choque, exceto por um
breve período no início do condicionamento. Embora as respostas
fossem reconhecidamente semelhantes, as respostas ao choque eram
geralmente descritas.como parecidas com reflexos (respondentes), en
r
l
Pe
58
ças mais velhas; um choque forte erà mais eficiente que um choque
fraco. Os resultados referentes à intensidade do choque foram con
firmados nos laboratórios norteramericanos com sujeitos adultos, mas
alguns sujeitos, mesmo com choque intenso não se condicionaram de
maneira alguma. Comumente, os resultados com animais foram con
firmados. O responder difuso foi substituído por reações altamente
específicas à medida que o condicionamento prosseguia; a resposta
condicionada era evocada menos rapidamente do que a incondicio-
nada e o condicionamento era melhor sempre que era possível esqui
var o choque. Além disso, os resultados com seres humanos eram
F
notoriamente dependentes do tipo de instruções que recebiam e da
ia D
experiência anterior dos sujeitos em situações semelhantes.
A chave para a maioria desses problemas se encontra no que
Tr t P
pode ser chamado, meio esdruxulamente, “reforço condicionado ne
gativo”. O leitor estará lembrado da distinção, feita na seção 5, entre
reforçamento positivo e negativo. Os reforçadores positivos foram
r
59
à prova de luz. No teto de cada divisão há um alçapão que permite
colocar ou retirar o animal da câmara. Uma das paredes da divisão
branca é de vidro, o que permite ao experimentador observar o animal.
O procedimento no primeiro dia do experimento é simplesmente
colocar o animal na divisão branca, ligar uma corrente elétrica na
grade do chão, deixando que receba choque até que salte através da
cortina preta da portinhola para a divisão preta. Como se poderia
esperar, o rato resolve rapidamente este problema, em questão de
segundos. Daí por diante o experimentador, depois de ter dado ao
F
rato alguns minutos de descanso, experimenta outra vez. E outra vez,
até que se tenha acumulado 60 corridas da divisão branca para a
ia D
preta. A esta altura, ninguém vai discutir a afirmação de que o cho
que é um reforçador negativo — e que o correr para a divisão preta
Tr t P
foi reforçado pela remoção do choque. Ninguém duvida também que
o choque é um estímulo eliciador para a atividade “emocional”. E
pode-se também concluir que a divisão branca, no decorrer destas
r
60
outra chance de fugir. Isto é repetido sessenta vezes ou até que o
animal não abandone mais a divisão branca. Resultado: no fim do
dia, ele estará ainda atravessando a porta com apreciável velocidade
embora não tão rapidamente quanto a princípio. A divisão branca,
apesar de não mais apresentar choque, é ainda alguma coisa da qual
deve fugir. A sua “remoção” é recompensadora. Devido à associa
ção inicial entre a divisão branca e um reforço negativo, o choque,
ela tornou-se um reforçador negativo, ou melhor, um reforço nega
tivo condicionado.
F
Outros pontos deveriam ser destacados em relação a este expe
rimento. Um ponto é que se o animal fosse confinado na divisão
ia D
branca por um período muito longo, no segundo dia ele não tentaria
deixá-la, exceto para algumas explorações no terceiro dia. Ocorre
Tr t P
ria a extinção da resposta emocional ao estímulo divisão branca (ver
seção 10). Esta divisão teria perdido seu poder de reforço negativo
condicionado, de modo que sua remoção deixaria de ser recompensa
r
afastar-se.
Um segundo ponto é que, se fizer com que o rato dê mais de
sessenta corridas no terceiro dia, sua velocidade de correr terá dimi
eX
61
Um outro ponto ainda. Poderíamos ter condicionado o rato a
remover qualquer outra coisa que não a divisão branca. Alterando
ligeiramente o aparelho, poderíamos tê-lo condicionado a corrcr dc
uma divisão para outra e, assim, remover um determinado fator es
pecial do estímulo na situação, digamos desligar uma luz forte ou
uma cigarra. Na verdade, poderíamos ter demonstrado que qualquer
espécie de estimulação que não fosse negativa poderia passar a sê-lo
— até mesmo a estimulação oriunda dos próprios movimentos do
animal. Se um choquc fosse apresentado em intervalos de cinco se
gundos, a menos que o animal estivesse apoiado só sobre as patas
F
traseiras, poderíamos ter logo um animal que passaria a maior parte
ia D
do tempo com as patas dianteiras no ar, escapando assim de suas
outras maneiras de se comportar, todas as quais teriam eventual
Tr t P
mente sido punidas pelo choque.
Se recapitularmos agora o caso do condicionamento de retirada
do dedo, mão ou pé, ele aparece sob uma luz diferente. Parece
r
62
remoção de um som, uma luz, ou outra ameaça qualquer. De outro
lado, há o que se poderia chamar uma esquiva de uma esquiva, que
foi originariamente reforçada porque recebia aprovação social ou eli
minava a desaprovação. Quando um sujeito relata que se sente “en
vergonhado” ou “meio tolo” por tirar o dedo do elétrodo quando
vem o sinal do choque, isto sugere que no passado suas falhas em
“enfrentar” tal estimulação foi seguida por conseqüências piores ain
da; e que, efetivamente, o deixar de retirar o dedo (para esquivar)
deve-se a um contramovimento que esquiva isto! Uma explicação
como esta pelo menos não contraria a descoberta de que as crianças
F
anormais adquirem a retirada do dedo mais facilmente que as nor
ia D
mais; que as meninas mais rapidamente que os meninos; que as crian
ças menores mais facilmente que as mais velhas; que com choque
Tr t P
forte é mais fácil que com fraco, etc.
Já se deu alguma atenção antes (seção 15) ao papel do reforço
positivo condicionado na vida diária do homem, e sua importância
r
63
que já não são vistos. Nos arabescos e figurações do ciclista de circo
há muito pouco que lembre as esquivas desajeitadas (ou os tombos
e os arranhões!) do principiante. E para retomar um exemplo ante
rior, nada lembra no passo elástico do andarilho a longa série de
“quase cair” e equilibrar-se que foram os principais ingredientes de
sua “aprendizagem de andar”.
Um aspecto mais sério deste assunto pode ser,aqui rapidamente
mencionado para encerrar esta seção. Reforçadores negativos, primá
rios e condicionados, constituem a maior parte do que chamamos
“punição” (Seção 10). No caso do primário, há efetivamente “feri
F
mento” corporal, como quando uma criança é espancada, leva palma-'
ia D
das ou é fisicamente forçada à submissão. No caso do condiciona
mento, pode ser na forma de um insulto, caçoadas, ironias ou amea
Tr t P
ças, entre outras coisas. Em ambos os casos," contudo, uma resposta
emocional fica condicionada de maneira pavloviana e a situação torna-
-se negativamente reforçadora. A fuga da situação, ou de qualquer
resposta com ela relacionada, torna-se recompensadora.
r
l
Pe
64
aqueles cuja principal preocupação é com os desajustamentos huma
nos e com sua cura. Os problemas envolvidos não são simples. Nem
de longe tão simples como este apanhado do campo possa ter suge
rido. Mas hoje se pode ver, melhor do que nunca, que necessitarão,
para uma solução completa, de uma ampla compreensão dos princí
pios básicos aos quais o leitor foi introduzido neste trabalho.
17. Pós-escrito
F
Na seção 1, página 6, foram mencionados alguns exemplos de
ia D
aprendizagem, e algumas questões a respeito deles foram levantadas.
Não se ofereceu nenhuma definição do conceito, nem se prometeu
Tr t P
uma. Nem seria uma definição útil agora. Deu-se a entender, entre
tanto, que a “aprendizagem” passou a incluir grande parte do que se
entende hoje pelo nome de “psicologia” e foi prometido que um co
nhecimento dos: princípios gerais tratados nestas páginas permitiria ao
r
l
leitor analisar muitos casos de aprendizagem na vida diária, inclusive
Pe
os que lá foram citados. Assim sendo, seria bom que o leitor, agora,
relesse a primeira seção, perguntando-se se a promessa foi cumprida,
completamente ou em parte. Se o foi, melhor! Se não, e se o leitor
eX
tiver sido “aplicado”, então este trabalho não esteve à altura de seus
objetivos. Neste caso, o único resultado positivo que ainda pode res
tar é que tenha conseguido despertar o interesse na continuação dos
estudos neste campo, ou no da própria psicologia.
65
Apêndice: curvas acumuladas e registrador acumulado
F
termos de freqüência de ocorrência. Denominamos forte o ato que
ia D
ocorre freqüentemente e fraco aquele que ocorre raramente. Uma
criança condicionada a pressionar uma avalanca para obter pequenos
Tr t P
pedaços de doce aumentará rapidamente a freqüência das pressões
quando ocorrerem os primeiros reforçamentos da resposta. Com o
tempo, o doce perde sua atração e a freqüência diminui' gradualmen
te. A princípio, a resposta foi fortalecida e depois tornou-se fraca.
r
l
Pe
66
0 1 2 3 0 1 2 3
(minutos) (minutos)
Fig. 1 Fig. 2
F
Na figura 2 maior número de respostas são representadas. Este
ia D
gráfico mostra que cerca de 100 respostas foram emitadas em um pe
ríodo de três minutos, numa razão gradualmente decrescente. Pode-
Tr t P
-se considerar esta curva como um gráfico do consumo de cerca de
100 pedaços de doce por uma criança, durante um período de três
minutos. Uma curva como esta, que mostra um decréscimo da fre
r
0 1 2 3
(minutos)
Fig. 3
67
Seria muito útil ter um aparelho que, automaticamente, produ
zisse curvas de freqüência como estas, no próprio momento em que
as respostas são emitidas. Teríamos economizado o trabalho de
acumular respostas durante as sucessivas unidades de tempo (por
exemplo, cada minuto) e evitado elaborar curvas como as das figu
ras 1, 2 e 3, às vezes muito tempo depois de ter observado o com
portamento. Assim, se o sujeito do experimento (a menina, do exem
plo) construísse seu próprio registro gráfico à medida que se com
portasse, isto economizaria muito trabalho posterior e informaria em
F
cada momento, durante o experimento, exatamente o que estava ocor
rendo em termos da freqüência da resposta.
ia D
Esse aparelho existe! É o registrador acumulado, um dos ins
trumentos modernos mais úteis no estudo experimental do compor
Tr t P
tamento. Produz curvas como aquelas consideradas acima e -muitas
outras. Faz isso por simples adição (acumulação) de respostas e
tempo no registro gráfico (a curva). Exaiídnemos como isto ocorre.
r
68
superfície do papel.) As respostas, isoladamente, dariam uma linha
vertical; o tempo, isoladamente, uma horizontal.
Quando as respostas são apresentadas no decorrer do tempo, o
registrador acumulado faz curvas como as dos exemplos, ou combi
nações destas curvas. A fim de obter uma descrição pormenorizada
de como isto pode acontecer, suponhamos que já se tenha desenhado
na folha de registro uma linha para Respostas e uma linha para Mi
nutos, como na figura 4. Suponhamos também que se marquem pon
tos em cada linha a intervalos regulares, para mostrar o número de
respostas ou a quantidade de tempo que gastariam. Coloca-se agora
F
a pena do registrador no ponto zero, onde as duas linhas se encon
ia D
tram, e aciona-se o aparelho. Imagine que, com a passagem do tem
po, é possível, para alguns organismos, pressionarem uma alacanva,
Tr t P
obterem um reforço e, automaticamente, registrarem a resposta. Lem-
bre-se que cada resposta elevará a pena no papel na altura de um
pequeno degrau e que cada minuto de tempo será registrado como
uma curta distância horizontal da pena ao deslocar-se para a direita.
r
l
Pe
69
0 5 10 20 30 40 50
(minutos)
F
Fig. 4
ia D
recida com a que ocorre na figura 1. Segue-se um segmento em linha
reta, como o da figura 3, no qual as respostas aparecem numa fre
Tr t P
qüência constante. E finalmente, uma aceleração negativa, como a
da figura 2. /
Embora a curva da figura 4 tenha sido construída desse modo
r
70
Segundo, mesmo nos casos de degraus pequenos e velocidades
baixas, alguns organismos, como pombos, por exemplo, respondem
com alta freqüência e, se nada impedisse a pena, ela ultrapassaria a
parte superior do papel de registro. Por essa razão, os registradores
acumulados estão equipados com um mecanismo de reajuste que faz
a pena voltar automaticamente à linha de base quando alcança uma
determinada altura do papel de registro (quando um certo número de
respostas foi apresentado). O efeito é simüar ao apresentado no
fim do registro da figura 4. Curvas de respostas que se estendem no
tempo, mantendo alta freqüência, podem mostrar muitas voltas e as
F
censões. (Isto não significa, naturalmente, que se subtraem respostas
do número das já apresentadas; as curvas acumuladas, como o nome
ia D
sugere, acumulam respostas — somente adicionam. Se se tivesse no
papel de registro todo o espaço necessário, o registro continuaria até
Tr t P
o fim, sem qualquer necessidade para recomeçar da base.)
er
l
P
eX
71
(
LEITURAS SUGERIDAS
F
ao problema da aprendizagem, sugerem-se os seguintes livros, para serem lidos
nesta ordem:
ia D
HOLLAND, JAMES G., e B. F. SKINNER The analysis of Behavior. New
York: McGraw-Hill, 1961 (Trad, bras.: A Análise do Comportamento,
Tr t P
São Paulo, E.P.U., 5.a Reimp., 1974).
FERSTER, C. B. e MARY CAROL, PERROT, Behavior Principles, New York:
Appleton-Century-Crofts, 1968.
SKINNER, B. F., Science and Human Behavior. New York: Macmillan, 1953.
er
l
MILLENSON, J. R., Principles of Behavioral Analysis. New York: Macmillan,
1967.
P
73