Vous êtes sur la page 1sur 460

'

www.facebook.com/groups/livrosparadownload

www.slideshare.net/jsfernandes/documents

A p r e n d iz a g e m

T radutores: Andreia Schmidt (Programa de Ps-Graduao em Educao Especial - UFSCar) Deisy das Graas de Souza (Universidade Federal de So Carlos) Fernando Cesar Capovilla (Universidade de So Paulo) Julio Cesar Coelho de Rose (Universidade Federal de So Carlos) Maria de Jesus Dutra dos Reis (Universidade Federal de So Carlos) Aline Acetuno da Costa (Programa de Ps-Graduao em Educao Especial - UFSCar) t Ligia Maria de Castro Marcondes Machado (Universidade de So Paulo) t Alcides Gadotti (Universidade Federal do Par)

C357a

Catania, A. Charles Aprendizagem: comportamento, linguagem e cog nio / A. Charles Catania; trad. Deisy das Graas de Souza... [et al.]. 4.ed. - Porto Alegre : Artes Mdicas Sul, 1999. 1. Educao - Aprendizagem cognitiva. I. Ttulo. CDU 371.13:159.922

Catalogao na publicao: Mnica Ballejo Canto - CRB 10/1023 ISBN 85-7307-553-8

A. Charles Catania
U niversity o f M aryland B altim ore County

p r e n d iz a g e m :
4- Edio

Comportamento, Linguagem e Cognio

Coordenao geral e superviso tcnica da traduo:


D EISY D A S G R A A S D E SOUZA Universidade Federal de So Carlos.

ARVED
D I T O R A

PORTO ALEGRE, 1999

Obra originalmente publicada sob o ttulo Learning Prentice-Hall, Inc., 1998. Simon & Schuster / A Viacom Company ISBN 0-13-235250-8

Capa: Joaquim da Fonseca Preparao do original: Zita Souza, Cludia Bressan Superviso editorial: Leticia Bispo de Lima Editorao eletrnica: AGE - Assessoria Grfica e Editorial Ltda.

Reservados todos os direitos de publicao, em lngua portuguesa, ARTMED EDITORA S.A. Av. Jernimo de Ornelas, 670 - Santana 90040-340 Porto Alegre RS Fone (51) 3330-3444 Fax (51) 3330-2378 proibida a duplicao ou reproduo deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios (eletrnico, mecnico, gravao, fotocpia, distribuio na Web e outros), sem permisso expressa da Editora. SO PAULO Av. Rebouas, 1073 - Jardins 05401-150 So Paulo SP Fone (11) 3062-3757 Fax (11) 3062-2487 SAC 0800 703-3444 IMPRESSO NO BRASIL
PRINTED IN BRAZIL

P ara Connie, B ill e Ken.

Prefcio

A little learning is a dang'rous thing; Drink deep, or taste not... Alexander Pope

A aprendizagem uma questo central em Psicologia. Perguntar-se o que um organismo pode aprender o mesmo que perguntar-se o quanto seu comportamento depende de sua his tria de evoluo e o quanto depende do que ele experimentou durante sua vida. Os estudos so bre aprendizagem tm abrangido tanto os proce dimentos relativamente simples com animais quanto as complexidades da linguagem humana e da resoluo de problemas. A pesquisa nessas reas to diferente, e a literatura to extensa, que grande a tentao de restringirmos nossa ateno apenas aos tpicos da aprendizagem e do comportamento animal ou apenas aos tpi cos da aprendizagem e da memria humana. Mui tos textos de aprendizagem cederam a essa ten tao. Por sua vez, o estudo da aprendizagem tem-se especializado cada vez mais, a ponto de cada abordagem desenvolver sua prpria termi nologia e metodologia de pesquisa. Neste livro, parte do meu propsito consis tiu em articular essas literaturas e explorar algu mas das continuidades entre a aprendizagem hu mana e a aprendizagem de outros organismos. Os seres humanos so, sem dvida, nicos, mas eles compartilham uma herana evolutiva com as outras espcies. Ento, as propriedades da aprendizagem animal provavelmente so rele

vantes para a aprendizagem em humanos. Ain da que apenas mostremos que alguns tipos de aprendizagem humana no sejam redutveis a ti pos de aprendizagem que se sabe ocorrerem com outros organismos, teremos pelo menos come ado a definir o que peculiarmente humano. Aqui, so examinadas as principais reas na Psicologia da Aprendizagem, sob um ponto de vista consistentemente comportamental. No vou tentar descrever a natureza de uma orientao comportamental. Tal viso evoluiu consideravel mente, desde sua origem paroquial, e melhor tratada no contexto de temas psicolgicos espe cficos, alguns dos quais sero discutidos mais tarde. Saliento apenas que adotar uma posio comportamental no implica excluir aspectos do comportamento humano, como o pensar, o sen tir e o imaginar. Para os que gostam de pensar em termos de paradigmas cientficos e de mu danas de paradigma, este texto ilustra um para digma comportamental que emergiu entre os ana listas do comportamento em anos recentes; ten do a seleo como mecanismo central, ele en globa todos os fenmenos do comportamento. Assim, tpicos muitas vezes considerados do mbito exclusivo da Psicologia Cognitiva con tempornea sero tratados juntamente com ou tros mais tradicionalmente considerados como comportamentais. Em sua estrutura geral, este livro contm trs sees principais (II a IV), referenciadas por uma introduo (I) e uma concluso (V). A Parte II lida com o comportamento sem aprendizagem, tomando por base um contexto evolucionrio. A

Parte III (Captulos 5 a 13) focaliza a aprendiza gem sem palavras, cobrindo tpicos bsicos do comportamento e da aprendizagem em no-humanos. A Parte IV (Captulos 14 a 20) focaliza a aprendizagem com palavras, examinando a aprendizagem humana e a memria. Essas se es so claramente independentes em algumas partes, mas, na maioria das vezes, os conceitos desenvolvidos anteriormente constituem pr-re quisitos para o tratamento de temas mais com plexos nas sees subseqentes. A nova organi zao dos captulos cria a possibilidade de que se empregue os Captulos 1 a 13, acrescidos da concluso apresentada no Captulo 21, em um curso de 14 semanas, que compreende apenas os tpicos bsicos de aprendizagem animal. Fiz um grande esforo para incluir exemplos de comportamento humano ao discutir a relevn cia de estudos do comportamento animal; do mesmo modo, procurei mencionar os conceitos apropriados do comportamento animal ao dis cutir a aprendizagem humana e a memria. Uma diferena importante entre esta edio e a ltima que foram introduzidos, ao longo do texto, mui tos exemplos de importantes aplicaes de pro cessos bsicos ao comportamento humano. Eles mostram, com freqncia, como a anlise do comportamento pode contribuir significativa mente para a educao. Seria de surpreender se o tpico aprendizagem no ocasionasse tais im plicaes. As escolhas de exemplos particulares foram, at certo ponto, ditadas pela lgica do assunto em questo e pela disponibilidade de casos apropriados na literatura de pesquisa rele vante. Muitas vezes, os alunos no percebem o em prego de comportamento humano para ilustrar o significado de descobertas a partir da pesquisa animal. Em vrios semestres, tenho apresenta do, em verificaes de leitura, uma questo de mltipla escolha que pergunta quantos exemplos de comportamento humano so mencionados ao longo dos captulos, que correspondem ao atual Captulo 6. As quatro alternativas so: a) ne nhum, b) menos que 10, c) mais ou menos 20 e d) mais que 40. Havia mais de 50 exemplos de comportamento humano ao longo daqueles ca ptulos, na primeira e na segunda edies (e o nmero ainda maior nesta edio), mas a m

dia das respostas foi praticamente a) ou b); os alunos que contestavam o d) como resposta cor reta s vezes achavam instrutivo conferir o n mero de exemplos de comportamento humano. Informaes adicionais sobre as respostas dos alunos a questes do texto esto disponveis no Instructor s Test-Item File, que inclui uma va riedade de itens sob a forma de questes objeti vas e itens dissertativos para cada captulo. C pias do Test-Item File podem ser obtidas com o organizador. Um outro suplemento do texto con siste em uma srie de programas de computa dor, Behavior on a Disk (ISBN 0-922077-23-1), que inclui simulaes de modelagem e outros processos comportamentais, experimentos sobre memria e aprendizagem verbal e exerccios de reviso de terminologia (os programas esto dis ponveis em disquetes de 3,5 polegadas, em for mato MS-DOS para computadores IBM e com patveis, pela CMS Software, P.O. Box 5777, Santa Fe, NM 87502-5777, EUA). Como nas edies anteriores, esta quarta edi o de Aprendizagem inclui algumas notas eti molgicas no incio de cada captulo. Essas pe quenas histrias condensadas das palavras so lembretes importantes de que nossa linguagem muda facilmente. Consistncias terminolgicas so essenciais para abordagens tcnicas, mas a linguagem tambm deve progredir e se adaptar a novos achados e novas perspectivas. Temos que usar a linguagem do comportamento com cuida do, mas talvez houvesse menor risco de nos tor narmos rgidos a esse respeito, se conhecsse mos algo de suas origens. Esta edio, como a ltima, tambm inclui um glossrio, que resume a terminologia essen cial na rea e que pode constituir uma organiza o conveniente para estudo e reviso. A prepa rao de um glossrio fora o autor a atentar para contradies e ambigidades potenciais em con ceitos bsicos e tambm para o leitor pode ser vir a essa mesma funo. O glossrio inclui uma introduo com alguns comentrios sobre seu es copo e suas caractersticas especiais. Na seo de referncia, as entradas incluem as pginas em que elas so citadas no texto; elas foram selecio nadas como pontos de partida teis para explo rar a literatura sobre aprendizagem e tambm para documentar pontos especficos.

V III

P refcio

Para estudar a aprendizagem necessrio sa ber o que a aprendizagem. O Captulo 1 come a, portanto, com o problema da definio de aprendizagem (mas no o resolve). O Captulo 2 trata basicamente da organizao do livro e apre senta uma perspectiva dos tpicos examinados, em detalhes, nos Captulos 4 a 12, no contexto da histria deste campo de estudos. O Captulo 3 lida com a seleo, como um conceito central para o que se segue, e fornece informaes bsi cas sobre a evoluo. O Captulo 4 examina o reflexo e outras relaes decorrentes da apresen tao de estmulos aos organismos. Em outros textos, prtica comun introduzir o condiciona mento neste ponto, mas dentro da presente orga nizao, este tpico ser efetivamente adiado para mais tarde. Os Captulos 5 e 6. sobre reforo e controle aversivo, mostram como as conseqncias do responder podem afetar o comportamento. Es tes tpicos levantam a questo sobre classes de respostas e classes de estmulos como unidades comportamentais. Eles levam, portanto, ao con ceito de operante, no Captulo 7, e ao conceito de operante discriminado, nos Captulos 8 e 9. O Captulo 9 tambm considera as implicaes de unidades comportamentais de ordem superior ou de segunda ordem. Esses conceitos continuam sendo ilustrados nos Captulos 10 e 11, que exa minam como o comportamento complexo pode ser sintetizado no contexto de esquemas de reforo. O Captulo 12 retoma o condiciona mento e mostra como ele pode estar relacio nado aos processos discutidos em captulos anteriores. Ao abordar o tema da linguagem, os Captu los 14 e 15 tratam das complexidades do com portamento verbal humano. Algumas caracters ticas das abordagens comportamental e cogniti va so explicitamente comparadas no Captulo 16. que versa sobre Psicolingiistica. Estes trs captulos estabelecem o cenrio para o exame da aprendizagem verbal e da transferncia, no Captulo 17, e da memria, nos Captulos 18 e 19. Cognio e resoluo de problemas (prohlem-solving). que so o foco do Captulo 20, apresentam uma oportunidade para sntese, por que colocam juntos tpicos considerados sepa radamente em vrios pontos ao longo do texto.

O captulo final consiste em uma reviso e inte grao de questes centrais na Psicologia da Aprendizagem. Vrios destes tpicos foram revistos ou am pliados. Alguns deles so: nomeao como uma classe verbal; classes de comportamento de or dem superior; desenvolvimento de linguagem e o argumento da pobreza do estmulo; classes de equivalncia; discriminao do prprio compor tamento; processos autoclticos; comportamen to governado verbalmente e controle instrucional; a distino entre seleo natural e seleo artificial; a modelagem do comportamento ver bal; linguagem animal; memria distorcida e re primida: e metfora e outros fenmenos de lin guagem. A homogeneidade entre os captulos so bre aprendizagem no-humana e condicionamen to e os captulos sobre aprendizagem humana e memria tambm foi melhorada. Ao longo de sua histria, a Psicologia da Aprendizagem tem-se preocupado com teorias. Teorias particulares de aprendizagem foram de senvolvidas, elaboradas e, ento, substitudas por outras. Muitas permanecem conosco, tipicamente mais circunscritas em seu escopo do que quan do introduzidas. Seja qual for a posio atual dessas teorias, os achados empricos que susten taram sua proposio ainda requerem que se lide com eles. Por essa razo, o presente texto enfati za descobertas empricas em detrimento de teo rias de aprendizagem. Ele terico apenas, e principalmente, na medida em que adere a uma linguagem comportamental consistente e na me dida em que busca uma organizao sistemti ca, capaz de acomodar os vrios procedimentos e processos de aprendizagem. Embora a teoria no seja enfatizada, tentei incluir informao su ficiente a respeito de procedimentos experimen tais, terminologia e dados, para fornecer um pon to de partida efetivo ao aluno, ao instrutor ou ao leitor em geral que queira adotar teorias espec ficas. A nfase do livro no reside tanto na inter pretao de descobertas especficas, mas nas re laes entre os vrios fenmenos includos na Psicologia da Aprendizagem. Meu intento foi tornar o livro til no apenas para pessoas com inclinaes comportamentais. mas tambm para aquelas que decididamente no adotam uma po sio comportamental.

P refcio

IX

O contedo deste livro foi desenvolvido ao longo de um curso introdutrio de Psicologia da Aprendizagem, primeiro no University College o f Arts and Science da New York University e, a seguir, na University o f Maryland Baltimore County. Sou grato a meus alunos e colegas em ambos os campi e, especialmente, a Eliot H. Shimoff. Como meus professores e colegas, muitos outros colaboraram com comentrios, discusses e encorajamento. Como nas edies anteriores, cito apenas alguns deles, sobretudo porque ain da sou capaz de identificar contribuies parti culares de cada um: Abraham Amsel, Kenneth C. Catania, William J. Catania, Joseph Cautelli, Daniel Cerutti, Leonard Cook, Willard F. Day, Israel Goldiamond, Lewis R. Gollub, Ernest S. Graham, Stevan Harnad, Eliot Hearst, Ralph F. Hefferline, Philip N. Hineline, Per Holth, Koji Hori, Pauline Horne, Herbert M. Jenkins, Victor G. Laties, Kennon A. Lattal, Richard A. Littman, C. Fergus Lowe, Ernest L. Moerk, J. A. Nevin, Koichi Ono, Michael J. Owren, Robert R. Pro vine, Robert Remington, George S. Reynolds, Marc Richelle, Terje Sagvolden, B. F. Skinner, Deisy de Souza, William C. Stebbins, S. S. Ste vens, Mark Sundberg e Vicci Tucci. Em uma lista assim, omisses so inevitveis; felizmente, a contribuio de muitos outros profissinais re conhecida por sua incluso nas referncias. Gos

taria tambm de registrar meu apreo pela ajuda incalculvel de Madelon Kellough, Tem Harold e Mary Johnston, pelo encorajamento de Jack Burton e pela tramitao do livro ao longo das sucessivas etapas de publicao, conduzida por Ilene Kalish e Karen Trost. Gostaria tambm de agradecer aos seguintes revisores do manuscrito para esta quarta edio: Rebecca M. Chesire, da University ofH aw aii ; Robert H. I. Dale, da Butler University, Lewis R. Gollub, da University o f Maryland College Park\ e David K. Hogberg, do Albion College. Acima de tudo, e como nas edies anterio res, falta ainda um reconhecimento. Desta vez, infelizmente, eles j no esto conosco para re ceb-lo. Devo mais do que sou capaz de dizer ao Nat e ao Fred: W. N. Schoenfeld e Fred S. Kel ler. Seus cursos e seu Princpios de Psicologia introduziram-me anlise do comportamento e me comprometeram, irrevogavelmente, com a explorao de suas preocupaes. Espero que este livro seja suficientemente fiel aos seus en sinamentos e que os leitores que os conheceram e os que aprenderam com eles possam reconhe cer algo deles nestas pginas.

A. Charles Catania Columbia, Maryland

P refcio

Sumrio Reduzido

PARTE I In tro d u o ......................................................................................................................................................... ^ Captulo 1 Aprendizagem e Comportamento................................................................................................................... 21 Captulo 2 Uma Taxonomia do Comportamento............................................................................................................ 32 PARTE II Com portam ento Sem A prendizagem ........................................................................................................47 Captulo 3 Evoluo e Comportamento........................................................................................................................... 49 Captulo 4 Comportamento Eliciado e Comportamento Em itido................................................................................. 60 PARTE III Aprendizagem Sem P a la v ra s.....................................................................................................................79 Captulo 5 As Conseqncias do Responder: R eforo...................................................................................................81 Captulo 6 As Conseqncias do Responder: Controle Aversivo............................................................................. 108 Captulo 7 Operantes: A Seleo do Comportamento................................................................................................129 Captulo 8 Operantes Discriminados: Controle de Estm ulo.......................................................................................145 Captulo 9 Discriminao Condicional e Classes de Ordem Superior.......................................................................163 Captulo 10 Esquemas de Reforo..................................................................................................................................177 Captulo 11 Combinaes de Esquemas: Sntese Comportamental............................................................................ 193 Captulo 12 Comportamento Respondente: Condicionamento...................................................................................210 Captulo 13 Aprendizagem S o cial................................................................................................................................. 235 PARTE IV Aprendizagem Com P a la v ra s ................................................................................................................ 249 Captulo Captulo Captulo Captulo Captulo Captulo Captulo 14 Comportamento Verbal: A Funo da Linguagem.................................................................................. 251 15 Comportamento Verbal e Comportamento No-Verbal..........................................................................271 16 Psicolingustica: A Estrutura da Linguagem........................................................................................... 289 17 Aprendizagem Verbal e Transferncia..................................................................................................... 306 18 As Funes do Lem brar.............................................................................................................................327 19 A Estrutura do Lembrar..............................................................................................................................342 20 Cognio e Resoluo de Problem as....................................................................................................... 354

PARTE V C oncluso...................................................................................................................................................369 Captulo 21 Estrutura e Funo na Aprendizagem...................................................................................................... 371 Glossrio............................................................................................................................................................................ 383 Crditos das Ilustraes................................................................................................................................................... 427 Referncias Bibliogrficas..............................................................................................................................................429 n d ice................................................................................................................................................................................. 455

Sumrio

PAR TE I
C a p tu lo 1

Introduo...........................................................................19
A p r e n d i z a g e m e C o m p o r t a m e n t o ....................................................................................... 21

A. A Linguagem da Aprendizagem e do C om portam ento.................................................................................22 Linguagem Comportamental e Linguagem Cognitiva........................................................................................ 24 O Mundo e o Laboratrio...................................................................................................................................... 26 B. Antecedentes, Com portam ento, C onseqncias............................................................................................ 27 Estmulos e Respostas............................................................................................................................................. 28 Hierarquias Comportamentais...............................................................................................................................30 C a p tu lo 2 U m a T a x o n o m ia d o C o m p o r t a m e n t o ................................................................................32

A. A Observao do C om portam ento.................................................................................................................... 33 B. A Apresentao de E stm u lo s............................................................................................................................. 35 C. Operaes Conseqenciais.................................................................................................................................. 37 D. Operaes de Sinalizao ou de Controle de E stm u lo .................................................................................38 Sinalizao de Apresentaes de Estmulo.......................................................................................................... 39 Sinalizao de Conseqncias...............................................................................................................................39 E. Estabelecendo a Efetividade das C onseqncias........................................................................................... 43 F. R esu m o .................................................................................................................................................................... 44

PARTE II
C a p tu lo 3

Comportamento Sem Aprendizagem .................................................... 47


E v o lu o e C o m p o r t a m e n t o ...................................................................................................49

A. A N atureza da E voluo...................................................................................................................................... 50 Receitas e Fotocpias.............................................................................................................................................. 51 Variao e Seleo................................................................................................................................................ 52 Tipos de S eleo..................................................................................................................................................... 57 Resum o......................................................................................................................................................................58 B. Filogenia, O ntogenia e C om portam ento.......................................................................................................... 58 C a p tu lo 4 C o m p o r t a m e n t o E lic ia d o e C o m p o r t a m e n t o E m i t i d o ............................................60

A. O Reflexo: E liciao..............................................................................................................................................61 Propriedades do Comportamento E liciado..........................................................................................................62 Estmulos Eliciadores e Probabilidades de Resposta.......................................................................................... 63 Tipos de Relaes Estmulo-resposta ................................................................................................................... 66 Efeitos de Eliciaes Sucessivas........................................................................................................................... 68

B. Do C om portam ento Eliciado ao C om portam ento E m itid o ...........................................................................71 O Padro Temporal do Comportamento............................................................................................................... 71 O Papel do Exerccio.............................................................................................................................................. 72 As Apresentaes de Estmulo em Estampagem (Imprinting ) .......................................................................... 75 As Operaes Estabelecedoras e a Importncia de Estm ulos.......................................................................... 76

PA R T E III C a p tu lo 5

A p re n d iz a g e m

S e m P a l a v r a s ...................................................................... 79

A s C o n s e q n c ia s d o R e s p o n d e r : R e f o r o ......................................................................81

A. Reforo e E xtin o ................................................................................................................................................ 82 Labirintos e Curvas de Aprendizagem .................................................................................................................82 Cmaras Experimentais e Registros Cumulativos...............................................................................................85 Reforo..................................................................................................................................................................... 90 E xtino................................................................................................................................................................... 92 B. Os Reforadores como O portunidades p ara o C om portam ento.................................................................97 Relatividade do R eforo.........................................................................................................................................98 Aquisio do Comportamento...........................................................................................................................101 C a p tu lo 6 A s C o n s e q n c ia s d o R e s p o n d e r : C o n t r o le A v e r s i v o ........................................... 108

A. P u n io ................................................................................................................................................................ 109 Comparando Reforo e Punio....................................................................................................................... 109 A Relatividade da Punio................................................................................................................................. 112 Efeitos Colaterais da Punio............................................................................................................................113 B. Reforo Negativo: Fuga e E sq u iv a................................................................................................................117 Fuga...................................................................................................................................................................... 117 Esquiva................................................................................................................................................................. 120 E xtino...............................................................................................................................................................125 Punio Positiva e Punio N egativa...............................................................................................................125 A Linguagem do Controle Aversivo.................................................................................................................126 C a p tu lo 7 O p e r a n t e s : A S e le o d o C o m p o r t a m e n t o ............................................................... 129

A. Modelagem: Reforo Diferencial de Aproximaes Sucessivas...............................................................130 Seleo Natural e Seleo Artificial na Modelagem......................................................................................130 B. Diferenciao e In d u o ..................................................................................................................................132 Classes de Respostas.......................................................................................................................................... 132 Alguns Exemplos de Reforo Diferencial....................................................................................................... 133 Classes Operantes: Funo Versus Topografia................................................................................................137 C. A E stru tu ra O p eran te....................................................... .............................................................................. 138 Reforo Diferencial da Organizao Tem poral.............................................................................................. 138 Comportamento Complexo: A Aprendizagem em Labirinto........................................................................140 Seqncias de Respostas: Encadeamento Versus Unidades Temporalmente Estendidas.......................................................................................................................... 142 Classes Operantes e Comportamento Novo.....................................................................................................143 C a p tu lo 8 O p e r a n t e s D is c r im in a d o s : C o n t r o l e d e E s t m u l o ................................ ..................145

A. A N atureza dos Operantes D iscrim inados...................................................................................................146 Atentar para as Propriedades dos Estmulos....................................................................................................149 Gradientes de Controle de Estm ulo.................................................................................................................152 Esvanecimento (Fading): Controle de Estmulo porAproximaes Sucessivas.........................................156 A Terminologia do Reforo D iferencial.......................................................................................................... 157 B. Cognio A n im al...............................................................................................................................................159 Mapas Cognitivos...............................................................................................................................................160 Conceitos Naturais e Classes de Estmulos Probabilsticas........................................................................... 161 Definio de Classes de Estm ulos...................................................................................................................162

14

S um rio

C a p tu lo 9

D is c r im in a o C o n d i c io n a l e C la s s e s d e O r d e m S u p e r i o r .............................. 163

A. Dimenses Relacionais de E stm ulos............................................................................................................... 164 Emparelhamento com o Modelo e Emparelhamento por Singularidade........................................................ 164 Comportamento Simblico: Classes de Equivalncia.......................................................................................166 B. Classes de Com portam ento de O rdem S u p e rio r..........................................................................................169 Aprender a Aprender (Leaming S e t) ...................................................................................................................170 Propriedades das Classes de Ordem S uperior................................................................................................... 172 Origens da E strutura..............................................................................................................................................173 C. Fontes do Com portam ento N ovo......................................................................................................................174 C a p tu lo

10

E s q u e m a s d e R e f o r o .............................................................................................................. 177

A. Esquem as de Razo Varivel e de Intervalo V arivel................................................................................. 178 Esquemas Acoplados............................................................................................................................................ 183 Esquemas de Reforo e C ausao.......................................................................................................................184 B. Esquemas de Razo Fixa e de Intervalo F ix o ................................................................................................ 187 Atraso de R eforo..................................................................................................................................................189 C. A Terminologia dos Esquemas de R efo ro .....................................................................................................191 C a p tu lo

11

C o m b in a e s d e E s q u e m a s : S n te s e C o m p o r t a m e n t a l ........................................... 193

A. Esquem as Mltiplos e M istos............................................................................................................................ 194 Respostas de Observao.......................................................................... ........................................................... 194 Interaes entre Esquemas: Contraste Comportamental.................................................................................. 196 B. Esquem as Encadeados, Tandem e de Segunda O rd em ................................................................................ 197 Reforo Condicionado.......................................................................................................................................... 197 C. Esquem as C oncorrentes.................................................................................................................................... 200 Igualao, Maximizao e Escolha.....................................................................................................................200 Esquemas Encadeados Concorrentes..................................................................................................................202 D. Combinaes de Esquemas e Sntese C om portam ental............................................................................. 207 C a p tu lo

12

C o m p o r t a m e n t o R e s p o n d e n t e : C o n d i c i o n a m e n t o .................................................. 210

A. Reflexos Condicionais.........................................................................................................................................211 Tipos de Condicionamento..................................................................................................................................214 Condicionamento e Contigiiidade....................................................................................................................... 216 Combinaes de Estmulo no Condicionamento.............................................................................. ................217 Contigiiidade e Conseqncias............................................................................................................................221 Automodelagem e Automanuteno...................................................................................................................223 B. Interaes Operante-Respondente: E m oo................................................................................................ 225 Condicionamento e Em oo................................................................................................................................225 Estmulos Pr-aversivos e Pr-apetitivos........................................................................................................... 227 C. Limites Biolgicos da A prendizagem ............................................................................................................. 229 Limites Sensoriais.................................................................................................................................................230 Limites M otores.................................................................................................................................................... 230 Limites Sobre as Conseqncias......................................................................................................................... 231 Preparao........................................................................................................................................................... 232 C a p tu lo

13

A p r e n d iz a g e m S o c i a l .............................................................................................................. 235

A. Tipos de Contingncias S ociais........................................................................................................................236 Aprender sobre os O utros.................................................................................................................................... 237 Aprender com os O utros...................................................................................................................................... 238 Aprender sobre si Prprio.................................................................................................................................... 241 B. R e v is o ..................................................................................................................................................................244 Tipos de Contingncias e Estmulos Contingentes........................................................................................... 245

S um rio

15

P A R T E IV
Captulo

Aprendizagem Com P a la v ra s .......................................... 2 4 9


Comportamento Verbal: A Funo da L inguagem ..............................................251

14

A. Correspondncias entre as Classes Vocais e as Classes E sc rita s.............................................................. 252 Comportamento E cico........................................................................................................................................ 253 Transcrio............................................................................................................................................................. 255 Comportamento Textual.............................................. .........................................................................................256 D itado......................................................................................................................................................................256 Relaes entre as Classes......................................................................................................................................257 B. C om portam ento I n tra v e rb a l............................................................................................................................ 258 C. O Contato do Com portam ento Verbal com o A m biente.............................................................................259 A bstrao................................................................................................................................................................261 A Extenso das Classes Verbais........................................................................................................................... 263 A Linguagem dos Eventos Privados................................................................................................................... 264 Classes Verbais e Nomeao................................................................................................................................ 266 D. C om portam ento Verbal Condicional sobre Com portam ento V erb al......................................................267 Autoclticos Relacionais: A Conjuno das Unidades Verbais....................................................................... 267 Autoclticos Descritivos: Discriminando nosso Prprio Comportamento Verbal....................................................................................................................................269

Captulo

15

Comportamento Verbal e Comportamento N o-V erbal ..................................271

A. Conseqncias dos O perantes V erbais............................................................................................................272 Causao M ltipla................................................................................................................................................ 274 B. Com portam ento Governado Verbalmente e Com portam ento Modelado por C ontin g n cias.........274 Controle Instrucional............................................................................................................................................ 275 Insensibilidade s Contingncias.........................................................................................................................277 Conseqncias Intrnsecas Versus Conseqncias Extrnsecas....................................................................... 279 C. Correspondncias entre Dizer e F a z e r ............................................................................................................280 Modelagem do Comportamento Verbal..............................................................................................................280 D. O Com portam ento do Ouvinte ou do L e ito r................................................................................................. 283 Significados como Equivalncias........................................................................................................................284 E. Com portam ento Verbal e Linguagem In fra -H u m a n a ................................................................................285

Captulo

16

Psicolingustica: A Estrutura da Linguagem ......................................................... 289

A. Sintaxe: A E stru tu ra G ram atical da L in g u a g em ........................................................................................ 290 Constituintes e Estrutura da F ra se ....................................................................................................................... 291 Transformaes......................................................................................................................................................294 B. Semntica: O Significado das Unidades V e rb a is......................................................................................... 296 A Mensurao do Significado............................................................................................................................. 298 M etfora................................................................................................................................................................. 300 C. Algumas Propriedades da L inguagem ............................................................................................................ 301 Desenvolvimento da Linguagem .........................................................................................................................302

Captulo

17

Aprendizagem Verbal e Transferncia ....................................................................... 306

A. Procedim entos da Aprendizagem V e rb a l...................................................................................................... 306 Aprendizagem Serial............................................................................................................................................. 309 Aprendizagem de Pares A ssociados................................................................................................................... 312 Recordao L ivre...................................................................................................................................................315 Discriminao Verbal............................................................................................................................................ 317 Reconhecimento Verbal: Um Caso Especial de DiscriminaoVerbal............................................................319 Resumo....................................................................................................................................................................320 B. T ransferncia........................................................................................................................................................ 321 Transferncia Positiva e N egativa.......................................................................................................................322

16

S um rio

Proao e Retroao.............................................................................................................................................. 324 Extenses a Procedimentos no Verbais............................................................................................................. 325 Resumo....................................................................................................................................................................326 C a p tu lo

18

A s F u n e s d o L e m b r a r ...................................................................................................... 327

A. M n e m n ic a........................................................................................................................................................... 329 B. A M etfora do A rm azenam ento, da Reteno e da R ecu p erao ............................................................331 Armazenamento: Codificao e Nveis de Processamento..............................................................................332 Reteno: A Questo da Reorganizao da M em ria...................................................................................... 335 Recuperao: Dependncia de Pistas e Acessibilidade.................................................................................... 337 C. M e tam em ria.......................................................................................................................................................340 Memria Corrente ou Memria de Trabalho..................................................................................................... 340 O Lembrar Discrim inado......................................................................................................................................340 C a p tu lo

19

A E s t r u t u r a d o L e m b r a r .....................................................................................................342

A. M em ria Icnica: Os Efeitos Persistentes dos Estmulos ......................................................................... 343 B. M em ria de C urto Prazo: O Papel do E nsaio...............................................................................................344 C. M emria de Longo Prazo: Interferncia e E squecim ento......................................................................... 347 D. A E stru tu ra da M emria: O que L em b ra d o ?........................................................................................... 350 Memria de Procedimento e Memria Declarativa.......................................................................................... 350 Memria Implcita e Memria Explcita.............................................................................................................351 Memria Autobiogrfica e Memria Semntica ............................................................................................... 351 Outrs Tipos de Lem brar..................................................................................................................................... 352 Resumo....................................................................................................................................................................352 C a p tu lo

20

C o g n i o e R e s o lu o d e P r o b l e m a .............................................................................. 354

A. Processos Cognitivos...........................................................................................................................................355 Imaginao Visual................................................................................................................................................. 356 Sim ulaes............................................................................................................................................................. 358 Estgios de Processamento.................................................................................................................................. 359 Representaes M entais........................................................................................................................................360 B. Resoluo de P roblem as.....................................................................................................................................363 Fixao Funcional.............................. ...................................................................................................................366 A Construo de Solues................................................................................................................................... 367

PA R T E V C a p tu l o

C o n c l u s o ..............................................................................................................................369 E s t r u t u r a e F u n o n a A p r e n d i z a g e m ........................................................................ 371

21

A. Duas Psicologias da Aprendizagem : Uma H istria C o n d en sad a............................................................. 373 B. E stru tu ra e F u n o ............................................................................................................................................. 375 C. Aprendizagem e E voluo................................................................................................................................. 378 D. Anlise do Com portam ento e Sntese do C om portam ento........................................................................ 381 G l o s s r i o .........................................................................................................................................................................383 C r d ito s d as I l u s tr a e s ...........................................................................................................................................427 R e fe r n c ia s B i b lio g r f ic a s ..................................................................................................................................... 429 n d i c e ................................................................................................................................................................................ 455

S um rio 1 7

PARTE I

INTRODUO

Aprendizagem e Comportamento

A. A Linguagem da Aprendizagem e do Com portam ento Linguagem Comportamental e Linguagem Cognitiva O Mundo e o Laboratrio B. Antecedentes, Com portam ento, Conseqncias Estmulos e Respostas Hierarquias Comportamentais

A palavra inglesa leamiag (aprendizagem), prova velmente. deriva do radical indo-europeu, leis-, que significava pista ou pegada. Antes de atingir sua forma atual, sofreu muitas transformaes: laestan, leornian, lemen. Em diferentes perodos da evolu o da lngua inglesa, ela pode ter sido entendida como seguir uma pista, continuar, vir a saber ou, talvez mesmo, entrar nos trilhos. Do mesmo radical veio o verbo last (durar). A palavra behavior (comportamento), como habit (hbito), inhibit (inibir) e ability (habilidade), est relacionada com a palavra latina habere (man ter ou ter). O prefixo be foi agregado em palavras como behabban, do ingls antigo. Como uma pala vra que designava a forma com que algum se con duz a si mesmo, ela estava mais prxima do sentido de conduta ou comportamento do que do sentido mais contemporneo de atividade, do mesmo modo que habit costumava ser mais comumente o que era vestido do que o que era habitualmente feito.

Suponhamos que uma pessoa no estivesse familiarizada com a palavra fenmeno e se de parasse com ela, em algumas sentenas. Ela po deria decidir, com base no contexto, que a pala vra significa alguma coisa que acontece ou um evento notvel. Neste ponto, se poderia consul

tar um dicionrio, que talvez a defina como um evento que pode ser observado; um segundo re gistro poderia definir a palavra fenmeno como uma pessoa ou coisa surpreendente ou pouco co mum. O dicionrio mostraria que a palavra um substantivo comum e que seu plural fenme nos (phenomenon e phenomena, em latim). Mes mo depois de ler a definio, ainda poderia ser difcil para essa pessoa empregar a palavra. Mes mo assim, ela teria aprendido alguma coisa so bre a palavra e isso poderia ser til prxima vez que se deparasse com ela. Mas o que dizer da definio do objeto de estudo deste livro? O que este fenmeno que denominamos aprendizagem? A palavra no nos causa problema na conversa cotidiana, mas uma definio de dicionrio que afirme que ela sig nifica vir a saber alguma coisa ou adquirir co nhecimento e habilidade no muito til. A pa lavra aprendizagem bem mais familiar que f e nmeno e, contudo, muito mais difcil de defi nir. Normalmente podemos dizer se aprendemos alguma coisa e somos capazes de concordar a respeito daquilo que conta como aprendizagem. Mesmo assim, enfrentamos problemas quando tentamos formular uma definio. Um livro-texto pode definir aprendizagem, por exemplo, como uma mudana relativamente permanente no comportamento, resultante da experincia (cf. Kimble, 1961, pp.1-13). Mas o que significa comportamento, experincia,- e quanto o relativamente permanente permanen te? Encarar um eclipse solar uma experincia e certamente ir alterar o comportamento futuro

do observador, se resultar em dano permanente dos olhos. Mas, se algum afirmasse que essa alterao um caso de aprendizagem, provavel mente discordaramos.

Seo A

A Linguagem da Aprendizagem e do Comportamento

Este um livro sobre a aprendizagem, mas devemos, de incio, encarar o fato de que no seremos capazes de definir aprendizagem. No h definies satisfatrias. Ainda assim, pode mos estudar a aprendizagem. Fazemos isso sem pre que observamos como os organismos vm a se comportar de maneiras novas. Em nosso es tudo da aprendizagem, vamos examinar dois ti pos de questo: (1) qual a natureza dos eventos a que nos referimos como aprendizagem e (2) qual a melhor forma de falar deles? Consideremos as palavras aprendizagem e conhecijnento. Elas parecem obviamente impor tantes. Mas, quando funcionam de diferentes maneiras em diferentes contextos, geralmente no notamos, o que pode gerar confuso. Por exemplo, algumas vezes falamos em aprender sobre algo; outras vezes falamos em aprender como fazer algo. Algum que tenha aprendido como um automvel funciona pode no saber como dirigir um; por outro lado, algum que te nha aprendido a dirigir um carro pode no ser capaz de dizer como ele funciona. Alguns tipos de aprendizagem envolvem aes e outros envolvem palavras. Devemos tra tar esses dois tipos de aprendizagem em conjun to ou em separado? Os filsofos esto preocu pados com esse tipo de distino quando deba tem sobre as diferenas entre saber como e sa ber que (p. ex., Ryle, 1949). Os psicolingistas, s vezes, estabelecem a distino, contras tando conhecimento ou memria tprocedimen to e conhecimento ou memria declarativa. A distino to fundamental que, como mostra o sumrio, este livro est dividido em duas par tes principais. Uma est voltada para a apren dizagem que no envolve palavras, e a outra dedicada aprendizagem que envolve pala vras.

Se a aprendizagem pudesse ser definida em uma ou duas frases, no teramos qualquer pro blema. Definiramos a palavra e, ento, discuti ramos as condies sob as quais a aprendiza gem ocorre, os tipos de coisas que so aprendi das, as maneiras pelas quais diferentes instnci as de aprendizagem podem ser combinadas, as limitaes da aprendizagem, e assim por diante. Mas, aprendizagem significa coisas diferentes, em diferentes momentos, para diferentes pessoas. Consideremos alguns exemplos. Um pombo descobre alimento ao longo de sua jornada e re toma quele lugar, mais tarde, quando est no vamente faminto. Uma criana se toma capaz de ler uma histria ou de soletrar algumas pala vras simples. Um cachorro ensinado a sentar ou a deitar, sob comando. Um paciente que certa vez teve uma experincia ruim no consultrio de um dentista sente-se desconfortvel na sala de espera. Um filhote de gato, aps suas primei ras expedies de caada, passa a evitar gambs e porcos-espinho. Um consumidor v um ann cio de uma liquidao que ainda no comeou e, alguns dias depois, volta loja e aproveita os preos baixos. Um autor que encontra uma pala vra pouco familiar, mais tarde vem a empreg-la em um pequeno conto. Um estudante, depois de ler um captulo de um livro de matemtica, en contra a soluo de um problema que, at ento, parecia insolvel. O que esses exemplos tm em comum? Eles envolvem cachorros e gatos, crianas e adultos, e provavelmente concordaramos que todos so instncias de aprendizagem. Mas razovel agru par um pombo que aprende uma rota para a fon te de alimento com um estudante que descobre a soluo para um problema matemtico? Algum poderia sugerir que nossos proble mas de definio seriam resolvidos se acrescen tssemos que a aprendizagem tem que ocorrer por meio de alguma mudana no crebro. Mas alguma vez olhamos para o crebro de um orga nismo para decidir se ele aprendeu alguma coi sa? Todos aprendemos a dizer quando aprende mos ou quando outros aprenderam alguma coi sa, mas quantos de ns j viram um crebro fa zendo alguma coisa? Isso no significa dizer que a aprendizagem no tenha qualquer base fisiolgica. Naturalmen

22

A . C h a r l e s C a ta n i a

te que tem e seria fascinante saber que mudan feridas. Contudo, esse tipo de vocabulrio no as neurolgicas acompanham a aprendizagem. apropriado para discutir como interesses ou tra Mas teramos problemas em decidir o que pro os particulares se desenvolveram em um indi curar no sistema nervoso, se no soubssemos o vduo. Consideremos um outro exemplo. H uma di bastante sobre a aprendizagem. De fato, no po demos ter uma adequada neurocincia da apren ferena importante entre mentir e dizer a verda dizagem, a menos que compreendamos suas pro de. Mas, se uma criana aprende a evitar proble priedades comportamentais. Tais propriedades mas dizendo mentiras, e outra aprende a evitdeterminam que tipo de coisas o neurocientista los dizendo a verdade no deveramos nos sur interessado em aprendizagem deve procurar no preender se a primeira criana vier a se tornar sistema nervoso. Essa a razo pela qual nossa menos confivel do que a segunda. Contudo, o comportamento de cada criana foi modelado por principal preocupao ser com as propriedades comportamentais da aprendizagem, mais do que suas conseqncias, cada criana se comporta de modo a evitar problemas. Essa modelagem com suas bases fisiolgicas. do comportamento deveria ser de nosso interes At aqui, estivemos pouco preocupados com os fatos da aprendizagem; estivemos mais preo se, mas o vocabulrio cotidiano no nos equipa cupados sobre como falar a respeito deles. As bem para discuti-la. Problemas desse tipo tambm ocorrem em linguagens mudam; suas terminologias refletem o que importante, no momento presente, para outros campos, alm da Psicologia. Quando ob os que falam uma dada linguagem. Um proble servam eventos no mundo, os fsicos no consi ma que a linguagem que evoluiu em nossa in deram adequado o vocabulrio do cotidiano. Eles terao cotidiana com os outros no , necessa cunham novos termos ou apoderam-se de outros riamente, a mais apropriada para uma linguagem j existentes. O ltimo recurso pode criar difi da aprendizagem (essa uma das razes para a culdades. Palavras como trabalho, fora e ener gia, por exemplo, significam para os fsicos, na incluso da seo etimolgica, ou histria das linguagem tcnica, coisas diferentes do que sig palavras, no incio de cada captulo). nificam para a maioria das pessoas em sua con Normalmente, estamos mais interessados no que as outras pessoas sabem e no que tendem a versao rotineira. Felizmente, para os fsicos, fazer do que em como elas vieram a se tomar o muitos fenmenos que eles estudam atualmente que so. Um pai ou uma professora, por exem esto to distantes de nossa experincia comum, plo, poderiam preocupar-se com uma criana que que no confundimos sua linguagem tcnica com briga, freqentemente, com outras crianas e que o discurso leigo. nunca brinca cooperativamente. Mas, se a crian Esse no o caso da Psicologia. Todos esta a comea a brincar cooperativamente, o pai mos, inexoravelmente, envolvidos com o com pode no se importar se isso ocorreu devido s portamento. Falamos sobre como as pessoas cres recompensas naturais da cooperao, se a coo cem e mudam, especulamos sobre as razes que perao foi explicitamente ensinada ou se brigar elas tm para fazer certas coisas e ns prprios ou outras alternativas para o brincar foram puni aprendemos novos fatos e adquirimos novas ha das. bilidades. Se desejarmos criar novas formas de A linguagem que geralmente empregamos falar sobre esses eventos, temos que cuidar para para descrever o que as pessoas fazem til. E que a nova linguagem no venha a se confundir importante saber o que esperar dos outros, e deve com a antiga. Temos passado a maior parte de ser por isso que descrevemos as pessoas pela nossas vidas falando de maneiras especficas maneira como elas tendem a se comportar. Re sobre o que fazemos, e esses modos familiares ferimo-nos uns aos outros como expansivos ou de falar podem interferir com quaisquer novas reservados, relaxados ou compulsivos, confiformas que tentemos estabelecer. Algumas se > eis ou imprevisveis. Descrever pessoas com es deste livro sero dedicadas ao estabeleci r ilivras como artstico, atltico, social, intelecmento de uma linguagem comportamental, e essa 3kj1 ou musical especifica suas atividades pre linguagem no ser simplesmente uma parfra

A pr en d iza g em 2 3

se dos usos cotidianos; ela ir exigir algumas no vas formas de lidar com fenmenos ou eventos familiares.

LINGUAGEM COMPORTAMENTAL E LINGUAGEM COGNITIVA Algumas vezes, falamos sobre o que as pes soas fazem, outras sobre o que elas sabem. Por um lado, o que algum faz a nica coisa que est acessvel a ns. No h outra coisa a ser estudada, seno o comportamento. Em um ex perimento de aprendizagem, por exemplo, uma pessoa pode descrever pensamentos ou sentimen tos, mas tais descries ainda so comportamen tos (o comportamento verbal pode ser especial, mas ainda assim um comportamento). Indepen dentemente de quais sejam os fenmenos que es tudamos em Psicologia, nossas terminologias e teorias devem ser, em ltima instncia, deriva das de um comportamento, daquilo que os orga nismos fazem. Por outro lado, um organismo mais do que aquilo que pode ser visto em seu comportamento. Dois alunos podem permanecer quietos durante uma aula, e ainda assim pode ficar claro para o professor que um deles capaz de responder a cer tas questes e resolver certos problemas, enquan to o outro no. Embora eles possam ser distingui dos com base no desempenho passado, no presen te momento eles no se comportam de forma dife rente. A diferena est naquilo que cada um vir tualmente capaz de fazer. Poder-se-ia dizer sim plesmente que um dos estudantes sabe mais que o outro. Quando estudamos esse conhecimento, tentador dizer que estudamos a mente. O debate entre psiclogos que se denominam comportamentalistas e os que se intitulam mentalistas ou cognitivistas tem sido consideravel mente duradouro. Trata-se, at certo ponto, de um debate sobre os modos apropriados de se fa lar de eventos psicolgicos. O comportamentalista afirma que se o comportamento tudo o que est disponvel para ser medido, a lingua gem de eventos mentais pode ser enganadora, especialmente quando uma afirmao mentalista aceita como explicao, e por isso desenco raja a continuidade da pesquisa.

Por exemplo, s vezes, dizemos, casualmen te, que uma idia, um sentimento ou um palpite levou algum a fazer algo. O comportamentalista no questiona a existncia de idias, sentimen tos e intuies, mas critica sua invocao como causa do comportamento. E fcil demais con tentar-se com uma explicao assim; para um comportamentalista no basta dizer que algum fez algo por causa de uma idia, de um senti mento ou de uma intuio. As idias, os senti mentos e os palpites dizem respeito ao mundo e, portanto, devem ter sua origem em nossas expe rincias com o mundo. Para explicar o que faze mos, devemos estender a busca a essas experin cias passadas ou, em outras palavras, ao com portamento passado. Se tivermos xito, teremos tambm algo til a dizer acerca das origens de nos sas idias, de nossos sentimentos e de intuies. O cognitivista sustenta que essa viso des necessariamente estreita. Quando lidamos com o mundo, devem ocorrer processos que no so observveis em nosso comportamento. Quando tentamos lembrar de uma palavra que est na ponta da lngua ou tentamos resolver um pro blema dormindo sobre ele, acontecem algu mas coisas que no transparecem em nosso com portamento, e pode ser que nem mesmo sejamos capazes de relat-las. Se pudssemos descobrir algo acerca de tais processosisso certamente se ria relevante para o estudo da aprendizagem. Contudo, a disputa entre comportamentalis tas e cognitivistas pode ter origem tanto nas di ferentes maneiras de se falar sobre o comporta mento quanto em diferenas nas descobertas de pesquisa. Algumas dificuldades surgem porque esses dois tipos de psiclogos geralmente esto interessados em tipos diferentes de questes. Os comportamentalistas tendem a lidar com ques tes relativas funo, e os cognitivistas ten dem a lidar com questes de estrutura. Suponhamos que estejamos interessados em ensinar uma criana a ler. Por um lado, podera mos cogitar sobre o que teramos que fazer para envolver a criana na leitura. Pensaramos no que poderia manter a criana alerta, no que a ajuda ria a prestar ateno s palavras apresentadas e no que poderia ajud-la a lembrar quais so as vrias palavras. Seramos melhor sucedidos se recompensssemos seus acertos ou se penalizs

24

A . C h a rle s C atania

semos os erros? Quando planejamos conseqn cias diferentes para as diferentes respostas que a criana pode apresentar, estamos determinando as funes dessas vrias respostas ou, mais pre cisamente, as relaes funcionais entre o com portamento e suas conseqncias. Por outro lado, por mais preocupados que estejamos com os efeitos da recompensa e da punio no domnio da leitura pela criana, isso no nos dir qual o modo mais eficiente de lhe apresentar materiais de leitura. Como a leitura estruturada? Qual a melhor forma de seqenciar os materiais? Deveramos ensinar a criana a ler, comeando por letras individuais, por sla bas ou por palavras inteiras? Quando programa mos diferentes ordens de apresentao dos ma teriais a serem aprendidos, estamos interessados nas relaes estruturais efetivas dentro do mate rial a ser ensinado. As palavras seriam melhor ensinadas como estruturas unitrias ou como estruturas complexas construdas a partir de uni dades mais simples, como letras ou slabas? Pro blemas de estrutura dizem respeito a como o comportamento e o ambiente esto organizados. Os dois tipos de problemas so importantes. Qualquer tentativa de melhorar a forma como as crianas aprendem a ler ser deficiente se for ig norado qualquer um deles. Considere um outro exemplo. Suponhamos que descobrimos que as crianas que aprendem a ler a partir de textos acompanhados por figuras apresentem maior probabilidade de atentar para as figuras do que para as palavras. Um de nossos problemas seria funcional e poderia nos levar a perguntar se po deramos melhorar o ensino de leitura colocan do as palavras em uma pgina e a figura rele vante na pgina seguinte. Isso tambm poderia ajudar o professor, que tem que julgar se a crian a de fato leu a palavra ou se apenas adivinhou a palavra a partir da figura. Poderamos, at mesmo, criar um sistema de instruo por computador, em que a criana somente pudesse ver a figura como conseqncia da leitura correta da palavra. Mas outro de nossos problemas seria estru tural, porque ainda seria importante saber quais figuras deveriam acompanhar quais palavras e a ordem em que os diferentes materiais de leitura deveriam ser apresentados. Por melhor que seja a instruo informatizada para manejar as rela

es entre palavras e figuras e as respostas da criana, sua efetividade poderia ser prejudicada se tentssemos ensinar as palavras difceis antes das palavras fceis ou as palavras com grafia ir regular antes das palavras com grafia regular. Um programa de leitura para ensinar uma lngua al fabtica, como o ingls, provavelmente seria bem diferente de um programa para ensinar uma ln gua ideogrfica, como o chins. Cada programa teria que levar em considerao a estrutura fala da e escrita da lngua a ser ensinada. Historicamente, certas controvrsias surgiram na Psicologia, porque os psiclogos interessa dos em problemas funcionais tendiam a falar uma linguagem comportamental, enquanto os interes sados em problemas estruturais tendiam a falar uma linguagem cognitiva ou mental. Embora os comportamentalistas pudessem ter estudado os problemas estruturais, do mesmo modo que os cognitivistas poderiam ter estudado os proble mas funcionais, os problemas nos quais os com portamentalistas e os cognitivistas estavam in teressados tendiam a ser correlacionados com a linguagem que eles empregavam. E fcil ver como tal correlao pode ter sur gido. Se o experimentador est preocupado com a funo, ele estuda as conseqncias de rela es particulares entre os eventos ambientais es pecficos e as aes especficas; essas relaes podem ser convenientemente expressas na lin guagem comportamental de estmulos e respos tas. Se a preocupao do experimentador com a estrutura, ele estuda as propriedades de capa cidades ou as habilidades particulares; essas pro priedades so convenientemente expressas na linguagem cognitiva de conhecimento e mente. (Uma distino paralela entre estrutura e funo, a separao entre anatomia e fisiologia, ocorreu na histria da Biologia; ver Captulo 21.) Mas no temos que nos desviar de nosso pro psito por causa dessa controvrsia. Vamos con siderar tanto os problemas funcionais quanto os estruturais em aprendizagem e, portanto, exami naremos os dois tipos de pesquisa. Em ambos os casos, ser til descrever as situaes em termos de antecedentes, ou as circunstncias que esta belecem a ocasio para o comportamento, o com portamento que ocorre nessas circunstncias e as conseqncias do comportamento (esses trs

A prend iza gem 2 5

termos so abreviados, por convenincia, como ABC). Podemos considerar tanto a funo, as relaes entre os termos (p. ex., dados certos an tecedentes, que conseqncias so produzidas pelo comportamento?), como a estrutura, as pro priedades de termos particulares (p. ex., quais so as propriedades crticas daqueles anteceden tes?). A orientao que este livro segue lida tanto com a estrutura quanto com a funo, e engloba, assim, tanto os conceitos comportamentais como os conceitos cognitivos. Essas duas orientaes psicolgicas diferem em suas linguagens e nos problemas de pesquisa que enfatizam, mas am bas tm em comum a confiana no mtodo ex perimental, a ancoragem de conceitos em obser vaes experimentais e a premissa de que nosso objeto de estudo, embora complexo, ordenado e no casual. Nosso interesse reside naquilo que determina o comportamento. Se estivermos preo cupados com os possveis maus usos do conhe cimento sobre o comportamento, devemos reco nhecer que no podemos eliminar um determi nante do comportamento humano escolhendo, simplesmente, no estud-lo; de fato, podemos nos defender melhor contra os maus usos de tc nicas de controle do comportamento humano se entendermos como elas funcionam.

O MUNDO E O LABORATRIO Ento, como fazer descobertas sobre o com portamento? Os problemas de linguagem tor nam-se ainda mais difceis, porque vivemos em um mundo complexo. Os eventos que influenci am nosso comportamento no ocorrem isolada mente. Assim, para entendermos uma situao, devemos nos desvencilhar dos detalhes no-essenciais e analis-la. Analisar uma coisa sim plesmente dividi-la em suas partes-componentes. Para isso, voltamo-nos para o laboratrio. Comeamos com o estudo de organismos mais simples do que ns prprios, em ambientes sim plificados. Logicamente, devemos encarar a ob jeo de que um experimento de laboratrio artificial e, portanto, no apropriado ao estabe lecimento de generalizaes sobre a aprendiza gem fora do laboratrio. Mas comear com even

tos simples nos ajudar a desenvolver tcnicas e terminologias que possam ser aplicadas aos e . ere tos complexos. O ambiente controlado do laboratrio facili ta o exame de uma coisa por vez. Podemos pro gramar as circunstncias, de modo a saber o que entra na situao experimental; se formos cui dadosos, conseguiremos excluir algumas das dis traes que poderiam, de outro modo, obscure cer os processos que desejamos estudar. A sim plicidade de nosso ambiente de laboratrio tam bm pode nos ajudar a ver os variados aspectos da aprendizagem e, portanto, a desenvolver um vocabulrio apropriado ao nosso objeto de estu do. Temos que ser capazes de identificar os even tos, antes que possamos estudar suas proprieda des. Um dos pontos de partida ser estudar os comportamentos que no envolvem a linguagem, porque provavelmente sero mais simples do que os comportamentos que envolvem a linguagem. O que eles nos dizem sobre o comportamento sem a linguagem poder nos ajudar, mais tarde, a apreciar o que especial no comportamento com a linguagem. Mesmo depois de termos estudado o com portamento no laboratrio, no podemos espe rar que sejamos capazes de interpretar qualquer ocorrncia de comportamento fora do laborat rio. H limites para o que podemos saber. E ten tador pedir a um psiclogo que explique por que algum se comportou de um modo particular, o que levou a um certo incidente ou como algum veio a adquirir interesses, medos ou apegos par ticulares. Mas o psiclogo geralmente tem to pouca informao disponvel, que pode ofere cer apenas uma interpretao plausvel. Essa situao difere apenas em grau daquela em outras cincias. Assim como os princpios da aerodinmica no so invalidados se no con seguimos explicar cada volta e guinada no traje to da queda de uma folha em particular, os prin cpios de comportamento no so invalidados se no pudermos explicar cada detalhe do desem penho de um organismo em uma ocasio parti cular. No estudo da aprendizagem, importante reconhecer o que permanece fora de nosso al cance. No que se segue, veremos que o caminho mais promissor o que permanece prximo dos dados; vamos nos ater menos teoria psicolgi-

26

A . C harles C atania

ca e mais descrio apropriada das descober tas. Geralmente ser mais til descrever o que um organismo aprendeu ou lembrou do que ten tar explicar sua aprendizagem ou sua memria.

Seo B

Antecedentes, Comportamento, Conseqncias

Voltemos agora ao comportamento como objeto de estudo. Estudar a aprendizagem es tudar como o comportamento pode ser modifi cado; ento devemos considerar primeiro o que comportamento, como ele pode ser investiga do e que vocabulrio pode descrev-lo melhor. O comportamento no mais fcil de definir do que a aprendizagem. Podemos dizer, superficial mente, que comportamento qualquer coisa que um organismo faa, mas essa definio seria muito abrangente. Deveramos incluir a respira o ou o metabolismo juntamente com os movi mentos musculares e as secrees glandulares? Os comportamentos so descritos com verbos: as pessoas andam, falam, pensam, fazem coisas. Mas tambm fazemos distino entre aes ativas e pas sivas. Embora possamos dizer que algum respi ra, no diramos que algum bate o corao. As pessoas sangram quando se cortam, mas no fala mos de seu sangramento como comportamento. Vamos tentar resolver esse problema. Nosso objetivo examinar algumas propriedades do comportamento. Embora os fenmenos do com portamento, s vezes, compartilhem nomes em comum, eles so variados, de modo que pode ser melhor considerar alguns exemplos do que tentar elaborar definies. Podemos lidar com exemplos especficos sem grandes riscos de mal entendidos. Quando observamos um organismo, vemos propriedades de seu ambiente e proprie dades de seu comportamento. Essas proprieda des so chamadas de estmulos e respostas, mas nem o estmulo nem a resposta tm interesses por si s. Uma anlise experimental determina que existem alguns tipos de relaes entre os estmulos e as respostas e como surgem essas relaes. Ela deve considerar tambm contextos mais amplos, as situaes nas quais essas relaes entre os estmulos e as respostas esto inseridas.

Imagine um pombo em uma cmara experi mental. Em uma das paredes h uma abertura para um comedouro, no qual pode-se colocar o alimento. Acima da abertura do comedouro, h um disco transparente embutido na parede que pode ser iluminado por trs. O pombo est sen do treinado para bicar o disco (e obter alimento) sempre que estiver iluminado. Agora suponha mos que o disco esteja iluminado, que o pombo esteja sem comer por algum tempo e que sua bi cada no disco produza, imediatamente, uma pe quena quantidade de alimento. Nessa situao, se a alternativa de no bicar nunca for seguida por comida, ser muito diferente se a mesma al ternativa for seguida por uma quantidade de co mida muito maior, mas que s apresentada de pois de um certo tempo (com atraso). Em cada caso, uma resposta, como bicar o disco, segui da por um estmulo, por um alimento. Mas os contextos so muito diferentes. Esperaramos que o pombo bicasse no disco no primeiro caso, mas no no segundo? Se o pombo no bica, pode mos ficar tentados a dizer que ele demonstra autocontrole, rejeitando a pequena quantidade de alimento imediato pela quantidade maior que recebe mais tarde. Esse tipo de situao ser dis cutida mais detalhadamente no Captulo 11. Por ora, o ponto importante que devemos conside rar no apenas os detalhes dos eventos momen to a momento, mas tambm o contexto em que eles ocorrem, ao longo de extensos perodos de tempo. Examinemos melhor a relao entre compor tamento e ambiente, observando um beb huma no. Poderamos comear perguntando o que o beb sente, mas isso traria muitas complicaes. O beb ainda no fala e no poderia nos dizer. Mesmo que fosse uma criana mais velha, que pudesse nos contar o que sente, teramos que nos preocupar sobre como a criana aprendeu as pa lavras apropriadas e se elas significam, para ns a mesma coisa que significam para quem ensi nou a criana. Quando tratarmos da linguagem, no Captulo 14, vamos examinar o papel que ela desempenha em moldar nosso conhecimento e o dos outros, mas isso no vai nos ajudar. Sabemos que o beb ativo, aprendendo do ambiente e interagindo com ele. Mas como des cobrirmos o que est acontecendo? Podemos co

A prend iza gem 2 7

mear simplesmente pela observao. Observa mos por um tempo e notamos os movimentos das mos, dos braos ou das pernas. Talvez em algum momento, o beb comece a chorar. Se o choro cessa sem nossa interveno, o beb pode dormir ou deitar quietinho com os olhos aber tos. Se observarmos de perto, podemos ver os olhos se movendo, embora seja difcil julgar exa tamente o que o beb est olhando, ou mesmo se ele est olhando para alguma coisa. Poderamos comear a catalogar as vrias coisas que o beb faz e descobrir que certos movimentos particu lares, geralmente, ocorrem em certas seqnci as. Mas se apenas observamos, podemos dizer pouco mais do que isso: que certos movimentos ocorrem mais ou menos freqentemente e mais ou menos em certa ordem.

ESTMULOS E RESPOSTAS No temos que nos restringir a observar. Po demos tocar ou balanar o beb, mover objetos diante de seus olhos ou escond-los, fazer sons ou colocar uma chupeta em sua boca. Seria de esperar que o beb respondesse a cada evento de um modo caracterstico. Se o toque fosse na palma da mo, por exemplo, ele provavelmente fecharia a mo, agarrando o objeto que a tocou. O vocabulrio para esses eventos j familiar: chamamos o toque na palma de estmulo e o agar rar, de resposta. Nesse caso, no estamos interessados apenas no estmulo ou apenas na resposta; estamos in teressados na relao mtua de um com o outro. Denominamos essa relao, a produo fidedig na de uma resposta especfica por um estmulo especfico, de reflexo. O reflexo ser abordado no Captulo 4. O importante aqui que o termo reflexo simplesmente um nome para uma rela o comportamental: uma correlao observada entre um estmulo especfico e uma resposta es pecfica (Skinner, 1931). O reflexo no nem uma teoria, nem uma explicaco e apenas uma entre as muitas relaes possveis entre o com portamento e o ambiente. Alm da produo do agarrar pelo toque na palma, poderamos catalogar outros exemplos de reflexos: o choro causado por um rudo intenso;

o sugar produzido por uma chupeta na boca; o piscar disparado por um lampejo de luz. Esses no so, porm, os nicos tipos de relaes pos sveis. O ambiente age sobre o beb quando os estmulos produzem respostas, mas o beb tam bm pode agir sobre o ambiente. Chorar, por exemplo, freqentemente chama a ateno da me. Chorar, ento, uma resposta que pode produzir uma conseqncia: a presena da me. Essa relao envolve estmulos e respostas, mas no podemos denomin-la reflexo. Por um lado, aqui as respostas ocorrem primeiro, no os est mulos; por outro, aqui o comportamento tem conseqncias. As relaes podem se tornar ainda mais com plicadas. Se os olhos da criana se movem en quanto a luz est acesa, os movimentos dos olhos mudam o que ela v. Os movimentos dos olhos no podem ter tais efeitos quando no h luz. Assim, a criana pode vir a olhar em volta quan do h luz, mas no quando est escuro. Na pre sena de um estmulo, a luz, mover os olhos tem conseqncias; produz outros estmulos, coisas novas so vistas. Os movimentos oculares no podem ter essas conseqncias no escuro. A re lao envolve trs termos: um estmulo antece dente, a luz; uma resposta, o movimento ocular, na presena deste estmulo; e uma conseqncia, o que visto de diferente, dada esta resposta em presena do estmulo. Essa relao de trs ter mos, estmulo-resposta-conseqncia, chama da de contingncia de trs termos e importante porque o comportamento de um organismo de pende tanto dos antecedentes quanto das conse qncias. Um antecedente simplesmente algo que vem antes e uma conseqncia simplesmente o que causado por algum evento ou o que acon tece como resultado dele. Assim, o uso coloquial corresponde razoavelmente bem ao sentido tc nico do termo em anlise do comportamento. E importante notar que as conseqncias no de veriam ser identificadas com os estmulos. As respostas podem ter muitos tipos de conseqn cias. s vezes elas produzem certos estmulos que, de outra forma, estariam ausentes, mas elas tambm podem impedir que algo acontea ou mudar as conseqncias de outras respostas. O alimento produzido por uma resposta, por exem-

28

A . C harles C atania

pio, tanto um estmulo como uma conseqn cia, mas o alimento apresentado, independente mente do comportamento, somente um estmu lo; o choque evitado por uma resposta um est mulo, mas a conseqncia da resposta a au sncia do choque, o que no um estmulo. No que diz respeito a estmulo e resposta, a relao entre os usos tcnico e coloquial no to simples. Os estmulos so eventos no mundo e as respostas so instncias do comportamento. O termo estmulo freqentemente restrito aos eventos fsicos especficos, tais como luzes, sons ou toques. Mas os organismos podem responder a caractersticas variadas do ambiente, incluin do as relaes (p. ex., esquerda de, acima de), o comportamento complexo (p. ex., expresses faciais, tons de voz), as propriedades funcionais (p. ex., comestvel, confortvel) e assim por di ante (cf. Gibson, 1979). Freqentemente tais ca ractersticas ambientais sero tratadas como es tmulos, mesmo que no sejamos capazes de es pecificar as dimenses fsicas que as caracteri zam. A linha entre os estmulos e as respostas raramente ambgua. Ainda assim, s vezes os ca sos especiais complicam nossas definies. O que dizer, por exemplo, dos estmulos que se ori ginam no organismo? Consideremos a diferen a entre um rudo intenso e o incmodo de uma dor de dente (a dor de dente pode ser vista como uma ocasio para ir ao dentista). Eles diferem no sentido de que o rudo pblico, e a dor privada; em outras palavras, o rudo pode ser ouvido por mais de uma pessoa, enquanto a dor de dentes pode ser sentida apenas pela pessoa que tem o dente afetado. Isso seria um problema se insistssemos em que todos os estmulos tivessem que estar fora do organismo, mas se existissem re ceptores apropriados, no teramos razo para ex cluir, como estmulos, partes importantes do mun do que estariam dentro da pele do organismo. Quanto ao termo resposta, o uso coloquial freqentemente implica que a resposta seja uma resposta a algo (tipicamente um estmulo). Contudo, o termo no funcionar dessa forma aqui, porque uma explicao do que causa as respostas inclui, tipicamente, outros fatores (p. ex., suas conseqncias passadas, caractersticas do organismo) alm dos estmulos em cuja pre

sena elas ocorrem. Levando em conta tais re servas, consideremos agora algumas outras pro priedades dos estmulos e das respostas. Um estmulo um evento ambiental, mas tais eventos tm graus variados de complexidade. No exemplo em que o choro do beb produzia a aten o da me, consideramos a me como um est mulo. O ambiente do beb certamente diferen te, quando sua me est presente e quando ela est ausente. Porm, que tipo de estmulo a me? No sabemos que aspectos de sua aparn cia, de sua voz ou de seu toque so importantes para a criana, nos primrdios de sua vida. Po demos especular que o beb no reagiria me da maneira usual se ela se aproximasse dele usan do uma mscara cirrgica, mas no poderamos estar certos, a menos que fizssemos o experi mento. A despeito de nossa ignorncia em rela o a essas questes, no temos dvida de que a me uma parte importante do ambiente do beb e podemos ainda considerar til falar dos efeitos que a me tem, medida que entra e sai do mun do do beb. Esse exemplo ilustra, novamente, os diferen tes problemas de estrutura e de funo. Quando tentamos analisar que caractersticas visuais, au ditivas e tteis da me so importantes para o beb, estamos lidando com a estrutura deste es tmulo complexo, a me. Poderamos nos per guntar como o beb aprende a responder a um indivduo particular como a me, apesar das mu danas em seu vesturio ou penteado, em sua expresso facial ou em sua postura. Se, por ou tro lado, nos concentrarmos em como a me in terage com as respostas do beb, estaremos pre ocupados com o significado funcional da me no ambiente da criana. Se ela est chorando, por exemplo, pode no ser relevante se ela reco nhece a me por sua face, pelos cabelos ou pela voz, contanto que sua presena faa alguma di ferena; seria suficiente notar que quando a me se aproxima da criana, o choro pra. Mais adiante, falaremos em estmulos ainda mais simples: luzes, sons, alimento na boca. Mas, mesmo com os estmulos mais simples, teremos que distinguir entre os problemas estruturais, como ao analisar as propriedades dos estmulos, e os problemas funcionais, ao analisar as intera es entre os estmulos e as respostas.

A pr en d iza g em 2 9

E quanto s respostas? Como devemos lidar com elas? Ao descrev-las, encontramos pelo menos duas dificuldades. A primeira que o comportamento no se repete exatamente da mesma forma de uma ocorrncia para outra. Se a criana agarra um objeto em duas ocasies di ferentes, o agarrar no ser o mesmo a cada vez. A diferena pode ser pequena, na fora do agar rar, por exemplo, ou na posio exata dos dedos. Mas, se houver qualquer diferena que seja, de vemos nos perguntar se deveramos considerar as duas ocorrncias do agarrar como duas ins tncias da mesma resposta ou como duas res postas diferentes. Devemos falar no de respos tas individuais, mas de classes de respostas com propriedades em comum. A segunda dificuldade que as respostas, s vezes, so adequadamente descritas em termos de movimentos, mas, outras vezes, a descrio deve incluir o ambiente em que as respostas ocor rem. Suponhamos que desejemos comparar, por exemplo, as instncias em que o beb sustenta um objeto com a mo fechada. Em termos dos msculos que se movem, segurar ou agarrar um objeto com a mo direita tem mais em comum do que segurar um objeto com a mo direita e com a mo esquerda. Contudo, s vezes, pode ser mais importante falar de segurar um objeto, no importa com que' mo, do que falar do mo vimento de uma mo em particular. Uma anlise do comportamento deve fazer uma distino entre os movimentos, respostas de finidas por sua forma ou pela musculatura em pregada, e as aes, respostas definidas por suas relaes com o ambiente. Para nossos propsi tos, vamos verificar que aes so mais impor tantes. Consideremos com que freqncia fala mos em fazer coisas, ir a lugares ou manipular objetos, sem levar em conta os detalhes de como ssas aes so executadas. Mesmo na ausncia de movimento, podemos :oncluir, s vezes, que ocorreu um comportamen to. Por exemplo, normalmente um beb agarra as dedos de um adulto to fortemente que pode ser levantado no ar. Uma vez levantado, o beb pode no se mover enquanto segura pelo dedo e linda assim, o simples fato de que ele no cai leva-nos a concluir que a resposta de agarrar con tinua. Do mesmo modo, se vemos um adulto pa

rado em p, nosso julgamento de que ele est se comportando provm, parcialmente, de nosso co nhecimento de que ele cairia se estivesse incons ciente ou morto. Poderamos argumentar que o adulto em p est, de fato, apresentando movi mentos pequenos, imperceptveis, mas, mesmo que ocorram ligeiros ajustes posturais da pessoa que est de p, no precisamos observ-los para concluir que a pessoa est se comportando. A caracterstica crtica do agarrar da criana e do ficar de p do adulto , simplesmente, que essas respostas tm um efeito; nenhum dos dois cai. Assim, nem todos os movimentos precisam ser instncias do comportamento, e nem todas as instncias do comportamento precisam ser mo vimentos. Fazemos muitas coisas que no en volvem qualquer movimento bvio. Quando ouvimos msica, por exemplo, podemos mudar nossa ateno de um instrumento para outro. A mudana de ateno comportamento, mesmo que no seja medida como um movimento. Mui tos aspectos do pensar e do imaginar no envol vem qualquer movimento, mas, como as coisas que fazemos, elas so variedades de comporta mento. Quer o comportamento envolva ou no os movimentos, ele tipicamente tem conseqncias, e uma das conseqncias mais relevantes do comportamento que ele cria oportunidades para outros comportamentos. Se uma criana recebe um biscoito, por exemplo, o biscoito lhe d a oportunidade de comer. A importncia do bis coito baseada no comportamento de comer da criana, seu comportamento com relao quele estmulo. Como teremos reiteradas oportunida des de ver, no podemos caracterizar os estmu los independentemente do comportamento do organismo, nem podemos caracterizar as respos tas independentemente do ambiente do organis mo.

HIERARQUIAS COMPORTAMENTAIS Uma maneira de se classificar o comporta mento de um organismo ordenar as respostas de acordo com as freqncias relativas com que o organismo as realiza. Por exemplo, se damos a uma criana a oportunidade de comer, brincar

3 0 A . C ha rle s C atania

ou tomar banho, podemos verificar que a crian a brinca bastante, come de vez em quando, e dificilmente toma a iniciativa para tomar banho. Brincar, como o comportamento mais provvel, vem primeiro na ordem, seguida pelo comer e, ento, pelo tomar banho. Essa ordenao tem sido chamada de hierarquia de comportamento (cf. a hierarquia de famlias de hbitos de Hull, 1943). Uma maneira equivalente de se descre ver essa ordenao a linguagem da prefern cia: poderamos dizer que a criana prefere jo gar a comer e que prefere qualquer destes dois a tomar banho. As hierarquias de comportamento so mut veis. Se esperssemos at o momento da refei o e dssemos a escolha entre comer e brincar, poderamos descobrir que o comer tornou-se mais provvel do que o brincar ou, em outras palavras, que o comer deslocou-se para o alto da hierarquia em relao ao brincar. Enquanto est comendo, a criana no est brincando nem tomando banho, mas poderamos verificar as posies relativas dessas duas respostas, dan do criana a escolha entre os brinquedos e a banheira. Talvez descobrssemos que esta cri ana quase sempre prefere os brinquedos. Assim podemos concluir que, agora, brincar com os brinquedos est acima do tomar ba nho na hierarquia de comportamentos desta criana. Podemos mesmo verificar que a criana sem pre deixa a rea de banho, mesmo quando no h muito mais o que fazer, em outro lugar. Pode ser que a criana tenha tido uma m experincia ali, recentemente. Para qualquer tipo de compor tamento, devemos considerar quando ele come a e quando termina.

Em geral, conveniente falar de estmulos, em vez de oportunidades para responder. Assim, para a criana do exemplo podemos descrever a comida como um estmulo ou evento apetitivo e tomar banho como um evento aversivo, enquan to os eventos que no so nem apetitivos nem aversivos seriam categorizados como neutros. Infelizmente, mesmo que sejamos capazes de empregar esses termos em situaes especficas, os estmulos em geral no podem ser agrupados to facilmente. Os contextos fazem muita dife rena. No podemos simplesmente dividir o ambiente em trs classes de eventos, chamados apetitivos, neutros e aversivos. Pelo contrrio, devemos avaliar cada estmulo em relao a ou tras variveis. Com mudanas na hierarquia de comporta mentos, surgem mudanas na importncia dos estmulos. Consideremos, por exemplo, como a comida pode mudar de apetitiva para aversiva durante um jantar de feriado excessivamente lon go. Na banheira, por exemplo, se os pais mane jarem a situao com cuidado, a criana pode comear a tolerar os banhos e, eventualmente, vir a preferir os brinquedos na banheira do que os brinquedos em outros lugares. De qualquer modo, medida que o comportamento da criana muda, podemos dizer que a criana est aprenden do alguma coisa sobre brinquedos e banheiras. Revimos, at aqui, algumas das proprie dades gerais dos estmulos e das respostas medida que eles entram nas relaes entre os antecendentes, o comportamento e as conse qncias. Com esses preliminares como base, estamos prontos para avanar para alguns ex perimentos e descobertas clssicas na Psico logia da Aprendizagem.

A pr en d iza g em 3 1

Uma Taxonomia do Comportamento

A. A Observao do Comportamento B. A Apresentao de Estmulos C. Operaes Conseqiienciais D. Operaes de Sinalizao ou de Controle de Estmulo Sinalizao de Apresentaes de Estmulo Sinalizao de Conseqncias E. Estabelecendo a Efetividade das Conseqncias F. Resumo

(cair), relaciona-se a case (caso), accident (acidente), chance (chance) e coincidence (coincidncia).

Uma taxonomia um sistema de classificao. A palavra deriva do grego tassein, to arrange (arran jar), mais a raiz grega nomia, method (mtodo). Par tilha sua primeira raiz com o termo gramatical syn tax (sintaxe), com tactic (ttica) e com taxis (taxia), um tipo de movimento; a segunda raiz partilhada com disciplinas sistemticas como a astronomia e a economia, com metrnomo e autonomia, e prova velmente mesmo com nmero. As respostas, dependendo de suas relaes com os estmulos eliciadores, as conseqncias, as ope raes estabelecedoras e os estmulos discriminati vos so ditos eliciados, emitidos, evocados ou oca sionados. Todos os quatro termos tm razes latinas. As trs primeiras partilham um prefixo abreviado de ex-, out (fora): eliciar, derivada elaqueus, noose( n) ou snare ( lao), est relacionada a delight (deleite) e latch (amarra); emitir, derivada de mittere, to send (mandar) ou let go (deixar ir), est relacionada a to omit (omitir) e intermitent (intermitente); evocar, de rivada de vocare, to call (chamar), est relacionada a vocal e invocar. A palavra occasion (ocasio), deri vada do prefixo ob-, against (contra), ecadere, to fali

Este captulo oferece um esboo de uma ta xonomia comportamental ou, em outras palavras, um vocabulrio que permite organizar os vrios procedimentos e fenmenos do comportamen to. Em vez de tentar explicar as instncias do comportamento como leis formais, vamos bus car uma classificao sistemtica do comporta mento em termos de suas origens. A taxonomia no ser exaustiva, porque no podemos anteci par tudo o que vai ocorrer medida que estuda mos o comportamento. A cincia do comporta mento complexa, est em progresso e prova velmente continuar progredindo. Mas podemos, ao menos, almejar um sistema descritivo, que or ganize os fenmenos sobre os quais sabemos alguma coisa, sem excluir aqueles que ainda es to por investigar. Os procedimentos utilizados no estudo do comportamento podem ser chamados de opera es experimentais, e as mudanas que produ zem no comportamento so denominadas de pro cessos comportamentais. Estudamos a relao entre os eventos ambientais e o comportamento do organismo manipulando o ambiente e obser vando como isso afeta o que o organismo faz. Operamos sobre o ambiente do organismo ou, em outras palavras, efetuamos certas operaes experimentais. Na anlise do comportamento, as operaes so o que o experimentador faz, ar ranja ou programa, e os processos so as mu danas que resultam no comportamento. (Uma

analogia conveniente vem da Medicina, onde a operao cirrgica o que o mdico faz ao pa ciente, e os processos que se seguem so os efei tos da operao, como mudanas na circulao, na respirao, etc.) Os procedimentos para apren dizagem podem ser descritos em termos destas operaes, isoladas ou em combinao. A operao mais simples, logicamente, con siste meramente em (1) observar o comporta mento. O comportamento que observamos nos diz o que um organismo capaz de fazer. Mas no temos nenhum controle sobre os eventos quando apenas observamos, assim pode ser que no sejamos capazes de tirar concluses sobre as causas do comportamento. Devemos, ento, intervir, e a interveno mais simples consiste em (2) apresentar estmulos. Uma outra inter veno, mais complicada, consiste em (3) pro gramar o ambiente de modo que o comportamen to do organismo tenha determinadas conseq ncias. Uma vez que as respostas apresentam conseqncias, elas podem ocorrer mais ou me nos freqentemente e, assim, as operaes conseqenciais levam aos processos denominados de reforo e punio. Ainda no esgotamos as possibilidades: po demos programar as coisas de modo que (4) os estmulos sinalizem a apresentao de outros es tmulos ou que (5) os estmulos sinalizem a opor tunidade de produzir conseqncias. Falamos, ento, de operaes de controle de estmulos', essas operaes podem ocorrer apenas em com binao com uma das operaes mais simples, apresentar estmulos ou programar conseqn cias. O comportamento pode, ento, depender da presena ou da ausncia do estmulo sinaliza dor. Devemos considerar tambm as operaes que (6) podem mudar os efeitos das conseqncias do comportamento, como quando o alimento se toma um reforador mais potente depois de um perodo de privao de alimento. Tais operaes so chamadas de operaes estabelecedoras, no sentido de que estabelecem as condies sob as quais as conseqncias podem tomar-se efeti vas como reforadoras ou como punidoras. Assim, as operaes bsicas que iremos con siderar so: (1) observar o comportamento, (2) apresentar estmulos, (3) programar conseqn cias para as respostas, (4) sinalizar estmulos, (5)

sinalizar conseqncias e (6) esbabelecer a efe tividade de conseqncias. A seguir, vamos exa minar vrios experimentos clssicos para ilus trar essas operaes e introduzir alguns dos prin cipais pesquisadores da histria da Psicologia da Aprendizagem.

Seo A

A Observao do Comportamento

O que devemos fazer para observar o com portamento? Na seo anterior, argumentamos que comportamento interessante depende de ambientes interessantes. O que aconteceria se tentssemos outra direo, evitando a contami nao do comportamento pelo ambiente? Ima gine, por exemplo, pegar um rato e faz-lo usar vendas, para diferenciar os estmulos visuais, e tampes nos ouvidos, para diferenciar os sons. Ento, removemos os odores com um sistema de ventilao. Considerando que o rato ainda pode tocar coisas, incluindo seu prprio corpo, desenvolvemos um traje feito de tubos ocos que mantenha suas pemas presas, reduzindo o con tato ttil, pelo menos, para as patas. Isso ainda pode ser insatisfatrio, porque o peso do rato produz presso nos pontos em que o traje toca partes de seus corpo e assim possibilita que ele se oriente no espao. O prximo passo enviar o rato equipado para uma estao orbital, onde a gravidade eliminada. Contudo, depois que ti vssemos realizado tudo isso, o que poderamos dizer acerca de seu comportamento? O que po deramos observar o rato fazendo? O exemplo do rato hipottico, mas alguns experimentos sobre a privao sensorial coloca ram pessoas em ambientes que se aproximam das condies de estimulao mnima que imagina mos para o rato. O problema que, em ambien tes como esse, tanto para uma pessoa como para um roedor, no h muito o que fazer; no h qual quer lugar para ir e ningum com quem falar. Embora as pessoas em tais ambientes relatem uma gama de atividades durante o tempo em que passam acordadas, do pensar ao alucinar, no surpreendente que elas passem a maior de seu tempo dormindo.

A prend iza gem 3 3

Estvamos certos de incio. Para observar comportamento interessante, temos que obser var o organismo em um ambiente interessante. Vamos considerar alguns exemplos. Nos primr dios do estudo da Psicologia da Aprendizagem, especulaes sobra a natureza da aprendizagem baseavam-se, freqentemente, em evidncia ane dtica derivada da simples observao, como a seguinte:
A maneira pela qual meu cachorro aprendeu a le vantar o trinco do porto do jardim e passar para o lado de fora um bom exemplo de comportamento inteligente. O porto de ferro na entrada de minha casa preso por um trinco, mas desloca-se e abre com seu prprio peso, se o trinco estiver levantado. Sempre que queria sair ofo x terrier levantava o trin co com o dorso de sua cabea, e assim soltava o porto que ficava escancarado...Como ele aprendeu o truque? Nesse caso particular, a questo pode ser respondida, porque ele foi cuidadosamente obser vado. Quando era colocado para fora da porta, ele naturalmente queria sair para a rua, onde havia muita atrao - a oportunidade de correr, outros cachor ros para provocar, possivelmente gatos com que se preocupar. Ele olhava impaciente atravs da cerca... e no devido tempo teve a oportunidade de olhar de baixo do trinco, levantando-o com sua cabea. Ele retirou a cabea e olhou em outra direo, mas o porto se abriu... Depois de umas dez ou doze expe rincias, em cada uma das quais a sada foi efetuada mais rapidamente, e com menos olhares para luga res errados, o fo x terrier tinha aprendido a ir direto e sem hesitao ao lugar exato. Neste caso, levantar o trinco aconteceu inquestionavelmente por acidente e o truque apenas tomou-se habitual pela associa o repetida com a mesma situao da ao casual e da fuga feliz. Uma vez firmemente estabelecido, no entanto, o comportamento permaneceu constante pelo resto da vida do cachorro, uns 5 ou 6 anos. (Morgan, 1920, p. 144)

te, um posto avanado para a espionagem alem envolvendo operaes navais da Primeira Guer ra Mundial: Ley, 1990). Em alguns dos experi mentos de Khler, bananas ou laranjas eram co locadas em locais visveis, mas inacessveis, e os chimpanzs usavam materiais dentro da rea como ferramentas para obter a fruta. A seguinte passagem descreve o comportamento do chim panz macho, Sulto:
Os seis animais jovens da colnia da estao esta vam dentro de uma sala com paredes perfeitamente lisas e cujo teto - cerca de dois metros de altura no podiam alcanar. Uma caixa de madeira..., aberta em um dos lados, estava situada no meio da sala, o lado aberto na vertical, e em plena vista. O objetivo estava pregado em um canto no teto, cerca de dois metros e meio da caixa. Todos os seis macacos ten taram, em vo, alcanar a fruta saltando do solo. Sulto logo abandonou essas tentativas, andou in quieto de um lado para outro, subitamente parou em frente caixa, estimou seu tamanho, pegou-a, virou-a apressada e diretamente rumo ao objetivo, mas comeou a subir nela a uma distncia (horizon tal) de meio metro, e, saltando para cima com toda sua fora, desgrudou a banana. Cerca de cinco mi nutos haviam se passado desde que a banana fora presa no teto; da pausa momentnea diante da caixa at a primeira mordida na banana, apenas alguns segundos se passaram, uma ao perfeitamente contnua aps a primeira hesitao (Khler, 1972, pp. 39-40).

Observar esse comportamento, talvez, tenha sido um acidente feliz, como o do cachorro le vantando o trinco. Mas pode-se aprender mais sobre a aprendizagem pelo arranjo dos ambien tes nos quais o comportamento observado. Um pesquisador que fez isso foi Wolfgang Khler, um dos fundadores da Psicologia da Gestalt. Khler estudou o comportamento de chimpan zs mantidos, de 1913 a 1917, na Estao Antropide de Tenerife, uma ilha ao noroeste da frica (Khler, 1927; os chimpanzs no so na tivos de Tenerife, e a estao era, provavelmen
34 A . C harles C atania

Em muitos casos, claro, os chimpanzs fize ram tentativas mal sucedidas de resolver proble mas como esses. Khler discutiu essas observaes e outras relacionadas, em termos de insight e intelign cia dos chimpanzs. Mais importante, talvez, ele demonstrou o quanto os chimpanzs eram capa zes de fazer. Os chimpanzs eram muito menos familiares naqueles dias do que atualmente, e os leitores de seu tempo estavam impressionados por suas descries do desempenho do chimpan z. O problema que no era possvel dizer, com base apenas na observao, de onde provinha o comportamento. Seria Sulto capaz de resolver um problema particular por causa de alguma dis posio cognitiva herdada? Por que o problema tinha caractersticas em comum com alguma si tuao que ele j tivesse encontrado? Por que ele tinha visto outros chimpanzs cujo compor tamento podia imitar? Ou por causa de alguma combinao desses e de outros fatores?

Khler achava o termo insight (descoberta sbita) apropriado, devido ao aspecto sbito com que a soluo do problema freqentemente emer gia. Essa soluo de problemas que parecia ba seada em insights levou a outras questes: se a aprendizagem tinha lugar gradual ou abrupta mente, e se este tipo de resoluo de problema poderia ser explicitamente ensinado. Debates acerca do quanto os primatas no-humanos po dem aprender continuam at os dias de hoje. Mas a observao por si s raramente identifica as fontes do comportamento e, assim, raramente re solve tais questes. A rigor, Khler fez mais do que simplesmente observar o comportamento. Ele arranjou os am bientes dentro dos quais suas observaes eram feitas. Observao sem interveno algo dif cil de se conseguir. Para ser bem-sucedido na observao dos organismos na situao natural, preciso saber os possveis efeitos de uma pre sena humana sobre seu comportamento. Mes mo levar um organismo para o cativeiro , em si mesmo, uma interveno. Para estudar tais efei tos, deve-se apresentar os estmulos apropriados. Em qualquer estudo do comportamento, ento, apresentar estmulos praticamente inevitvel.

seu pescoo e, logo, uma intumescncia aparece em sua base. A intumescncia desloca-se para cima, cau sando as deformaes mais assustadoras e as voltas e contores mais peculiares do pescoo. Subita mente, ela abaixa a cabea e regurgita um enorme monte de alimento meio digerido. Isto cai e um pe queno pedao agora pego e apresentado aos filho tes. Eles redobram seus esforos e, logo, apoderamse do alimento, ao que ela lhes apresenta um novo bocado. Uma vez ou outra, os filhotes bicam o ali mento no cho, mas, mais freqentemente, o alvo o bico do progenitor e, embora sua pontaria no seja sempre certeira, raramente, eles precisam mais que trs ou quatro tentativas at que acertem (Tinber gen, 1960, p. 178).

Seo B

A Apresentao de Estmulos

Khler, de fato, apresentou estmulos quan do programou o ambiente para os chimpanzs que observou. Ento, vamos considerar um con junto de exemplos em que o papel dos estmulos examinado mais diretamente. A seguinte pas sagem, pelo etlogo Niko Tinbergen, descreve o primeiro episdio de alimentao do filhote da gaivota arenque:
As vezes o pssaro adulto levanta-se e olha para o ninho abaixo e, ento, podemos ver o primeiro com portamento de solicitao dos filhotes. Eles no per dem tempo contemplando ou estudando o progeni tor, cuja cabea eles vem pela primeira vez, mas comeam a bicar imediatamente na ponta do bico dele, com arremessos relativamente certeiros, repe tidos e rpidos de seus pequenos bicos. Eles nor malmente abrem as asas e soltam uns fracos piados. A velha ave no pode resistir a isso e, se os filhotes persistirem, ela os alimentar. Primeiro ela estica

Por enquanto, temos aqui apenas algumas observaes do comportamento dos filhotes. Mas elas envolvem os efeitos dos estmulos e, por tanto, provocam algumas questes. Quais so, exatamente, as caractersticas crticas desses estmulos especiais apresentados pela gaivotame? Algumas so mais importantes que outras? Seriam elas as mais efetivas? Tinbergen disps-se a responder a essas ques tes preparando estmulos que se assemelhassem, de vrias formas, gaivota-me. Ento, ele me diu o bicar quando esses estmulos eram apre sentados a filhotes de gaivota arenque recmsados da casca do ovo. A gaivota arenque tem uma cabea branca e um bico amarelo com uma mancha vermelha prxima da extremidade. Um bico com uma mancha negra, azul ou branca gerou menos bicadas do que um com uma man cha vermelha, mas um bico com uma mancha de qualquer cor produziu mais bicadas do que um bico sem qualquer mancha. Comparadas man cha vermelha, as cores do bico e da cabea foram relativamente irrelevantes na gerao de bicadas. De fato, desde que o modelo ti vesse um bico com uma mancha vermelha, a presena ou a ausncia de uma cabea fazia pouca diferena. Tinbergen variou tambm a forma do bico, como ilustrado na Figura 2.1. Ao lado de cada estmulo, o bicar mostrado como uma porcen tagem do nmero de bicadas gerado pela forma normal do bico, o primeiro, em cima. A mancha vermelha e outras diferenas de cor foram eli minadas, de modo que as mudanas no bicar po deriam ser atribudas apenas a mudanas na for ma. A maior parte dos modelos produziu menos
A prend iza gem 3 5

FIGURA 2.1 Uma srie de modelos empregados na an lise de quais propriedades do bico da gaivota-me pro duzem bicadas de solicitao no filhote recm-sado da casca. Ai bicadas em cada um dos outros modelos so expressas como porcentagem do nvel de referncia (100%) dado pelas bicadas no modelo superior. (Adap tado de Tinbergen & Perdeck, 1950, Figura 15.)

bicadas do que o modelo com a forma normal de bico. O modelo com um bico alongado (embai xo) produziu consideravelmente mais bicadas do que quaisquer outros, incluindo aquele com a forma normal de bico. Devido sua efetividade em relao forma normal, Tinbergen referiuse a este modelo como um estmulo supernor mal, mas ele especulou que a forma deste mode lo particular poderia ser mais parecida com aque la que o fdhote v primeiro, no bico de seu pro genitor, quando olha para cima, por baixo da cabea do pssaro adulto, do que a vista de per fil, usada para a maior parte dos outros modelos. Tinbergen variou tambm outras proprieda des do bico da gaivota, como o movimento, a inclinao e a altura do solo. Sua anlise permi tiu que construsse um estmulo verdadeiramen te supernormal, um basto vermelho na forma de um lpis com trs faixas brancas estreitas, que gerou mais bicadas do que um modelo acurado tridimensional da cabea de uma gaivota aren

que. Mais importante, ele foi capaz de especifi car as caractersticas da cabea da gaivota adul ta que eram importantes para gerar bicadas e de distingui-las das caractersticas sem importn cia. Em outras palavras, ao apresentar estmulos e observar seus efeitos, Tinbergen foi capaz de identificar a estrutura crtica dos estmulos que geravam bicadas nos filhotes recm-nascidos de gaivota arenque. As apresentaes de estmulo so uma carac terstica comum da pesquisa conduzida por etlogos, cuja preocupao a evoluo de padres especficos da espcie e comportamentos nos ambientes naturais (habitats) de um organismo. Um dos efeitos de apresentaes de estmulo, como acabamos de ver, a produo de respos tas. Esse processo, um resultado da apresenta o de estmulos, chamado de eliciao\ dizse que o estmulo elicia uma resposta. Na lin guagem da etologia, os estmulos crticos ou as caractersticas crticas do estmulo so chama dos de liberadores (releasers), e o comportamen to que eles produzem chamado de padro fixo de ao. Mas as variaes na terminologia no deveriam obscurecer a simplicidade da opera o bsica de apresentar estmulos. Os efeitos eliciadores ou liberadores de est mulos podem mudar ao longo do tempo. Dados dos filhotes da gaivota risonha (laughing gull) mostram um exemplo. A alimentao no filhote da gaivota risonha difere em detalhes daquela da gaivota arenque, mas inclui o bicar de solici tao no bico da ave adulta, seguido pela regur gitao do alimento parcialmente digerido por ela, que o filhote, ento, come. A preciso das bicadas de solicitao foi testada pela apresen tao de modelos a filhotes de idades variadas. Apenas um tero das bicadas de filhotes recmnascidos atingia o modelo, ao contrrio dos fi lhotes de dois dias, para os quais mais de trs quartos das bicadas eram precisas (Hailman, 1969). A melhora na preciso ter sido em funo de mu danas na coordenao ou na experincia visual, ou em outros fatores? Alguns tipos de comporta mento podem estar embutidos ou ser pr-programados no organismo, enquanto outros podem ser aprendidos. Como podemos dizer qual qual? As conseqncias de bicadas certeiras dife rem das de bicadas no-certeiras. No habitat na

36

A . C harles C atania

tural da gaivota risonha, mais provvel que uma bicada certeira seja seguida do regurgitar de co mida pelo progenitor do que uma no-certeira. As bicadas precisas podem aumentar, em rela o s bicadas fora do alvo, devido s diferen as em suas conseqncias. As observaes de Hailman so consistentes com essa idia:
Se um filhote inexperiente est inicialmente prxi mo demais do alvo, o impacto de sua bicada contra o bico ou modelo to grande que o filhote joga do para trs, cerca de uma polegada (2,4cm). Se o filhote comea longe demais do alvo, o mpeto da bicada perde o alvo, e o filhote cai para a frente, cerca de duas polegadas. Os filhotes mais velhos raramente cometem tais erros grosseiros, o que su gere que a experincia de bicar de muito longe e de muito perto ajudou o filhote a aprender a ajustar sua distncia (Hailman, 1969, p. 100).

Quase no final do sculo XIX, Thorndike des crevia seus procedimentos do seguinte modo:
Escolhi, como meu mtodo geral, um que, simples como , possui vrias outras vantagens notveis, alm daquelas que acompanham um experimento de qualquer tipo. O mtodo consistiu meramente em colocar animais, quando famintos, em espaos fe chados, dos quais eles poderiam escapar por meio de algum ato simples, como puxar um lao de cor da, pressionar uma barra ou pisar sobre uma plata forma... O animal era colocado no espao fechado, o alimento era deixado vista, do lado de fora, e suas aes eram observadas. Alm de resgistrar seu comportamento geral, ateno especial era diri gida a como ele fazia para desempenhar o ato necessrio (caso ele fosse bem-sucedido), e faziase o registro do tempo que ele levava dentro da cai xa, at desempenhar a puxada, a unhada ou a mor dida bem-sucedida... Se, por outro lado, aps um certo tempo, o animal no tivesse sido bem-sucedi do, ele era retirado, mas no alimentado (Thorndi ke, 1898, pp. 5-6).

Para estudar tais casos, no suficiente a sim ples apresentao de estmulos. Uma operao mais complexa deve ser programada: os estmu los devem ser apresentados como conseqncias do comportamento do organismo.

Uma das caixas-problema de Thorndike ilustrada na Figura 2.2. Em tais aparatos, Thorn dike estudou gatos, cachorros e pintinhos. Ele apresentou a seguinte descrio como tpica do comportamento da maioria dos gatos:
Quando colocado dentro da caixa, o gato mostrava sinais evidentes de desconforto e de um impulso a

Seo C

Operaes Conseqenciais

Novamente recorremos a um novo conjunto de exemplos, desta vez baseados na pesquisa sobre inteligncia animal, desenvolvida pelo psi clogo norte-americano Edward L. Thorndike. A diferena crtica entre a pesquisa de Thorndi ke e a de Khler que Thorndike observou, sis tematicamente, certas mudanas no comporta mento, ao longo de muitas repeties do com portamento de um organismo em uma dada si tuao, em vez de restringir sua ateno a ins tncias unitrias de resoluo de um problema. Thorndike notou, tipicamente, as mudanas gra duais no comportamento, ao longo de muitas re peties, ao contrrio das mudanas sbitas ou abruptas tipicamente relatadas por Khler, tal vez porque os problemas que ele estudou no levassem a solues sbitas ou baseadas em nsights. O mais importante que os experi mentos de Thorndike demonstraram o quanto o responder geralmente depende de suas con seqncias passadas.

FIGURA 2.2 Na maioria das caixas que Thomdike (1898) empregou, o animal tinha um nica maneira de abrir a porta. Na caixa mostrada, so ilustrados trs mtodos diferentes para abrir a porta: um pedal dentro da caixa (A); um arame ou corrente que podia ser al canado de dentro da caixa (B); e duas tramelas, que podiam ser alcanadas de dentro para destrancar a porta (C). A porta (D) geralmente tinha um contrapeso, de modo que ela se abria por si mesma quando o ani mal executava a resposta apropriada.

A prend iza gem 3 7

escapar do confnamento. Ele tenta se espremer por qualquer abertura: arranha e morde as barras ou o arame; empurra suas patas para fora, atravs de qual quer abertura, e agarra tudo o que alcana; continua seus esforos quando alcana alguma coisa solta ou instvel; pode unhar coisas dentro da caixa... O gato que est unhando por todos os lados da caixa, em sua luta impulsiva, provavelmente agarrar o bar bante, lao ou boto que abre a porta. E gradual mente, todos os outros impulsos mal sucedidos se ro apagados (stamped out), e o impulso particular que levou ao ato bem-sucedido ser impresso (stam ped in ) pelo prazer resultante at que, aps muitas tentativas, o gato, quando colocado na caixa, agar rar imediatamente o boto ou o lao, de uma forma bem-definida (Thomdike, 1898, p. 13).

Como conseqncia de suas respotas, o gato escapava do confinamento e tambm ganhava acesso ao alimento. Podemos supor que tanto a fuga como o alimento eram importantes para fa zer com que a resposta bem-sucedida gradual mente dominasse as outras, mal sucedidas. De qualquer modo, o procedimento no pode ser simplesmente reduzido apresentao de est mulos. Uma nova parte do ambiente no era ape nas apresentada ao gato; ela se tornava dispon vel como uma conseqncia do que ele havia feito. O comportamento do gato mudava como resultado dessa operao de conseqenciao. Experimentos contemporneos, freqentemente, examinam respostas mais simples em situaes mais simples, mas esto igualmente interessa dos nas relaes entre as respostas e suas conse qncias. Programamos conseqncias para as respos tas, construindo ambientes. Se colocamos ali mento no compartimento-alvo de um labirinto, por exemplo, criamos um ambiente em que a conseqnica para a locomoo de um rato, do com partimento de partida ao compartimento-alvo, ser encontrar o alimento. Depois que o rato al cana o alimento uma vez, podemos descobrir como essa conseqncia afeta seu comportamen to, examinando o que ele faz da prxima vez que o colocamos no compartimento de partida. As conseqncias que programamos podem variar de eventos de significao biolgica b via, como apresentar alimento ou gua, at mu danas relativamente pequenas em coisas vistas, ouvidas ou tocadas. Mas nem todas as conse qncias envolvem a produo de estmulos: as

respostas podem alterar os estmulos, quando, por exemplo, a rotao de um redutor de inten sidade muda o brilho de uma lmpada; elas po dem remover os estmulos, como quando a ope rao de um interruptor desliga uma lmpada; elas podem prevenir os estmulos, como quando tirar o fio da tomada, antes de consertar a lm pada, elimina a possibilidade de choque; elas po dem, at mesmo, mudar as conseqncias de outras respostas, como quando a substituio de uma lmpada queimada faz com que a resposta de operar o interruptor de luz volte a ser nova mente eficaz. Qualquer mudana ambiental pode ser uma mudana produzida por uma resposta. Duas classes de conseqncias podem ser distinguidas com base em seus efeitos sobre o comportamento. As conseqncias reforadoras so as que aumentam ou mantm o responder; as conseqncias punitivas so as que diminu em ou suprimem o responder. (E til, tambm, dispor de um termo que no prejulgue se as con seqncias sero reforadoras ou punitivas. O termo conseqenciao foi introduzido com este propsito. Por exemplo, se no sabemos se es trelinhas douradas reforaro o comportamento de uma criana de jardim de infncia em sala de aula, ainda assim seria apropriado falar em conseqenciar o comportamento com estrelinhas douradas; p. ex., Powers & Osbome, 1976.)

Seo D

Operaes de Sinalizao ou de Controle de Estmulo

Quando os estmulos se tomam efetivos como sinais geralmente os chamamos d&estmulos dis criminativos, e as operaes que envolvem si nais so chamadas de operaes sinalizadoras ou de operaes de controle de estmulos. A apresentao de estmulos e a programao de conseqncias raramente ocorrem isoladamen te: geralmente elas so sinalizadas por outros eventos. Um lampejo de relmpago precede, ti picamente, o estampido de um trovo. Um se mforo alerta o motorista sobre as possveis con seqncias de ir em frente ou de parar em um cruzamento. Esses dois exemplos ilustram que os efeitos sinalizadores ou discriminativos dos

38

A . C h a rle s C atania

estmulos podem ser combinados com apresen taes de estmulo ou com operaes conseqenciais. Retomaremos a eles mais tarde. Ambos demonstram as funes sinalizadoras de estmu los, embora, como veremos, os dois tipos de sina lizao possam ter propriedades muito diferentes.

SINALIZAO DE APRESENTAES DE ESTMULO Os estmulos que sinalizavam a apresentao de outros estmulos eram a base dos experimen tos sobre reflexos condicionais ou condiciona dos, conduzidos pelo fisilogo russo Ivan P. Pavio v. Pavlov (1927) estudou como os estmu los adquiriam propriedades sinalizadoras, de monstrando que respostas a estmulos como o alimento, s vezes, eram produzidas por outros estmulos que tinham precedido o alimento de modo regular e previsvel. Pavlov falava dos efei tos de alimento na boca de um cachorro em ter mos de reflexo alimentar (para Pavlov, os com ponentes de tal reflexo incluam tanto a resposta glandular de salivar, como as respostas motoras como mastigar e engolir). Ele se concentrou na salivao, porque a tecnologia disponvel torna va o salivar mais fcil de medir do que as res postas motoras. O duto de uma das glndulas sa livares do cachorro era exposto, por meio de ci rurgia, para fora de seu queixo e era conectado a um sistema hidrulico que permitia contar as gotas de saliva. Para um cachorro, o som de um metrnomo precedia consistentemente a apresentao de ali mento. Pavlov apresentou a seguinte descrio das condies necessrias para fazer um estmu lo funcionar como sinal:
Em vrias ocasies, esse animal tinha sido estimu lado pelo som do metrnomo, seguido imediatamen te pelo alimento - isto , um estmulo que, em si mesmo, era neutro, tinha sido superposto ao do reflexo alimentar inato. Observamos que, aps v rias repeties da estimulao combinada, os sons do metrnomo tinham adquirido a propriedade de estimular a secreo salivar e de evocar as reaes motoras caractersticas do reflexo alimentar... As sim, o requisito primeiro e mais essencial para a for mao de um novo reflexo condicionado reside na coincidncia temporal da ao de qualquer estmu

lo previamente neutro com algum estmulo incon dicional definido. Alm disso, no suficiente que haja superposio entre os dois estmulos; tam bm igualmente necessrio que o estmulo condici onado comece a operar antes que o estmulo incondicionado entre em ao. Se essa ordem for inverti da, o estmulo incondicionado sendo aplicado pri meiro e o estmulo neutro em seguida, o reflexo con dicionado pode no ser estabelecido de modo al gum. (Pavlov, 1927, pp. 26-27)

Os experimentos de condicionamento de Pa vlov demonstraram como uma operao sinali zadora pode ser superposta operao mais sim ples de apresentao de estmulo.

SINALIZAO DE CONSEQNCIAS Em vez de sinalizar a apresentao de est mulos, um estmulo pode sinalizar as ocasies em que as respostas tero conseqncias. A si nalizao de conseqncias desempenhou um importante papel na histria da Psicologia da Aprendizagem, bem antes que comeasse a ser estudada experimentalmente. Ela esteve envol vida, por exemplo, na anlise do caso de Clever Hans, um cavalo que parecia ter sido ensinado a resolver problemas aritmticos (Pfungst, 1911). O cavalo aparentemente resolvia, com suas pa tas, no apenas adio e multiplicao, mas tam bm raiz quadrada.
O visitante podia andar livremente e, se quisesse, podia aproximar-se do cavalo e de seu mestre, um homem entre 60 e 70 anos de idade. Sua cabea bran ca era coberta por um chapu preto de abas largas. A sua esquerda, o animal majestoso, um cavalo rus so de trote, permanecia como um aluno dcil, ma nejado no por meio de chicote, mas por encoraja mento gentil e recompensas freqentes com po ou cenouras... Nosso cavalo inteligente era certamente incapaz de falar. Seu principal modo de expresso consistia em batidas com a pata dianteira direita. (Pfungst, 1911, pp.18-19)

Clever Hans dava suas respostas pelo nme ro de vezes que batia com a pata. Seu desempe nho foi investigado por Oskar Pfungst, que des cobriu que o cavalo acertava com preciso ape nas na presena do treinador. Alm disso, Cle ver Hans somente sabia as respostas se seu mes tre tambm as soubesse. Assim, Pfungst mudou

A pr end iza gem 3 9

sua ateno do cavalo para o treinador e deter minou que o cavalo estava respondendo a pistas sutis fornecidas pelo comportamento do treinador.
... pensamos descobrir com que movimentos fazer o cavalo parar de bater a pata. Descobrimos que mo vimentos para cima serviam como sinais para parar. Levantar a cabea era o mais efetivo, embora le vantar as sobrancelhas ou a dilatao das narinas como no riso zombeteiro - tambm parecessem ser efetivas.... Por outro lado, movimentos da cabea para a direita e a esquerda ou para a frente e para trs...eram inefetivos. Tambm descobrimos que to dos os movimentos de mo, inclusive o maravilho samente efetivo enfiar a mo no bolso com cenou ras no resultavam em qualquer resposta. (Pfun gst, 1911, p. 63)

O treinador tinha cooperado com a investi gao e no havia qualquer evidncia de que ele estivesse ciente dos sinais que fornecia. Pfungst notou que
as realizaes de Hans so fundadas... em um de senvolvimento unilateral do poder de perceber os mais leves movimentos do questionador... assim, temos justificativas para concluir, a partir do com portamento do cavalo, que o desejo pelo alimento a nica mola efetiva para a ao... A formao gra dual das associaes mencionadas acima, entre a per cepo do movimento e os movimentos do prprio cavalo , com toda a probabilidade, no o resultado de um processo de treino, mas um subproduto nointecional de uma tentativa mal sucedida de uma educao real. (Pfungst, 1911, pp. 240-241)

algumas logo pareciam produzir complexas men sagens datilografadas. No entanto, quando se descobriu que as crianas podiam responder cor retamente a questes somente quando os facili tadores conheciam as questes, tornou-se claro que a comunicao facilitada era uma espcie de fenmeno moderno de Clever Hans (Montee, Miltenberger, & Wittrock, 1995). Os facilitado res vinham guiando ativamente a datilografia, embora em muitos casos no estivessem cien tes, como o treinador de Clever Hans, de que estavam fazendo isso. Os efeitos sinalizadores, como os apresenta dos por Clever Hans, foram, eventualmente, exa minados de modo mais sistemtico. Eles passa ram a ser chamados de funes discriminativas dos estmulos e diferiam, de muitas maneiras, dos tipos de funes sinalizadoras que haviam sido estudadas por Pavlov. A pesquisa que mais decisi vamente estabeleceu a distino foi conduzida pelo psiclogo norte-americano B. F. Skinner, que programou um ambiente em que as presses barra por um rato produziam alimento quando uma luz estava acesa, mas no quando estava apagada, como ilustrado na seguinte passagem:
O aparato consiste de uma cmara escura, bem ven tilada e prova de som... contendo... uma barra ho rizontal, feita de arame pesado, que pode ser pres sionada, aproximadamente, l,5cm para baixo, con tra uma tenso de 10 gramas. Quando a barra se move para baixo, um interruptor de mercrio, dire tamente atrs da parede, fechado. Estamos inte ressados na resposta do rato de pressionar esta bar ra, que podemos definir como qualquer movimento do rato que resulte no fechamento do interruptor. O interruptor opera um comedouro, que deposita uma pelota de alimento, de tamanho padro, dentro da bandeja, onde ela fica acessvel ao rato. O experi mentador pode quebrar vontade a conexo entre a barra e o comedouro... O nico requisito adicional para a investigao de uma discriminao uma fonte extra de energia estimulante... uma pequena lmpada eltrica (3 c.p.)... O experimentador con trola a corrente para a lmpada e a conexo entre a barra e o comedouro, de tal modo que a resposta barra, mais luz, sempre seguida pelo depsito de uma pelota de alimento na bandeja, enquanto que a resposta barra, sozinha, nunca reforada desta forma. O animal finalmente aprende a responder barra quando a luz est acesa, mas a no responder quando a luz est apagada. (Skinner, 1933, pp. 304 305)

Nesse caso, os movimentos do treinador for neciam os estmulos na presena dos quais as batidas da pata eram seguidas por alimento. O caso de Clever Hans demonstra que mesmo as propriedades mais sutis dos estmulos podem si nalizar as conseqncias do responder, e ele freqentemente citado quando os crticos consi deram se um comportamento sofisticado depen de de dicas que possam ter sido no-intencionalmente fornecidas pelos participantes. A comunicao facilitada, por exemplo, foi uma tentativa de fornecer uma terapia para crian as autistas no-verbais. As mos das crianas eram guiadas sobre o teclado de uma mquina de escrever por facilitadores, indivduos que su postamente forneceriam suporte emocional e aju da motora. Mesmo que as crianas no falassem,

40

A . C harles C atania

Nesse exemplo, a luz sinaliza as conseqn cias do pressionar a barra: a presso barra reforada na presena, mas no na ausncia de luz. A luz um estmulo discriminativo, e o rato passa a pressionar a barra mais freqentemente quando a luz est acesa do que quando est apa gada. medida que o rato comea a responder diferentemente na presena e na ausncia da luz, seu comportamento entra sob controle da luz como um estmulo discriminativo; pode-se di zer, tambm, que a luz ocasiona o comportamen to. O desenvolvimento desse responder diferen cial tem sido denominado aprendizagem discri minativa. As relaes entre um estmulo discriminati vo e as conseqncias do responder so elabora das por Skinner na seguinte passagem (o termo operante refere-se a uma classe de respostas que tm certas conseqncias particulares, e o termo reforo refere-se a essas conseqncias):
... o operante deve operar sobre a natureza para pro duzir seu reforo. Embora a resposta seja livre para ocorrer em um grande nmero de situaes estimu ladoras, ela ser eficaz para produzir o reforo ape nas em uma pequena parcela delas. A situao fa vorvel geralmente marcada de algum modo e o organismo... passa a responder sempre que estiver presente um estmulo que esteve presente em uma situao prvia de reforo, e a no responder, se este no for o caso. O estmulo precedente no elicia a resposta, ele meramente estabelece a ocasio em que a resposta ser reforada... Portanto, trs termos de vem ser considerados: um estmulo discriminativo prvio (SD), a resposta (R) e o estmulo reforador (S1). A relao entre eles pode ser formulada como segue: apenas em presena de SD que uma R seguida de S*. (Skinner, 1938, p. 178)

nem sempre reforado, pois o lpis nem sempre est ali. Em virtude da estimulao visual do lpis (SD), fao o movimento requerido apenas quando ele ser reforado. O papel desempenhado pelo es tmulo visual mostrado, considerando-se o mes mo caso em um quarto escuro. Em uma ocasio, es tendo a mo e encontro um lpis, em outra estendo a mo e no o encontro... Nem no claro nem no es curo o lpis elicia minha resposta (como um cho que elicia flexo), mas, no claro, ele estabelece a ocasio em que a resposta ser reforada. (Skinner, 1938, p. 178)

Skinner explorou experimentalmente essa re lao de trs termos com as luzes como estmu los discriminativos, as presses barra por ratos como respostas e as pelotas de alimento como conseqncias reforadoras, mas seu exemplo se guinte, de alcanar e tocar objetos no ambiente visual, ilustra a ampla gama de situaes a que o conceito se aplica.
Um exemplo conveniente o comportamento ele mentar de fazer contato com partes especficas do ambiente estimulante. Certo movimento de meu bra o (R) reforado pela estimulao ttil de um l pis em minha mesa de trabalho (S1). O movimento

A relao de trs termos, estmulo discriminativo-resposta-conseqncia, ser um tema re corrente. Cada um dos termos crtico. Sua com binao distingue este caso de outras relaes comportamentais mais simples. Na situao pavloviana, por exemplo, em que um estmulo sinalizado, o comportamento do organismo no tem qualquer efeito sobre a seqncia de even tos; nenhuma conseqncia programada para as respostas. Consideremos novamente os exemplos do re lmpago que precede o trovo e das luzes do se mforo. Nossas piscadas ou o susto com o cla ro do relmpago no impediro o estampido subseqente do trovo. Mas, se o semforo est vermelho quando nos aproximamos do cruza mento, freiar ocasionado por esse estmulo ape nas porque aprendemos as conseqncias poten ciais de fazer ou no fazer isso. Apenas o segun do destes dois exemplos envolve todos os ter mos da contingncia de trs termos de Skinner. Uma diferena terminolgica importante acom panha estas distines, (i) quando um estmulo a causa fundamental de uma resposta, dizemos que o estmulo elicia a resposta ou que a res posta eliciada; mas, (ii) quando uma resposta ocorre em presena de um estmulo, porque o estmulo sinaliza alguma conseqncia do res ponder, dizemos que o estmulo ocasiona a res posta e que a resposta emitida. Os primeiros experimentos com animais fre qentemente estavam interessados no tanto no estudo da natureza da aprendizagem de discri minao, mas nas capacidades sensoriais dos organismos. A viso de roedores, por exemplo, foi estudada pelo arranjo de duas trilhas, uma das quais levava ao alimento (Yerkes & Watson, 1911). No ponto em que o rato teria que esco-

A prend iza gem 4 1

lher a trilha da esquerda ou a da direita, eram apresentados dois estmulos (p. ex., um carto preto ou um carto branco). A trilha do alimento variava entre a esquerda e a direita, mas era sem pre indicada pelo mesmo carto (p. ex., preto). Quando o rato aprendia a tomar a trilha indicada pelo estmulo correlacionado com o alimento, os limites de sua viso podiam ser estudados pela substituio do par original de cartes-estmulo por outros (p. ex., cinza-claro e cinza-escuro). Tais experimentos eram trabalhosos; demonstrar a aprendizagem de discriminao podia levar centenas de tentativas, se que o rato aprendia. Esse tipo de estudo envolvia vrios problemas, e o menor deles no era o de assegurar que o rato estivesse olhando para os estmulos ao atin gir o ponto de escolha. Os equipamentos evoluram com o passar do tempo. A Figura 2.3, por exemplo, mostra a plata forma de salto, desenvolvida por Karl S. Lashley (1930). Lashley descreveu suas vantagens:
... ela requer que o animal salte, de uma certa dis tncia, sobre padres de estmulo, em vez de passar correndo por eles... Geralmente tenho treinado os animais colocando-os na plataforma, junto tela, e permitindo que eles caminhem, passando pelas por tas abertas at o estrado de alimento e, ento, gra dualmente, afastando a plataform a at que em 10 ou 15 tentativas a distncia de 25cm seja alcan ada. Os cartes so colocados em posio e o treino de discriminao comea. (Lashley, 1930, pp. 454-457)

cais e achar alimento e saltar em direo s li nhas horizontais e cair na rede. Mas direita e es querda no so irrelevantes para o rato. A situa o envolve, pelo menos, quatro respostas, cada uma com sua conseqncia particular: saltar rumo s linhas verticais esquerda, saltar rumo s linhas verticais direita, saltar rumo s linhas horizontais esquerda e saltar rumo s linhas horizontais direita. Pode ser mais provvel que os ratos respondam com base na posio, direita e esquerda, do que com base nos cartes de est mulo. Por exemplo, se as trs primeiras tentati vas do treino vertical-horizontal fossem imple mentadas com as linhas verticais direita, como na Figura 2.3, no deveramos nos surpreender se, na quarta tentativa, com as linhas verticais pela primeira vez esquerda, o rato saltasse para a direita, em direo s linhas horizontais. At a

No equipamento de Lashley, os ratos normal mente aprendiam a discriminar entre o preto e o branco com perfeita preciso dentro de 4 ou 5 tentativas e, mesmo discriminaes mais difceis, como vertical versus horizontal, podiam ser aprendidas em menos de 50 tentativas. Esses casos em que os estmulos discrimina tivos sinalizam as conseqncias do responder so mais complexos do que o exemplo em que as presses barra por um rato produziam ali mento na presena, mas no na ausncia de luz. Ali, nossa preocupao era apenas com quo fre qentemente as presses barra ocorriam quan do a luz estava acesa e quando estava apagada. Consideremos, contudo, a plataforma de saltos. Ela parece envolver apenas duas respostas e suas conseqncias: saltar em direo s linhas verti

FIGURA 2.3 A plataforma de saltos de Lashley (Lash ley, 1930, Figura 1). Um rato era treinado a saltar da plataforma (S) para uma das duas portas (L e R). Se saltasse para a porta correta, a porta se abria e o rato alcanava o estrado de alimento (FP). Se saltasse para a porta incorreta, ela permanecia fechada e o rato caa na rede abaixo (N). A prancha metlica (M), projetada acima das portas, impedia que o rato saltasse alto de mais. Na ilustrao, a porta da direita (R) seria a cor reta para um rato que estivesse sendo treinado a saltar em direo s linhas verticais.

42

A . C harles C atania

tentativa quatro, saltar rumo direita era to efi caz em levar ao alimento quanto saltar rumo s linhas verticais. O tipo de discriminao em que um nico estmulo est presente ou ausente, como no exemplo de pressionar a barra, denominado discriminao sucessiva ou vai-no-vai. Aquela em que dois ou mais estmulos esto presentes ao mesmo tempo e em que cada um deles est corre lacionado a uma resposta diferente, como no exem plo da plataforma de saltos, denominada discri minao simultnea. Ambas ilustram operaes si nalizadoras superpostas s conseqncias do res ponder. A comparao entre discriminaes suces siva e simultnea mostra que essas operaes ocor rem em graus variados de complexidade.

mo. Quando esse intercmbio perturbado - quan do o organismo privado da oportunidade de beber toma-se evidente que o beber teria maior probabi lidade de ocorrer na primeira oportunidade. Em sen tido evolucionrio, isso explica por que a priva o fortalece todos os comportamentos condiciona dos e incondicionados relacionados com a ingesto de gua. (Skinner, 1953, pp. 141-142)

Skinner falou desses fenmenos em termos de impulsos:


O termo simplesmente uma maneira conveniente de se referir aos efeitos da privao e da saciao e de outras operaes que alteram a probabilidade do comportamento mais ou menos da mesma maneira. Ele conveniente porque nos permite lidar com muitos casos de uma vez. H muitas maneiras de se mudar a probabilidade de que um organismo venha a comer; ao mesmo tempo, um nico tipo de priva o fortalece muitos tipos de comportamento. (Skin ner, 1953, p. 144)

Seo E

Estabelecendo a Efetividade das Conseqncias

Algumas conseqncias do comportamento so mais importantes do que outras e sua efeti vidade pode variar ao longo do tempo. Por exem plo, a gua pode ser um reforador efetivo se algum estiver privado de gua por algum tem po, mas ter menor probabilidade de funcionar como reforador se uma grande quantidade de gua tiver sido consumida. As coisas que podem ser feitas para mudar a efetividade dos reforadores so chamadas de operaes estabelecedoras. A privao e a saciao so dois exemplos, mas no so as nicas possibilidades. O exerc cio vigoroso no calor e em clima seco, por exem plo, ou a boca cheia de uma comida bem salga da podem ter o mesmo efeito que um perodo de privao de gua. As operaes estabelecedoras mudam a efetividade das conseqncias, mudan do a probabilidade do comportamento, como ilus trado por B. F. Skinner na seguinte passagem:
... a probabilidade de beber toma-se muito alta sob severa privao de gua e muito baixa sob saciao excessiva... O significado biolgico da mudana na probabilidade bvio. A gua est sendo constan temente perdida pela excreo e pela evaporao, e uma quantidade igual deve ser ingerida para com pensar essa perda. Sob circunstncias normais, um organismo bebe intermitentemente e mantm um estado razoavelmente constante e supostamente ti

O comportamento decorrente de operaes estabelecedoras chamado de evocado. Skinner, no entanto, apontou que os efeitos de operaes estabelecedoras no devem ser igualados aos de estmulos:
Uma crena comum a de que a privao afeta o organismo pela criao de um estmulo. O exemplo clssico so as pontadas de fome. Quando um orga nismo fica sem comida por um tempo suficiente, as contraes do estmago estimulam-no de modo ca racterstico. Geralmente essa estimulao identi ficada com o impulso da fome. Mas tal estimulao no est estreitamente relacionada com a probabili dade do comer. As pontadas de fome so caracters ticas apenas de uma parcela pequena de toda a gama ao longo da qual essa probabilidade varia continua mente. Geralmente fazemos nossas refeies sem atingir a condio em que as dores so percebidas e continuamos a comer por muito tempo depois que as primeiras garfadas interromperam quaisquer do res que pudessem ter ocorrido. (Skinner, 1953, p. 144-145)

Como o exemplo de Skinner indica, deve-se distinguir os efeitos discriminativos dos estmu los dos efeitos de operaes estabelecedoras. Considere um outro exemplo (Michael, 1982). Uma pessoa est propensa a tomar um refrige rante e, ao localizar uma mquina de venda au tomtica, procura na bolsa por uma moeda. A mquina um estmulo discriminativo, porque estabelece a ocasio na qual possvel obter o
A pr en d iza g em 4 3

refrigerante. Mas com relao moeda, a m quina um evento estabelecedor: ela torna a moeda importante. Ela no um estmulo dis criminativo para olhar na carteira ou no portamoedas e encontrar uma moeda, porque a moe da seria encontrada ali sempre que fosse procu rada, quer a pessoa tivesse ou no visto a mqui na de refrigerante. Em outras palavras, a mqui na de refrigerante no um estmulo em cuja presena algum tem maior probabilidade de encontrar moeda na carteira; mas ela toma a moeda uma conseqncia reforadora significa tiva para checar a carteira. Em contraste com a linguagem de controle de estmulos, em que se diz que as mudanas nos estmulos discriminativos ocasionam respos tas, na linguagem das operaes estabelecedo ras diz-se que o responder evocado por tais ope raes ocorre em um ambiente relativamente constante. Por exemplo, se h maior probabili dade de que algum abra a geladeira muito tem po depois das refeies, o comportamento da pessoa que muda de tempos em tempos e no o refrigerador. Nesse caso, diz-se que abrir a gela deira foi evocado pela operao estabelecedora, privao de alimento. Mas ainda assim tal com portamento ocasionado pelo refrigerador, por que abri-lo pode ocorrer em sua presena, mas no em sua ausncia. E quando queremos falar desse comportamento sem mencionar as opera es estabelecedoras nem os estmulos discrimi nativos, apropriado falar que o comportamen to foi emitido. Em outras palavras, as operaes estabelecedoras evocam, os estmulos discrimi nativos ocasionam e as respostas que eles evo cam e/ou ocasionam so emitidas. Nosso tratamento sobre as operaes estabe lecedoras foi rpido, porque, em si mesmas, elas no fornecem exemplos de aprendizagem. Como teremos oportunidade de verificar, no entanto, elas fornecem os contextos nos quais normal mente ocorre a aprendizagem e, portanto, dif cil estudar a aprendizagem sem elas.

Seo F

Resumo

Como vimos, o estudo do comportamento est interessado nas relaes entre os eventos am

bientais, os estmulos, e as aes do organismo, as respostas. Podemos examinar essas relaes analisando como as manipulaes do ambiente produzem mudanas no responder. Um primei ro passo crtico a observao do comportamen to, mas no basta simplesmente observar. Para compreender o comportamento devemos inter vir, mudando o ambiente. Podemos descrever as mudanas ambientais em termos de classes de operaes experimentais: operaes d eapresentao de estmulo, operaes conseqenciais e operaes sinalizadoras ou de controle de est mulo e operaes estabelecedoras. Ao longo deste livro, retomaremos freqentemente a es sas operaes e elas ajudar-nos-o a organizar, especialmente, o tpico sobre aprendizagem sem palavras da Parte III. A Tabela 2.1 sumariza as operaes. Exceto pela observao, a apresentao de estmulos a operao mais simples. Quando apresentamos estmulos, podemos observar as respostas produzidas. Um toque na bochecha de um beb recm-nascido, por exemplo, pode fazlo voltar-se e comear a sugar. As apresentaes de estmulo so relevantes para a aprendizagem, porque as respostas produzidas pelos estmulos podem variar, dependendo das condies sob as quais os estmulos so apresentados. s vezes, o organismo muda seu ambiente: o comportamento pode ter conseqncias. Progra mar o ambiente de modo que ele seja afetado pelas respostas de um organismo uma opera o conseqencial. As conseqncias podem in cluir a apresentao, a remoo ou a preveno de estmulos, ou eventos mais complexos, como mudanas nas conseqncias de outras respos tas. Por exemplo, uma criana pode aprender a pedir um copo de leite ou ela pode descobrir que o que tem na xcara de caf do pai algo geral mente quente e amargo, ou ela pode ainda apren der que aceitar um copo de suco s permitido depois que ela tiver dito obrigada. Algumas res postas que tm conseqncias podem ocorrer mais freqentemente e outras, menos freqente mente. Se um organismo responde mais freqen temente porque seu comportamento mudou o ambiente, dizemos que o comportamento foi re compensado ou reforado', se um organismo res ponde menos freqentemente pela mesma razo, dizemos que a resposta foi suprimida ou punida.

44 A.

C h a r l e s C a ta n i a

TABELA 2-1 Operaes Comportamentais Bsicas Operao 1. Observao 2. Operao de apresenta o de estmulo Descrio Nenhuma interveno. O estmulo A apresen tado. Exemplos Observamos um animal se comportando. O rudo alto (A) assusta a criana. O mdico pro jeta luz (A) dentro do olho do paciente. Introduzir uma moeda em uma mquina autom tica (B) resulta num re frigerante (C). Tocar num fogo quente (B) produz queimadura (C). A luz se apaga (C) quan do o interruptor acio nado (B). O relmpago (D) precede o trovo (E). Terminologia

O estmulo elicia a respos ta; a resposta eliciada pelo estmulo. A resposta emitida.

3. Operao conseqencial

A resposta B tem a conse qncia C (p. ex., um estmulo produzido ou terminado).

4. Operao sinalizadora ou de controle de est m ulo: su p e rp o sta apresentao de estmu lo 5. Operao sinalizadora ou de controle de est mulo: superposta s conse qncias

O estmulo D sinaliza a apresentao do est mulo E.

O estmulo elicia a respos ta; a resposta eliciada pelo estmulo.

O estmulo F sinaliza que a resposta B ter a con seqncia H.

6. Operao estabelecedora

estabelecidada a efetivi dade de um a conse qncia I como um re forador ou como um punidor.

O semforo vermelho (F) sinaliza que ultrapassar o cruzamento (G) pode levar multa (H). A campainha do telefone (F) sinaliza que atender (G) pode oportunizar uma conversa com al gum (H). O alimento (I) toma-se um reforador efetivo de pois da privao de co mida. A apresentao de choque toma reforadora a re moo do choque (I). Quando importante des trancar uma porta, a chave da porta (I) tor na-se reforadora.

O estmulo ocasiona a res posta; a resposta emi tida em presena do es tmulo.

Um evento estabelecido como um reforador ou punidor. O comportamento evo cado pela operao estabelecedora.

Podemos sinalizar as apresentaes de est mulos ou as operaes conseqenciais, progra mando-as somente quando alguns estmulos es to presentes. Os organismos no se comportam indiscriminadamente. Eles fazem algumas coi sas em algumas circunstncias e outras coisas em outras circunstncias. Um estmulo pode sinalizar a ocorrncia imi nente de um outro. Por exemplo, a criana pode ria aprender que o som de uma chave na porta

precede, de modo previsvel, o retorno, do tra balho, de um dos pais, ou que um relmpago geralmente seguido por um trovo. Nesses ca sos a sinalizao superposta a apresentaes de estmulo: o som da chave precede o apareci mento do pai, e o relmpago precede o trovo. Por outro lado, um estmulo pode sinalizar as condies sob as quais uma resposta tem conse qncias. Por exemplo, uma criana pode apren der que suas solicitaes tm maior probabilidaA pr end iza gem 4 5

de de serem atendidas na presena de um dos pais, do que na presena dos dois pais juntos, ou que o comportamento inapropriado tem maior probabilidade de ser seguido por repreenso na presena de um dos pais do que na presena do outro. Nesses casos, o controle de estmulo est superposto a uma operao conseqiiencial: a pre sena dos pais sinaliza vrias conseqncias para as solicitaes ou para o comportamento inade quado. As mudanas no comportamento, decorren tes das operaes de apresentao de estmulo ou das operaes conseqenciais, podem come ar a ocorrer somente na presena de estmulos sinalizadores. Quando um estmulo sinaliza que um evento est para ocorrer ou que o comporta mento de um organismo pode ter certas conse qncias, o organismo pode comear a respon der diferentemente quando o estmulo est pre sente e quando ele est ausente. Esse processo chamado de discriminao, e diz-se que o com portamento do organismo ocasionado pelo es tmulo discriminativo. Finalmente, o significado de eventos como resultado de conseqncias do comportamento pode ser alterado por operaes estabelecedo ras, como a privao e a saciao. Se uma cri

ana pede ou no um copo de gua, por exem plo, pode depender, em grande parte, de quanto tempo se passou desde a ltima vez que ela tomou gua. Essas operaes podem evocar o comporta mento e elas funcionam mudando a efetividade de eventos como reforadores ou punidores. O comportamento pode ser complicado. Es tmulos diferentes podem ter efeitos diferentes sobre respostas diferentes e diferentes respostas podem ter conseqncias diferentes. No entan to, uma variedade de procedimentos de aprendi zagem pode ser tratada como combinaes des tes tipos bsicos de intervenes experimentais: as apresentaes de estmulo; as operaes con seqenciais, como o reforo e a.punio, em que as respostas agem sobre o ambiente; as opera es sinalizadoras ou de controle de estmulo, em que essas outras operaes so sinalizadas por estmulos discriminativos; e as operaes es tabelecedoras, que alteram o significado das con seqncias do comportamento. Como nossa taxonomia do comportamento, essas categorias iro nos levar por um longo caminho, mas mais tarde, especialmente quando considerarmos a transio da aprendizagem sem palavras para a aprendizagem com palavras, verificaremos que elas no esgotam as possibilidades.

46

A . C ha rle s C atania

PARTE II

COMPORTAMENTO SEM APRENDIZAGEM

Evoluo e Comportamento

A. A Natureza da Evoluo Receitas e Fotocpias Variao e Seleo Tipos de Seleo Resumo B. Filogenia, Ontogenia e Comportamento

As palavras evoluo e revoluo derivam do latim volvere, to roll (rolar); a diferena que evoluo implica unrolling (desenrolar), ou rolling out (rolar para fora), e revoluo implica rolling over (rolar sobre) ou tuming around (voltar ao redor de si). A seleo pode estar relacionada a legere, em latim, to gather (conseguir) ou to choose (escolher) (cf. a etimologia de logos, no Captulo 14). O prefixo seacrescenta a implicao de weeding outfrom a lar ge tiumber (eliminao ou excluso de um grande nmero), em contraste com bringing together (agru par ou juntar), implicado pelo con-, o prefixo radi cal para collection (coleo). As palavras filogenia, a histria evolutiva, e on togenia, a histria de vida de um organismo indivi dual, partilham o radical grego gen-, no sentido de kind (tipo) ou sort (espcie de) (cf. etimologia de generalizao, no Captulo 8). Phylo- tem uma raiz grega que implica uma tribo ou cl ou uma linhagem racial. Onto- tem um radical que implica being (ser) ou reality (realidade). Em combinao com gen-, ambos implicam origem: a origem de um filo ou uma populao, ou a origem de um ser vivo.

Nosso planeta tem aproximadamente 4,6 bi lhes de anos. E um tempo muito longo. Se voc tentar contar at um milho, vai levar mais de trinta anos para terminar, mesmo que mantenha um ritmo ininterrupto de uma contagem por se

gundo. Se parar para dormir, voc vai levar muito mais tempo. (A estimativa de um por segundo muito generosa; fcil contar rpido quando os nmeros so pequenos, mas os nmeros maio res, como 374.516.982, certamente vo tornar a contagem mais lenta, principalmente, se voc es tiver preocupado em no perder a conta). Durante a maior parte desse perodo, existiu vida na Terra (ver Gould, 1989, para uma expla nao detalhada). Evidncias qumicas e fsseis indicam que ela comeou, aproximadamente, no primeiro bilho de anos, e, ao longo da maior parte dos trs bilhes de anos seguintes, a vida consistiu de organismos unicelulares. Os orga nismos multicelulares apareceram h apenas 600 milhes de anos atrs, mais ou menos no pero do geolgico chamado de Cambriano. Durante esse perodo ocorreu uma exploso na diversi dade de vida multicelular que foi seguida por uma ampla exterminao; os sobreviventes consisti ram nos principais grupos a partir dos quais as espcies contemporneas evoluiram. Um desses grupos era o de vertebrados. A evoluo de an fbios para rpteis incluiu muitos eventos signi ficativos, como a colonizao da terra. Os di nossauros foram uma parte espetacular da hist ria, mas eles desapareceram h mais ou menos 65 milhes de anos. Seu desaparecimento abriu espao para a evoluo dos mamferos, e, pro vavelmente, h 4 milhes de anos haviam evo ludo os primatas que andam de p. Posterior mente, ns, humanos, surgimos desta linha, h pouco mais de 100.000 anos. Todos somos apa rentados e todos descendemos de uma linha

muito longa de sobreviventes. A evoluo con tinua em progresso e rpida o bastante para ser observada no perodo de vida de uma pessoa (Weiner, 1994). Ela ocorre em habitats naturais, como as Ilhas Galpagos, onde diferentes esp cies de tentilhes evoluem com mudanas nos habitats locais de cada ilha, mas acontece tam bm como resultado de intervenes humanas, quando, por exemplo, os organismos que cau sam doenas tomam-se resistentes a antibiti cos, ou pragas de insetos tomam-se resistentes aos inseticidas. Esses so, apenas alguns dos mui tos fatos sobre a evoluo. O registro fssil incompleto, e h muitos detalhes que desconhe cemos, mas as evidncias da biologia, da geolo gia e de outras disciplinas mostram que a evolu o aconteceu e continua a ocorrer. Em outras palavras, a evoluo no uma teoria; um nome para certos tipos de mudanas que ocorrem com as populaes biolgicas a que denominamos es pcies. As teorias da evoluo no so teorias sobre se espcies contemporneas so descenden tes dos ancestrais to diferentes que encontramos nos registros geolgicos. Todas as teorias da evo luo tomam isso como certo. Elas diferem no que dizem sobre como a evoluo surgiu. A Teoria que tem sido melhor sucedida em acomodar os fatos da evoluo a teoria de Charles Darwin sobre a evoluo em termos de seleo natural.

Seo A

A Natureza da Evoluo

A seleo natural se refere explicao de Darwin sobre a evoluo com base no diferen cial de sobrevivncia e de reproduo dos mem bros de uma populao; o ambiente seleciona os indivduos que transmitem suas caractersticas de uma gerao para a outra e, assim, modela as caractersticas dos membros das populaes se guintes (para discusses sobre os detalhes da seleo natural, ver Dawkins, 1976, 1986). A evoluo por seleo natural requer variao dentro de populaes; essas variaes so o ma terial sobre o qual a seleo trabalha. A seleo era bem conhecida mesmo antes de Darwin, mas era do tipo empregado pelo ho mem na horticultura e na criao de animais. As

pessoas sabiam como cultivar, seletivamente, plantas ou rebanhos para conseguir maior resis tncia ou para manter uma ou outra caractersti ca. Esse cultivo seletivo era denominado sele o artificial e criava novas variedades de vege tais, flores, etc. Os cavalos para trabalho eram selecionados pela sua fora e os cavalos de corri da eram selecionados pela velocidade. Uma parte do insight de Darwin foi que um tipo semelhante de seleo podia ocorrer na natureza, sem a inter veno humana; esta era a seleo natural. Os principais argumentos de Darwin foram publicados pela primeira vez em seu livro A ori gem das espcies (Darwin, 1859). Os argumen tos foram calorosamente recebidos em alguns setores, mas sofreram fortes resistncias por parte de outros. A resistncia cresceu e l pelo final do sculo XIX espalhou-se a crena de que o Darwinismo estava morto. Ele se recuperou bem mais tarde no sculo XX. O perodo de mais ou menos meio sculo que precedeu sua recupera o passou a ser chamado de o eclipse do Da rwinismo (Bowler, 1983; cf. Catania, 1987). A razo para o eclipse no foi o de que a evo luo em si tivesse sido desacreditada, mas sim que outras teorias que no a de Darwin torna ram-se dominantes. As principais alternativas (1) seleo natural foram (2) o Lamarckismo, (3) a ortognese e (4) a combinao da gentica Mendeliana com a teoria da mutao. O Lamar ckismo baseava-se no trabalho do cientista fran cs do sculo XVIII, que, em sua poca, havia trabalhado muito para demonstrar o fato da evo luo. A teoria de Lamarck era a de que as ca ractersticas adquiridas durante a vida de um or ganismo podiam ser passadas para seus descen dentes, por meio de mudanas em seu prprio material gentico. Um problema com essa teoria que ela no conseguia mostrar por que as ca ractersticas adquiridas que apresentavam van tagens deveriam ter maior probabilidade de serem passadas adiante do que as caractersticas desvan tajosas, como uma mutilao, por exemplo. De acordo com a teoria da ortognese, a evo luo era ditada por foras internas dos organis mos, sem referncia s demandas do ambiente; ela poderia estar ligada ao desenrolar do desen volvimento. Supunha-se que uma manifestao desse desenrolar era a recapitulao da filoge-

50

A . C harles C atania

nia pela ontogenia. A ontogenia o desenvolvi mento do organismo individual e a filogenia sua histria evolutiva. Pensava-se que durante a ontogenia o embrio passasse por estgios que correspondiam sua filogenia. Essa idia de re capitulao, porm, tem srias limitaes e j no central na teoria da evoluo (Gould, 1977). O problema com a gentica Mendeliana era que, em si mesma, ela no fornecia um mecanis mo para a variao. Em uma descendncia estri tamente Mendeliana, os gens dominantes e os recessivos em uma gerao determinavam suas propores na gerao seguinte. Sem variao, a seleo natural no tinha sobre o que agir. Para explicar o aparecimento de formas novas, expli caes Mendelianas acrescentaram a teoria da mutao, a qual sustentava que a evoluo se pro cessava por meio de mudanas genticas espon tneas e geralmente grandes. Naquela poca, porm, sabia-se muito pouco sobre a mutao, para que ela pudesse ser a base de uma explica o convincente.

RECEITAS E FOTOCPIAS No sculo XIX, os gens eram entidades te ricas. As tcnicas da biologia celular ainda no haviam atingido o ponto em que os gens foram localizados em clulas reais. Contudo, todas es sas teorias evolucionrias supunham que algum tipo de material hereditrio era transmitido de uma gerao para a outra e que a evoluo era determinada pelas propriedades desse material. A principal falha em algumas teorias era a supo sio de que o material gentico constitua uma representao ou cpia do organismo. Na ver so inicial da ortognese, chamada preformacionista, o embrio era literalmente um homnculo, um pequeno indivduo, completo em todas as partes; em variaes posteriores da teoria, o embrio era visto como tomando formas ances trais, medida que a ontogenia, como se dizia, recapitulava a filogenia. Para o Lamarckismo, a transmisso de caractersticas adquiridas reque ria que elas fossem, de algum modo, preserva das no plasma gentico; assim, o plasma germinativo tinha que conter algum tipo de plano da quelas partes do organismo que deveriam ser al

teradas nas geraes seguintes. Em qualquer dos casos, o plasma germinativo podia ser conside rado como uma representao ou cpia do orga nismo. Uma receita uma seqncia de procedimen tos ou instrues. Ela descreve como criar um produto, mas no incorpora, necessariamente, uma descrio do produto (a receita de um bolo no se parece com um bolo). Uma receita pode ser informativa, mas pouco provvel que con tenha informaes sobre suas origens, como o nmero de tentativas feitas at que ela funcio nasse bem. Uma fotocpia, por outro lado, ge ralmente no diz como construir a estrutura que ela mostra. Como uma receita, ela pode ser in formativa, mas provvel que ela tambm omi ta informaes sobre suas origens, tais como a ordem em que as diferentes partes foram desen volvidas. Uma fotocpia uma representao ou cpia, mas uma receita no . As explicaes Lamarckistas e da ortognese preformacionista tratavam o material gentico como fotocpias, mais do que como receitas. Uma das principais realizaes da Biologia contempornea consistiu em reinterpretar o ma terial gentico no como uma fotocpia da es trutura do organismo, mas como uma receita para seu desenvolvimento (ver Dawkins, 1986, Ca ptulo 11, sobre as metforas de receita e fotoc pia). A formulao moderna exigiu que se re pensasse em que sentido se pode dizer que o material gentico contm informao, se sobre a histria evolucionria ou sobre a estrutura do organismo (cf. Dawkins, 1982, Captulo 9). Os materiais genticos fornecem informao limi tada sobre os ambientes passados em que eles foram selecionados, em parte porque no incluem o material gentico de todos os outros organis mos que no sobreviveram. E fornecem infor mao limitada sobre a eventual estrutura de um organismo, porque so receitas para a produo de protenas, mais do que fotocpias de partes do corpo. Uma implicao disso a de que o Lamarckismo e pelo menos algumas variedades da ortognese no tem sustentao como uma alteranativa seleo Darwiniana, porque suas teorias implcitas da cpia so inconsistentes com o que aprendemos sobre como o material gen tico funciona.

A prend iza gem 5 1

irnico que, ao lado do Lamarckismo e da ortognese, a gentica Mendeliana tambm te nha-se constitudo em forte desafio seleo Darwiniana. A integrao da gentica Mendeli ana com a seleo Darwiniana, por volta de 1920 a 1930, conhecida como a moderna sntese, tor nou-se a essncia da Biologia contempornea. O problema que a gentica Mendeliana no contemplava um mecanismo para variaes. Foi ento que experimentos genticos com moscas de frutas permitiram no apenas a elaborao dos mecanismos genticos, mas tambm trouxeram as mutaes para o laboratrio. Com as moscas de frutas, muitas geraes podiam ser estudadas em um perodo de tempo relativamente curto. A pesquisa forneceu evidncias experimentais so bre as taxas naturais de mutao e sobre a mag nitude dos efeitos de mutao, que eram relati vamente pequenos, comparados com as mudan as hipotetizadas em teorias anteriores sobre a mutao. A combinao da gentica Mendelia na com os dados sobre mutaes fornecia a va riabilidade necessria para a atuao da seleo natural. A perspectiva Darwiniana teve que enfren tar e superar outras barreiras, alm das teorias competidoras (cf. Mayr, 1982). Comentamos, anteriormente, sobre as falhas no registro fssil. Nossa compreenso da vida pr-histrica depen de da descoberta de membros ocasionais de es pcies primitivas, preservadas nesses registros, mas os acidentes tanto em sua preservao quan to em sua descoberta deixam lacunas inevitveis. Alm disso, as partes duras, como os ossos e as conchas, tm maior probabilidade de serem pre servadas do que as partes moles. E mesmo que encontrssemos todas as partes intactas, nossa informao sobre como essas criaturas se com portavam seria limitada. Temos sempre que re correr evidncia indireta (p. ex., analogias com espcies vivas, registros fsseis do comporta mento, tais como o de pegadas). A idade da Terra foi um outro problema. No sculo XIX a estimativa era muito curta para tor nar plausvel a evoluo pela seleo natural, mas essa idade foi revisada e muito ampliada duran te este sculo. Uma outra incompreenso se re feria probabilidade de eventos improvveis quando eles podem ter muitas oportunidades de

ocorrer ao longo de extensos perodos de tem po. Suponhamos, por exemplo, que alguma mo lcula orgnica seja um pr-requisito crucial para a vida, que ela ocorra na natureza com a proba bilidade de um em um milho, apenas quando uma corrente eltrica proveniente de um raio crie a molcula, ao passar por uma mistura de gases que estavam presentes na atmofesra dos primr dios da Terra. A criao de tal molcula pode parecer muito remota. Mas as muitas tempesta des ao longo de muitos milhes de anos durante a histria primitiva de nosso planeta teriam re petido aquelas condies muitos milhes de ve zes, tomando uma certeza virtual de que a mol cula seria criada no apenas uma, mas muitas vezes, muito embora o momento particular de sua criao fosse imprevisvel (cf. Dawkins, 1986; Gleick, 1987).

VARIAO E SELEO Consideremos, agora, um exemplo de sele o natural. Comeamos com uma populao de animais de caa (antlopes, por exemplo), cujos membros variam quanto velocidade com que podem fugir de predadores; as razes para a di ferena podem residir na anatomia (p. ex., a ex tenso dos ossos, o tamanho dos msculos), em diferenas sensoriais que permitem a alguns ini ciar a fuga mais rapidamente do que outros, a diferenas metablicas que afetem a resistncia, etc. Se esses animais so atacados por predado res, tudo o mais sendo igual, os mais lentos se ro os que tero maior probabilidade de serem capturados. A condio de que tudo o mais seja igual importante. Falar apenas de velocidade uma supersimplifcao. Por exemplo, um indivduo que seja rpido s custas de ter que comer muito mais pode lev-lo a ter que procurar alimento (forragear) por muito mais tempo e, assim, cor re um risco maior de ser visto pelos predadores durante a pastagem. Esse risco maior pode con trabalanar sua vantagem em velocidade, por que esse animal provavelmente ficar mais can sado do que outros, se ele for caado mais freqentemente do que eles. Ou, como um outro exemplo, um organismo pode correr mais rapi-

52

A . C h a rle s C atania

damente do que outro, mas este pode ser mais difcil de capturar, porque pode mudar de dire o mais rapidamente ou de maneira mais im previsvel. Contanto que os membros de uma po pulao variem, nosso argumento pode ser reelaborado em termos dos efeitos de tais fato res sobre a probabilidade de ser capturado. Va mos falar sobre velocidade, porque conveniente para nossa finalidade, mas devemos notar que as dimenses efetivas de fuga de predadores so, pro vavelmente, muito mais complexas do que isso. Em algum momento ao longo da histria, nos sa populao de presas tem uma certa velocida de mdia, com alguns membros da populao estando acima da mdia e outros abaixo. Os que esto abaixo da mdia so os que mais prova velmente sero capturados e, portanto, tero menor probabilidade de passar seus gens para a gerao seguinte. Ento, a gerao seguinte de ver apresentar mais descendentes dos que esta vam acima da mdia, ou, em outras palavras, ven cero os corredores mais rpidos. Assim, a ve locidade mdia nesta gerao ser mais alta do que na gerao anterior. Mas o mesmo tipo de seleo continua operando: novamente, os mais lentos tero maior probabilidade de serem cap turados do que os mais rpidos. Ao longo de muitas geraes, portanto, a velocidade mdia vai se tomando cada vez maior. (Um tipo seme lhante de seleo tambm opera sobre os preda dores, porque sua eficincia em capturar as pre sas tambm vai variar entre os indivduos.) A evoluo do cavalo fornece fortes evidn cias para esse tipo de seleo (Simpson, 1951; Gould, 1996). Ao longo dos 50 milhes de anos ou mais desde o eohippus, o assim chamado ca valo da aurora (tecnicamente seu nome Hyracotherium ), os indivduos das populaes das quais descendem os cavalos modernos aumen taram gradualmente em tamanho. Essas mudan as no tamanho foram acompanhadas por outras mudanas (p. ex., os dedos tomaram-se patas), incluindo, supostamente, mudanas no compor tamento. O eohippus foi o antecessor dos cava los modernos, mas improvvel que uma popu lao de eohippus pudesse sobreviver nos habi tais dos cavalos contemporneos. O fato de que o eohippus est extinto relevante para nossa histria. Muitos de seus descendentes devem ter

sido os mais competentes fugitivos do seu tipo, no seu tempo, mas eles j no esto vivos. Quan do a seleo opera sobre alguma propriedade relativa, como a velocidade relativa mdia de uma populao, a mdia da populao muda. Por exemplo, depois que a captura pelos predadores selecionou repetidamente uma fuga mais rpida em uma populao, poucos descendentes dos que eram originalmente mais lentos tero sobrevivi do, mesmo que sua velocidade de corrida tenha tido uma vantagem seletiva em uma poca em que ela era uma velocidade muito rpida em re lao mdia da populao. Em outras palavras, como demonstra o oehippus, no devemos es perar encontrar, nas populaes atuais, exempla res de formas ancestrais. De acordo com esses argumentos, a fonte de seleo est no ambiente (os ambientes dos pre dadores incluem suas presas e os ambientes das presas incluem os predadores). A seleo cria as caractersticas dos organismos, mas a seleo to necessria para mant-las como para cri-las. Por exemplo, os ancestrais das baleias eram, em certa poca, mamferos terrestres. Depois que voltaram para o mar, as contingncias que fa ziam com que as pernas representassem uma vantagem no mais mantiveram a seleo de per nas bem-formadas. Pelo contrrio, a seleo co meou a favorecer pernas que eram efetivas para movimentos na gua. As pernas dos ancestrais da baleia desapareceram gradualmente; em certo sentido, apropriado dizer que as pemas foram extintas ou que se tomaram extintas (Skinner, 1988, p. 73; cf. Provine, 1984). A seleo opera sobre as espcies, mas o faz pela ao sobre os rgos, os sistemas e as partes particulares do corpo. Consideremos um outro exemplo. Os ambi entes que possuem rvores altas, cujas folhas so comestveis, so ambientes em que pescoos lon gos podem ser vantajosos, especialmente se r vores mais curtas so raras ou se suas folhas so freqentemente consumidas por competidores. As girafas passaram pela seleo natural de pes coos relativamente longos; tal seleo no po deria ter ocorrido em ambientes sem rvores al tas (as rvores altas estabeleceram a ocasio para pescoos longos). Mas a seleo tambm depen deu do que estava disponvel como ponto de par tida. Em uma espcie, as variaes entre os indi

A pr end iza gem 5 3

vduos podem favorecer a seleo daqueles com pescoos longos, mas, em outra, elas podem favorecer a seleo dos que sobem em rvo res mais eficientemente. O ambiente selecio na a partir de populaes de organismos, mas a seleo pode operar somente sobre a faixa de variaes disponveis naquelas populaes. Os fatores estruturais devem ser includos en tre os limites sobre as variaes possveis. Na espcie humana, por exemplo, nossos ances trais mamferos de quatro patas impediram a evoluo de um par de asas emergindo de nos sos ombros. O tipo de seleo filogentica que discutimos at aqui envolve mudanas graduais que ocorre ram ao longo de extensos perodos de tempo (ve remos, mais tarde, que ela tem muito em comum com um tipo de seleo que ocorre ao longo da vida de um indivduo; ver Captulo 7, sobre mo delagem). Algumas controvrsias sobre a evo luo se referem a se ela ocorreu gradualmente, como no exemplo do cavalo, ou se em saltos (evoluo pontual ou saltao). Por exemplo, o registro fssil apresenta evidncias de grandes mudanas nas espcies, ao longo de perodos de tempo relativamente curtos, para padres evolu tivos (p. ex., a exploso de vida multicelular no perodo Cambriano; no final do perodo Cret ceo, a extino dos dinosssauros, talvez como resultado do impacto de um cometa ou de algu ma outra catstrofe planetria, e a subseqente proliferao dos grandes mamferos). Dadas as fortes evidncias para ambos os tipos de mudana evolutiva, talvez fosse mais razovel concluir que a evoluo pode ocorrer de uma maneira ou de outra, com algumas caractersticas selecionadas gradualmente e continuamente em relao a uma certa mdia da populao, e outras selecionadas depois de eventos pontuais que produziram ex pressivas mudanas ambientais (incluindo, tal vez, as extines em larga escala). Como indicado em nosso tratamento da ve locidade de corrida, a evoluo por seleo na tural envolve mais do que mudanas ao longo de dimenses nicas. Ela resulta em uma com plexidade organizada, tal como a intrincada es trutura do olho humano. E razovel acreditar que a seleo natural pudesse ter produzido tal com plexidade organizada? Usando uma analogia da

engenharia aeronutica, Dawldns (1982) apre senta o problema assim:


Os projetistas da primeira mquina a jato comea ram com um papel em branco. Imagine o que eles teriam produzido, se tivessem sido obrigados a de senvolver o primeiro jato a partir de uma mquina a gs, mudando um componente por vez, parafuso por parafuso, fivela por fivela, boto por boto. Um avio a jato montado dessa maneira seria, de fato, uma mquina bem estranha. E difcil imaginar que um aeroplano planejado por esse meio evolucio nrio pudesse sequer sair do cho. Ainda assim, para completar a analogia biolgica, temos que acrescentar mais uma restrio. No apenas o pro duto final que deve sair do cho, mas todos os exem plares intermedirios ao longo do processo e cada intermedirio deve ser superior ao seu predecessor. (Dawkins, 1982, p. 38)

Se o olho um produto da seleo natural, ele no poderia ter emergido de uma s vez. Mas que benefcio parte de um olho? Que vanta gem seletiva ele confere? A resposta que mes mo 1% de um olho seria uma vantagem substan cial, se todos os contemporneos do organismo que o possui tivessem menos que 1%. Qualquer sensibilidade luz melhor do que nenhuma, 2% melhor do que 1%, 3% melhor do que 2%, e assim por diante. Dawkins descreve as van tagens de um olho sem lentes sobre a inexistn cia de um olho:
Voc pode dizer se est prximo a encontrar uma parede ou uma pessoa. Se fosse uma criatura selva gem, voc certamente poderia usar seu olho sem len te para detectar a sombra crescente de um predador e a direo de onde ele estaria se aproximando. Em um mundo primitivo, onde algumas criaturas no tm olhos e outras tm olhos sem lentes, aquelas com olhos sem lentes teriam todo tipo de vantagens... muito plausvel que cada pequena melhora na pre ciso da imagem, do borro embaado perfeita vi so humana, aumente as chances de sobrevivncia de um organismo. (Dawkins, 1986, p.81).

Quando um sistema complexo como um olho evolui em uma dada espcie, toma-se extrema mente improvvel que outro sistema com a mes ma funo venha a substitu-lo algum dia. Por exemplo, o 1% de viso que pode ter sido um precursor evolutivo de um olho humano com pleto fornece uma vantagem consideravelmente menor, se um olho completo j existir, do que se

54

A . C harles C atania

a alternativa for no ver nada. A seleo no substitui mecanismos existentes com outros que realizariam a mesma funo; assim, no deve ramos esperar que um terceiro olho se desen volvesse no meio da testa dos homens. O que dizer de outros casos, como o disfarce ou o mimetismo nos animais? Um inseto basto pode se parecer tanto com um basto que um pssaro que come tais insetos passaria por ele sem com-lo. Mas qual seria a vantagem de se parecer apenas 5% com um basto? Em respos ta a essa questo, Dawkins (1986, pp. 83-84) as segura que mesmo 5% de semelhana pode ser o suficiente para fazer diferena ao entardecer, sob neblina ou se o pssaro estiver distante. Se os indivduos de uma populao variam em sua similaridade a ramos e gravetos, a seleo natu ral baseada em diferenas ainda que pequenas pode direcionar a populao para disfarces mais e mais convincentes. A semelhana com um basto uma proprie dade pouco usual e , certamente, apenas uma das muitas direes possveis para a seleo. J salientamos que a seleo pode operar sobre di ferentes caractersticas em diferentes populaes, e nem toda caracterstica que parea adaptativa , necessariamente, um produto da seleo natu ral. Darwin considerava a seleo natural como o mais importante mecanismo da evoluo, mas ele tomou o cuidado de apontar que a seleo natural no era o nico mecanismo possvel: Estou convencido de que a Seleo Natural tem sido o meio principal, mas no exclusivo, de modificao (Darwin, 1859, p. 6, itlicos acres centados). As explicaes selecionistas das ca ractersticas de uma populao requerem mais do que uma histria plausvel sobre como tais caractersticas podem ser vantajosas. Algumas caractersticas podem surgir como produtos incidentais da seleo. Gould e Lewontin (1979) utilizaram a construo de So Mar cos como uma analogia. So Marcos uma ca tedral em Veneza, com um domo sustentado por arcos. Quaisquer dois arcos adjacentes se encon tram no topo de um pilar comum e na constru o da catedral o espao triangular acima do pi lar e entre os dois arcos foi preenchido, e sua superfcie usada como um mosaico. O espao denominado um sprandel:

Cada sprandel contm um desenho admiravelmen te adaptado em seu espao decrescente. Um evan gelista est sentado na parte superior, ladeado pelas cidades celestes. Abaixo, um homem representan do um dos quatro rios bblicos (o Tigre, o Eufrates, o Indu e o Nilo) derrama gua de um ajarra no espa o que se estreita entre seus ps. O desenho to elaborado, harmonioso e proposital, que so mos tentados a v-lo como o ponto de partida de qualquer anlise (Gould & Lewontin, 1979, pp. 581-582).

A questo que a Catedral de So Marcos no foi construda para criar os sprandels. Os sprandels foram um subproduto arquitetnico inevitvel, mas incidental, da construo de um domo no topo de arcos arredondados. De modo anlogo, algumas caractersticas de populaes contemporneas podem no ser produtos dire tos da seleo natural; em vez disso, elas podem ter sido subprodutos incidentais de outras carac tersticas no-relacionadas, que tenham surgido por meio da seleo. Quando a fonte de uma ca racterstica herdada incerta, a questo, s ve zes, apresentada nos termos da analogia de So Marcos: ela um produto da seleo natural ou um sprandel? At aqui estivemos concentrados nas proprie dades da seleo, mas o que podemos dizer, ago ra, sobre a evoluo do comportamento (cf. Skin ner, 1984)? J notamos que o comportamento deixa apenas evidncia indireta no registro fs sil. Apesar disso, seguro supor que os sistemas de respostas evoluiram antes dos sistemas sensoriais. Para um organismo que nada pode fazer sobre o que v, no h vantagem em ver. Alguns organismos permaneceram imveis, mas outros comearam a se contrair e a se contorcer. Al guns organismos foram passivamente arrastados pelas correntes ocenicas e outros se fixaram em lugares particulares. Os organismos dos quais descendemos desenvolveram maneiras de se des locar de um lugar para outro. medida que os sistemas motores se desen volveram, as vantagens de responder diferencialmente aos eventos ambientais foram, possivel mente, a base para a seleo dos sistemas sensoriais. Afastar-se ao ser tocado pode ser o bastan te para evitar um predador e certamente seria mais vantajoso do que se afastar ao acaso. Inge rir coisas com base em suas propriedades qu

A pr end iza gem 5 5

micas certamente seria mais vantajoso que inge rir coisas ao acaso. Essas propriedades do com portamento so to importantes, que difcil ima ginar um mundo em que todas as criaturas fos sem desprovidas delas. Mas novamente devemos lembrar que no deveramos esperar encontrar exemplares de formas ancestrais nas populaes atuais. Os padres mais primitivos de comportamen to foram, provavelmente, direcionados principal mente por estmulos eliciadores. Suponhamos, por exemplo, que a luz brilhante elicie um mo vimento ao acaso. Uma larva de inseto na pre sena de luz comea a se mover e continua a faz-lo at que, por acaso, encontre um lugar escuro; uma vez ali, ela pra. No encontramos muitas dessas larvas na luz, mas podemos en contrar uma grande quantidade em lugares es curos (p. ex., debaixo do tronco podre de uma rvore cada). Quando as expomos luz, todas elas comeam a se movimentar. Mas seu com portamento no direcionado para lugares es curos; elas chegam ali por acaso, umas antes das outras, e acabam se congregando ali, apenas por que onde elas param. A orientao que ocorre dessa maneira denominada uma cinesia\ ela se distingue de uma orientao em direo a ou para longe de algum estmulo, que denominada taxia. Exemplos de taxias incluem movimentos em direo luz (fototaxia positiva) e movimentos para cima, contra a gravidade, como quando se sobe em uma rvore (geotaxia negativa). Os de talhes desses e de outros tipos de orientao va riam (por exemplo, em um organismo com dois olhos a fototaxia pode ocorrer porque o organis mo se move consistentemente, de modo a igua lar a quantidade de luz recebida em cada olho). Esses exemplos, como as relaes reflexas, partilham a propriedade de que cada uma envol ve um padro fixo de responder a eventos am bientais. De incio, no havia qualquer movimen to; ento o movimento passou a ocorrer sob con trole de estmulos. Tais padres foram particu larmente vantajosos em ambientes estveis. Por exemplo, dado um estmulo pontiagudo em sua pata, um cachorro flexiona a perna, puxando a pata em direo ao corpo. Para um animal que caminha sobre o solo, esta resposta vantajosa. Se o cachorro pisa em um espinho, sua flexo

puxa a pata para longe do espinho. A preguia, porm, vive em um ambiente muito diferente. Ela se dependura nas rvores e seus reflexos comparveis envolvem uma extenso, em vez de flexo da perna. Se o estmulo agudo um espi nho, a preguia, dependurada, vai apenas fazer o estmulo penetrar mais fundo, caso puxe sua perna em direo ao corpo, em vez de estend-la (cf.Hart, 1973, p. 176). Mas nem todos os ambientes so estveis. Deve ter sido um passo evolutivo importante quando tais padres de comportamento toma ram-se modificveis ou, em outras palavras, quando alguns organismos tomaram-se capazes de aprender. A aprendizagem deve ter sido, de incio, selecionada dentro de domnios restritos. Por exemplo, ao deixar seu ninho, a vespa esca vadeira voa em crculos cada vez maiores; seu retomo ao ninho, mais tarde, baseado em mar cos espaciais, tais como pedras ou plantas sobre as quais ela voou antes da partida (Tinbergen, 1972). Sua capacidade de aprender marcos de referncia parte de sua herana filogentica e, provavelmente, muito especfica para encon trar o ninho. A prpria capacidade de aprender deve ter sido selecionada. A seleo dessa capacidade ocorreu, possivelmente, de muitas maneiras di ferentes, em espcies diferentes e em tempos di ferentes. Os aspectos do ambiente que, geralmen te, permanecem constantes ao longo de toda a vida tm que ser aprendidos apenas uma vez, en quanto coisas sobre ambientes mutveis tm que ser aprendidas e ento descartadas e aprendidas de novo (em nossas prprias vidas, os nomes das pessoas que conhecemos no mudam muito, en quanto os itens em nossas listas de supermerca do, geralmente, mudam de uma compra para ou tra). Por isso devemos esperar que alguns tipos de aprendizagem sejam difceis de reverter, en quanto outros permanecem transitrios e facil mente modificveis. A sobrevivncia de um bezerrinho recm-nascido, por exemplo, pode de pender de quo bem e rapidamente ele aprende sobre as caractersticas que distinguem sua me das outras vacas; em um ambiente estvel, tal aprendizagem (s vezes denominada imprinting) pode ser efetivamente permanente. Sob tais con dies, o perodo de vida durante o qual a apren

56

A . C harles C atania

dizagem ocorre tambm pode ser limitado. Mas medida que o bezerro cresce e toma-se mais independente, ele tambm aprende sobre muitas coisas que mudam dia aps dia, como a passa gem de predadores ou os lugares onde o alimen to e a gua so encontrados. Os que buscam por mecanismos de aprendi zagem no sistema nervoso devem esperar que contingncias evolucionrias tenham seleciona do diferentes tipos, com alguns produzindo mu danas relativamente permanentes no compor tamento, enquanto outros produzem mudanas facilmente reversveis, com alguns restritos a si tuaes relativamente especficas e outros a si tuaes geralmente amplas, com alguns operan do em momentos da vida do organismo diferen tes de outros. Em outras palavras, a seleo de diferentes tipos de sistemas nervosos depende dos diferentes tipos de comportamento que eles produzem. Vamos retomar a este tpico no Ca ptulo 12, quando considerarmos os limites bio lgicos para a aprendizagem.

TIPOS DE SELEO A seleo que consideramos at agora, a se leo de populaes de organismos ao longo do tempo evolucionrio, pode ser chamada de sele o filogentica. Mas esse no o nico tipo de seleo que nos interessa. Dos vrios tipos de aprendizagem que sero explorados nos captu los que se seguem, um o caso em que as res postas so afetadas por suas conseqncias. Por exemplo, se um organismo est privado de ali mento e alguma resposta produz comida, aquela resposta provavelmente ir ocorrer mais freqen temente. J discutimos casos como esse, como instncias de reforamento. O reforamento tam bm pode ocorrer em situaes ou ambientes par ticulares, quando, ento, dizemos que a situao estabelece a ocasio em que as respostas so re foradas. Tais casos envolvem um dpo de sele o que opera ao longo da vida do indivduo, em vez de ao longo de sucessivas geraes. Esse tipo de seleo pode ser chamado de se leo ontogentica-, ele envolve seleo pelas conseqncias (cf. Skinner, 1981). Para o orga nismo privado de alimento, por exemplo, as res

postas que produzem comida continuam a ocor rer; outras respostas no. A comida a conse qncia que seleciona algumas respostas e no outras. Essa uma maneira de dizer que o res ponder selecionado por seu ambiente ( im portante notar o quanto isso diferente de dizer que o prprio organismo selecionou alguma maneira de responder). Poderamos dizer que as respostas que produzem comida sobrevivem e que as outras se extinguem. Paralelos entre es tas duas variedades de seleo, seleo filoge ntica ou Darwiniana e seleo ontogentica ou seleo do comportamento por suas conseqn cias, tm sido exploradas com um detalhamento considervel (p. ex., Catania, 1978; Skinner, 1981; T. L. Smith, 1986); alguns paralelos sero salientados medida que os fenmenos da apren dizagem forem sendo explorados. O comportamento adquirido por meio de aprendizagem, durante a vida de um organismo particular, desaparecer, a menos que seja, de alguma maneira, passado para outros. Uma ter ceira variedade de seleo ocorre quando o com portamento pode ser passado de um organismo para outro, como na imitao, ou, mais impor tante, na linguagem. O que algum disse ou es creveu, por exemplo, pode sobreviver morte da pessoa, se for passado e repetido por outros. O comportamento verbal que sobrevive entre os membros de um grupo e partilhado por eles parte da cultura daquele grupo. Vamos dar uma ateno especial a este terceiro tipo de sele o, que tem sido chamado de seleo cultu ral, nos captulos sobre aprendizagem social e sobre o comportamento verbal (Captulos 13 a 15). Vimos considerando trs tipos de seleo: (1) a seleo filogentica, a evoluo, ao longo do tempo biolgico, de populaes de organismos e suas caractersticas, tais como o comportamen to; (2) a seleo ontogentica, a modelagem do comportamento por suas conseqncias, duran te a vida de um organismo individual; e (3) a seleo cultural, a sobrevivncia de padres de comportamento medida que so passados de um indivduo para outros. Esses tipos de sele o dependem de comportamentos que mudam tanto durante a ontogenia quanto durante a filo genia.

A pr en d iza g em 5 7

RESUMO Comeamos esta seo com uma breve revi so da evoluo da vida na Terra. A concepo de Darwin sobre essa evoluo, a seleo natu ral, sofreu desafios de outras abordagens, tais como a ortognese e o Lamarckismo. Ela supe rou esses desafios quando foi integrada gen tica Mendeliana e teoria da mutao e quando comeou a ser reconhecido que o material gen tico era mais do tipo de uma receita do que uma cpia de um organismo. As mudanas acumula das produzidas ao longo do tempo pela seleo natural criaram a complexidade organizada, mas tambm significaram, freqentemente, que as formas ancestrais no sobreviveram nas popula es contemporneas. Alguns sistemas biolgi cos foram modelados diretamente pela seleo e outros foram subprodutos incidentais (spran deis). O advento da aprendizagem foi um even to importante na evoluo do comportamento; ele permitiu um segundo tipo de seleo, a sele o ontogentica ou a seleo de classes de com portamento no perodo de vida de um organis mo, como quando o responder persiste porque tem certas conseqncias. Um terceiro tipo de seleo tomou-se possvel quando o comporta mento pode ser passado de um indivduo para outro, na seleo cultural. A anlise do compor tamento deve considerar o comportamento como um produto da seleo filogentica, ontogenti ca e cultural; devemos entender cada tipo de se leo para entender de onde vem o comporta mento. Vamos tratar brevemente, a seguir, da relao entre a filogenia do comportamento e sua ontogenia.

recapitula a filogenia, assim, no podemos es perar traar a evoluo do comportamento se guindo o desenvolvimento do comportamento em um indivduo (ou vice-versa). Se apesar des sas limitaes ou se devido a elas, uma questo recorrente tem sido a das contribuies relativas da filogenia e da ontogenia para o comportamen to, em que medida o comportamento depende da histria evolutiva e em que medida depende da aprendizagem? Quando tais perguntas so for muladas em relao a questes socialmente sig nificativas, como a herana da inteligncia, isso geralmente resulta em acaloradas controvrsias, especialmente quando as alternativas so apre sentadas como dicotomias ou oposies (p. ex., natureza versus criao, hereditariedade versus ambiente). A pesquisa de Spalding, um naturalista bri tnico do sculo XIX, fornece um argumento elo qente para o papel da filogenia no comporta mento.
... temos apenas que olhar para os filhotes de ani mais inferiores para verificar que, de fato, eles no tm que passar pelo processo de aprender o signifi cado de suas sensaes em relao s coisas exter nas; que pintinhos, por exemplo, correm, bicam e pegam pedaos de alimento e seguem imediatamente o chamado da me, depois de deixar a casca do vo... Tenho observado e experimentado com mais de 50 pintinhos, retirando-os debaixo da galinha quando ainda esto no ovo. Mas destes, nenhum dos que emergiram da casca estava em condies de mani festar familiaridade com as qualidades do mundo externo. Ao deixar a casca eles estavam molhados e desamparados.... (Spalding, 1873/1954, pp. 2-3)

Seo B

Filogenia, Ontogenia e Comportamento

Spalding notou que os pintinhos desenvolvi am-se rapidamente. Dentro de quatro ou cinco horas depois de sair do ovo, eles estavam bican do objetos e alisando as penas de suas asas. Mas ele tambm reconheceu que muito podia ser aprendido em quatro ou cinco horas
Para tomar bvia essa objeo em relao ao olho, vou recorrer ao seguinte expediente. Tomando os ovos justamente quando os pequenos prisioneiros comeavam a abrir seu caminho de sada, eu remo via um pedao da casca e, antes que eles abrissem o olho, colocava em suas cabeas um pequeno capuz que, tendo uma tira de elstico na parte inferior, fe chava-se ao redor de seu pescoo. (Spalding, 1897/ 1954, p. 3)

O comportamento uma funo conjunta de contingncias filo genticas, aquelas que opera ram nos ambientes ancestrais durante a evolu o de uma espcie, e de contingncias ontogenticas, as que operaram durante as interaes de um organismo com seu ambiente, durante sua prpria vida (cf. Skinner, 1966). A ontogenia no
58 A . C ha rles C atania

Spalding mantinha os pintinhos cegos durante um a trs dias e, ento, removia seus capuzes.
Quase invariavelmente, eles pareciam um pouco atordoados pela luz, permaneciam imveis por v rios minutos e continuavam, por algum tempo, me nos ativos do que antes de terem sido desencapuzados. Seu comportamento, no entanto, foi, em todos os casos, conclusivo contra a teoria de que as per cepes de distncia e direo pelo olho sejam re sultado de experincia, de associaes formadas na histria de cada vida individual. Geralmente, ao fi nal de um ou dois minutos, eles seguiam com os olhos os movimentos de insetos rastejantes, viran do suas cabeas com a preciso de uma velha ave. (Spalding, 1873/1954, p. 3)

Nosso principal interesse neste texto o com portamento que aprendido, mas devemos sem pre considerar a possibilidade de que o compor tamento que estudamos tenha fontes filogenticas. Podemos tentar criar ambientes arbitrrios para minimizar o papel da filogenia. A caixa experimental padro para pombos, por exemplo, um ambiente arbitrrio, porque os ambientes naturais no apresentam os discos nos quais os pombos bicam para produzir alimento, quando o disco est iluminado. Mas os ambientes arbi trrios nem sempre so suficientemente arbitr rios; eles no necessariamente tornam arbitrrio o comportamento que ocorre neles. Considere mos as respostas de bicar de um pombo:
Tais respostas no so totalmente arbitrrias. Elas so escolhidas porque podem ser facilmente execu tadas e porque podem ser repetidas rapidamente, e por longos perodos de tempo, sem fadiga. Em um pssaro como o pombo, o bicar tem uma certa uni dade gentica; ele uma partcula caracterstica de comportamento que aparece com uma topografia bem-definida (Ferster & Skinner, 1957, p. 7)

O comportamento deve comear muito cedo na vida de um organismo, mas isso, por si s, no uma evidncia de que as fontes so filogenticas, e no ontogenticas. Lembre-se de que Spalding estava incerto sobre o quanto um pintinho podia aprender em apenas algumas horas

aps o nascimento. As criaturas podem estar pre paradas pela filogenia para fazer todo o tipo de coisas que seus ancestrais faziam, mas eles tam bm podem estar preparados para comear a aprender imediatamente. O comportamento co mea no embrio (p. ex., Hall & Oppenheim, 1987). Tanto no perodo pr-natal como no per odo ps-natal, alguns desses comportamentos so independentes da estimulao sensorial e das conseqncias. Outros comportamentos so mo dificveis, talvez at mesmo no perodo pr-na tal: o comportamento muda mesmo com as pri meiras interaes do organismo com seu ambi ente (p. ex., Johanson & Hall, 1979; Rudy, Vogt, & Hyson, 1984). De acordo com esse ponto de vista, deveria ficar evidente que a resposta ques to de ser o comportamento um produto da filo genia ou da ontogenia que ele um produto de ambas (quanto s questes sobre as magnitudes relativas de suas contribuies, naturalmente, a resposta geralmente : depende...). Antes de tratar do comportamento que aprendido, devemos notar a variedade de com portamento que est disponvel antes que a apren dizagem ocorra. O comportamento que no aprendido aparece em muitas variedades (Gallistel, 1980; von Holst, 1973). Alguns tipos tm caractersticas de osciladores (p. ex., os batimen tos cardacos). Outros tm caractersticas de servo-mecanismos (p. ex., a manuteno do equil brio, durante a qual pequenos deslocamentos produzem ajustes compensatrios). Outros ain da so produzidos, de diversas maneiras, por estmulos ( p. ex., como nas relaes reflexas ou nas cinesias e taxias ou na mudana contnua no tamanho da pupila com mudanas na intensida de da luz). As vrias fontes do comportamento fornecem nossa taxonomia, nosso sistema para a classificao do comportamento. Nos cap tulos seguintes, iremos examinar os respondentes, os operantes, os operantes discrimi nados, os significados e as lembranas como classes de comportamentos que emergem des sa taxonomia.

A prend iza gem 5 9

Comportamento Eliciado e Comportamento Emitido

4
moderna agora relacionada ao comportamento, eti queta. A raiz indo-europia, spend-, to pour a libation (fazer libao) ou to make a treaty (fechar um con trato), levou ao termo grego sponde, a drink offe ring (uma oferenda de bebida), e ao termo latino spondere, to promise (prometer). Por meio destas palavras, a palavra resposta, originalmente an un dertaking in retum (comprometer em troca), est vin culada a sponsor (esposo, patrocinador) e, talvez mesmo, a espontaneous (espontneo). Esta ltima relao interessante porque a palavra resposta, atualmente, refere-se a uma unidade de comporta mento no necessariamente produzida por um est mulo; as respostas podem ser eliciadas por estmu los, mas podem ocorrer tambm espontaneamente, quando, ento, se diz que so emitidas.

A. O Reflexo: Eliciao Propriedades do Comportamento Eliciado Estmulos Eliciadores e Probabilidades de Resposta Probabilidades ou Freqncias Relativas Probabilidades Condicionais Tipos de Relaes Estmulo-Resposta Efeitos de Eliciaes Sucessivas Habituao Potenciao Efeitos do Tempo desde o ltimo Estmulo Eliciador B. Do Comportamento Eliciado ao Comportamento Emitido O Padro Temporal do Comportamento O Papel do Exerccio As Apresentaes de Estmulo em Estampagem {Imprinting) As Operaes Estabelecedoras e a Importncia de Estmulos

A palavra reflexo derivada do latim re-, back (vol tar), adicionada de flectere, to betid (curvar). Com efeito, uma resposta reflexa era concebida como a reflexo do estmulo. E discutvel seflectere e o ter mo latino plicare, tofold (dobrar), compartilham uma raiz indo-europia comum. Se isso acontece, a pa lavra reflexo est muito proximamente relacionada a reply (replicar), complex (complexo) e multiple (mltiplo). As origens de estmulo e resposta so melhor estabelecidas. A raiz indo-europia steig-, to stick (espetar), um ancestral de estmulo. A mesma raiz gerou tam bm distinguish (distinguir), instinct (instinto) e, via stylos (estilo), um instrumento de escrever, style (es tilete ; mas provavelmente no est intimamente re lacionado a extino). Do francs antigo estiquet, to impale (espetar) e, posteriormente, to labe (rotu lar), a raiz produziu tambm uma palavra francesa

Na Psicologia da Aprendizagem, o conceito de reflexo tem desempenhado um papel histori camente importante. A primeira seo deste ca ptulo apresenta o vocabulrio dos reflexos e lida com alguns efeitos da apresentao de estmu los. O captulo comea com algumas situaes relativamente simples, nas quais um estmulo produz ou elicia uma resposta e mostra que no se pode julgar o efeito de um estmulo se no conhecermos tambm o responder que ocorre em sua ausncia. Os conceitos de probabilidade e pro babilidade condicional fornecem uma maneira de lidar com este problema; esses conceitos esto envolvidos no tratamento de uma srie de diferen tes fenmenos, descritos ao longo deste livro. Em seguida, sero examinadas as relaes re flexas simples, em termos de probabilidades con dicionais, e algumas das circunstncias sob as quais o comportamento eliciado muda ao longo

de sucessivas apresentaes de estmulo. Esses casos estabelecem o cenrio para a segunda se o do captulo, que explora como o comporta mento pode emergir quando no produzido por um estmulo eliciador; tal comportamento cha mado de emitido. O captulo termina com uma discusso das maneiras pelas quais a importn cia comportamental de um estmulo pode mudar ao longo do tempo; a estampagem (imprinting) um exemplo usado para relacionar tais efeitos ao conceito de motivao.

Seo A

O Reflexo: Eliciao

Uma maneira simples de mudar o comporta mento de um organismo consiste em apresentar um estmulo. Por exemplo, se algum est en volvido em uma conversa em voz baixa, um ru do alto sbito provavelmente interromper a con versa e produzir a mudana de postura conhe cida como reao de sobressalto. Essa relao fidedigna entre um evento ambiental, um estmu lo e uma mudana resultante no comportamento, uma resposta, tem sido denominada de reflexo. A aplicao da terminologia do reflexo para o com portamento tem uma histria que comea com Ren Descartes, um filsofo francs do sculo XVII (Fearing, 1930). Descartes estava familiari zado com os aparelhos hidrulicos construdos para entreter os visitantes nos jardins reais da Frana. Quando algum pisava em uma alavanca escondi da, disparava um fluxo de gua que movimentava as esttuas. Descartes viu uma similaridade entre tais dispositivos e o comportamento. Segundo ele, os estmulos eram comparveis a visitantes que,
entrando em uma das grutas que contm muitas fon tes, causem, eles prprios, sem saber, os movimen tos que eles mesmos testemunham. Porque, ao en trar, necessariamente pisam em certos ladrilhos ou placas, dispostos de tal modo que, se eles se aproxi mam de uma Diana no banho, fazem com que ela se esconda nas roseiras e, se tentam segui-la, fazem com que um Netuno surja sua frente, ameaandoos com seu tridente. (Descartes, traduzido em Fea ring, 1930, pp. 20-21)

Do mesmo modo que pisar na alavanca es condida dispara o movimento de uma esttua,

um estmulo dispara uma resposta. Para Descar tes, o papel dos tubos e da gua nesse sistema de esttuas era desempenhado, em organismos vi vos, por nervos e espritos animais. Para nossos propsitos, a parte mais impor tante do conceito de reflexo, como formulado por Descartes, que o termo incorporava a no o de que o comportamento, s vezes, causa do por eventos ambientais, como quando retira mos rapidamente a mo ao tocar uma chama. Eventualmente, os fisiologistas voltaram sua' ateno para o mecanismo de tais relaes comportamentais e comearam a explorar os com ponentes do arco reflexo, a rota desde o impacto sensorial original do estmulo atravs do siste ma nervoso central e a volta ao sistema muscu lar ou glandular, em cujo interior a resposta ocor ria. As anlises do reflexo tomaram-se mais e mais sofisticadas (p. ex., Sherrington, 1906) e tomaram-se a unidade bsica do comportamen to nos conceitos de reflexo condicionado de Pa vlov (1927) e no behaviorismo de Watson (1919). Mencionamos acima duas ilustraes de re flexos: a reao de sobressalto e a retirada da mo de uma chama. Muitos outros so familia res: a extenso do joelho produzida por uma ba tida no tendo patelar; salivao produzida por alimento na boca; ajustes posturais produzidos por perda brusca de apoio. Tais exemplos tm em comum a caracterstica de que algum est mulo produz seguramente alguma resposta. Essa a propriedade que define um reflexo. Nessas circunstncias, dizemos que o estmulo elicia a resposta ou que a resposta eliciada pelo est mulo; o estmulo um estmulo eliciador, e a resposta uma resposta eliciada (o termo eliciado nunca usado no sentido inverso, para nos referirmos ao efeito de uma resposta sobre a ocor rncia de um estmulo). O reflexo no o estmulo nem a resposta, a relao entre ambos (Skinner, 1931). Por exem plo, no poderamos falar de reflexo se dispa rssemos fogos de artifcio, mas no observs semos a resposta de sobressalto; o rudo sozinho insuficiente para justificar o uso do termo. Nem falaramos de reflexo se observssemos uma res posta sem um estmulo identificvel; em si mes ma, a reao de sobressalto no um reflexo. E no deveramos confundir as reaes de sobres-

A pr end iza gem

61

salto produzidas por rudos intensos com aque las produzidas de outras maneiras. Muitos refle xos receberam o nome a partir de suas respostas caractersticas; so exemplos o reflexo patelar e a reao de sobressalto. Mas til lembrar que eles no so nomes para as respostas; se obser vssemos a salivao ou a extenso do joelho na ausncia de estmulos eliciadores, a terminolo gia do reflexo no seria apropriada. Consideremos outro exemplo. A produo de contrao da pupila por luz intensa no olho tem sido, s vezes, chamada de reflexo pupilar. Mas, a rigor, essa relao envolve uma resposta que se ajusta continuamente aos nveis do estmulo: medida que o brilho aumenta, a pupila se con trai; e medida que diminui, a pupila se dilata. Sob luz muito intensa, a pupila humana pode reduzir-se a aproximadamente um vigsimo do tamanho de quando est relaxada e em total es curido. Nesse caso, no apropriado usar a ter minologia dos reflexos, porque esta linguagem tira a ateno da relao funcional inversa entre o tamanho da pupila e o brilho, enfatizando ape nas a mudana particular no tamanho da pupila que faz parte de um contnuo de possibilidades. Para outros casos, ainda que superficialmen te paream envolver as relaes reflexas, a lin guagem do reflexo pode ser equivocada. Na con versa cotidiana, por exemplo, por vezes falamos de pessoas que tm reflexos rpidos ou lentos, freqentemente nos referindo ao comportamen to habilidoso de atletas em esportes competiti vos. No entanto, essas referncias geralmente so tecnicamente imprecisas. Uma reao rpida ao disparo inicial em uma corrida, por exemplo, um comportamento operante ou um comporta mento que depende tanto de seus antecedentes quanto de suas conseqncias, ainda que ocorra muito rapidamente. Tais qualificaes deixam claro que os refle xos so apenas um subconjunto dos muitos ti pos de relaes que podem existir no comporta mento. Alm disso, nossa ateno restringir-se s relaes reflexas que envolvem os estmu los externos. No nos preocuparemos com as coordenaes reflexas entre as respostas como quando, na flexo ou na extenso de membros, a contrao de um msculo acompanhada pelo re laxamento do msculo oposto, nem com outras co

ordenaes mais complexas (p. ex., coordenaes rtmicas na locomoo: Gallistel, 1980). Alguns exemplos sero examinados no Captulo 7.

PROPRIEDADES DO COMPORTAMENTO ELICIADO Uma vez identificada uma relao reflexa entre um estmulo e uma resposta, podemos exa minar as propriedades dos reflexos (cf. as Leis do Reflexo, Skinner, 1938). Consideremos um estmulo eliciador, como uma soluo cida ou azeda na lngua (p. ex., vinagre) e uma resposta eliciada, como a salivao. Acima de um valor mnimo, denominado limiar, o cido na lngua elicia fidedignamente a salivao, mas com uma concentrao muito baixa ou uma quantidade muito pequena ela pode no ocorrer. Quando a intensidade de um estmulo muito pequena para eliciar uma resposta, diz-se que o estmulo est abaixo do limiar. O limiar no tem um valor fixo, um resumo estatstico extrado de nossas mensuraes. medida que concentramos a soluo ou aumen tamos sua quantidade, ou ambas, a probabilida de de se alcanar valores que produzam a sali vao cada vez maior. A uma dada concentra o, podemos determinar quantas gotas devem ser colocadas na lngua para eliciar a salivao de maneira confivel; de maneira inversa, para um dado nmero de gotas, podemos determinar a concentrao necessria. Algumas concentra es e quantidades tero um efeito apenas mar ginal, algumas vezes eliciando a salivao, ou tras vezes no. Note que um estmulo, em si mesmo, no tem um limiar. Pelo contrrio, os valores de limiar so determinados para certas caractersticas par ticulares de estmulos, enquanto as outras carac tersticas do estmulo so mantidas constantes. Por exemplo, na eliciao de salivao, o nme ro limiar de gotas seria tipicamente menor para uma soluo cida forte do que para uma soluo cida fraca; ento no teria sentido especificar o limiar para o nmero de gotas sem tambm espe cificar a acidez da concentrao ou vice-versa. Algum tempo sempre transcorre entre o est mulo e a resposta; esse perodo de tempo cha-

62

A . C harles C atania

mado de latncia da resposta. Alm disso, a res posta deve ocorrer com alguma magnitude e ter alguma durao. Uma vez que essas proprieda des podem covariar, elas tm recebido, s vezes, um nome comum, a.fora do reflexo. Assim, a fora do reflexo seria fraca se o responder ocor resse com a latncia longa, a magnitude peque na e a durao curta, mas seria forte se o respon der ocorresse com a latncia curta, grande mag nitude e longa durao. (A taxa da resposta eliciada no relevante para a fora do reflexo, porque ela determinada pela taxa de apresen tao do estmulo eliciador). Sechenov (1863), um fisilogo russo, notou que o gasto de energia do organismo em muitas respostas (p. ex., espirros e tosses) excede de lon ge a energia fornecida por um estmulo elicia dor. O efeito eliciador de um estmulo no de pende de qualquer transferncia direta de ener gia do ambiente para o organismo; pelo contr rio, observou Sechenov, o estmulo deveria ser considerado como um tipo de gatilho, liberando a energia que o organismo j tem disponvel em msculos, glndulas ou outras estruturas. Essa noo era, naturalmente, consistente com a con cepo de reflexo de Descartes. Embora o estmulo eliciador seja mais preci samente considerado um gatilho que libera ener gia j disponvel no organismo, a intensidade do estmulo eliciador pode afetar a resposta eliciada. A latncia da resposta, de modo tpico, varia inversamente intensidade do estmulo; em ou tras palavras, a latncia da resposta diminui medida que a intensidade do estmulo aumenta. E a magnitude e a durao da resposta, tipica mente, variam diretamente com a intensidade do estmulo; em outras palavras, essas medidas au mentam medida que a intensidade do estmulo aumenta. Dizer que a fora do reflexo aumenta com a intensidade do estmulo uma maneira de resumir essas relaes. Uma vez que se tomou comum falar de rela es reflexas em termos de fora, mais do que em termos de medidas especficas, tambm se tomou mais fcil considerar a relao reflexa como uma unidade fundamental de comporta mento, e os reflexos comearam a ser tratados como componentes bsicos, a partir dos quais eram construdos comportamentos mais comple

xos. O conceito de reflexo tinha uma simplici dade tentadora e, medida que passou a ser mais amplamente aceito como uma unidade comportamental, parecia razovel concluir que as rela es reflexas poderiam constituir uma base para a compreenso de uma variedade de processos comportamentais. Alguns estmulos haviam sido identificados como causa de algumas respostas e, indevidamente, passou-se a supor que para toda resposta deveria existir um estmulo elicia dor correspondente. O sistema de reflexo condicionado de Pavlov e o behaviorismo de Watson, nas dcadas de 1920 e 1930, desenvolveram-se a partir de tal suposi o. Com reflexos servindo como unidades de comportamento, o comportamento complexo era, ento, tratado como nada mais que a combina o de tais unidades. Quando uma resposta ocor ria sem que um estmulo eliciador fosse obser vado, eram hipotetizados alguns estmulos com propriedades apropriadas. Alm disso, supunhase que as respostas de um reflexo tinham propri edades de estmulo que as tomavam capazes, por sua vez, de eliciar outras respostas. Assim, o comportamento que se estendia por longos per odos de tempo podia ser interpretado como uma seqncia ou cadeia de reflexos, em que cada resposta funcionaria simultaneamente como a resposta eliciada de um reflexo e 0 estmulo eli ciador do prximo. Tais sistemas de reflexo fo ram elaborados de vrias maneiras mas, apesar da engenhosidade de seus proponentes, eles no mais provocam ateno substancial na psicolo gia da aprendizagem. O conceito de reflexo tem seu lugar na anlise do comportamento, mas seu alcance limitado, e ele no se sustenta por si mesmo.

ESTMULOS ELICIADORES E PROBABILIDADES DE RESPOSTA O reflexo apenas uma relao, entre as muitas relaes possveis entre os estmulos e as respostas. No reflexo, a apresentao de algum estmulo produz fidedignamente alguma respos ta. Mas, o estmulo desse reflexo pode afetar outras respostas de maneira diferente, e a res posta desse reflexo pode ser diretamente afetada

A p re n d iz a g e m

63

por outros estmulos. Para qualquer estmulo par ticular, sua apresentao pode aumentar a pro babilidade de algumas respostas, diminuir a pro babilidade de outras e ainda no ter qualquer efei to sobre outras. Do mesmo modo, para uma res posta particular, sua probabilidade pode ser au mentada por alguns estmulos, diminuda por outros e, ainda, pode no ser afetada por outros. Alm disso, no basta simplesmente notar que uma resposta segue regularmente um estmulo para concluir que a linguagem do reflexo seja apropriada. Precisamos tambm saber o quanto a resposta provvel sem o estmulo. Por exem plo, se um rato, em uma roda de atividade, gasta a maior parte de seu tempo correndo e corre tan to na presena quanto na ausncia de rudo, no poderamos dizer que o rudo elicia o correr, sim plesmente porque observamos que o rato corre quando apresentamos o rudo. Para falar de rela es reflexas, devemos saber qual a probabili dade da resposta tanto na ausncia quanto na presena do estmulo. Considere um cachorro que esteja se coan do. Se aparece um gato, ele para de se coar, rosna e assume uma postura agressiva. Se o gato vai embora e o dono do cachorro chega, ele late, pula e abana o rabo. Mas, se o dono ralha, o ca chorro pode choramingar e esconder o rabo en tre as pernas. No podemos dizer sequer se as respostas do cachorro ao dono so estritamente eliciadas ou se dependem, em alguma medida, de conseqncias de respostas passadas na pre sena do dono. O gato, o dono e a repreenso do dono, cada um desses eventos toma algumas respostas mais provveis, enquanto toma outras menos prov veis. Algumas das respostas podem ser observa das de tempos em tempos, mesmo na ausncia desses estmulos e nenhuma delas ocorrer ne cessariamente toda vez que um estmulo espec fico for apresentado. Em uma relao reflexa, uma resposta pouco freqente na ausncia de algum estmulo ocorre regularmente quando tal estmulo apresentado, mas essa apenas uma entre muitas possibilidades. A resposta de latir, por exemplo, afetada por vrios estmulos di ferentes, e podemos estar interessados em est mulos que a tornem menos provvel, bem como naqueles que a tomem mais provvel.

Probabilidades ou Freqncias Relativas Essas vrias relaes entre os estmulos e as respostas podem ser melhor descritas quantitati vamente em termos de probabilidades ou fre qncias relativas. Ento seremos capazes de definir os efeitos de estmulos comparando a pro babilidade de uma resposta quando um estmulo est presente com sua probabilidade quando o estmulo est ausente. Uma probabilidade ou fre qncia relativa uma proporo ou razo: o nmero de vezes em que o evento ocorre, com parado com o nmero de vezes em que ele pode ria ter ocorrido. Por exemplo, no reflexo de Babinski, um leve toque na sola do p de um beb recm-nascido elicia, tipicamente, o espalhamento ou distenso dos dedos. Calculamos a probabilidade de res posta contando quantas vezes uma resposta produzida ao longo de um dado nmero de apre sentaes de estmulo. No beb recm-nascido, a distenso dos dedos pode ser produzida por cada um dos vinte toques na sola do p; a pro poro de respostas , portanto, de 20 respostas em 20 oportunidades, ou uma probabilidade de 1,0. O reflexo de Babinski geralmente diminui com a idade e, se testarmos este reflexo de novo algum tempo depois, pode ser que somente 6 dos 20 toques possam, ento, produzir uma respos ta; a probabilidade agora de 0,3. Mais tarde ainda na vida da criana, provavelmente, verifi caremos que o reflexo ter desaparecido com pletamente: nenhum dos 20 toques produz uma resposta, e a probabilidade, ento, 0,0. Na notao matemtica de probabilidades, esses exemplos podem ser escritos, respectiva mente, como:
p(Rj) = 1,0; pR j) = 0,3; e, p(R3) = 0,0.

Aqui p representa probabilidade e os termos entre parntesis so abreviaes dos eventos cujas probabilidades so especificadas na equa o (neste caso, R para respostas, onde os ndi ces 1,2 e 3 correspondem s trs medidas suces sivas do reflexo de Babinski). Esses exemplos tambm ilustram que as probabilidades so de finidas de tal modo que elas podem ter valo res somente na faixa entre 0,0, quando o even-

64

A . C h a r le s C a ta n ia

to nunca ocorre, e 1,0, quando o evento sem pre ocorre.

Probabilidades Condicionais O reflexo de Babinski um exemplo apro priado a nossos propsitos, porque a resposta de distenso dos dedos no ocorre freqentemente na ausncia de seu estmulo eliciador. Mas o que ocorre com o piscar eliciado por um sopro de ar no olho? Se estudamos esse reflexo com uma criana cujas piscadas j ocorrem a uma taxa de uma resposta a cada um ou dois segundos, como podemos distinguir piscadas eliciadas daquelas que teriam ocorrido mesmo na ausncia do so pro do ar (Spence & Ross, 1959)? De fato, po demos ser incapazes de dizer se uma piscada especfica ou no eliciada. Mas, comparando a probabilidade de uma piscada depois do sopro de ar com a probabilidade na ausncia de sopro, podemos, pelo menos, avaliar o efeito do est mulo. Nosso procedimento ilustrado na Figura 4.1. Observamos a plpebra, registramos as piscadas dentro de um perodo de tempo depois de cada

estmulo e comparamos o responder, nesses pe rodos de tempo, com o responder em perodos de tempo equivalentes na ausncia de um est mulo. As probabilidades, neste exemplo, so ex pressas com a seguinte notao:
p(RJS) = 1,0 ; p(R/no S) = 0,6.

Nessa notao, o R uma resposta e o S um estmulo. A primeira equao pode ser lida como: a probabilidade de uma resposta, dada a apresentao de um estmulo (piscar o olho, dado o sopro de ar), 1,0. A segunda equao pode ser lida como: a probabilidade de uma resposta, dada a ausncia de um estmulo (piscar o olho, sem sopro de ar), 0,6. Este tipo de probabilida de, em que a probabilidade de um evento espe cificada em termos da presena ou ausncia de um outro evento, uma probabilidade condici onal (a terminologia no deveria ser confundida com a de reflexos condicionados ou condicio nais de Pavlov, embora ambas tenham a caracte rstica de que um evento uma condio para algum outro evento). Em outras palavras, p(AJ B) pode ser lida como: a probabilidade de A,

_I _I J _I

l I_I_I__!_l__

I_ _l __1 __ 1 _ _1 _ _1 _ _ I_ _L

I I J i i

Tempo (Secundos)

FIGURA 4.1 Estimativa da probabilidade de piscadas com e sem o sopro eliciador. Cada Unha vertical slida representa uma piscada. Na linha A nenhum sopro fo i apresentado. As linhas tracejadas separam 5 perodos de 1 segundo durante os quais as piscadas foram registradas (S=segundos). Ocorreram piscadas em trs destes cinco perodos e a probabilidade de piscadas na ausncia do estmulo , portanto, 0,6. Na linha B, cada seta representa um sopro no olho. Ocorreu uma piscada em cada um dos cinco perodos de um segundo que se seguiu a esses estmulos. Assim, a probabilidade de uma piscada dado um sopro de ar , portanto, 1,0. Somente a primeira das duas piscadas que se seguiram ao estmulo X contaram para esta probabilidade. Contamos um perodo de tempo como no contendo piscadas ou contendo ao menos uma piscada e, ento, calculamos a probabilidade, dividindo os perodos de tempo, com ao menos uma piscada, pelo total dos perodos de tempo. O sopro de ar aumentou de 0,6 para 1,0. (Um experimento real usaria uma amostra muito mais ampla de observaes para efeito de clculo de probabilidades.)
A p re n d iz a g e m

65

dado B; ou a probabilidade de A na condio de que B esteja presente. De maneira semelhante, /?(X/no Y) pode ser lida como: a probabilidade de X, dado no-Y; ou, a probabilidade de X sob a condio de que Y esteja ausente. As anlises subseqentes favorecero a lin guagem de probabilidades em detrimento de outras maneiras de se descrever o comportamen to. No h muita diferena entre dizer que um estmulo causou uma resposta e que um estmu lo eliciou uma resposta. Qualquer uma das duas formas poderia ser aplicada a casos particulares de uma relao reflexa (como quando a apresen tao de um estmulo especfico, M, seguida por uma instncia particular de resposta, N). Tam bm no h muita diferena entre dizer que um estmulo aumentou a tendncia a responder e que um estmulo elevou a probabilidade da resposta. Esses usos podem ser aplicados aos efeitos mdi os ao longo de muitas ocorrncias (p. ex., quando o estmulo O geralmente produz a resposta P).

Para essa finalidade, usaremos o sistema de co ordenadas da Figura 4.2. O eixo y representa a probabilidade de resposta considerando que um estmulo tenha sido apresentado; o eixo x repre senta a probabilidade de resposta considerando que o estmulo no tenha sido apresentado (cf. coordenada no glossrio). Em outras palavras, qualquer ponto neste grfico representa duas pro babilidades condicionais: a probabilidade de res posta dado um estmulo, p{R/S), e a probabili dade de resposta dado um no-estmulo,/?(R/no S). Por exemplo, o ponto A, na Figura 4.2 repre senta uma relao estmulo-resposta em que a probabilidade de resposta 0,75 quando o est mulo est presente e somente 0,50 quando o es tmulo est ausente; neste caso, o estmulo au menta a probabilidade da resposta. A diagonal, na Figura 4.2 apresenta um inte resse especial. Uma resposta que ocorra sem ser eliciada por um estmulo considerada emitida. A diagonal representa as relaes estmulo-res posta em que a probabilidade de resposta inde pendente do estmulo ou no afetada por ele.

TIPOS DE RELAES ESTMULO-RESPOSTA Discutimos, principalmente, aqueles casos que envolvem uma classe de estmulo e uma clas se de resposta. Mas o comportamento geralmente mais complicado: os ambientes incluem uma variedade de estmulos, e os organismos produ zem uma variedade de respostas. Por exemplo, podemos notar dois tipos de pios produzidos por patinhos recm-sados da casca. Aqueles produ zidos quando a me est presente so, geralmen te, referidos como pios de contentamento; aque les que ocorrem quando um pssaro estranho apa rece so, geralmente, referidos como pios de desconforto (p. ex., Hoffman, 1996). Poderamos reduzir a probabilidade de pios de contentamen to e elevar a probabilidade de pios de descon forto removendo a me ou apresentando um ps saro estranho. Nossa nomenclatura deve-nos per mitir descrever os efeitos de cada estmulo sobre cada resposta. Devemos lidar no com os est mulos apenas ou com as respostas apenas, mas com as relaes estmulo-resposta. Podemos agora resumir algumas dessas rela es em termos de probabilidades condicionais.

p(R/noS) - Probabilidade de Resposta Dado um No-Estmulo

FIGURA 4.2 Relaes estmulo-resposta representadas como probabilidades condicionais de resposta dada presena de um estmulo, p(R/S), e sua ausncia, p(R/ no S). So mostrados exemplos de relaes estmuloresposta em que o estmulo aumenta a probabilidade da resposta (A), no tem efeito sobre a probabilidade da resposta (B) ou reduz a probabilidade da resposta (C); o aumento na probabilidade da resposta chamado reflexo, em que o estmulo produz confiavelmente a res posta, ilustrado em D.

66

A . C h a r le s C a ta n ia

Assim, no ponto B, a probabilidade de resposta 0,25, quer o estmulo seja apresentado ou no. Por exemplo, os pios de contentamento ou os pios de desconforto do patinho podem no ser afetados pela presena ou ausncia de algum de seus irmos. Para dizer que uma resposta foi eliciada, no basta saber que a resposta seguiu um estmulo. Pode acontecer que uma resposta seja emitida assim que um estmulo apresentado. Ento, quando uma resposta segue um estmulo, no podemos dizer que a resposta foi eliciada, a menos que saibamos que o estmulo, de fato, causou a resposta. Uma terceira classe de relaes estmulo-resposta ilustrada pelo ponto C, para o qual uma probabilidade de resposta de 0,90, quando o es tmulo est ausente, reduzida para 0,10 pela presena do estmulo; neste caso, o estmulo re duz a probabilidade de resposta. Tais redues de probabilidade de resposta por um estmulo so, algumas vezes, chamadas de inibio do reflexo. Por exemplo, se os pios de contentamen to do patinho cessassem quando um pssaro estranho aparecesse, poderamos dizer que o pssaro estranho inibiu os pios de contenta mento. O ponto D representa um caso onde um est mulo aumenta a probabilidade de resposta de, aproximadamente, 0,1 para cerca de 1,0. Esse o tipo de relao estmulo-resposta que denomi namos de reflexo. Enquanto inibe os pios de con tentamento, o pssaro estranho pode produzir um efeito tambm sobre os pios de desconforto do patinho. O grfico mostra que esta apenas uma den tre as inmeras possibilidades existentes. Em al gum ponto, entre o extremo superior do grfico ondep(R/S) prxima de 1,0 e a diagonal, onde S no tem qualquer efeito sobre R, temos que decidir se o efeito eliciador do estmulo no mais fidedigno o suficiente para justificar que chamemos a relao de reflexo. Mas onde deve estar o limite? Provavelmente no excluiramos os casos em que p(RJS) apenas um pouco me nor que 1,0 (p. ex., 0,95 ou mesmo 0,90). Mas tambm no tenderamos a incluir efeitos muito leves dos estmulos. Por exemplo, falaramos de uma relao estmulo-resposta como sendo re flexa, se uma resposta com probabilidade de 0,26

fosse aumentada pelo estmulo para uma proba bilidade de 0,32 ? Certamente no. Todos os pontos acima e esquerda da dia gonal na fi gura representam excitao, casos nos quais um estmulo aumenta a probabilidade de resposta; enquanto aqueles abaixo e direita re presentam inibio, casos em que um estmu lo reduz a probabilidade de resposta. Qualquer limite que pudssemos estabelecer para separar essas relaes estmulo-resposta que chamamos de reflexos daquelas que no chamamos, seria arbitrrio. Essa concluso importante. Vimos que alguns dos sistemas comportamentais ini ciais, como os de Watson e Pavlov, basearam seus desenvolvimentos no reflexo como unidades fun damentais de comportamento. Sem dvida, era mais fcil lidar com as relaes reflexas, alta mente regulares, do que com outras relaes es tmulo-resposta, menos fidedignas. Mas, se a Figura 4.2 apropriada para descrever as rela es estmulo-resposta e, se o reflexo apenas um caso especial entre elas, ento, qualquer sis tema de comportamento construdo somente com base no reflexo, como uma unidade comportamental, estava destinado a ser incompleto. Uma das propriedades do comportamento deixadas de fora das primeiras explanaes era a emisso de respostas, a ocorrncia de respos tas na ausncia de estmulos eliciadores. As res postas emitidas recebiam nomes como compor tamento instrumental ou operante, porque eram estudadas em termos do quanto eram instrumen tais para mudar o ambiente ou como operavam no ambiente. Elas derivavam sua importncia no de sua relao com os estmulos eliciadores, mas de suas conseqncias. Por contraste, o compor tamento eliciado era denominado reflexo ou respondente. Quando essa distino foi feita, outras carac tersticas foram adicionadas a ela. Especifica mente, argumentou-se que o comportamento ins trumental ou operante consistia de respostas es quelticas, como os movimentos dos membros, enquanto o comportamento reflexo ou respondente consistia de respostas autnomas, como as secrees glandulares. Essa distino tambm foi vista como paralela distino tradicional entre ao voluntria e involuntria. Tais distines, desde ento, tm sido seriamente questionadas.

A p re n d iz a g e m

67

Por exemplo, o comportamento de curvar a postura, eliciado por um barulho forte e sbito no reflexo de sobressalto, uma resposta moto ra melhor descrita como involuntria. Mas a res posta de engolir parece voluntria e tambm en volve uma relao reflexa. Essa resposta elici ada pela estimulao proveniente do fundo da garganta, gerada por qualquer coisa slida ou l quida que esteja na boca, j que impossvel engolir se a boca est seca ou se no houver algo a ser engolido para estimular essa rea. Por ou tro lado, dirigir certamente parece ser uma ao voluntria e operante. Contudo, um motorista experiente que se sente no banco do passageiro de um carro pode, involuntariamente, pisar forte no assoalho do carro sem que haja ali um pedal de freio, quando um obstculo se aproxima re pentinamente sua frente na estrada. Temos aqui todas as possibilidades: quer o comportamento seja operante ou respondente, podemos identifi car exemplos que paream ser tanto voluntrios quanto involuntrios. Em outras palavras, a dis tino leiga entre as aes voluntrias e aquelas involuntrias nada tem a ver com a nossa distin o entre comportamento operante e responden te. (Como ser visto quando tratarmos do com portamento verbal, no Captulo 14, o mais im portante para determinar se um comportamento pode ser chamado de voluntrio ou de involun trio deve ser se a pessoa que agiu pode identifi car a origem do controle de suas aes.) As respostas esquelticas podem ser eliciadas e as respostas autnomas podem ser emiti das. importante manter a distino entre o res ponder emitido e o eliciado. Mas, a mesma res posta pode ser, algumas vezes, eliciada e, algu mas vezes, emitida. Assim, no podemos classi ficar o responder efetivamente nestas duas cate gorias, com base em propriedades fisiolgicas do comportamento, tais como a diferena entre as respostas esquelticas e as autnomas. A Figura 4.2 apia um outro ponto mencio nado anteriormente. Quando definimos reflexo, argumentamos que o reflexo no nem o est mulo nem a resposta, mas sim a relao entre eles. O grfico representa as relaes estmuloresposta; ele no pode representar os estmulos sozinhos, nem as respostas sozinhas. Assim, o pssaro estranho como um estmulo no tem

qualquer localizao no grfico; sua localizao depende da resposta que estamos medindo. Si milarmente, o pio de desconforto do patinho, como resposta, no tem qualquer localizao no grfico; sua localizao depende do estmulo que estamos apresentando.

EFEITOS DE ELICIAES SUCESSIVAS Descrevemos alguns efeitos de apresentaes de estmulos sobre o comportamento. Uma com plicao que duas apresentaes diferentes de um mesmo estmulo podem ter efeitos diferen tes. Por exemplo, podemos nos assustar muito mais com o primeiro relmpago em uma tem pestade do que com os outros relmpagos que se seguem. Alm disso, os efeitos dos estmulos podem depender de quo rapidamente eles se seguem uns aos outros. Por exemplo, se estamos descascando cebolas, as lgrimas eliciadas pela cebola que est sendo descascada no momento podem depender de se comeamos a trabalhar com ela imediatamente depois de terminar a l tima ou se acabamos de retomar de um interva lo. E, em um outro efeito denominado somao, um estmulo abaixo do limiar para eliciar uma resposta se for apresentado uma s vez, pode tornar-se um eliciador efetivo, se for apresen tado repetidamente, com uma taxa suficiente mente alta. Em outras palavras, o responder eliciado freqentemente depende do nmero de apresentaes do estmulo e de seu espaamen to no tempo.

Habituao J mencionamos a reao de sobressalto pro duzida por um evento inesperado, como um re lmpago ou um rudo intenso sbito. Mesmo sem outros eventos que sinalizem sua ocorrncia, a repetio de um rudo intenso produzir suces sivamente menores reaes de sobressalto, at que, eventualmente, nenhum comportamento ser observado quando o rudo ocorrer. Muitos estmulos eliciam as respostas chamadas de orientao ou de observao; por exemplo, um

68

A . C h a r le s C a ta n ia

cachorro levanta suas orelhas em resposta a um som novo ou comea a farejar em resposta a um odor no-usual. Com as repeties desses est mulos, entretanto, o responder do cachorro dimi nui; o responder ocorre com magnitude menor e latncia mais longa, at que, eventualmente, desa parece completamente (no entanto, veremos mais tarde que as respostas de orientao e de observa o podem depender no apenas de estmulos eliciadores, mas tambm de suas conseqncias). Esse decrscimo no responder com estmu los repetidos tem recebido o nome de habitua o. (Outro termo possvel, adaptao, algumas vezes se refere a mudanas ocorridas no com portamento, devido exposio contnua a al guns estmulos ou situaes, como quando se diz que um organismo se adapta ao ambiente do la boratrio; algumas caractersticas da terminolo gia da habituao e de termos relacionados de pendem de se as mudanas no responder podem ser atribudas a tipos especficos de mudanas no sistema nervoso; cf. Groves & Thompson, 1970). A habituao uma caracterstica do respon der eliciado, produzida por uma variedade de es tmulos. Ela ocorre com respostas to diferentes como a mudana na resistncia eltrica da pele produzida por choque (a reao galvnica da pele ou GSR), pios de desconforto de pssaros si lhueta de um predador passando por sobre sua cabea e contraes em minhocas, produzidas por exposio luz, para no mencionar as rea es de sobressalto e as respostas de orientao, j mencionadas antes (p. ex., Ratner, 1970). A adaptao tambm pode ser um componente im portante da dinmica das emoes (Solomon & Corbit, 1974).

os estmulos considerados aversivos ou puniti vos do que com os estmulos considerados neu tros, apetitivos ou reforadores. A potenciao no deve ser confundida com outro fenmeno chamado de sensibilizao (cf. Ison & Hoffman, 1983). Na sensibilizao, os efeitos eliciadores de um estmulo aumentam como resultado de apresentaes de algum ou tro estmulo; um estmulo amplifica o efeito eli ciador de outro estmulo. Por exemplo, um cho que eltrico pode tomar mais provvel que um rudo intenso subseqente produza uma reao de sobressalto; diz-se que o choque sensibiliza o organismo para o rudo. O mtodo de apresentao do estmulo pode determinar se o efeito observado o da habitua o ou da potenciao. Kimble e Ray (1965) es tudaram o reflexo de limpeza no sapo: o toque de uma cerda no dorso do sapo elicia um movi mento da pata traseira sobre as costas. Em um grupo, toques sucessivos eram feitos em uma regio especfica do dorso do sapo, mas dentro dessa regio a localizao exata da estimulao podia variar de um toque para o outro; em um segundo grupo, os toques sucessivos eram fei tos exatamente na mesma localizao do dorso, a cada vez. Em ambos os grupos eram apresen tados, por dia, 100 toques a intervalos de 10 se gundos, ao longo de 12 dias consecutivos. Os grupos comearam com aproximadamente a mesma probabilidade de movimentos de limpe za eliciados, mas essa probabilidade aumentou ao longo dos dias para o primeiro grupo e dimi nuiu para o segundo grupo. Em outras palavras, ocorreu a potenciao quando a localizao do toque eliciador variava ligeiramente de apresen tao para apresentao, mas quando a localiza o era constante, ocorreu a habituao.

Potenciao Mas os estmulos, s vezes, podem ter efei tos opostos. Por exemplo, os choques eltricos eliciam guinchos em ratos; se vrios choques so apresentados, apresentaes subseqentes pro duzem mais o responder do que as primeiras (p. ex., Badia, Suter & Lewis, 1966). Esse efeito tem sido chamado de potenciao (outro termo tam bm utilizado facilitao', p. ex., Wilson, 1959). O processo de potenciao mais provvel com Efeitos do Tempo desde o ltimo Estmulo Eliciador Se o estmulo deixa de ser apresentado por algum tempo depois da habituao ou da poten ciao, a probabilidade de o responder ser elici ado poder retomar a valores prvios. Por exem plo, a reao de sobressalto ao rudo alto pode diminuir ou mesmo desaparecer depois de vri

A p re n d iz a g e m

69

os rudos em sucesso, mas pode aparecer de novo, com toda a fora, se, mais tarde, um rudo intenso se seguir a vrias horas de silncio. Se o responder eliciado diminui ao longo de estmu los sucessivos, provvel que ele retome aos nveis anteriores mais elevados, depois que os estmulos forem descontinuados. De maneira inversa, se o responder eliciado aumenta ao lon go de estmulos sucessivos, ele geralmente re torna a seus nveis anteriores mais baixos, de pois que os estmulos so descontinuados. As mudanas no responder, chamadas de adaptao e de facilitao, no so permanentes e, medi da que o tempo passa, ocorre um retomo aos n veis prvios.
HABITUAAO

Essas relaes esto resumidas na Figura 4.3. Cada linha mostra os efeitos hipotticos de dez estmulos sucessivos sobre a probabilidade de resposta ou fora do reflexo. A parte superior da Figura 4.3 (A, B e C) ilustra a habituao; a par te inferior (D, E e F) ilustra a potenciao. Em ambos os casos, so dados trs exemplos que di ferem somente no tempo que separa os primei ros cinco estmulos dos ltimos cinco. medi da que esse tempo se toma mais longo (de A a C e de D a F), o responder produzido pelos cinco ltimos estmulos fica mais similar ao respon der produzido pelos primeiros cinco estmulos. Em outras palavras, com a passagem do tempo, o responder retorna a seus nveis prvios. Por

hi
W

m X

h POTENCIAO

cc Q )

CD

Aff:

f f li
Tempo

FIGURA 4.3 Habituao e potenciao. As setas indicam os estmulos; as linhas verticais indicam as probabilidades com as quais estes estmulos eliciam as res postas. A habituao ilustrada em A, B e C; a probabilidade diminui com os est mulos sucessivos. A potenciao ilus trada em D, E e F; a probabilidade au menta com os estmulos sucessivos. Em ambos os casos, as probabilidades de res posta retomam a nveis prvios medida que aumenta o tempo desde o ltimo est mulo.

70

A . C h a r le s C a ta n ia

exemplo, em A o responder eliciado pelo lti mo estmulo x com uma probabilidade menor do que pelo primeiro estmulo w. Mas quando o es tmulo x apresentado depois de perodos su cessivamente mais longos sem estmulos, como em B e C, a probabilidade com a qual o estmulo x elicia o responder se aproxima daquela com que o estmulo w eliciou o responder. Relaes anlogas existem para os estmulos y e z em D, E, e F. Se a habituao fosse irreversvel, podera mos observar a adaptao apenas uma vez ao lon go da vida de um indivduo ou, do contrrio, as adaptaes sucessivas levariam o responder a n veis cada vez mais baixos, at que, finalmente, desaparecesse por completo. Um caso paralelo para a potenciao levaria, de modo semelhan te, ou a uma nica ocorrncia de potenciao ao longo da vida do organismo, ou a aumentos con tinuados e ilimitados no responder eliciado. Tais coisas, s vezes, podem acontecer. Por exemplo, reaes do sistema imunolgico, que podem ser consideradas como instncias de comportamen to eliciado, algumas vezes parecem mostrar uma potenciao irreversvel (p. ex., para algumas pessoas que tenham desenvolvido uma reao alrgica a picadas de abelha aps serem picadas vrias vezes, a reao pode diminuir pouco, se que diminui, medida que o tempo passa).

estmulo sero explorados quando tratarmos da lei do exerccio. Considerados em conjunto, es ses tpicos identificam as possveis origens do responder, quando ele considerado emitido, e no eliciado. O captulo termina com uma dis cusso das maneiras pelas quais a importncia comportamental de estmulos pode mudar ao longo do tempo; a estampagem ( imprinting) um exemplo usado para relacionar tais efeitos ao conceito de motivao.

O PADRO TEMPORAL DO COMPORTAMENTO A apresentao de um estmulo pode deter minar a seqncia de respostas que ocorrem ao longo de um perodo extenso de tempo. Por exemplo, se um rato est privado e damos-lhe uma pelota de alimento, ele come a pelota. Quan do termina de comer, se houver gua disponvel, ele bebe. Esta relao entre comer e beber sub seqente to forte que, apresentando alimento em pequenas quantidades, ao longo de um per odo extenso, podemos fazer o rato beber muitas vezes sua rao diria normal de gua (Falk, 1977; Wetherington, 1982). Esse aumento no be ber chamado de polidipsia, e o responder que depende de um outro responder, dessa maneira, chamado de comportamento adjuntivo. O com portamento adjuntivo, ento, o comportamen to em que uma resposta acompanha de modo regular alguma outra resposta. A polidipsia, como um tipo de comportamen to adjuntivo, decorre, ao menos parcialmente, da maneira pela qual o comer e o beber esto rela cionados no padro alimentar do rato. Se o ali mento e a gua esto livremente disponveis, o rato, geralmente, faz poucas e grandes refeies diariamente e bebe depois de cada refeio. Se, ento, foramos o rato a fazer muitas refeies pequenas, apresentando alimento em muitas por es pequenas a curtos intervalos de tempo, o rato ainda bebe depois de cada refeio, mas no reduz suficientemente a quantidade de cada in gesto de gua para compensar o beber mais fre qente. Assim, um rato que tenha passado de cinco grandes refeies para cinqenta peque nas refeies dirias, beberia, agora, dez vezes

Seo B

Do Comportamento Eliciado ao Comportamento Emitido

Vimos que o reflexo apenas uma das vrias relaes possveis entre os estmulos e as res postas. Examinaremos, a seguir, como as apre sentaes do estmulo afetam o modo como o reponder se distribui ao longo do tempo. Quan do os estmulos ocorrem repetidamente, eles po dem produzir padres temporais de comporta mento. Os tpicos desta seo incluem a ordem e o padro temporal das respostas que ocorrem quando duas ou mais respostas diferentes so produzidas por um estmulo. O comportamento adjuntivo, em que uma resposta segue regular mente alguma outra resposta, um exemplo. Outros exemplos da apresentao repetida de um

A p re n d iz a g e m

71

mais. Mas, se a ingesto, depois de cada uma das cinqenta pequenas refeies, fosse de ape nas metade, em vez de um dcimo da quantida de das ingestes depois de cada uma das cinco grandes refeies, o rato beberia cinco vezes mais do que antes. Tais aumentos na ingesto diria de gua so to regulares em ratos que apolidipsia tem sido empregada para fazer com que eles ingiram substncias que geralmente rejeitam (p. ex., lcool; Meisch & Thompson, 1971). O comportamento adjuntivo pode incluir ou tras respostas alm de comer e beber. Por exem plo, se, em vez de gua, h uma roda de ativida de disponvel para o rato, correr na roda seguir o comer, da mesma maneira que o beber segue o comer no procedimento de polidipsia (Levitsky & Collier, 1968). A apresentao de estmulos pode impor uma estrutura temporal sobre o comportamento de ou tras maneiras. Um experimento examinou os padres de comportamento gerados em pombos por apresentaes repetidas de alimento (Staddon &Simmelhag, 1971). Cada pombo era colocado em uma cmara, em cuja parede havia uma aber tura para o comedouro. O comedouro consistia de uma bandeja com gros ordinariamente fora do alcance do pombo; o alimento era apresenta do iluminando-se a bandeja e levantando-a para uma posio em que o pombo poderia comer. Os pombos eram observados por uma janela na cmara e o seu responder era classificado em vrias categorias, tais como bicadas dirigidas parede do comedouro ou ao piso, posturas e orientao para a parede do comedouro. No incio do intervalo entre as apresentaes de alimento, um pombo, geralmente, fazia uma volta de 90 graus e, ento, menos freqentemen te, introduzia sua cabea na abertura do come douro ou bicava em direo ao piso. Outros pom bos mostraram padres que incluam respostas diferentes, tais como limpar as penas ou andar de um lado para outro. Essas respostas se torna vam menos provveis e o bicar se tornava a res posta dominante ou mais provvel, medida que se aproximava o momento da prxima opera o do comedouro. As apresentaes repetidas do estmulo im puseram uma estrutura temporal ao comporta .j.-HIu. O responder inicial, nos intervalos entre

as apresentaes do comedouro, variou de um pombo para outro, enquanto o responder no fi nal do perodo era relativamente constante entre pombos e, geralmente, inclua alguma forma de bicar. Bicar tambm o comportamento ocasio nado por apresentaes de alimento; o pssaro obtm comida em sua boca por meio do bicar. Ao menos neste caso, o comportamento termi nal parece ter algo em comum com as respostas produzidas pelas apresentaes de estmulo (cf. condicionamento temporal, no Captulo 12). As apresentaes repetidas de estmulo parecem no apenas eliciar as respostas, mas tambm produ zir um comportamento, em outros momentos, que estreitamente relacionado ao responder elicia do. O problema que difcil demonstrar que seqncias de comportamento geradas por apre sentaes sucessivas de estmulo no so afeta das por outras variveis como, por exemplo, por suas conseqncias ou pelos efeitos discrimina tivos dos estmulos (p. ex., Reid & Staddon, 1982). O PAPEL DO EXERCCIO A prtica faz a perfeio um ditado fami liar sobre o papel da repetio no comportamen to. Antes que os efeitos das conseqncias do responder fossem reconhecidos, acreditava-se que a mera repetio do responder, sem a consi derao de suas conseqncias, era suficiente para manter o comportamento. Consideremos o seguinte trecho de Sechenov:
... um beb capaz de tossir, espirrar e engolir, ime diatamente aps o nascimento. O ato de sugar tam bm pertence a essa categoria de movimentos com plexos... De fato, todo mundo sabe que uma criana recm-nascida capaz de sugar... Alm disso, um fato bem conhecido que a atividade desse comple xo mecanismo no beb provocado pela irritao dos lbios; ponha, por exemplo, seus dedos ou uma vela, ou um palito de madeira entre os lbios de um beb e ele comear a sugar. Tente a mesma coisa com uma criana, trs meses depois que foi desma mada, e ela no mais sugar; entretanto, a habilida de de produzir movimentos de suco vontade retida pelo homem por toda a vida. Esses so fatos altamente notveis: por um lado mostram que a con duo da sensao dos lbios para os mecanismos nervosos centrais que produzem os movimentos de

C- a r l e s

C a ta n ia

sugar cessam, aparentemente, depois do desmame; por outro lado, indicam que a integridade dessa con duo mantida pela repetio freqente do refle xo. (Sechenov, 1863, pp. 28-29)

Sechenov enfatiza aqui a complexidade da resposta no reflexo de suco, mas o mais im portante sua observao sobre o papel da repe tio. De acordo com Sechenov, no apenas a repetio importante para a manuteno da res posta, mas a resposta tambm se toma indepen dente dos efeitos de estmulos eliciadores. No beb, o sugar eliciado por estmulos (irrita o nos lbios) mais tarde, esses estmulos no mais eliciam a resposta, mas o organismo per manece capaz, at a vida adulta, de produzir a resposta, mesmo na ausncia desses estmulos (cf. Schoenfeld, 1966; ver, tambm, Hall & Oppenheim, 1987, p. 113: Para a maior parte das espcies em que o filhote suga o alimento na me, essa habilidade reduzida se o sugar no for praticado... pode-se m ostrar que, para a maioria dos filhotes de animais, virtualmente todos os comportamentos organizados orien tados para a me so fortemente influencia dos pelos eventos experienciados). Com base em tais fenmenos, podemos con cluir que a eliciao repetida de uma resposta aumenta a probabilidade de que a resposta seja emitida. As primeiras explicaes sobre a apren dizagem (p. ex., Thorndike, 1921; Verhave, 1967) trataram dos efeitos da repetio da res posta como componentes bsicos da aprendiza gem, descritos em termos de leis do exerccio e leis da prtica. Essas leis eram freqentemente ambguas em relao a questes como se era ou no importante que a resposta repetida fosse eli ciada ou emitida. De qualquer modo, elas foram logo superadas por outras preocupaes. A me dida que a Psicologia da Aprendizagem se vol tou para outros fenmenos, tais como o reforo e o controle de estmulos, a possibilidade de um papel para o exerccio ou a prtica ficou negli genciada. A evidncia muito escassa para per mitir concluses seguras sobre se o exerccio ou a prtica podem ser um componente bsico de aprendizagem, mas existem alguns dados pro vocativos. Um exemplo fornecido por uma pesquisa sobre as respostas de fuga de um peixe tropical

(Zebra danio), a um estmulo planejado para as semelhar-se rpida aproximao do seu maior predador (Dill, 1974). medida que o estmulo se aproxima, o peixe comea a nadar para longe do local (apesar de estar em um meio aqutico, essa resposta do peixe de nadar em fuga pode ser adequadamente chamada de reao de vo). A latncia da resposta de nadar comea a dimi nuir com as repetidas exposies ao estmulo; em outras palavras, o estmulo passa a eliciar a resposta de fuga mais e mais fortemente. Aps dez dias sem a ocorrncia de eliciaes, a res posta no havia retomado aos seus nveis ini ciais: a mudana produzida pelo estmulo no foi revertida (cf. a seo sobre potenciao; ver, tambm, o Captulo 6 sobre as reaes defensi vas especficas da espcie). Mas nem todas as respostas comeam com a eliciao. Algumas das primeiras respostas na vida de um organismo ocorrem espontaneamen te, na ausncia de estmulos identificveis. Por exemplo, dentro do ovo, o embrio do pintinho faz movimentos no coordenados de seus mem bros e corpo. Esses movimentos podem evitar que os ossos, em desenvolvimento, fixem-se em suas articulaes ou podem modificar a forma dos ossos em crescimento e do tecido conjunti vo. Mais tarde, no desenvolvimento do embrio, aparecem efeitos de estmulos eliciadores, tal vez simplesmente medida que o aparato sen sorial do embrio amadurece. Essa progresso do responder espontneo para o responder elici ado pode ser resumida, dizendo-se que os em bries de pintinhos agem antes de reagir (Provine, 1976, p. 210). Os estmulos tomam-se importantes mais tarde, como quando os movi mentos rotatrios do pintinho, ao romper a cas ca, so afetados, dependendo de se ele continua ou no a encontrar pores intactas da casca. A evidncia sugere que o bicar, em pintinhos recm-nascidos, depende no somente das con dies que eliciam o bicar e das conseqncias das primeiras bicadas, mas tambm de quanto o pintinho j se engajou em bicar (Hogan, 1971). Uma vez que o responder ocorra, qualquer que tenha sido sua origem, ele pode ter conseqn cias, e a sobrevivncia do pintinho pode depen der, por sua vez, das conseqncias que afeta rem ou no seu comportamento. Entre as gaivo

A p re n d iz a g e m

73

tas, por exemplo, bicar o bico do progenitor, mas no atingir o alvo tem conseqncias diferentes de atingir o bico; somente no ltimo caso que a gaivota-me alimenta o filhote. Essas conse qncias diferenciais afetaro a preciso das bi cadas subseqentes do filhote, somente, medi da que a resposta se toma independente de seus estmulos eliciadores. Esse desenvolvimento cor responde a uma formulao possvel da lei do exerccio: uma vez que uma resposta tenha sido eliciada por um estmulo, a resposta pode tor nar-se mais provvel, mesmo na ausncia do es tmulo. Em experimentos sobre salivao, os ces sa livam, inicialmente, somente quando o alimento apresentado, mas, depois de vrias apresenta es de alimento, eles comeam, tambm, a sa livar ocasionalmente quando o alimento est au sente (p. ex., Zener & McCurdy, 1939). Tal res posta, denominada salivao espontnea, tem sido atribuda ao condicionamento da resposta salivar a caractersticas da situao experimen tal (p. ex., pode ser argumentado que o estmulo eliciador era uma mancha na parede, que o ca chorro viu casualmente, justamente quando co meou a apresentao de alimento). Nenhum outro estmulo eliciador era identificvel, assim a nica maneira de resguardar o tratamento de respostas salivares como parte de uma relao reflexa seria supor que a salivao poderia ser eliciada por tais caractersticas arbitrrias da si tuao experimental. Contudo, o problema de identificar estmulos simplesmente desaparece se admitirmos a possibilidade da ocorrncia de res postas sem estmulos eliciadores; de fato, no poderamos, de outra maneira, conceber o res ponder emitido. O conceito de responder emiti do ser essencial para a abordagem das opera es conseqenciais, como o reforamento e a punio. As primeiras teorias do comportamento sus tentavam que a simples repetio do comporta mento era importante, em si mesma, para o de senvolvimento e a manuteno daquele compor tamento. Consideremos a seguinte afirmao de Sechenov ...Se uma criana que acabou de aprender a andar fica doente e permanece na cama por um longo tempo, ela esquece a arte previamente adquirida de andar... Esse fato tes

temunha, uma vez mais, a grande importncia da repetio freqente para a atividade nervosa (Sechenov, 1863, p. 29). J no podemos estar to certos acerca da evidncia sobre a qual Sechenov baseou sua con cluso (p. ex., ele observou uma criana ou mui tas crianas?), mas podemos considerar um exemplo contemporneo em Zelazo, Zelazo & Kolb (1972). Esta pesquisa envolveu o reflexo de andar, que aparece em bebs recm-nascidos e desaparece em, aproximadamente, 8 semanas (McGraw, 1945). A resposta do reflexo de an dar tem muito em comum com o comportamen to em que a criana se engaja mais tarde, quan do est aprendendo a andar. Os movimentos co ordenados de andar, assemelhando-se queles de um adulto, podem ser eliciados segurando o beb sob os braos e deixando seus ps tocarem uma superfcie horizontal. Quando os pais exercita ram o reflexo de andar de seus bebs, seguran do-os de maneira a eliciar a resposta de andar, este reflexo tinha menor probabilidade de desa parecer e o andar, em mdia, iniciava mais cedo do que em outros grupos de bebs, para os quais o andar no foi exercitado. Assim, o exerccio desse reflexo durante as oito primeiras semanas de vida no somente aumentou o responder eli ciado, que ordinariamente diminui durante esse perodo de tempo, mas parece ter encurtado o tempo para o posterior aparecimento dessa res posta como um componente do comportamento emitido, o andar. Mas os autores reconheceram que os movi mentos de andar produzem outras mudanas no mundo do beb (visuais, cinestsicas ou tteis), que podem reforar tais respostas. Mesmo du rante as 8 semanas de exerccio, o andar era al gumas vezes emitido, em vez de eliciado, e algo mais do que uma simples eliciao estava ocor rendo: O andar...parecia progredir de uma res posta reflexa para uma instrumental. H pouca dvida de que tenha ocorrido alguma aprendi zagem... No apenas havia mais respostas... mas elas eram melhor executadas (Zelazo, Zelazo & Kolb, 1972, p. 315). A situao complica-se ainda mais como um exemplo de eliciao, da das as mudanas no peso do beb e nas capaci dades de suporte de suas pemas ao longo de tais estudos (Thelen e col., 1982).

74

A. C h a r le s C a ta n ia

Especulamos que uma resposta, uma vez pro duzida por um estmulo, pode tornar-se mais pro vvel, mesmo na ausncia do estmulo. Em ou tras palavras, eliciar uma resposta pode elevar sua probabilidade de emisso. Essa formulao difere das leis clssicas do exerccio ou da prti ca s quais a relacionamos. Ela depende apenas da mais simples das operaes experimentais, a apresentao de estmulos. Mas no precisamos tentar estabelecer tais leis. possvel que algu mas respostas emitidas tenham sua origem por que so primeiro eliciadas, enquanto outras so emitidas desde o incio. A questo, ento, no a universalidade das leis do exerccio ou alter nativas, tais como emisso espontnea; antes, tra ta-se da questo experimental de qual a fonte do responder em casos particulares. Outros pro blemas na anlise do comportamento tero esse mesmo enfoque nos captulos seguintes. Em vez de tentar explicar os casos de comportamento em termos de leis formais exaustivas, vamos ten tar melhorar nossa taxonomia do comportamen to, fazendo uma classificao do comportamen to em termos de suas origens.

AS APRESENTAES DE ESTMULO EM ESTAMPAGEM (IMPRINT1NG) At este ponto, estivemos concentrados em como os estmulos afetam o responder. Virtual mente todos os fenmenos considerados neste captulo podem ser descritos em termos de pro babilidades de resposta. Por exemplo, em uma relao reflexa, um estmulo aumenta a probabi lidade de uma resposta para perto de 1,0; na ha bituao, a probabilidade da resposta diminui ao longo de apresentaes sucessivas do estmulo, e no comportamento adjuntivo a eliciao de uma resposta muda a probabilidade de alguma outra resposta. Vamos examinar agora um resultado de apresentaes de estmulo, a estampagem (Lo renz, 1937), que deve ser discutida em outros termos que no o dos efeitos sobre a probabili dade de resposta. A estampagem oferece uma ponte para o tratamento das conseqncias das respostas no prximo captulo. Quando um patinho sai da casca do ovo, provvel que a primeira coisa em movimento que

ele veja seja sua me e, mesmo neste primeiro dia de vida fora do ovo, o patinho, provavelmen te, comear a ficar perto dela. Mas, se a me no est presente e o patinho v, de incio, algu ma outra coisa em movimento, tal como uma pessoa, ele comportar-se-, em relao a esse estmulo, como teria feito em relao sua me. Considera-se que tais estmulos so es tampados, isto , em sentido figurado, grava dos no patinho. A estampagem tem sido demonstrada, tanto no laboratrio como no campo, com uma varie dade de estmulos, indo de pssaros reais e pssaros-modelos a trens eltricos (alguns estmu los, certamente, funcionam melhor que outros). Tem sido dito, algumas vezes, que o desenvolvi mento da estampagem tem um perodo crtico de um ou uns poucos dias: se a estampagem no ocorre durante esse perodo crtico, ela pode no ocorrer mais. De fato, as coisas parecem ser mais complicadas (Hoffman, 1996). Por exemplo, o medo de estmulos novos se desenvolve ao final do perodo crtico. medida que os pssaros se tomam mais velhos, eles apresentam piados de desconforto caractersticos na presena de est mulos novos e movem-se para longe de tais est mulos. Assim, os pssaros mais velhos, geral mente, no ficam perto de tais estmulos por tem po suficiente para que a estampagem ocorra, mas isso pode ocorrer se esse efeito dos estmulos novos for prevenido ou revertido. Em quaisquer dos casos, o patinho comea a responder de maneira significativa a um estmu lo, seja a me-pata, seja uma pessoa ou algum objeto arbitrrio em movimento, se o estmulo apresentado sob condies apropriadas e sufi cientemente cedo em sua vida. Uma dessas res postas seguir o estmulo estampado medida que ele se move; tem sido dito, algumas vezes, que esse seguir eliciado pelo estmulo estam pado, mas esse uso da linguagem de eliciao enganador. Se o estmulo estampado a me-pata, o patinho a seguir e emitir piados de descon forto em sua ausncia. Mas, que tipo de con trole o estmulo estampado exerce sobre a res posta de seguir? Sempre que o patinho anda em direo me, ele se encontra mais prxi mo dela; sempre que se afasta, ele se encon-

A p re n d iz a g e m

75

tra mais longe dela. Em outras palavras, a con seqncia natural de caminhar em diferentes direes mudar a distncia entre o patinho e a me. Se a proximidade da me uma conse qncia importante para o patinho, no deve ria causar surpresa que ele caminhe em dire o a ela e no para longe dela. Segue-se tam bm que, se o ambiente do patinho for altera do de tal modo que a proximidade com a me requeira uma outra resposta que no o andar, essa outra resposta deveria substitu-lo. Tal experimento foi planejado por Peterson (1960). De um dos lados de uma janela havia um compartimento escuro, contendo um estmu lo estampado em movimento. Um patinho, do outro lado da janela, podia iluminar o lado com o estmulo estampado, apresentando um resposta apropriada. Ele fez isso, mesmo quando a res posta requerida era incompatvel com o seguir, tal como bicar um disco localizado na parede ou ficar parado sobre uma plataforma perto da janela. Em outras palavras, a propriedade crti ca do estmulo estampado no era que ele podia eliciar respostas particulares, tais como seguir, bicar ou ficar parado, mas, antes, que tornou-se uma conseqncia importante para o patinho e, assim, podia reforar ou aumentar a freqncia de tais respostas como seguir, bicar ou ficar pa rado. Em ambientes naturais, seguir geralmente mantm o patinho prximo do estmulo estam pado (geralmente sua me), mas um ambiente de laboratrio mostra que o patinho pode apren der a apresentar outras respostas, se so elas ou no que tm a importante conseqncia de man ter prximo o estmulo estampado. Na estampagem, os efeitos de apresentao inicial do estmulo a ser estampado no so as mudanas nas probabilidades do responder. An tes, so as operaes estabelecedoras. Elas mudam a importncia do estmulo. O estmu lo estampado adquire sua importncia para o organismo simplesmente por ter sido apresen tado sob circunstncias apropriadas. Ele co mea como um estmulo em relao ao qual o organismo relativamente indiferente, mas termina como um estmulo que funciona como reforador e, portanto, modela o comporta mento do patinho.

AS OPERAES ESTABELECEDORAS E A IMPORTANCIA DE ESTMULOS H outras maneiras de mudar a importncia dos estmulos. Algumas delas foram tratadas no Captulo 2, como os casos de operaes estabe lecedoras. Por exemplo, se for mais provvel que um rato coma do que corra na roda de atividade, esperaremos que o rato pressione a barra mais freqentemente, e que suas presses barra pro duzam mais alimento do que se suas presses produzissem apenas acesso roda de atividade. Mas suponhamos que o rato continue a ter livre acesso ao alimento, enquanto a roda trancada, impedindo assim o rato de correr. Depois de um perodo de privao do correr na roda de ativi dade, poderamos, ento, descobrir que o rato estaria mais propenso a correr do que a comer, se a oportunidade de correr na roda ficasse no vamente disponvel, e que o rato pressionaria a barra mais freqentemente se as presses bar ra produzissem mais acesso roda de atividade do que se elas produzissem alimento. Em outras palavras, ao privar o rato de um ou outro desses estmulos, podemos mudar a importncia de um em relao ao outro; podemos fazer o correr na roda mais provvel do que o comer ou o comer mais provvel do que o correr, dependendo da privao prvia, de cada um deles, a que o rato tenha sido submetido. As mudanas na importncia dos estmulos que ocorrem com as operaes estabelecedoras so discutidas em termos de impulso ou motiva o (p. ex., Bolles, 1975). Os estmulos tomamse mais ou menos reforadores ou mais ou me nos aversivos, dependendo dos fatores como o tem po desde sua ltima apresentao. O alimento, por exemplo, toma-se mais reforador medida que o tempo passa sem comer e pode, at mesmo, tor nar-se aversivo depois do comer, se for consumi da uma quantidade muito maior do que a usual. A importncia dos estmulos tambm pode ser mudada por outros meios que no a priva o; como veremos nos captulos seguintes, os reforadores condicionados e os estmulos aver sivos condicionados, por exemplo, so estmu los que adquiriram suas propriedades reforadoras ou aversivas por meio de sua relao com outros estmulos. (Para uma discusso da intera

76

A . C h a r le s C a ta n ia

o entre a motivao e os efeitos da adaptao, ver Solomon & Corbit, 1974). Os estudos fisiolgicos de motivao normal mente esto interessados nas relaes entre os fatores orgnicos e a importncia dos estmulos (p. ex., os efeitos dos nveis de acar no sangue sobre o comportamento relacionado ao alimen to, os efeitos de nveis hormonais sobre o com portamento sexual, etc.). A motivao, ento, no uma fora ou um impulso especial a ser locali zado em algum lugar dentro do organismo; an tes, um termo aplicado a muitas variveis or gnicas e ambientais, que tomam vrios estmu los importantes para um organismo. Este captulo se concentrou em como os est mulos afetam o responder. Muitos fenmenos considerados aqui podem ser descritos em ter mos de probabilidades de resposta: em uma re lao reflexa, um estmulo aumenta a probabili dade da resposta para cerca de 1,0; em uma ini bio reflexa, um estmulo reduz a probabilida de da resposta; ao longo de apresentaes su

cessivas de um estmulo, a probabilidade de eli ciao da resposta pode decrescer (habituao) ou aumentar (potenciao); no comportamento adjuntivo, a eliciao de uma resposta muda a probabilidade de uma outra resposta; as apresen taes repetidas de um estmulo podem produ zir padres temporais de comportamento; eliciaes sucessivas podem aumentar a probabilida de da resposta na ausncia do estmulo, como no fenmeno do exerccio. O exemplo da estam pagem envolve os efeitos adicionais da apresen tao do estmulo e estabelece a ocasio para a discusso de operaes estabelecedoras. Estamos prontos para passar para as opera es de reforamento e punio. Toda vez que as respostas tm conseqncias, essas conse qncias tambm tero seus efeitos como est mulos. Dadas as muitas mudanas no responder que podem ser produzidas pela apresentao de estmulos, no deveramos esperar compreender o responder conseqencial sem lev-las em con siderao.

A p re n d iz a g e m

77

PARTE III

APRENDIZAGEM SEM PALAVRAS

As Conseqncias do Responder: Reforo

A. Reforo e Extino Labirintos e Curvas de Aprendizagem Cmaras Experimentais e Registros Cumulativos Reforo Extino Extino versus Inibio Contingncias Resposta-Reforador e Apresentaes do Reforador Extino e Superstio B. Os Reforadores como Oportunidades para o Comportamento A Relatividade do Reforo A Aquisio do Comportamento Aprendizagem Latente Aprendizagem Sensrio-Motora

gidade so, geralmente, contrapostas: contingn cia, no sentido tcnico, ressalta como a probabili dade de um evento pode ser afetada ou causada por outros eventos, enquanto contigidade simplesmente implica a justaposio de eventos no espao ou no tempo, sem levar em conta a causao.

A raiz indo-europia, sekw-, seguir, liga a palavra conseqncia a sinalizar e designar (do latim sig num, alguma coisa que a gente segue) e a social e associao (do latim socius, companheiro ou segui dor). O termo compartilha o prefixo con-, com as palavras condicionamento, contingncia e contigui dade. A palavra condicionamento, atravs da raiz indo-europiade/:-, mostrar ou pronunciar, tem mui tos parentes: como ditado, do latim dicere, dizer; teach (ensinar em ingls), que se originou do velho ingls, taecan, mostrar ou instruir; julgamento, do latim judex, aquele que proclama a lei; e paradig ma, do grego para, alm de, e deiknunai, mostrar. A palavra contingncia, do latim contingere, tocar de todos os lados, acontecer, tem vrios sentidos: uma possibilidade, uma condio de depender do acaso; alguma coisa incidental a uma outra coisa. Como contato, combina a raiz com-, junto, e tangere, to car. Tambm a palavra contigidade, condio de tocar ou estar em contato, tem as mesmas origens. Curiosamente, em psicologia, contingncias conti

O comportamento tem conseqncias, e uma propriedade importante do comportamento que ele pode ser afetado por suas conseqncias. Podemos estudar este fenmeno programando conseqncias para o comportamento, mas pro gramar conseqncias envolve mais do que sim plesmente apresentar estmulos. Os estmulos devem ocorrer em alguma relao com o com portamento. O ambiente deve ser programado de tal forma que as respostas faro com que algo acontea. As conseqncias para o comportamento j esto presentes no ambiente natural. Mesmo an tes de intervirmos, os organismos podem mudar seus ambientes fazendo coisas ou locomoven do-se de um lugar para outro. Mas, podemos es tudar melhor como as conseqncias afetam o comportamento, programando as operaes conseqenciais no laboratrio. Por exemplo, pode mos construir um labirinto de modo que um rato privado de gua encontre gua depois de fazer uma seqncia apropriada de viradas ou pode mos construir uma cmara dentro da qual um pombo privado de alimento possa produzir ali mento ao bicar um disco localizado na parede. Ento poderemos observar como a gua afeta as viradas que o rato faz ao percorrer o labirinto ou como o alimento afeta a taxa com que o pombo

bica o disco. Ento, podemos ver como a gua afeta as escolhas de entradas que o rato faz, medida que percorre o labirinto ou como o alimento afeta a taxa com que o pombo bica o disco. Este captulo comea explorando o desenvol vimento histrico de experimentos sobre as con seqncias do comportamento. A seguir, trata de algumas propriedades do conceito contempor neo de reforo, tais como o significado de des continuar o reforo (extino), a relatividade do reforo, os tipos de conseqncias que podem ser reforadoras e a gama de respostas que po dem ser reforadas. Termina mostrando que o reforo no relevante apenas para os compor tamentos mantidos por conseqncias fisiolgi cas importantes, como o alimento e a gua, mas tambm para as interaes sensrio-motoras sim ples, por exemplo quando os movimentos ocu lares afetam o que se v.

Seo A

Reforo e Extino

de, ele repudiou a segunda metade da lei, man tendo o aumento na probabilidade ou gravao, mas descartando o decrscimo na probabilidade ou desgravao. O que permaneceu foi ento denominado Lei do Efeito fraca. Esse aspecto histrico ser relevante para o Captulo 6, quan do for abordada a punio.) A Figura 5.1 mostra os dados de um dos ga tos de Thomdike. Para fugir da caixa, o gato ti nha que puxar um fio que ia de uma argola de arame na porta dianteira da caixa at um ferro lho que mantinha a porta fechada. Na primeira vez em que foi colocado na caixa, o gato levou 160 s para escapar. Esse tempo diminuiu gra dual e irregularmente ao longo de tentativas su cessivas, at que nas ltimas tentativas, o gato comeou a escapar regularmente em menos de 10 segundos. Esse decrscimo gradual do tem po gasto para completar uma tarefa veio a cha mar-se de aprendizagem por tentativa e erro (Khler, mais tarde, estabeleceu um contraste entre essa mudana gradual e as solues sbi tas ou insights que observou em chimpanzs).

O Captulo 2 introduziu os experimentos de Thomdike, nos quais os animais aprendiam a fugir de caixas-problema, operando um disposi tivo que abria a porta. Normalmente, um animal privado de alimento era colocado dentro da cai xa, com a comida disponvel do lado de fora. Entre sua atividade variada, o animal, mais cedo ou mais tarde, operava o dispositivo e ficava li vre para sair da caixa. De incio, essa era uma resposta de baixa probabilidade, mas, porque abria a porta, sua probabilidade aumentava ao longo de tentativas repetidas. Thomdike descreveu como as conseqncias do responder afetavam o responder subseqente em termos de um princpio que ele denominou de Lei do Efeito. A lei passou por vrias revi ses, mas sua essncia era que a probabilidade de resposta pode ser aumentada por algumas conseqncias e reduzida por outras. Em uma linguagem mais prxima da de Thomdike, as respostas com efeitos satisfatrios seriam gra vadas (stamped-in), enquanto que aquelas com efeitos desagradveis seriam desgravadas (stamped-out). (A primeira verso da lei de Thomdi ke foi chamada de Lei do Efeito forte. Mais tar

LABIRINTOS E CURVAS DE APRENDIZAGEM Nos anos que se seguiram, a aprendizagem por ensaio e erro foi estudada com muitos orga nismos diferentes, em muitos tipos de situaes. Os experimentadores acreditavam que a inteli gncia das diferentes espcies poderia ser com parada observando-se a velocidade da aprendi zagem em caixas-problema, labirintos, pistas e em outros aparatos (p. ex., Hilgard, 1951). O pla nejamento de equipamentos comeou a ser ditado por questes tericas: se a aprendizagem se dava por saltos discretos, na base do tudo-ou-nada, ou se, em vez disso, ela ocorria gradual e continua mente; se os organismos aprendiam os movimen tos (aprendizagem de resposta) ou as proprieda des do ambiente (aprendizagem de estmulo); se as conseqncias do responder levavam diretamen te aprendizagem ou apenas levavam o organis mo a apresentar um desempenho tal que demons trasse o que havia aprendido de outros modos. Uma caracterstica comum desses experimen tos era que o responder tomava-se mais prov

82

A . C h a r le s C a ta n ia

Tentativas

FIGURA 5.1 Uma curva de aprendizagem. Tempo gasto por um gato para escapar de uma caixa problema, em funo das tentativas. (Thorndike, 1898, Figura 1)

vel quando tinha certas conseqncias. Essa mudana na probabilidade era medida de maneira diferente, dependendo do equipamento empre gado e dos objetivos experimentais. Os grficos que mostravam como o comportamento mudava durante o experimento eram chamados de cur vas de aprendizagem : o tempo gasto para com pletar uma resposta em funo do nmero de ten tativas (p. ex., Figura 5.1); a percentagem de res postas corretas; a proporo de animais que atin giam algum critrio de desempenho bem-suce dido. Algumas vezes, essas medidas eram trans formadas para facilitar a comparao entre elas. Quando ratos percorriam um labirinto, por exem plo, o tempo de corrida da caixa de partida para a chegada geralmente diminua, enquanto a por centagem de escolhas corretas e a proporo de animais que no cometiam erros aumentava. Converter o tempo, para percorrer o labirinto, em velocidade (definida como a recproca do tempo gasto) fazia com que as trs medidas au mentassem com a aprendizagem. Mas as formas das curvas de aprendizagem dependiam tanto dos equipamentos usados e das medidas tomadas que o progresso da aprendizagem no podia ser des crito de uma nica maneira.

O problema era que esses experimentos pro duziam desempenhos complexos. Por exemplo, medir o tempo que o rato levava para deixar de entrar nos becos sem sada medida que ia apren dendo a percorrer o labirinto no mostrava como a aprendizagem se dava num nico ponto de es colha. Essa considerao levou a uma gradual simplificao dos labirintos, como ilustrado na Figura 5.2. O diagrama A mostra o plano de um dos pri meiros labirintos empregados no estudo da apren dizagem animal (Small, 1899-1900), uma ver so de 1,80 m por 2,40 m do labirinto de sebes de Hampton Court na Inglaterra. (Curiosamen te, esses labirintos podem tambm ter criado o contexto para as esttuas operadas hidraulica mente, que contriburam para o conceito de re flexo de Descartes; cf. Captulo 4). Quando a porta da caixa de sada era levantada, os ratos podiam entrar no labirinto; o alimento era colo cado na rea alvo, no centro. Com o aumento da experincia no labirinto, os ratos atingiam a rea alvo com maior rapidez e com menos viradas incorretas ao longo do caminho. Mas era difcil examinar a aprendizagem em qualquer ponto par ticular de escolha. O ponto de escolha em 1, no

A p re n d iz a g e m

83

Sada

Sada

Alvo

FIGURA 5.2 Etapas na evoluo dos labirintos no estudo da aprendizagem animal. A. o labirinto de HamptonCourt, conforme adaptao de Small ( 1899-1900); B. um labirinto em U, com seis pontos de escolha; C. o labirinto em T, com um nico ponto de escolha; e D, a pista reta.

diagrama A, podia ser aprendido mais rapida mente do que o 7, porque o ponto 1 aparecia mais cedo do que o 7 ou porque os planos do piso eram diferentes; a escolha no ponto 4 poderia ser aprendida mais rapidamente que a escolha no ponto 5, devido s diferentes possibilidades de abordar o ponto 4 (vindo do 3 ou do 5) ou devido ao menor nmero de ocasies em que o ponto 5 seria encontrado, se o rato fosse direta mente do ponto 3 ao 4 com maior freqncia do que do 3 ao 5. Gradualmente, as estruturas do labirinto evo luram para formas mais sistemticas, como no diagrama B. Neste labirinto, algumas vezes cha mado de labirinto em U devido forma das uni dades sucessivas, os pontos de escolha eram es sencialmente os mesmos quando o rato chegava a cada um deles; eles diferiam apenas em suas localizaes na seqncia e em se virar esquer da ou direita seriam as respostas corretas. Esse tipo de procedimento sistemtico tomava fcil

especificar a seqncia correta (em B, direitaesquerda-direita-esquerda-esquerda-direita) e computar os erros. Mesmo aqui, contudo, as in teraes entre as posies e as seqncias com plicam a anlise. Por exemplo, seria a escolha da esquerda, no ponto 4, afetada pelo fato de ela ter sido precedida por outra virada direita no ponto 3 ou seguida por uma virada esquerda no ponto 5? Seria importante se o rato chegasse ao ponto 4, aps retomar de um beco sem sada no ponto 3, tendo feito um erro ali, em vez de aps uma virada correta direita? Seria impor tante que o ponto 4 estivesse no meio do labirin to, em vez de prximo a seu incio ou fim? Era talvez inevitvel que o labirinto fosse reduzido a um ponto de escolha nica, como no labirinto em T, com uma rea alvo direita em C na Figura 5.2. Aqui, quando o rato deixava a rea de sada, ele tinha que fazer uma nica escolha, direita ou esquerda. Mas algumas complica es possveis ainda no estavam eliminadas.

84

A . C h a r le s C a ta n ia

Suponhamos, por exemplo, que um rato em sua primeira tentativa no labirinto em T virasse direita enquanto que um segundo rato virasse esquerda. Deveramos permitir que o segundo rato refizesse o percurso depois de ter alcanado a rea vazia no fim do brao esquerdo? Se, em vez disso, ele fosse recolocado na rea de parti da, deveria ele ser forado a alcanar a rea alvo (p. ex., bloqueando-se o brao esquerdo da pis ta), para garantir que sua experincia na rea alvo fosse comparvel do primeiro rato? O prxi mo passo lgico era eliminar completamente os pontos de escolha, deixando nada mais do que um simples corredor, como em D, na Figura 5.2. Agora, nenhum erro era possvel, e as medidas de comportamento ficaram reduzidas simples mente velocidade com que o rato se locomo via do ponto de sada para o ponto de chegada. Havia outros problemas. As medidas mdias do desempenho de um grupo de animais no re presentavam necessariamente o desempenho dos indivduos do grupo. Suponhamos, por exemplo, que, para ratos sozinhos em um labirinto em T simples, os erros freqentes mudem abruptamen te para viradas consistentemente corretas, mas que essa mudana ocorra em diferentes tentati vas para os diferentes ratos. Em um grupo gran de de ratos, 65% podem passar a virar correta mente em tomo da quinta tentativa, 72% em tor no da sexta, 79% em tomo da stima, 83% por volta da oitava, e assim por diante, at que o de sempenho se tome estvel entre 98 e 100% na vigsima tentativa. Esse desempenho do grupo, dada a aparncia de um aumento gradativo de viradas corretas, obscureceria completamente a mudana abrupta no desempenho individual dos ratos (Sidman, 1952). Mesmo a pista simples no foi a soluo de finitiva, porque a velocidade para percorrer a ala reta era afetada por muitos fatores triviais. Se as tentativas comeassem com a abertura da porta do ponto de sada, a velocidade dependeria da direo para a qual o animal estaria voltado no momento em que a porta fosse aberta. A veloci dade seria tambm afetada pela manipulao do animal quando o experimentador o transportas se, a cada tentativa, do ponto de chegada para o de partida ou pelos rastros de cheiro deixados pelos outros animais, ou at mesmo se o espao

do ponto de chegada permitisse ao rato diminuir a velocidade sem bater a cabea contra a parede (Killeen & Amsel, 1987). Tanto com os labirintos como com as pistas, o experimentador tinha que retornar o organis mo da rea de chegada para a de sada, toda vez que iniciava uma nova tentativa. Assim, era o experimentador, e no o organismo, quem de terminava quando o comportamento ocorria. Alm disso, medir quanto o rato demorava no especificava o que ele estava realmente fazendo durante aquele tempo. Duas inovaes experi mentais ajudaram a resolver esses problemas. A primeira consistiu em um aparelho construdo de tal modo que o organismo podia emitir repe tidamente, sem a interveno do experimenta dor, uma resposta facilmente especificada; a se gunda foi um mtodo de registro, baseado dire tamente na taxa ou freqncia de respostas, em contraposio s medidas indiretas derivadas de seqncias de respostas ou de grupos de orga nismos. Essas inovaes, inspiradas parcialmente pelo interesse em reduzir a manipulao do or ganismo, simplificando assim o trabalho do ex perimentador, foram caractersticas importantes de uma linha de pesquisa iniciada por Skinner (1930, 1938,1950; ver, especialmente, Skinner, 1956, para uma histria dessa evoluo).

CMARAS EXPERIMENTAIS E REGISTROS CUMULATIVOS Dois aparatos representativos so ilustra dos na Figura 5.3: uma cmara padro para ratos com uma nica barra, esquerda, e uma cmara para pombos com trs discos, direi ta. Ambas compartilham de dispositivos de resposta; de mecanismos para apresentar reforadores como alimento ou gua e de fon tes de estmulos. Em um procedimento tpico, um rato colo cado na cmara aps ter sido privado de alimen to. Uma barra ressalta da parede. Prximo bar ra, encontra-se um comedouro para receber as pelotas de alimento, depositadas por um meca nismo do outro lado da parede; um rudo carac terstico acompanha cada apresentao da pelo ta. Uma lmpada piloto ilumina a cmara, e um

A p re n d iz a g e m

85

FIGURA 5.3 Uma cmara para ratos ( esquerda) e uma cmara com trs discos para pombos ( direita). A cmara do rato inclui uma barra (A), um comedouro e um tubo para fornecimento de pelotas (B), um alto-falante (C) e uma lmpada ou luz da caixa (D); algumas cmaras para ratos incluem um piso de grades, por meio do qual pode ser aplicado um choque eltrico (E). A cmara do pombo inclui trs discos (F, G e H) e a abertura para um comedouro (I). As lmpadas ou os projetores localizados atrs de cada disco permitem projetar cores ou figuras sobre os discos.

rudo do alto-falante pode mascarar os sons de fora da cmara. O primeiro passo o treino ao comedouro. As pelotas vo sendo depositadas no comedou ro. Cedo ou tarde, o rato acaba encontrando-as e comendo-as. Uma vez que isso ocorra, as pelo tas continuam caindo at que, aps cada apre sentao, o rato se aproxime rapidamente do co medouro a partir de qualquer ponto da caixa. Normalmente 10 pelotas so suficientes. Uma vez completado o treino ao comedouro, mudase o procedimento de maneira que a apresenta o do alimento passe a depender das presses barra. Eventualmente o rato pressiona a barra, a presso produz a queda da pelota e a pelota oca siona o comer. O rato ento, provavelmente, vol tar barra e a pressionar de novo. (As alterna tivas para a demora em pressionar a barra so consideradas no Captulo 7). O resultado de in teresse aqui a freqncia com que o rato pres siona a barra. Se a freqncia aumenta, chama mos a pelota de alimento de reforador. No tipo de cmara mostrado na Figura 5.3, podemos em pregar outros tipos de reforadores. Por exem plo, o dispensador de pelotas pode ser substitu do por uma pequena concha para apresentar go tas de gua ou de leite. A cmara do pombo difere da do rato, por que as barras so substitudas por discos e o alimentador, que contm a dieta padro para pom

bos, fica a seu alcance por alguns poucos segun dos. A abertura do comedouro se localiza no centro e abaixo dos discos. O comedouro fica centralizado abaixo dos discos. E prtica comum iluminar o comedouro e apagar todas as outras luzes, sempre que o comedouro operado. A cmara comumente apresenta outras caracters ticas, como uma lmpada para iluminao geral tnue, fontes de rudo mascarador e outros est mulos audidvos, etc. O disco uma pea de plstico, montado atrs de um orifcio redondo aberto na parede da c mara. Ele conectado a um micro-interruptor, que registra as bicadas do pombo se elas forem suficientemente fortes (os discos so, normal mente, sensveis a bicadas de menos de 0,1 Newton, que corresponde a aproximadamente 10 gramas ou um tero de uma ona). O plstico geralmente translcido, de modo que cores ou padres podem ser projetados nele por meio de lmpadas ou projetores miniaturizados localiza dos atrs dos discos. A cmara na Figura 5.3 con tm 3 discos, dispostos horizontalmente, a uma distncia de 23 centmetros acima do piso da cmara. Qualquer experimento em particular pode usar apenas um dos discos, dois deles ou todos os trs. Quando em uso, os discos geral mente so iluminados. Como ocorre com os ra tos, se as bicadas de um pombo privado de ali mento em um disco produzem alimento, pode-

86

A . C h a r le s C a ta n ia

se esperar um aumento na taxa com que o pom bo bica o disco. O rato e o pombo so organismos comuns de laboratrio. Cada um deles tem padres idios sincrticos especficos da espcie, que devem ser levados em conta, e no devemos supor que qual quer coisa observada com ratos ou pombos pos sa ser generalizada para outros organismos. Con tudo, sua dieta, manuteno em cativeiro, suscetibilidade a doenas e outras caractersticas so razoavelmente bem-entendidas, e seu pequeno porte, durao de vida relativamente longa e eco nmica fazem deles sujeitos particularmente con venientes. Assim, eles tm servido, freqente mente, em experimentos sobre as conseqncias do responder. Responder em aparelhos como os da Figura 5.3 tem sido, s vezes, denominado de operante livre: livre, porque o organismo livre para emitir a resposta em qualquer momento, sem ter que esperar pelo experimentador (como quando o rato na rea alvo deve esperar ser recolocado no ponto de sada do labirinto, antes de percorr-lo

novamente); e operante, porque a resposta ope ra sobre o meio ambiente. O operante livre se presta ao emprego dos mtodos de registro, como o registro cumulati vo, que fornece um quadro pormenorizado e con veniente de como o responder se altera ao longo do tempo. A maioria dos registros cumulativos modernos so computadorizados, mas em um registrador cumulativo original, ilustrado na Fi gura 5.4, uma fita de papel enrolada em torno de um cilindro. Um motor gira o cilindro a uma velocidade constante, desenrolando a fita. Uma pena ou qualquer outro dispositivo para escre ver repousa sobre o papel medida que ele pas sa pelo cilindro, e cada resposta (p. ex., uma bi cada no disco pelo pombo) move a pena a uma pequena distncia sobre o cilindro, perpendicu larmente ao movimento do papel. Assim, a qual quer momento durante a sesso esse registro mostra o total de respostas acumuladas. Exemplos de registros cumulativos so mos trados na Figura 5.5. Como o papel se move a uma velocidade constante, quanto mais elevada

Cilindro

Direcionador da Pena

Pena

Direo do Movimento da Pena

Direo do Movimento do Papel

Rolo de Papel

FIGURA 5.4 Principais componentes de um registrador cumulativo. Um cilindro gira a uma velocidade constante, e cada resposta move a pena a uma distncia fixa sobre o papel. A velocidade do papel e o tamanho do desloca mento da pena a cada resposta dependem do comportamento em estudo. A escala mais comum de um centmetro por minuto e 1100 respostas para a largura toda do papel (cerca de 80 respostas por centmetro). Nessa escala, uma inclinao de 45 graus representa uma taxa de cerca de 40 respostas por minuto. Quando a pena alcana a extremidade superior do papel, ela retoma automaticamente para a posio inicial na base do papel.
A p re n d iz a g e m

87

DC o

10 Minutos

FIGURA 5.5 Amostras de registros cumulativos representativos. Nesta figura, uma inclitiao de 45 graus repre senta uma taxa de cerca de 20 respostas por minuto. Os registros A e B diferem, principalmente, quanto taxa de respostas: a taxa mais elevada em A do que em B. A taxa zero em quase todo o registro C; um segmento de C, durante o qual ocorreram algumas poucas respostas, fo i ampliado e mostrado em relao a um registro de eventos em D. Os registros E e F so aproximadamente iguais quanto taxa de respostas, mas mostram detalhes diferentes nos padres do responder; E tem aparncia de degraus, indicando perodos de resposta alternados com pausas, enquanto F, com uma granulao mais lisa, indica um responder relativamente constante. Os registros G e H mostram taxas que se alteram com o correr do tempo, diminuindo em G (acelerao negativa) e aumentando em H (acelerao positiva).

a taxa de respostas, mais abrupta a inclinao do registro cumulativo, como mostram os regis tros A e B. Na escala da Figura 5.5, a taxa de resposta de aproximadamente 30 respostas por minuto para o registro A e de, aproximadamen te, 12 por minuto para o registro B. O registro C inclui somente algumas poucas respostas; as pores horizontais indicam perodos de tempo em que no ocorreram respostas (note que um registro cumulativo no pode ter uma inclinao negativa, porque a pena pode registrar as res postas, movendo-se apenas em uma direo ao longo da pgina). Uma pequena seo do registro C, que inclui umas poucas respostas, ampliada no registro D, em que o registro cumulativo ampliado acompanhado do registro de um evento na mes

ma escala temporal. A cada resposta, no registro de eventos, corresponde um pequeno degrau no registro cumulativo; esta propriedade dos regis tros cumulativos no , em geral, bvia, porque as escalas tpicas de respostas e de tempo so pequenas demais para essa resoluo fina de pormenores. Mesmo assim, diferentes padres de respos tas podem ser facilmente distinguidos nos regis tros cumulativos. Por exemplo, as taxas de res postas nos registros E e F so praticamente as mesmas, mas o registro E aparenta degraus, en quanto que o F relativamente liso. Isto signifi ca que o registro E foi produzido por surtos r pidos de respostas (segmentos ngremes), sepa rados por pausas (segmentos planos), enquanto o registro F foi produzido por um responder mais

88

A . C h a r le s C a ta n ia

uniforme. Essa propriedade do registro cumula tivo , s vezes, chamada de textura ou granula o', dos dois registros, o E tem uma textura mais spera que F. Os registros G e H fornecem outros exem plos de propriedades pormenorizadas do com portamento que o registro cumulativo evidencia. No registro G, a taxa comea em cerca de 25 respostas/min, mas diminui gradualmente medida que o tempo passa; no registro H, a taxa se altera na direo oposta, aumentando de uma taxa relativamente baixa para cerca de 30 respostas/min (os registros em que as inclinaes diminuem ao longo do tempo so chamados negativamente acelerados', aqueles que aumentam so chamados positivamente acelerados). A Figura 5.6 mostra algumas outras caracte rsticas, geralmente incorporadas nos registros cumulativos. Os registros A e B mostram como os deslocamentos da pena de respostas podem ser usados para indicar outros eventos, alm das

respostas. Nesses registros, somente algumas das respostas produziam o alimento, irregularmente em A (como em a, b e c), e regularmente em B (como em d e e). O padro cncavo repetitivo em B, como aparece entre d ee, costuma ser cha mado de padro de curvatura em concha (scalloping). No registro C, o responder que comeou em/produziu comida emg, como indicado pelo deslocamento da pena A pena ento volta a h e a seqncia repetida de h a i, e assim por dian te. Esse tipo de registro facilita a comparao entre segmentos sucessivos (p. ex., ocorreram muito mais respostas no segmento que termina em g do que no que termina em i). O registro D serve de ilustrao de como deslocamentos cons tantes da pena podem servir para distinguir dife rentes condies. Aqui o responder, ocasional mente, produz comida, mas apenas na presena de um tom; na presena desse tom, a pena per maneceu em sua posio normal, como nos seg mentos j, l e n, mas foi deslocada para baixo em sua ausncia, como nos segmentos k, m e o.

FIGURA 5.6 Caractersticas adicionais de registros cumulativos. Em A B, os deslocamentos da pena so usados para superpor o registro de outros eventos, como apresentao de alimento, sobre o registro acumulado das res postas (como em a at & ). Em C, a reciclagem da pena usada para simplificar as comparaes entre os segmentos sucessivos de um registro (f a g, h a i). Em D, deslocamentos da pena para cima so usados para distinguir o responder em presena de um estmulo (em), 1 e n) do no responder na sua ausncia (em k, m e o ) . Nesta figura, uma inclinao de 45 graus representa uma taxa de, aproximadamente, 40 respostas por minuto (a escala difere daquela da Figura 5.5).
A p re n d iz a g e m

89

Ao tratar do comportamento operante livre e dos registros cumulativos, exploramos parte do desenvolvimento tecnolgico da cincia do com portamento. Antes, porm, de nos dedicarmos efetivamente aos dados proporcionados por essa anlise, devemos atentar para alguns aspectos da terminologia do comportamento.

REFORO As presses barra por um rato privado de gua tomam-se mais provveis quando produ zem gua do que quando no produzem. Bica das no disco tomam-se mais provveis quando um pombo privado de alimento bica e produz comida do que quando no produz. E talvez, o choro de uma criana torne-se mais provvel quando chama a ateno dos pais do que quando no provoca essa ateno. Esses casos ilustram o princpio do reforo: o responder aumenta quando produz reforadores. O princpio sim ples, mas medida que evoluiu, da verso ini cial da Lei do Efeito de Thomdike at a posio atual, trouxe consigo alguns problemas de lin guagem e de lgica. Algumas propriedades do

vocabulrio contemporneo do reforo esto re sumidas na Tabela 5.1. A terminologia do reforo inclui o termo reforador como estmulo e os termos reforar e reforo ou reforamento, tanto na acepo de operao quanto na de processo. Por exemplo, quando as presses barra por um rato produ zem pelotas de alimento e as presses barra aumentam, podemos tanto dizer que as pelotas so reforadoras, ou que as presses barra so reforadas com pelotas. A resposta cuja freqn cia aumenta deve ser a que produziu a conse qncia. Por exemplo, se a presso barra de um rato produz choque eltrico, e apenas a fre qncia de saltos aumenta, seria inapropriado dizer que a presso barra ou que as respostas de saltar foram reforadas. Embora um reforador seja uma espcie de estmulo, o reforo no nem o estmulo nem a resposta. Como uma operao, o reforamento a apresentao de um reforador quando uma resposta ocorre; a operao efetuada sobre as respostas e, portanto, podemos falar to somen te de respostas reforadas, no de organismos reforados. Dizemos que a comida reforou a presso barra no caso do rato ou que as respos-

TABELA 5.1 A Terminologia do Reforo. Esta terminologia adequada se, e somente se, estiverem presentes trs condies: (1) uma resposta produz alguma conseqncia, (2) a resposta ocorre com mais freqn cia do que quando no produz conseqncias e (3) o aumento das respostas ocorre porque a resposta tem aquela conseqncia. Termo Reforador (substantivo) Reforador (adjetivo) Restries Um estmulo. Uma propriedade de um estmulo. Exemplos Pelotas de alimento foram empregadas como re foradores para as presses barra por ratos. O estmulo reforador era produzido mais freqen temente do que outros estmulos no-reforadores. O esquema de reforo em razo fixa programava a apresentao de alimento a cada 10 respostas de bicar. O experimento com macacos demonstrou reforo produzido por conseqncias sociais. Quando um perodo de recreio foi usado para re forar o cumprimento de uma tarefa escolar, as notas da criana melhoraram. O experimento foi planejado para verificar se es trelas douradas reforariam jogos de coopera o entre alunos de Ia srie.

Reforo (substantivo)

Reforar (verbo)

Como uma operao, apresentar conseqncias quando uma res posta ocorre. Como um processo, o aumento nas respostas que resultam do refor o. Como uma operao, apresentar conseqncias quando uma res posta ocorre; respostas so refor adas, no organismos. Como um processo, aumentar o res ponder mediante a operao de reforo.

a Uma terminologia paralela apropriada para punio (incluindo punidor como um estmulo e punir como verbo; cf. Captulo 6), com a diferena de que uma conseqncia punitiva reduz em vez de aumentar o responder.
90 A . C h a r le s C a ta n ia

tas de bicar o disco por um pombo foram refor adas com gua, mas no que o alimento refor ou o rato ou que o pombo foi reforado por bi car, ou que uma criana foi reforada. A princi pal razo para essa restrio ilustrada nos lti mos exemplos: quando se fala em reforar orga nismos muito fcil omitir a resposta ou o reforador, ou ambos. A restrio nos fora a ex plicitar o que est sendo reforado e porqu. Tambm no devemos omitir o organismo; sem pre podemos dizer de quem a resposta (p. ex., o choro de uma criana). O termo reforo tambm tem funcionado, fre qentemente, como um nome para um processo, o aumento no responder que se segue opera o de reforo. Esse emprego duplo, tanto como operao quanto como processo, dificulta a des crio do comportamento, mas vem sendo feito h tanto tempo que pouco provvel que mude. Por exemplo, a afirmao de que uma resposta foi reforada pode ser interpretada de duas ma neiras: a resposta produziu um reforador (ope rao) ou o responder aumentou porque produ ziu um reforador (processo). Este texto prefere o uso de reforo como uma operao. O proces so pode ser to facilmente descrito em termos de mudanas no responder (p. ex., o responder aumentou) que parece ser pouco justificvel a substituio da descrio direta do que acontece com a resposta por outros termos. Contudo, o uso do termo para se referir ao processo tem tan tos precedentes que impossvel evit-lo com pletamente. Alm disso, a superposio entre os vocabulrios de operao e processo se estende a muitos outros termos da aprendizagem (p. ex., extino, punio; Ferster & Skinner, 1957). O vocabulrio do reforo acarreta algumas dificuldades lgicas, mesmo quando restrito a operaes. Quando uma resposta se toma mais provvel porque produziu um estmulo, dizemos que a resposta foi reforada e chamamos o est mulo de reforador. Se nos perguntam como sa bemos que o estmulo reforador, podemos di zer que a resposta foi reforada. Logo comea mos a nos repetir. Uma vez que definimos o re forador pelos seus efeitos sobre o comportamen to, criamos um problema de definio circular se, ao mesmo tempo, definirmos o efeito pelo estmulo-reforador (Meehl, 1950).

Uma soluo seria reconhecer que o termo reforo descritivo, no explicativo. Ele nomeia uma relao entre o comportamento e o ambien te. A relao inclui, pelo menos, trs componen tes. Primeiro, as respostas devem ter conseqn cias. Segundo, sua probabilidade deve aumentar (isto , as respostas devem-se tornar mais pro vveis do que quando no tinham essas conse qncias). Terceiro, o aumento da probabilida de deve ocorrer porque a resposta tem essa con seqncia e no por outra razo qualquer. Por exemplo, se soubssemos apenas que o respnder aumentou, no seria apropriado dizer que a resposta deve ter sido reforada (poderia ter sido eliciada). Tambm no seria suficiente saber que a resposta est, no momento, produzindo algum estmulo que no produzia antes. Ainda teramos que saber se o responder aumentou porque o es tmulo era a sua conseqncia. Suponhamos que um pai atenda a uma crian a sempre que ela fale cochichando, mas supo nhamos tambm que esse comportamento de sus surrar da criana seja mais provvel na presena do pai do que na sua ausncia. A criana sussur ra e o pai aparece, e agora o sussurrar aumenta em freqncia. Como podemos decidir se a cri ana agora est sussurrando porque este com portamento foi reforado ou porque agora o pai est presente e toma mais provvel a ocorrncia desse comportamento? Isso ainda mais com plicado, porque o sussurrar da criana tambm pode reforar o comportamento de ateno do pai. Ao trabalhar com essas interaes impor tante distinguir os efeitos reforadores das con seqncias de outros efeitos (cf. Poulson, 1984). Consideremos um outro exemplo menos agradvel. Digamos que um pai agressivo mal trate uma criana sempre que ela chore e tente fazer com que o choro pare, dando-lhe umas pal madas. A criana chora, recebe as palmadas e isso faz com que o choro aumente. Nesse caso, a conseqncia do comportamento de chorar re ceber palmadas, e receber palmadas produz mais choro; no entanto, no diramos que as palma das reforaram o chorar. Dois critrios para se falar em reforo foram satisfeitos, mas o tercei ro no. O comportamento de chorar no se tor nou mais freqente porque as palmadas foram uma conseqncia dele; as palmadas levariam a

A p re n d iz a g e m

91

criana a chorar, mesmo que ela no estivesse chorando antes da primeira palmada. Os estmu los podem ter efeitos eliciadores ou outros efei tos, junto com seus efeitos reforadores ou em lugar deles. (Nestas circunstncias infelizes, a criana pode, eventualmente, aprender a supri mir o choro; como ser visto no Captulo 6, se ria apropriado dizer que as palmadas punem o chorar.) A terminologia do reforo requer que uma resposta tenha uma conseqncia, que o respon der aumente e que o aumento ocorra porque o responder tem conseqncias e no por outras razes. Satisfeitas essas condies, dizemos que a resposta foi reforada e que o estmulo era um reforador. Podemos supor tambm que o estmulo con tinuar a ser um reforador eficaz no futuro e que reforar outras respostas em outras situa es. Porm, ambas as suposies podem ser er radas. A eficcia dos reforadores muda com o tempo e qualquer conseqncia pode reforar algumas respostas, mas no outras. Por exem plo, o dinheiro pode ser mais reforador do que um sorriso para os servios de um encanador ou de um eletricista, mas o oposto talvez seja ver dadeiro em se tratando do comportamento de abraar a namorada. Apesar dessas restries, os reforadores empregados em muitas situaes experimentais padro (p. ex., alimento para or ganismos privados de alimento) provavelmente sero eficazes para uma variedade de respostas; o experimentador que escolhe um estmulo que refora algumas respostas e no outras, cedo ou tarde ter que lidar com a diferena. O tema da relatividade do reforo ser retomado mais adian te, neste captulo.

EXTINO As conseqncias de muitas respostas per manecem razoavelmente constantes durante a vida toda. Por exemplo, geralmente tocamos os objetos para os quais estendemos a mo e con seguimos mudar de um andar para o outro, quan do subimos um lance de escadas. Mas, para ou tras respostas, as conseqncias mudam. As res postas reforadas durante a infncia podem no

ser mais reforadas na idade adulta. Os sistemas educacionais, freqentemente, programam con seqncias como elogio ou notas para resolver problemas aritmticos ou responder questes fatuais, mas, cedo ou tarde, essas conseqncias artificiais so descontinuadas (com a esperana de que outras conseqncias mais naturais man tenham as respostas quando o estudante passa para outras situaes). Quando uma resposta reforada, sua probabilidade aumenta. Mas esse aumento no permanente: o responder volta aos nveis anteriores, to logo o reforo seja suspenso. A operao de suspender o reforo chama da de extino; quando o responder retoma a seus nveis prvios como resultado dessa operao, diz-se que foi extinto. Esse retomo do compor tamento aos seus nveis anteriores ao reforo demonstra que os efeitos de reforo so tempo rrios. O responder mantido apenas enquanto o reforo continua, e no depois que ele sus penso. Assim, a reduo no responder durante a extino no um processo especial que requei ra um tratamento separado, uma das proprie dades do reforo. Houve uma poca em que o responder du rante a extino era uma medida primria do re foro. A resistncia extino era expressa como o tempo decorrido at que o responder fosse re duzido a algum nvel especificado. Dois regis tros hipotticos da extino das presses barra de um rato so mostrados na Figura 5.7. Em am bos os registros, a taxa de respostas diminui com o passar do tempo (acelerao negativa), mas, dependendo do critrio de extino, ambos po dem representar maior resistncia extino. Se o critrio adotado for o tempo decorrido at o primeiro perodo de dois minutos sem resposta, ento, A mostra maior resistncia extino do que B. A no inclui 2min sem uma resposta, mas um perodo com essa durao aparece do meio para a frente em B. Se, por outro lado, o critrio for o total de respostas, a resistncia extino maior para B do que para A. A resistncia ex tino diminuiu de significado, porque sua defi nio permitia essas ambigidades. Mas a resistncia mudana (da qual a ex tino um caso especial) permanece como uma propriedade importante do comportamento (Nevin, 1992). Por exemplo, resolver problemas arit-

92

A . C h a r le s C a ta n ia

"

EXTINO

10 minutos

10 minutos

FIGURA 5.7 Dois registros cumulativos hi potticos da extino das presses barra por um rato aps reforo alimentar. Pode-se dizer que tanto A como B demonstram mai or resistncia extino, dependendo de se a extino medida pelo tempo transcorrido at que se passem dois minutos sem a emis so de uma resposta ou pelo total de respos tas emitidas durante a sesso de extino.

mticos, soletrar ou outras habilidades acadmi cas so consideradas fluentes quando forem re foradas e praticadas at o ponto de serem exe cutadas com grande exatido e com uma latncia curta (Johnson & Layng, 1992). Uma vez que essas habilidades se tomem fluentes, improv vel que sejam perturbadas por mudanas no am biente ou por outras distraes.

Extino versus Inibio Se no ocorresse a extino, os efeitos do reforamento seriam permanentes. Qualquer res posta estabelecida por reforamento duraria o resto da vida do organismo. Mas, claramente, no o caso. Por exemplo, quem usa relgio, prova velmente, vira o pulso com freqncia para olhlo; a conseqncia de olhar saber a hora. Mas, se por alguma razo a pessoa pra de usar o re lgio, eventualmente, pra de olhar o pulso; ver o pulso apenas no um reforador eficaz. A histria do conceito de extino, no entan to, no foi to simples. Por muito tempo perdu rou a suposio de que a extino suprimia ati vamente o responder. Afirmava-se que a extin o tinha efeitos inibitrios, ao contrrio dos efei tos excitatrios supostos para o reforo. Esse tra tamento dado extino teve origem na lingua gem que havia sido aplicada aos dados dos ex perimentos de condicionamento de Pavlov (cf. Captulo 12; ver tambm, Skinner, 1938, pp. 96 102). Uma vez estendida s conseqncias, essa linguagem foi mantida, porque parecia consis tente com outros efeitos que, geralmente, acom panham a extino. Assim, os textos de aprendi zagem tendiam a devotar captulos separados

para o reforo e a extino, em vez de trat-los como dois aspectos do mesmo fenmeno. Consideremos o fenmeno da recuperao espontnea. Em uma sesso tpica de extino o responder diminui medida que a sesso conti nua. Mas a taxa no incio da sesso seguinte, geralmente, mais alta do que era ao final da ltima sesso. Alguns registros cumulativos hi potticos que ilustram a recuperao espontnea so mostrados na Figura 5 .8 .0 responder no in cio de cada sesso era descrito como tendo-se recuperado espontaneamente da inibio acumu lada at o final da sesso anterior; supostamen te, essa inibio cresce no decorrer da sesso, suprimindo ativamente o responder, e dissipa-se durante o intervalo entre as sesses de extino. Pensava-se que fenmenos como a recupe rao espontnea significavam que o responder, reduzido pela extino, de algum modo estava ali o tempo todo, mas inibido (Reid, 1958). Explicaes variadas sobre a extino foram for muladas atravs desses processos inferidos, como a inibio, a frustrao, a interferncia ou a fadiga (Kimble, 1961). Essas explicaes di feriam apenas na maneira de caracterizar os even tos que geravam a inibio. Contudo, essas con cepes explicavam a extino em termos de eventos ou processos fictcos. Quando se afir mava que uma resposta tinha sido inibida du rante a extino, ela podia ser medida, mas no o que estivesse produzindo a inibio. No era necessrio pressupor a existncia de processos supressivos na extino. Por exemplo, os efeitos de condies pr-sesso, como o ma nejo do sujeito, podem fazer com que o incio da sesso seja diferente de perodos subseqentes. Se isso verdadeiro, os efeitos da extino mais
A p re n d iz a g e m

93

RECUPERAO ESPONTNEA EM EXTINO

FIGURA 5.8 Registros cumulativos hipotticos da recuperao espontnea de presses barra por um rato pre viamente reforado com alimento, em sesses sucessivas de extino. A taxa de respostas no incio da sesso 2 maior do que era no final da sesso 1; da mesma forma, a taxa no inco da sesso 3 maior do que no final da sesso 2.

no final da sesso podem no se transferir para o incio da sesso seguinte. Baseado nisso, Ken dall (1965) raciocinou que os padres usuais ob servados nas taxas de resposta nas sesses de extino poderiam ser revertidos sob condies apropriadas. De incio, ele reforou as respostas de bicar o disco, em trs pombos, durante ses ses de uma hora. Em seguida, programou ses ses de extino de um minuto de durao. So mente depois que o responder tinha sido confiavelmente reduzido a zero, nessas sesses curtas, que ele introduziu a primeira sesso de extin o de longa durao. Em poucos minutos, cada pombo recomeou a responder. At essa sesso, o responder nunca havia sido extinto at pero dos mais longos do que o primeiro minuto da sesso; quando a oportunidade, finalmente, apre sentou-se, o responder ocorreu nesses perodos posteriores ao minuto inicial. Em certo sentido, Kendall havia demonstrado a recuperao espon tnea durante a sesso, e no no seu incio. Outro exemplo da recuperao do responder extinto tem sido chamado de regresso ou res surgimento (Epstein & Skinner, 1980; Keller & Shoenfeld, 1950, pp. 81-82). Suponhamos que a resposta de um rato de puxar uma argola seja extinta e que a resposta de pressionar a barra seja reforada. Se mais tarde for extinta a resposta de presso barra, a resposta anteriormente ex tinta de puxar a argola, provavelmente, reapare cer. Fazendo uma analogia com a terminologia clnica, o fenmeno sugere que houve a regres so de um comportamento atual (pressionar a barra) para um comportamento antigo que j fora efetivo (puxar a argola).
94 A . C h a r le s C a ta n ia

Contingncias Resposta-Reforador e Apresentaes do Reforador A controvrsia sobre a natureza da extino pode decorrer do fato de que descontinuar o re foro tem no um, mas dois efeitos: (1) elimina a contingncia entre as respostas e os reforadores, de modo que (2) os reforadores no mais ocorrem. Nesse contexto, o termo contingncia simplesmente descreve as conseqncias do res ponder; aqui ele indica o efeito de uma resposta sobre a probabilidade de um estmulo. Por exem plo, se um rato recebe gros de alimento apenas quando pressiona a barra e, se cada presso pro duz uma pelota de alimento, a presso barra aumenta a probabilidade de apresentaes de comida de 0 para 1,0; mas, em uma contingn cia em que as presses barra nada fazem, a pro babilidade da comida independente dessas pres ses. (A rigor, uma contingncia resposta-estmulo sempre parte de uma contingncia de trs termos, mas essa questo no ser tratada neste momento; cf. Captulo 8.) As contingncias expressas como relaes de probabilidade entre as respostas e suas conse qncias podem ser representadas, graficamen te, da mesma forma que as relaes entre os es tmulos e as respostas que eles eliciam (Figura 4.2). O sistema de coordenadas ilustrado na Figura 5.9. O eixo y mostra a probabilidade de um estmulo, dada uma resposta oup(S/R); o eixo x mostra a probabilidade de um estmulo, dada a ausncia de resposta ou p(S/noR). Em relao Figura 4.2, os termos S e R foram invertidos. Aquela figura mostrava os efeitos dos estmulos

p(S/naoR) - Probabilidade do Estmulo Dada uma No-Resposta

FIGURA 5.9 Contingncias resposta-estmulo represen tadas em termos da probabilidade do estmulo, dada uma resposta, p(S/R), e probabilidade do estmulo na ausncia de resposta, p(S/noR). O grfico inclui a pro duo confivel de estmulos por respostas (A), estmu los independentes de resposta (B), extino (C), pre veno dos estmulos pelas respostas, como em esquiva (D; ver Captulo 6), e produo intermitente de estmu los, como nos esquemas de reforo (E; ver Captulo 10). Cf. Figura 4.2.

sobre as respostas; a Figura 5.9 mostra os efei tos das respostas sobre os estmulos. Em A, a probabilidade do estmulo alta dada uma resposta, e baixa na ausncia de resposta, como quando as presses barra por um rato produzem alimento. Em B, a probabilidade do estmulo independente das respostas, por exem plo, quando o alimento apresentado indepen dentemente de presses barra. Em C, a proba bilidade do estmulo zero, quer uma resposta tenha ou no ocorrido, como quando o alimento suspenso durante a extino. Mais tarde va mos considerar outros tipos de contingncias em outros contextos. Por exemplo, os casos em que as respostas reduzem a probabilidade de um estmu lo, como em D, ilustram a esquiva (Captulo 6), e os casos em que as respostas produzem um est mulo com uma probabilidade menor que 1,0, como em E, ilustram esquemas de reforo (Captulo 10). Comparemos, agora, os procedimentos quan to s mudanas nas contingncias e s mudan as nos estmulos. Consideremos, em primeiro lugar, um rato privado de alimento, cujas pres ses barra so reforadas com pelotas de ali

mento. A cada 10 ou 15 segundos, o rato pres siona a barra e come a pelota apresentada. Se a resposta de presso barra for, ento, colocada em extino, as presses no produziro as pe lotas, e o rato no come mais. Esse rato agora diferente sob dois aspectos: (1) suas presses barra no tm mais as conseqncias anteriores e (2) ele no come mais. Eis um procedimento alternativo. O rato per manece privado de alimento, mas quando descon tinuamos o reforo das presses barra, comea mos a apresentar pelotas automaticamente a cada 10 ou 15 segundos. Nesse caso, alteramos as con tingncias como no exemplo anterior: as presses barra que, antes, produziam alimento, no tm mais efeito. Mas, embora a comida no seja mais uma conseqncia das presses barra, este rato continua a obter comida a cada 10 ou 15 segun dos. Ambos os ratos, o do procedimento anterior e este, pressionaro a barra menos freqentemente, mas apenas um deles ainda poder comer. O procedimento padro de extino suspen de a contingncia e as apresentaes do estmu lo. O ltimo exemplo mostra, contudo, que a con tingncia pode ser descontinuada enquanto as apresentaes do estmulo continuam. Em am bos os casos, o responder que tinha sido refora do diminui. Mas descontinuar a apresentao de reforadores, o que ocorre apenas no primeiro procedimento, afeta uma faixa de respostas, mais do que apenas a resposta reforada. Se a comida subitamente retirada de um rato privado de ali mento que vinha comendo, por exemplo, ele se toma mais ativo e pode ser que urine ou defe que. Se as pelotas eram produzidas por presses barra, o rato pode morder a barra (Mowrer & Jones, 1943). Se h outros organismos presen tes na cmara, o rato pode atac-los (Azrin, Hu tchinson, & Hake, 1966). E a oportunidade de se engajar em tais respostas agressivas pode re forar outras respostas (p. ex., o organismo pode puxar uma corrente se esta resposta coloca ao seu alcance alguma coisa em que possa cravar os dentes: Azrin, Hutchinson, & McLaughlin, 1965). Esses efeitos, embora observados na ex tino, no so o resultado da suspenso da con tingncia de reforo. Eles ocorrem quando as pe lotas apresentadas, independentemente da res posta, deixam de ser apresentadas, tanto quanto

A p re n d iz a g e m

95

durante o procedimento de extino. Em ambos os casos, um rato que vinha sendo alimentado, deixa de receber comida. Na extino, esses efei tos colaterais so superpostos ao decrscimo no responder previamente reforado, porque a sus penso de reforadores , necessariamente, uma parte da extino. Tais observaes tm considervel significa do prtico. Em experimentos com crianas, por exemplo, algumas vezes so usados reforado res, independentes da resposta, em vez de extin o, para evitar os efeitos colaterais da interrup o da apresentao de reforadores (p. ex., ver Hart e col., 1968, sobre o reforamento social do brincar cooperativo em uma criana). As ope raes comportamentais tm, em geral, mais de um efeito. Um estmulo que refora uma respos ta pode eliciar outras respostas e servir como es tmulo discriminativo para outras. Os fenme nos considerados indicadores de que a extino seria mais do que um simples efeito temporrio do reforo eram, provavelmente, apenas efeitos colaterais. Muitos desses fenmenos, como o res ponder agressivo, gerado pela suspenso de apre sentaes do reforador, poderiam ter sido ob servados em situaes que no envolviam as con seqncias do responder.

tervalos curtos de tempo (p. ex., a cada 10 ou 15 segundos). As respostas que ocorriam imediata mente antes da apresentao de alimento tendiam a ser repetidas e, portanto, a ser seguidas de perto por mais apresentaes de alimento. O efeito da sucesso acidental de respostas de reforadores
geralmente bvio. Acontece de o pssaro estar executando alguma resposta quando o comedouro aparece; como resultado ele tende a repetir essa res posta. Se o intervalo antes da prxima apresentao no for to grande a ponto de ocorrer extino,... [isto] fortalece ainda mais a resposta... O pombo se comporta como se houvesse uma relao causal en tre seu comportamento e a apresentao de alimen to, embora tal relao no exista. (Skinner, 1948, pp. 168-171)

Extino e Superstio Como acabamos de ver, os efeitos gerais de suspender as apresentaes do reforador na ex tino so superpostos aos efeitos mais espec ficos de suspender as contingncias. Por que, en to, a extino foi, por tanto tempo, a principal base para o estudo dos efeitos de suspender as contingncias? E mais conveniente desligar a barra do equipamento que opera o comedouro do que desconectar a barra e, ao mesmo tempo, substitu-la por um relgio que opera o come douro periodicamente, mas pouco provvel que a resposta resida em uma mera mudana no equi pamento. E mais provvel que os procedimen tos tenham sido determinados por algumas ou tras propriedades do comportamento. Em um fenmeno chamado de superstio (Skinner, 1948), a comida era repetidamente apre sentada a um pombo privado de alimento, em in
96 A. C h a r le s C a ta n ia

Skinner notou que medida que o procedi mento continuava, a topografia ou a forma do pombo responder geralmente mudava de modo gradual, como as relaes acidentais desenvol vidas entre o responder e as apresentaes de alimento. Skinner se referia a essas mudanas como deslocamento topogrfico. Um pombo res pondia temporariamente como se suas respostas estivessem produzindo alimento, como uma con seqncia, mas nenhuma resposta particular per manecia consistentemente como um comporta mento supersticioso. Ao longo de perodos de observao mais extensos com este procedimen to, Staddon e Simmelhag (1971) observaram que o bicar, geralmente, predominava como a res posta que precedia imediatamente as apresenta es de alimento (cf. Captulo 4, sobre as contri buies da eliciao). O responder supersticioso, gerado por uma sucesso acidental de respostas e reforadores, um problema recorrente na anlise do compor tamento, porque tais seqncias acidentais po dem ocorrer, quer os reforadores sejam inde pendentes de respostas, quer eles sejam conse qncia delas. Se uma resposta seguida por uma resposta diferente, que reforada, o reforador pode afetar a ambas, embora sua apresentao dependa apenas da segunda resposta (Catania, 1971; Kazdin, 1977). Mesmo quando as respos tas tm conseqncias, propriedades da respos ta no relacionadas com o reforo podem se tor nar estereotipadas se acompanharem consisten temente as respostas reforadas. Por exemplo,

os gestos do jogador de boliche, aps lanar a bola, podem persistir por causa da relao ntima entre as respostas prvias e o impacto da bola (Herms tein, 1966). Alm disso, se as contingncias de reforo mudam de forma que as caractersticas do responder, que em um momento eram relevantes, tomam-se irrelevantes e se essas antigas caracte rsticas no so incompatveis com as caractersti cas relevantes atuais, elas podem persistir, simples mente porque continuam a ser seguidas por reforadores (Stokes & Balsam, 1991). Outra dificul dade que a superstio muito facilmente invo cada para explicar comportamentos para os quais no existem outras explicaes disponveis (Gu thrie & Horton, 1946; Moore & Stuttard, 1979). Podemos agora reconsiderar o que acontece quando uma contingncia de reforo suspen sa, enquanto as apresentaes do reforador con tinuam. Em primeiro lugar, as presses barra por um rato so reforadas com alimento; em seguida, as presses j no mais produzem ali mento, mas as apresentaes de pelotas conti nuam independentemente do comportamento. As presses barra continuam por algum tem po e tendem ainda a ser seguidas de perto pelo alimento. A ao de pressionar a barra sofre um declnio lento porque a sucesso acidental de respostas e reforadores se contrape aos efeitos da suspenso da contingncia de reforo. Final mente, a presso barra substituda por outras respostas, mas seria difcil dizer que esse decrs cimo simples. Por essa razo, programar uma transio de uma contingncia de reforo para as apresentaes do reforador independentemente da resposta pode ser uma estratgia pobre para exa minar os efeitos da suspenso da contingncia de reforo (Boakes, 1973; Catania& Keller, 1981). Uma vez mais, existem aqui implicaes pr ticas. Imaginemos um garoto institucionalizado, com um atraso de desenvolvimento, e que fre qentemente se engaja em comportamentos autolesivos, tais como bater na cabea ou enfiar o dedo nos olhos. Imaginemos tambm que des cobrimos que esses comportamentos esto sen do mantidos, em grande parte, pela ateno dos atendentes da instituio, que funciona como um reforador. Um procedimento de extino no recomendado, por causa dos danos que o garoto pode causar a si mesmo, se ignorarmos seu com

portamento autolesivo. Dar-lhe ateno, indepen dentemente de seus comportamentos autolesivos, uma alternativa possvel, mas como vimos, tal procedimento pode reduzir o comportamento in desejvel de forma muito lenta. Um procedimen to melhor seria empregar a ateno para refor ar uma resposta alternativa e, especialmente, uma que fosse incompatvel com o comporta mento autolesivo (Repp & Deitz, 1974). O com portamento autolesivo inevitavelmente diminui r, medida que a resposta alternativa aumentar em freqncia. Esses procedimentos, referidos como reforo diferencial de outro comportamen to, tm sido amplamente aplicados a problemas de comportamento (p. ex., ver Skiba, Pettigrew & Alden, 1971, sobre o comportamento de chu par o dedo). Um modo de reduzir o mau com portamento de uma criana reforar o seu bom comportamento. Esta uma razo pela qual o ditado Surpreenda a criana quando ela estiver agindo bem to eficiente, tanto para pais, quanto para professores.

Seo B

Os Reforadores como Oportunidades para o Comportamento

Os reforadores so, inevitavelmente, supersimplificados quando so tratados meramente como estmulos. A apresentao de qualquer re forador envolve a transio de uma situao para outra (cf. Baum, 1973). Por enquanto, te mos identificado os reforadores apenas pelos seus efeitos. Sem tomar o estmulo uma conse qncia do responder, no podemos dizer se ele ser efetivo como um reforador. Mesmo os re foradores evidentes, como a comida, podem va riar em eficcia, dependendo da privao. A apre sentao da comida como uma conseqncia para pressionar a barra pode no alterar a taxa dessa resposta se o rato j tem comida disponvel o tempo todo. Veremos que uma propriedade im portante de uma situao de reforo o respon der para o qual ela estabelece a ocasio. O Captulo 2 introduziu o conceito de opera es estabelecedoras, procedimentos que tomam os eventos mais ou menos efetivos como refor-

A p re n d iz a g e m

97

adores. O Captulo 4 discutiu alguns dos efei tos das operaes estabelecedoras com exemplos de motivao ou impulso. Podemos agora defi nir esses termos de forma mais precisa. Quando estudamos a motivao, estamos interessados no que torna as conseqncias mais ou menos efe tivas como reforadoras ou punitivas. Na taxonomia das operaes estabelecedoras, a priva o e a saciao so formas importantes, mas no as nicas, de mudar a efetividade de um estmu lo como reforador ou punidor. Nesse contexto, podemos agora examinar uma variedade de even tos que podem funcionar como reforadores. Algumas distines entre os reforadores, s vezes, so feitas com base nos tipos de opera es que os estabeleceram como reforadores. Por exemplo, um reforador condicionado aquele que se toma efetivo em virtude de sua relao com algum outro reforador (p. ex., a luz que aparece quando o comedouro operado, em uma caixa de pombo, pode, eventualmente, tornar-se um reforador condicionado devido sua relao com a apresentao de comida). A operao estabelecedora programa aqui a rela o entre os estmulos (i.e., liga o comedouro de tal modo que as apresentaes de comida so acompanhadas pela luz). No comportamento hu mano, o dinheiro freqentemente funciona como um reforador condicionado e, por causa de sua relao com muitos outros possveis reforado res (todas as coisas que se podem comprar com dinheiro), ele muitas vezes chamado de refor ador condicionado generalizado. Um refora dor que no depende de qualquer relao com outros reforadores chamado de reforador incondicionado. Muitos eventos considerados reforadores incondicionados tem, claramente, uma importn cia biolgica (p. ex., alimento, gua, contato se xual; cf. Richter, 1927). Mas os reforadores no esto limitados a eventos de importncia biol gica bvia. Por exemplo, os estmulos sensoriais como as luzes pisca-pisca podem ser refor adores poderosos para o comportamento de cri anas autistas (Ferrari & Harris, 1981). E quan do crianas com atrasos de desenvolvimento fo ram privadas de msica ou de aprovao social, por um curto perodo de tempo, esses eventos tor naram-se reforadores mais efetivos para outros

comportamentos, como operar um interruptor, por exemplo; por outro lado, quando se proporciona va msica ou aprovao social s crianas, at a saciao, a efetividade desses eventos como re foradores diminua (Vollmer & Iwata, 1991). Os reforadores tambm tm sido distingui dos com base em sua relao com as respostas. Um reforador intrnseco (tambm chamado de reforador automtico) o que tem uma relao natural com as respostas que o produzem (por exemplo, quando um msico toca pela msica que produz). Um reforador extrnseco (tambm chamado de reforador arbitrrio) tem uma re lao arbitrria com as respostas que o produ zem (por exemplo, quando um msico toca por dinheiro). O termo extrnseco tambm tem sido aplicado a estmulos que supostamente fun cionam como reforadores, porque sua fun o foi ensinada (por exemplo, quando se en sina a uma criana que importante tirar boas notas na escola). A despeito de seu rtulo, tais estmulos freqentemente so ineficazes como reforadores. Discutimos as funes eliciadoras, discrimi nativas e reforadoras dos estmulos. A apresen tao de estmulos pode ter, tambm, funes es tabelecedoras (cf. Michael, 1982). Consideremos dois exemplos: provar uma sopa sem sal no au menta a probabilidade de que o sal seja passado quando voc pedir por ele, e chegar em frente a uma porta trancada no aumenta a probabilildade de que voc encontre a chave em seu bolso. No entanto, essas situaes possivelmente au mentaro a probabilidade de que voc pea o sal ou que coloque a mo no bolso. Nesses casos, alguma coisa que era neutra (o sal ou a chave) tornou-se reforadora. (Tais efeitos tm sido cha mados, algumas vezes, de funes de incentivo; o termo incentivo, no entanto, tem sido aplicado tanto para a funo estabelecedora quanto para a funo discriminativa dos estmulos; p. ex., Bolles, 1975; Logan, 1960).

RELATIVIDADE DO REFORO Existe uma grande variedade de reforado res. Alguns so consumidos. Outros no. Alguns parecem eficazes na primeira experincia que o

98

A . C h a r le s C a ta n ia

organismo tem com eles. Outros adquirem suas propriedades reforadoras durante a vida do or ganismo. Nenhuma propriedade fsica comum permite identificar os reforadores independen temente de seus efeitos sobre o comportamen to. Por exemplo, difcil dizer que aspecto da ateno do professor refora o comportamento do aluno, mas sabemos que quando um profes sor se dirige a um aluno do primeiro grau com um tapinha nas costas ou com um comentrio encorajador contingente ao seu comportamento de ler, o comportamento de estudar do aluno aumenta, enquanto outros comportamentos no relacionados com o estudo, como vadiar por exemplo, diminuem (Hall, Lund, & Jack son, 1968). Sabemos tambm que mudanas no comportamento do aluno podem reforar o comportamento do professor (Sherman & Cormier. 1974). tentador identificar os reforadores com eventos que, coloquialmente, so chamados de recompensas, mas isso seria um erro. Os refor adores no funcionam porque fazem o organis mo sentir-se bem ou porque o organismo gos ta deles. Nossa linguagem cotidiana no captu ra as propriedades essenciais dos reforadores. Por exemplo, em um estudo sobre quais refora dores poderiam ser efetivos no controle do com portamento de pessoas com retardo mental pro fundo, as predies baseadas na opinio dos fun cionrios sobre o que funcionaria para cada in divduo foram inconsistentes com os reforado res identificados por meio de uma avaliao sis temtica das preferncias individuais dos sujei tos (Green e col., 1988; cf. Fischer e col., 1992). Alguns eventos que, superficialmente, pare cem recompensadores podem no funcionar como reforadores; outros, que parecem o opos to, podem ter poderosos efeitos reforadores. Por exemplo, seria difcil imaginar que despencar de um lugar elevado ou ser violentamente torcido e sacudido possa ser reforador. Mas certamente, esses eventos contribuem para os efeitos refor adores da montanha russa e de outras para fernlias dos parques de diverso. Parece pouco provvel, tambm, que a restrio fsica funcio ne como reforador, mas uma anlise dos com portamentos autolesivos de trs crianas com se veros atrasos de desenvolvimento mostrou que

a restrio fsica, que impedia que a criana se batesse ou se mordesse, podia reforar respostas arbitrrias, como colocar bolinhas de gude den tro de uma caixa (Favell, McGimsey, & Jones, 1978). Uma vez que um reforador como este seja identificado, ele pode ser empregado para reforar os comportamentos que so incompat veis com os comportamentos autolesivos. As risadas de uma audincia parecem ser uma conseqncia reforadora para o comportamen to de contar piadas. Imagine que um professor conte algumas piadas, a classe ri e, como resul tado, o professor conta piadas mais freqente mente. Podemos dizer que as risadas reforaram o contar piadas, mas com base apenas nessa evi dncia no podemos dizer que o riso, em geral, seja um reforador. Imagine agora que o profes sor faa trocadilho (tentando pegar os alunos), a classe ri do professor (no cai na armadilha) e, como resultado, o professor faz trocadilhos me nos freqentemente. As risadas no reforaram o comportamento de fazer trocadilhos (na ver dade, deveramos dizer que elas puniram tal com portamento: Captulo 6). Se o riso reforou ou puniu, depende de se ele foi contingente ao contar piadas ou ao fazer trocadilhos. De fato, o comportamento de fazer trocadilhos provavel mente mais reforado por protestos dos alunos (quando eles caem na armadilha do professor) do que por risos. Imagine que o professor faa um trocadilho, os alunos reclamem (porque so pegos) e, como resultado, o professor tenta pegar os alunos com maior freqncia. Agora podemos dizer que os protestos dos alunos re foraram o comportamento de fazer trocadilhos. Dependendo de se as conseqncias so risa das ou protestos, o comportamento de fazer trocadilhos reforado ou punido. (De fato, as risadas contingentes aos trocadilhos podem ser ruins o bastante para fazerem um homem chorar). A efetividade de um reforador de pende da sua relao com as respostas que o produzem. Quando um rato produz alimento por meio de presses barra, o alimento d ao rato a opor tunidade de comer. Se o alimento e a barra ficam simultaneamente disposio do rato, mais provvel que o rato coma do que pressione a barra. Agora, consideremos a hiptese de que a

A p re n d iz a g e m

99

probabilidade de uma resposta aumente se ela criar uma oportunidade para o organismo se en gajar em uma outra resposta mais provvel que ela prprias (Premack, 1959, 1971). Em outras palavras, se a resposta A mais provvel do que a resposta B, a oportunidade de se engajar na resposta A pode ser usada para reforar a res posta B. Se isso for verdadeiro, o alimento um reforador eficiente para as presses barra por um rato privado de alimento simplesmente por que comer geralmente mais provvel do que pressionar a barra. Consideremos um experimento que inverteu os efeitos de dois estmulos, manipulando as pro babilidades das respostas ocasionadas por eles (Premack, 1962). As respostas de correr em uma roda de atividade foram controladas, travandose ou soltando o freio da roda. A ingesto de gua foi controlada pela introduo e retirada de um tubo de gua, por um orifcio em uma parede fixa em um dos lados da roda. O comportamen to de ingerir gua foi registrado por meio de um dispositivo eltrico chamado drinkmetro, que registrava as lambidas. De acordo com testes em perodos curtos, quando ambas as respostas fi cavam disponveis, correr tornou-se mais pro vvel do que beber depois que a roda era trava da, enquanto a gua permanecia disponvel, mas beber tornou-se mais provvel do que correr de pois que o tubo de gua era removido, enquanto a roda continuava disponvel. Em cada caso, a oportunidade de engajar-se na resposta mais pro vvel reforava a resposta menos provvel. Quando correr era mais provvel que beber (aps a restrio de acesso roda de atividade), as lam bidas tomavam-se mais provveis, caso se sol tasse a trava do freio e se permitisse o rato correr, do que se no lhe fosse dada a oportu nidade de correr. Inversamente, quando beber era mais provvel que correr (aps restrio de acesso ao tubo de gua), correr se tornava mais provvel quando isso dava acesso ao tubo, permitindo que o rato bebesse, mesmo quando no tivesse efeito algum sobre a opor tunidade de beber. Isso demonstra que os reforadores no po dem ser definidos independentemente das res postas que reforam. No experimento de Prema ck, beber reforou o correr quando beber era mais

provvel que correr, mas correr reforou o be ber quando as probabilidades foram invertidas. De acordo com essa concepo, os reforadores so relativos e suas propriedades importantes so baseadas nas respostas s quais eles criam opor tunidade de ocorrncia. Essa relatividade foi ignorada durante muito tempo. A maioria dos experimentos sobre apren dizagem havia se limitado a respostas de proba bilidades relativamente baixas (p. ex., pressio nar a barra, com ratos) e a reforadores que oca sionavam respostas altamente provveis (p. ex., alimento e comer). Esses casos eram comuns e convenientes, mas no passavam de casos espe ciais. Poucos pensaram em perguntar, por exem plo, se seria possvel programar situaes em que as oportunidades de pressionar uma barra ou de bicar um disco poderiam ser empregadas para reforar o comer (p. ex., Sawisch & Denny, 1973). A questo no to forada. A oportuni dade de fazer uma boa refeio pode ser um re forador eficaz, mas veja com que freqncia as crianas so persuadidas a terminar de almoar, quando outras atividades dependem disso. O comer pode ser reforador, por exemplo, quan do uma criana s ganha a sobremesa quando termina o dever de casa, mas pode ser reforado se a criana puder assistir televiso quando ter minar de comer. A relatividade do reforo pode ser melhor ilustrada expandindo-se o experimento anterior para trs respostas. Vamos acrescentar um co medouro roda de atividade e ao tubo de gua. Restringindo a acesso a eles de modo apropria do, podemos tomar o comer mais provvel do que o correr na roda e este mais provvel do que o beber. Descobrimos, ento, que correr pode ser reforado pela oportunidade de comer, mas a oportunidade de correr na roda pode reforar o beber; correr pode, simultaneamente, tanto re forar como ser reforado. Essas relaes so ilustradas esquerda na Figura 5.10. Se utiliza mos a privao de gua, tornando o beber a res posta mais provvel, as relaes de reforo se alteram, como ilustrado direita, na Figura 5.10. Em outras palavras, ao alterar as probabilidades relativas dessas trs respostas, podemos trans formar a oportunidade de se engajar em qual quer uma delas em um reforador eficaz com

100

A . C h a r le s C a ta n ia

COMER
comer pode reforar o

BEBER
beber pode reforar o comer comer pode reforar o beber correr pode reforar o beber COMER comer pode reforar o correr CORRER beber pode reforar o correr

CORRER

BEBER

FIGURA 5.10 Relaes de reforo dadas diferentes probabilidades de respostas em uma hierarquia de comporta mento. Quando comer a resposta mais provvel e beber a menos provvel ( esquerda), a oportunidade de comer pode reforar o correr ou o beber, mas a oportunidade de correr pode reforar apenas o beber. Em um outro momento ( direita), quando beber a resposta mais provvel e correr a menos provvel (p. ex., depois de um perodo de privao de gua), comer ainda pode reforar o correr, mas tanto comer como correr podem agora ser reforados pela oportunidade de beber.

respeito a uma das outras duas respostas ou a ambas. As probabilidades relativas com que di ferentes crianas preferem colorir livros, brin car com blocos de madeira ou brincar no parquinho podem ser informaes teis para algum que tenha que controlar o comportamento de crianas em creches ou nos primeiros anos do primeiro grau (p. ex., Wasik, 1970). A privao toma os reforadores mais efeti vos, porque a probabilidade de uma resposta em geral aumenta quando a oportunidade de se en gajar nela fica restrita (p. ex., Timberlake, 1980). Mas a operao pormenorizada do princpio de Premack tem gerado controvrsias, especialmen te porque essa operao depende de como as pro babilidades so calculadas. A escolha entre res postas simultaneamente disponveis pode ser uma medida mais satisfatria do que a propor o do tempo gasto para cada uma das respostas (p. ex., Dunham, 1977; Eisenberg, Karpman, & Trattner, 1967). Uma complicao adicional que algumas respostas tm maiores possibilida des do que outras de se substiturem umas s outras (Bemstein & Ebbesen, 1978; Rachlin & Burkhard, 1978). Por exemplo, a privao da oportunidade de comer um alimento pode no tomar o comer esse alimento um reforador efi ciente se outro alimento estiver disponvel, mas pode fazer isso se, em vez do segundo alimento, houver gua disponvel. Nesse caso, comer um alimento e comer outro so respostas permut

veis (cada uma substitui a outra como um refor ador), mas comer e beber no so. Introduzimos os reforadores como tipos de estmulos, mas agora estamos falando deles em termos de respostas. O tratamento mudou por que descobrimos que uma propriedade impor tante de um reforador o responder que ele ocasiona. Como o reflexo, o reforo uma rela o, e no uma teoria ou uma hiptese. Essa re lao inclui o responder, suas conseqncias e a mudana no comportamento que se segue.

AQUISIO DO COMPORTAMENTO Retomemos agora aprendizagem, exami nando como um organismo pode adquirir res postas por meio de reforo. O registro A, da fi gura 5.11 mostra um registro cumulativo hipo ttico da primeira sesso em que as presses barra por um rato foram reforadas. As primei ras respostas so separadas umas das outras por pausas longas. Depois de pouco mais de 5 mi nutos, as pausas longas desaparecem e ento o responder aumenta pelo resto da sesso. A aqui sio da presso barra parece gradual. Se qui sssemos repetir essas observaes, poderamos extinguir as presses at que as respostas vol tassem aos nveis prvios e, ento, conduzir uma nova sesso de reforo. O registro B, da Figura

A p r e n d iz a g e m

101

AQUISIO E REAQUISIO

10 minutos

FIGURA 5.11 Registros cumulativos hipo tticos da aquisio inicial do comportamen to de um rato de pressionar a barra durante a primeira sesso em que cada resposta reforada com alimento (A) e na reaquisi o do comportamento, quando o reforo novamente introduzido aps um perodo de extino (B).

5.11 mostra como poderia ser o desempenho. No incio da sesso, devido extino prvia, no ocorre nenhuma resposta. Quando finalmente uma resposta ocorre e reforada, o responder imediatamente aumenta a uma taxa aproxima damente igual do final da primeira sesso de reforo. Desta vez, observamos uma aquisio abrupta e no gradual da resposta de pressionar a barra. Como reconciliar esses dois desempe nhos to diferentes? Sidman (1960) discutiu uma alternativa ar gumentao de que a aprendizagem inicial teria produzido uma mudana irreversvel:
O animal aprendeu no apenas as respostas que fo ram bem-sucedidas em deslocar a barra, mas tam bm a se dirigir bandeja, pegar a pequena pelota, lev-la sua boca, etc. E essas respostas foram apren didas na seqncia correta, porque o reforo das mesmas estava correlacionado com os estmulos apropriados, tanto do ambiente como do comporta mento anterior. O ato de aproximar-se da bandeja, por exemplo, podia ser reforado somente depois do som do comedouro; o de pegar a pelota somente podia ser reforado depois que a mesma tivesse ca do na bandeja, etc... O que extinguimos quando des ligamos o mecanismo do comedouro?... J no h o som do comedouro, nem o rudo da pelota, nem a viso da pelota, nem a sensao tctil da pelota, etc. Aproximar-se da bandeja ainda possvel, mas so mente na ausncia de alguns de seus estmulos con troladores. As respostas envolvidas no pegar e in gerir a pelota no podem mais ocorrer no contexto original de sua aprendizagem. Enquanto nosso pro cedimento de extino pode ter reduzido a resposta de presso barra a seu nvel de pr-condicionamento, outros componentes da seqncia completa aprendida poderiam no ter sofrido uma completa extino. (Sidman, 1960, pp. 101-103)

sesses: Quando o reforo foi novamente in troduzido..., o animal no teve que reaprender toda a seqncia, porque a seqncia inteira no havia sido extinta (Sidman, 1960, p. 103). O reforo, ento, no produz aprendizagem; produz comportamento. Ao observar se o rato pressiona a barra quando a contingncia de re foro est em operao e no na sua ausncia, estamos simplesmente interessados em at que ponto o rato aprendeu as conseqncias de sua ao de pressionar a barra. As conseqncias do responder so crticas para a aprendizagem no porque a aprendizagem ocorra a partir delas, mas porque elas so o que aprendido. Certas con tingncias envolvem o modo pelo qual o ambi ente afetado pelo comportamento, sendo, por tanto, caractersticas importantes do ambiente a serem aprendidas pelos organismos.

Aprendizagem Latente As questes precedentes estavam implcitas em uma controvria baseada em um fenmeno deno minado aprendizagem latente (Thistlethwaite, 1951). Consideremos o experimento ilustrado na Figura 5.12 (Tolman & Honzik, 1930; Tolman, 1948). Ratos privados de alimento, dis tribudos em trs grupos, tinham que atraves sar um labirinto. Os ratos de um dos grupos encontravam o alimento no compartimentoalvo do labirinto e, aps sucessivas tentativas dirias, as entradas nos becos sem-sada di minuram gradualmente. Em um segundo gru po, os ratos no encontravam alimento no compartimento-alvo. Para esses animais, as entra das nos becos sem-sada diminuram, mas per-

A partir dessa anlise, Sidman resumiu as razes para a diferena na aquisio nas duas
102 A . C h a r le s C a ta n ia

10 FIGURA 5.12 Um experimento sobre aprendizagem latente. Os ratos foram submetidos a uma tentativa diria em um labirinto com 14 pontos de escolha. Um grupo (quadrados cheios) sempre en contrava alimento no compartimentoalvo e um segundo grupo (tringulos va zios) nunca o encontrava. O terceiro grupo no encontrava alimento na caixa-alvo at o dcimo dia (crculos va zios), mas, a partir de ento, ele era en contrado (crculos cheios). Este grupo, que teve desempenho como o segundo, rapidamente se igualou ao primeiro. Os ratos vinham aprendendo o padro do labirinto o tempo todo, assim, o alimen to no compartimento-alvo fo i necess rio somente para que eles exibissem o que j tinham aprendido. (Tolman & Honzik, 1930)

(O
E

Sem Comida

Comida 2
-

Sem Comida para Comida

__ I J __ I__ I
20
Dias

maneceram substancialmente mais elevadas do que as do primeiro grupo. Em um terceiro gru po, o alimento foi introduzido no compartimen to-alvo somente depois de dez sesses. O de sempenho deste ltimo grupo, que tinha sido igual ao do segundo grupo (sem alimento), tor nou-se, rapidamente, comparvel ao do primei ro grupo (com alimento); os ratos que percorre ram o labirinto previamente sem alimento no compartimento-alvo passaram a percorr-lo com to poucas entradas nos becos sem sada quanto os ratos que sempre encontravam o alimento no compartimento-alvo. At a introduo do ali mento, a aprendizagem do terceiro grupo tinha sido latente; o que havia sido aprendido foi de monstrado pela introduo do alimento. O argumento inicial era que os ratos apren diam o labirinto igualmente bem, quer houvesse ou no alimento no compartimento-alvo e que, portanto, no se podia atribuir a aprendizagem ao alimento como reforador. O raciocnio foi, em seguida, estendido aos reforadores em ge ral e chegou-se a afirmar que os experimentos sobre aprendizagem latente demonstravam que a aprendizagem poderia ocorrer sem reforo. Mas, logo veio o contra-argumento de que o ali

mento no compartimento-alvo no era o nico reforador possvel para o comportamento do rato de percorrer o labirinto. A remoo do ani mal do labirinto ao final de uma corrida, sua fuga dos espaos exguos dos becos sem sada ou seu retomo gaiola-viveiro onde era alimentado tam bm poderiam funcionar como reforadores efe tivos. Realizaram-se, ento, experimentos em que o manejo do rato ao final da corrida, a largura das pistas do labirinto e alimentao na gaiolaviveiro foram manipulados. Toda vez que um experimento mostrava que um determinado re forador poderia gerar a aprendizagem no labi rinto, um outro demonstrava a aprendizagem la tente de tal maneira que o reforador em ques to no poderia ser eficaz. E assim as coisas con tinuaram. Mesmo em termos de princpio o debate no podia ser resolvido e a aprendizagem latente, gradualmente, esgotou-se enquanto questo te rica crtica. A razo disso que o percurso de um labirinto pelo rato envolve, inevitavelmente, as conseqncias do responder. Em qualquer ponto de escolha, uma virada seguida de uma entrada num beco sem-sada e uma outra, pela oportunidade de avanar mais no labirinto; no
A p re n d iz a g e m

103

ltimo ponto de escolha, apenas uma virada seguida da entrada no compartimento-alvo, quer ele contenha ou no o alimento. Quando o rato cheira, toca, olha e move-se no labirinto, est emitindo respostas que tm conseqncias, em bora esses comportamentos no sejam to facil mente acessveis observao como as viradas corretas ou as entradas nos becos sem sada. Es sas conseqncias so o que o rato aprende. Cha m-las de reforadores uma questo, princi palmente, de preferncia, mas a linguagem da aprendizagem latente parece ter levado a um beco sem-sada.

Aprendizagem Sensrio-Motora As conseqncias nesses experimentos com ratos apresentaram, principalmente, estmulos que, em geral, tm significado biolgico para a sobrevivncia do organismo (p. ex., alimento e gua). Mas muitas conseqncias aparentemen te menos importantes so relevantes em nossas interaes cotidianas com o meio ambiente, como aquelas implicadas na aprendizagem la tente. Estamos cercados de contingncias em que um reforador se segue a uma resposta, mas elas so facilmente negligenciadas (ver Parsons, 1974, para um exemplo humano). Abrimos um livro para ler. Ouvimos para entender o que al gum est dizendo. Estendemos a mo em dire o ao lpis, para peg-lo. Cada conseqncia estabelece a ocasio para novas respostas. Quan do terminamos uma pgina de um livro, viramos a pgina e lemos a seguinte; quando o conferen cista acabou de falar, fazemos perguntas ou co mentrios; quando pegamos o lpis, escrevemos alguma coisa com ele. Na medida em que cada caso envolve um comportamento mantido por suas conseqncias, eles podem ser discutidos com a terminologia do reforo. Ver refora o olhar, ouvir refora o escutar, e tocar ou pegar um lpis refora o ato de estender a mo em di reo a ele. A interao dos processos sensoriais com o comportamento tem sido uma fonte permanente de controvrsias na Psicologia da Aprendizagem. Os tericos tomaram partido nos debates sobre se a aprendizagem motora ou sensorial. Os or

ganismos aprendem respostas ou relaes entre os estmulos? Aprendem associaes resposta-estmulo ou no associaes estmulo-estmulo? Um dos problemas o de saber se os proces sos sensoriais deveriam ser tratados como com portamento. Tal tratamento seria condizente com o ponto de vista de que o comportamento deve ser considerado quanto s relaes entre os est mulos e as respostas, em vez de quanto aos est mulos apenas ou s respostas apenas. Embora no possamos medir o ver e o ouvir sem ambi gidade, como medimos respostas discretas, tais como presses barra por um rato ou bicadas de um pombo, eles so, ainda assim, comportamen to. Dependem no apenas de que os estmulos visuais ou auditivos estejam presentes, mas tam bm do que o organismo faz. Olhar aumenta a pro babilidade de ver, assim como o ouvir aumenta a probabilidade de escutar. O organismo no pas sivo em seu contato com o ambiente. Os sons, as luzes e outros eventos bsicos tm sido descritos, s vezes, como estmulos neutros em relao a reforadores ou punidores potencialmente fortes (p. ex., a comida e o cho que). Mas, o rtulo neutro, embora conveniente, um nome enganoso. Os eventos no podem ser verdadeiramente neutros se forem conseqncias do comportamento, porque improvvel que no tenham algum efeito sobre o comportamento. Contudo, antes que a relatividade dos refora dores fosse reconhecida, as demonstraes dos efeitos reforadores de estmulos como luzes e sons eram recebidas com ceticismo. Ao longo de repetidos experimentos, entretanto, o fen meno chamado reforo sensorial tomou-se es tabelecido (Kish, 1966). Por exemplo, a ao de pressionar a barra por um rato no escuro aumen tava transitoriamente se as presses acendiam brevemente uma luz. Em outras palavras, a luz servia temporariamente como um reforador fra co. Fenmenos como esses logo passaram a ser discutidos em termos de comportamento explo ratrio e curiosidade, e os experimentos foram ampliados para uma variedade de conseqncias sensoriais. Por exemplo, se um macaco est so zinho em uma cmara fechada, a oportunidade de olhar para outros macacos do lado de fora pode ser usada para reforar a operao de um interruptor (Butler, 1957).

104

A. C h a r le s C a ta n ia

Nessas pesquisas, o experimentador avalia os afeitos das conseqncias sensoriais sobre uma resposta escolhida por ser fcil de medir. Mas, ;m qualquer ambiente, o comportamento do or ganismo ter, inevitavelmente, conseqncias sensoriais. O organismo altera seu ambiente, sim plesmente, locomovendo-se de um lugar para nutro; as coisas que ele v e toca mudam mediia que se locomove, e as relaes espaciais en tre os componentes de seu ambiente so uma sarte fundamental do que ele aprende (Gallistel, 1990). Um experimento realizado por Held e Hein '1963) ilustra tais relaes entre o comportamen to e as conseqncias sensoriais. Pares de gati lhos foram criados no escuro; suas primeiras ex perincias com estimulao visual ocorreram no iparelho mostrado na Figura 5.13. Ambos os ga tos recebiam o mesmo tipo de estimulao vi sual; cada um usava um anteparo que os impe lia de ver o prprio p e corpo; o grande cilin dro central impedia-os de ver um ao outro e am30S viam o mesmo padro de listras verticais nretas e brancas que cobriam uniformemente as saredes da cmara circular em que estavam. Os

gatos estavam atrelados a uma espcie de car rossel em miniatura, mas um deles se movia ati vamente (A), enquanto o outro era transportado passivamente (P). O gato ativo apoiava-se no piso da cmara, enquanto o passivo era coloca do dentro de uma caixa suspensa a uma pequena distncia do piso. Enquanto o gato ativo andava em volta do cilindro central, o gato passivo den tro do transportador percorria uma distncia cor respondente no outro lado. Se o gato ativo fizes se meia volta, em vez de continuar na mesma direo, um sistema de polias fazia o transporta dor virar-se, de modo que o gato passivo tam bm voltava-se para a nova direo. Ambos os gatos eram expostos a estimulos visuais semelhantes, mas os estmulos para o gato ativo eram uma conseqncia de seu prprio comportamento, enquanto que os do gato passi vo no o eram; eles dependiam dos movimentos do gato ativo e no dos seus prprios movimen tos. Os dois gatos foram, ento, submetidos a testes padro de coordenao visuomotora, tais como a colocao da pata com auxlio da viso (gatos normais estendem suas patas em direo borda de uma mesa ou de outras superfcies

FIGURA 5.13 Um aparelho para estudar a relao entre o comportamento e a estimulao visual. Tanto o gato ativo (A) como o passivo (P) eram atrelados a um sistema de polias, sustentado na coluna central. O gato A apoiase no piso, enquanto que o gato P fica suspenso em um carrinho. A medida que o gato A se locomove, o sistema de polias replica suas mudanas de posio para o gato P (ver setas). (Held & Hein, 1963, Figura 1)
A p re n d iz a g e m

105

horizontais quando suspensos no ar a uma pe quena distncia das mesmas). Embora a exposi o de ambos os gatos aos estmulos visuais te nha sido eqivalente, apenas o gato ativo res pondeu apropriadamente queles testes; o gato passivo tomou-se capaz de responder apropriada mente mais tarde, depois de ter tido oportunidade de andar livremente em uma sala iluminada. Este experimento tem muito em comum com o clssico experimento de Stratton (1897), que, por oito dias, usou prismas que invertiam e re vertiam seus campos visuais. De incio, seu mun do parecia de cabea para baixo e de trs-paraa-frente e os seus movimentos no eram coorde nados com o meio ambiente. Por exemplo, ao andar, ele olhava para o cho para ver onde pi sava, mas, por causa da inverso produzida pe los prismas, descobriu que estava olhando para o teto e no para o cho. Da mesma forma, tinha dificuldades em apontar para os objetos ou al can-los, porque as coisas vistas antes abaixo do nvel do olhar eram agora vistas acima, e as coisas direita eram agora vistas esquerda e vice-versa. Com o passar do tempo, contudo, a coordenao melhorou, e Stratton relatou que o mundo no mais lhe parecia assim to de cabea para baixo. As conseqncias do comportamento so novamente cmciais. Olhar e mover-se no cam po visual tm conseqncias diferentes com e sem o uso de prismas inversores, e o ajustamen to aos prismas requer que as novas conseqn cias sejam aprendidas. Por exemplo, ver o cho, quando se anda, importante. Mas, quando se comea a usar os prismas inversores, ver o cho, que era uma conseqncia de olhar para baixo, toma-se uma conseqncia de olhar para cima (nessa situao, naturalmente, para cima ou para baixo podem ser definidos quer em relao ao campo visual, quer em relao ao corpo; cf. Har ris, 1965). Assim, se ver o cho reforador para quem est andando e se algum anda enquanto est usando prismas inversores, ver o cho re forar a resposta de olhar para cima em vez da de olhar para baixo. Com a discusso da viso invertida de Strat ton, fomos da locomoo do organismo no am biente at respostas de magnitude menor como os movimentos do olho. Mesmo as respostas de

pequena escala podem ter profundas conseqn cias. Se notamos algo enquanto olhamos com o canto do olho, a probabilidade de v-lo clara mente maior se olharmos em direo a ele do que se olharmos para longe dele (exceto sob ilu minao insuficiente, quando vemos um objeto mais claramente se olharmos no diretamente para ele, mas sim levemente ao lado dele). Su ponhamos, ento que, em relao a um campo visual uniforme, ver um contorno tal como a bor da de um objeto pode reforar o movimento do olho. Deveramos esperar que os movimentos de olho se tomassem coordenados com o campo vi sual. Os dados disponveis acerca de movimen tos do olho de crianas recm-nascidas so con sistentes com essa noo. Por exemplo, quando as crianas so expostas a uma figura simples tal como um tringulo em um campo visual uni forme, elas tendem a fixar-se mais demorada e mais precisamente nos contornos e vrtices do tringulo medida que a experincia visual pro gride (p. ex., Salapatek & Kessen, 1966). Temos muito a aprender sobre quo arbitr rias podem ser tais relaes entre as respostas e as conseqncias (cf. Hein e col., 1979). Por exemplo, suponhamos que um sistema ptico pu desse projetar estmulos visuais no campo de viso de uma criana e alterar as conseqncias naturais dos movimentos dos seus olhos. O sis tema apresenta estmulos apenas quando a crian a olha adiante, em linha reta. Um estmulo apa rece no campo visual direito. Se a criana olha direita, o estmulo desaparece. Mas se ela olha esquerda, o estmulo se desloca para a esquerda, para onde a criana est olhando agora (e viceversa para estmulos no campo visual esquerdo). Em outras palavras, esse sistema ptico criaria um mundo em que a criana poderia fixar um objeto apenas ao olhar para longe dele (cf. Schroeder & Holland, 1968). A criana provavelmente aprenderia como olhar para as coisas nesse experimento, mas ns deveramos pensar duas vezes antes de realizlo. As reas visuais do crebro tm seu desen volvimento crtico na infncia, tanto em huma nos quanto em gatos (p. ex., Blakemore & Coo per, 1970; Freeman, Mitchell, &Millidot, 1972). Algumas mudanas iniciais podem ser modifi cadas mais tarde, mas outras podem ser relativa

106

A . C h a r le s C a ta n ia

mente permanentes. Por exemplo, uma criana com problemas precoces na viso binocular pode nunca adquirir uma percepo apropriada de pro fundidade, se os problemas no forem corrigi dos antes da idade adulta. Algumas coisas so mais facilmente aprendidas do que outras, em geral ou em alguns momentos particulares, e al gumas coisas aprendidas so mais facilmente alteradas do que outras. Por um lado, podemos relutar em usar o reforo como explicao para o comportamento que aprendido muito cedo e que relativamente permanente; por outro, deve se tomar cuidado em no o descartar quando a manuteno do comportamento poderia depen der da permanncia, ao longo de toda a vida do indivduo, das contingncias que originalmente criaram o comportamento. As contingncias e as conseqncias so parte da descrio do que aprendemos, mesmo com respeito a nossas inte raes mais simples com eventos do mundo. Comeamos este captulo com uma breve histria da Lei do Efeito: caixas-problema, labi rintos, pistas e cmaras operantes. Desses apa relhos e mtodos emergiu o princpio do reforo como um termo descritivo apropriado quando o

responder aumenta por causa de suas conseqn cias. A extino demonstra que o reforo tem efeitos temporrios, mas outros efeitos acompa nham a extino e podem ser superpostos ao decrscimo no responder que ela produz. A ex tino complicada, porque envolve suspender tanto a contingncia quanto as apresentaes do estmulo. As contribuies de contingncias e de apresentaes de estmulo para o comporta mento podem ser isoladas umas das outras, com parando os procedimentos de reforo, extino e superstio. A relao de reforo relativa. Um estmulo que propicia uma oportunidade para a emisso de uma resposta pode reforar uma outra resposta menos provvel e, assim, as rela es de reforo podem ser revertidas alterandose as probabilidades de respostas por meio de operaes estabelecedoras como a privao. Fe nmenos como a aprendizagem latente e a apren dizagem sensrio-motora demonstram que o re foro no uma explicao de aprendizagem; antes, faz parte da descrio do que aprendido. Os organismos aprendem as conseqncias de seu prprio comportamento.

A p re n d iz a g e m

107

As Conseqncias do Responder: Controle Aversivo

A. Punio Comparando Reforo e Punio A Relatividade da Punio Efeitos Colaterais da Punio Efeitos Eliciadores dos Estmulos Punitivos Efeitos Discriminativos dos Estmulos Punitivos B. Reforo Negativo: Fuga e Esquiva Fuga Responder Eliciado e Fuga A 'Ambigidade da Distino entre Reforo Positivo e Reforo Negativo Esquiva Reaes de Defesa Especficas da Espcie A Natureza do Reforador na Esquiva Extino Punio Positiva e Punio Negativa A Linguagem do Controle Aversivo A Etica do Controle Aversivo As palavras punio e reforo tm histrias bastante claras. Punio vem do latim poena, pain (sofrimen to) ou penalty (pena ou castigo), e reforo vem do latim fortis, strong (forte), que est relacionado a ter mos estruturais como fort (fortaleza) e burg (cidade). A palavra fuga, como ex-, out o f( fora de), mais cappa, cape (capa), parece ser derivada do francs nrdico antigo escaper, tirar a capa de algum, ou, por extenso, libertar-se de restrio. A palavra es quiva compartilha um sentido de sair de, como em tomar vazio, com outros termos com que tem pa rentesco: vacant (livre), evacuate (esvaziar), vanish (desaparecer), waste (desgastar). A palavra aversivo derivada do latim a, away (fora), mais vertere, to tum (voltar-se). Vertere tem um parentesco Germnico, com o sufixo -ward ou wards, que tm tido significados de warding off, guardar ou considerar; o sufixo aparece em recom pensa (reward), uma palavra freqentemente trata da erroneamente como um substituto para reforo.

At aqui, enfatizamos uma relao, o refor o, em que as conseqncias do responder tor nam o responder mais provvel. Existe uma ou tra relao, a punio, em que as conseqncias do responder tomam o responder menos prov vel. Alm disso, um estmulo que refora uma resposta, quando produzido por ela, pode ter uma funo diferente quando removido por uma resposta: sua remoo pode punir o respon der. Inversamente, um estmulo que pune a res posta que o produz pode reforar a resposta que o elimina. Por exemplo, o dinheiro pode refor ar, como quando uma criana paga por con cluir uma tarefa, no entanto, sua remoo pode punir, quando a mesada dessa criana cancela da por um comportamento inadequado. Da mes ma forma, uma queimadura dolorosa pode pu nir, quando, por exemplo, se aprende a no tocar em uma forma de bolo recm-sada do forno quente, mas sua remoo ou preveno pode reforar, quando se aprende a tratar uma quei madura com medicao apropriada ou a colo car uma luva de cozinha antes de manusear objetos no fogo. Com exceo do reforo positivo (reforo pela apresentao de um estmulo: cf. Captulo 5), essas relaes so freqentemente agrupadas como casos de controle aversivo. Em outras pa lavras, o controle aversivo inclui tanto a puni o como o reforo negativo (reforo pela re moo ou preveno de estmulos aversivos). Este captulo trata, primeiramente, da punio e, em seguida, do reforo negativo, em procedi mentos de fuga e esquiva.

Seo A

Punio

Enquanto operao, a punio consiste em programar, para o responder, uma conseqncia que o toma menos provvel. O estmulo progra mado como conseqncia chamado punidor (estmulo punitivo ). Por exemplo, se o compor tamento de presso barra de um rato produz um choque eltrico, o pressionar a barra consi derado punido e o choque considerado o puni dor, porque essa operao reduz o pressionar a barra. Neste sentido, a terminologia de punio segue paralela de reforo (cf. Tabela 4.1). Da mesma forma que o reforo, o termo pu nio empregado com referncia a operaes e processos. Assim, afirmar que uma resposta foi punida pode significar que a resposta produ ziu um estmulo punitivo ou que houve um de crscimo no responder devido produo de um punidor. Assim como no reforo, mais indica do restringir o termo punio terminologia de operaes e descrever diretamente o processo em termos de alteraes no responder. Contudo, assim como no reforo, a utilizao de pro cesso tem tantos precedentes que no pode ser evitada. A terminologia do reforo e da punio pa ralela tambm no que diz respeito ao seu objeto: as respostas, no os organismos, so punidas. Se as presses barra por um rato produzem cho que e diminuem de freqncia, apropriado di zer que o choque foi aplicado ao rato e que a presso barra foi punida; no apropriado di zer que o rato foi punido, embora isso contrarie o uso coloquial. Assim como no reforo, esta dis tino gramatical nos encoraja a sermos preci sos quando observamos e descrevemos o com portamento. Uma razo para uma distino to dramtica em relao ao uso cotidiano que neste o interesse, freqentemente, est voltado para a retribuio e no para as alteraes comportamentais. Considere, por exemplo, uma criana fazen do travessuras. Um dos pais chama a criana e, quando ela vem, recebe uma surra. Dizer sim plesmente que o pai puniu a criana pode ser conveniente, no entanto, esse uso do termo tor na fcil a omisso das respostas que poderiam ser afetadas. A conseqncia imediata das tra

vessuras foi o chamado de seu pai; a surra ocor reu depois que a criana obedeceu ao chamado. Embora a criana possa vir a se envolver em menos travessuras no futuro, devido surra, esta pode tambm diminuir a probabilidade de que, na prxima vez, a criana atenda ao chamado do pai. (Mas seria inapropriado recomendar que o pai v at a criana ministrar a surra, em vez de cham-la para que a criana v at ele; muitas alternativas melhores, como o reforo de respos tas incompatveis com o comportamento traves so, dispensam a surra.) A questo no meramente gramatical. Po demos ver melhor o que est acontecendo se explicitarmos a resposta punida (a surra puniu a aproximao da criana em relao ao pai) do que se fizermos uma descrio menos precisa (a surra puniu a criana). Ao enfatizar a terminolo gia de reforar e punir respostas, no precisa mos pr-julgar como essas operaes afetam o comportamento; partiremos da suposio de que essas operaes freqentemente afetaro outras respostas alm daquelas para as quais foram pro gramadas (p. ex., uma surra pode eliciar o cho ro). Uma terminologia que explicite sem ambi gidades as conseqncias do comportamento ajuda a descrever tais efeitos. COMPARANDO REFORO E PUNIO O efeito da punio simplesmente o oposto do efeito do reforo. A relao entre os dois pro cessos ilustrada na Figura 6.1, que apresenta dados hipotticos de reforo e de punio. O gr fico superior apresenta mudanas no responder barra por um rato, durante o reforo com co mida e, posteriormente, durante a extino. Du rante a linha de base, quando pressionar a barra no produz conseqncias, o responder ocorre com pouca freqncia. Quando o reforo ini ciado, o responder aumenta durante as primei ras sesses e depois permanece relativamente estvel. A extino, ento, gradualmente reduz o responder ao nvel da linha de base inicial. O grfico inferior da Figura 6.1 apresenta as mudanas nas presses barra pelo rato durante e aps a punio das respostas com choque el trico. Uma vez que a punio reduz o responder,
A p re n d iz a g e m

109

FIGURA 6.1 Efeitos do reforo e da punio sobre a presso barra hipottica por um rato privado de alimento. O grfico superior apresenta as respostas de presso barra na ausncia do reforo (linha de base), o aumento quando as presses barra produzem alimento (reforo) e o retomo a nveis anteriores quando o reforo inter rompido (extino). O grfico inferior mostra o responder mantido pelo reforo (linha de base), seu declnio quando o choque eltrico, produzido pela resposta, superposto a este desempenho (punio), e o retomo aos nveis anteriores elevados quando a punio interrompida (recuperao). O comportamento de pressionar man tido pelo reforo a linha de base sobre a qual os efeitos da punio esto ilustrados no grfico inferior, porque o decrscimo do responder no pode facilmente ser visto quando o responder est com freqncia baixa.

a freqncia inicial de respostas deve ser maior do que zero, do contrrio, nenhum declnio seria observado. Neste exemplo, o responder j man tido pelo reforo alimentar que permanece ao longo de todas as sesses; assim os efeitos da punio podem ser avaliados por meio da super posio da punio sobre esta linha de base. A linha de base mostra o responder mantido, antes da resposta de pressionar a barra ser punida. Quando a punio iniciada, as presses barra diminuem at um nvel baixo e constante. Na re cuperao, a punio interrompida e o respon der, gradualmente, retoma ao nvel anterior da linha de base. O reforo e a punio so simtricos: o pri meiro aumenta o responder, enquanto a ltima diminui, mas seus efeitos continuam enquanto

os procedimentos so mantidos e desaparecem depois que eles so interrompidos (o responder retoma aos nveis prvios introduo da ope rao de reforo ou de punio). Efeitos reais (e no-hipotticos) da punio so descritos na Fi gura 6.2 (Estes, 1944). Os efeitos ilustrados na Figura 6.2 so cla ros. Todavia, a efetividade da punio tem sido classicamente objeto de controvrsias. A puni o foi incorporada nas primeiras verses da Lei do Efeito de Thomdike (cf. Captulo 5). Thomdike afirmava, ento, que o comportamento po dia ser apagado (stamped out), por estados de coisas desagradveis, e fixado (stamped iri) por estados gratificantes. As formulaes da lei do efeito de Thomdike, que incluam o componen te de punio, foram chamadas de Lei do Efeito

110

A . C h a r le s C a ta n ia

FIGURA 6.2 Registro cumulativo do efeito de punio superposto a uma linha de base de reforo com comida, mantida ao longo da sesses. A resposta era a presso barra por um rato e o estmulo punitivo era choque. A taxa de presses diminuiu durante a punio e fo i recu perada aps a retirada da punio. (Estes, 1944, Figu ra 10.)

Forte. Mais tarde, Thorndike retirou o compo nente de punio; a verso que permaneceu in clua apenas a fixao do comportamento e foi chamada de Lei do Efeito Fraca. Thorndike ba seou suas concluses em experimentos de apren dizagem verbal humana, nos quais dizer certo para o aprendiz aumentava o responder, enquanto que dizer errado tinha menos efeito do que no dizer nada. Thorndike aceitou essa descoberta como uma evidncia geral contra a efetividade da punio. A concluso de Thorndike teve tal impacto que, mesmo os dados da Figura 6.2 foram inter pretados como significando que a punio era um procedimento ineficaz. Com base na recupe rao do responder, aps a interrupo da puni o, o argumento era que a punio no deveria ser tomada seriamente como uma tcnica para o manejo de comportamento, uma vez que ela po dia suprimi-lo apenas temporariamente. Contu do, com base nesse critrio, o reforo tambm deveria ser considerado ineficaz. Por algum mo tivo, os critrios empregados para avaliar a efe tividade da punio foram diferentes daqueles empregados para avaliar a efetividade do refor o. Muito embora o responder fosse reduzido du rante a punio, os investigadores tenderam a no

notar a reduo e notaram apenas a recuperao do responder depois que a punio era interrom pida. O que se segue fornecer boas razes para concluir que outras tcnicas, que no a punio, deveriam ser seriamente consideradas, sempre que possvel. Mas, se essa concluso est corre ta, isto ser apenas porque Thorndike e seus su cessores estavam certos por razes erradas. Mais recentemente os investigadores tm-se voltado novamente para a punio e estudado as condies que modificam sua efetividade em suprimir o comportamento (p. ex., Azrin & Holz, 1966; Church, 1963). Por exemplo, experimen tos com choque eltrico como estmulo punitivo para respostas de bicar o disco, que vinham sen do reforadas com alimento, em pombos, mos traram que quanto mais intenso e imediato o es tmulo punitivo tanto mais eficaz ele ser. Um estmulo punitivo, introduzido com sua intensi dade mxima, suprime o responder mais efeti vamente do que um introduzido com intensida de baixa, que aumenta gradualmente at a inten sidade mxima. Alm disso, a efetividade do es tmulo punitivo pode mudar ao longo de exten sos perodos de punio, quando, por exemplo, um estmulo punitivo de intensidade baixa se toma, gradualmente, ineficaz aps muitas apresen taes (cf. Azrin & Holz, 1966, pp. 426-427). E, como ocorre com a extino, mais fcil reduzir a probabilidade de uma resposta quando alguma ou tra resposta que produz o mesmo reforador est disponvel do que quando no h respostas alter nativas que produzam o mesmo reforador. Experimentos sobre as propriedades da pu nio no apenas mudaram os critrios para se avaliar a efetividade da punio; eles tambm levantaram dvidas se a punio tinha sido jul gada adequadamente, de acordo com os crit rios antigos. Ocasionalmente, um nico estmu lo punitivo ou alguns, se suficientemente inten sos e se aplicados como conseqncia de uma resposta fracamente mantida, podiam fazer a res posta desaparecer at mesmo pelo resto da vida do organismo. Tais efeitos excepcionais podem bem ser considerados como permanentes, mas por que deveramos ficar surpresos se a recupe rao, s vezes, fosse to lenta que ultrapassasse o tempo de vida do organismo? Consideremos um argumento anlogo para o reforo. Se algum

p r e n d iz a g e m

111

comprasse um bilhete de loteria e ganhasse um prmio de dez mil dlares, no nos surpreende ramos se descobrssemos que a compra ocasio nal de bilhetes de loteria continuasse ao longo de toda a vida da pessoa, muito embora este com portamento jamais viesse a ser reforado nova mente. No rejeitaramos a existncia da extin o com base nisso; portanto, no deveramos rejeitar a recuperao aps a punio por causa de casos episdicos de seus efeitos duradouros. Algumas caractersticas incidentais da puni o, provavelmente, contriburam para que ela fosse tratada de modo to diferente. Uma redu o no responder pode ser estudada apenas se algum responder j existir. Uma resposta que jamais emitida no pode ser punida. Assim, experimentos em punio, freqentemente, su perpem a punio ao responder mantido por re foro. Mas os efeitos da punio podem, ento, depender do que mantm o responder. Por exem plo, se presses barra so punidas com choque eltrico, o pressionar a barra reforado com ali mento diminuir menos se um rato estiver seve ramente privado de alimento do que se ele esti ver apenas moderadamente privado. Outra dificuldade que os estmulos puniti vos tendem a ter outros efeitos que ocorrem in dependentemente de eles serem ou no produzi dos pelas respostas. Como no caso do reforo, o efeito da punio deve depender da relao en tre as respostas e os estmulos punitivos (con tingncia) e no simplesmente da aplicao cle punidores. Por exemplo, o choque eltrico pode diminuir a taxa com que um pombo bica um dis co, mesmo que os choques sejam administrados independentemente do bicar o disco. Assim, antes de trat-los como estmulos punitivos, necess rio demonstrar que os choques tm efeito maior quando produzidos pelo bicar do que quando ocor rem independentemente do bicar (cf. Azrin, 1956). Os preconceitos contra o reconhecimento da punio foram to fortes que os procedimentos efetivos foram at mesmo chamados por um nome diferente, esquiva passiva. Por exemplo, consideremos um rato que esteja numa platafor ma, acima de uma grade eletrificada. Ao pisar na grade, o rato recebe o choque e toma-se me nos propenso, no futuro, a descer. apropriado dizer que ao descer da plataforma punido pelo

choque, mas tambm possvel dizer que o or ganismo est passivamente se esquivando do es tmulo punitivo, evitando descer da mesma. Tal uso do termo possibilitou que os procedimentos efetivos de punio fossem discutidos no voca bulrio de esquiva passiva, enquanto outros pro cedimentos que no reduziam o responder fo ram usados para defender a noo de que a pu nio era ineficaz. O termo punio se aplica relao entre o responder e a conseqncia. A questo , princi palmente, saber quando a aplicao do termo apropriada. Desde cedo, em sua evoluo, a an lise da punio enfatizou a transitoriedade de seus efeitos. Por essa razo, a punio permane ceu por longo tempo no reconhecida como uma operao comportamental fundamental. Mas a existncia de conseqncias que reduzam o res ponder j no questionada. A punio para lela ao reforo, exceto pelo fato de que os efei tos diferem quanto ao sinal: o reforo aumenta o responder reforado, e a punio reduz o respon der punido. Ambas as operaes tm efeitos tem porrios; quando so interrompidas, o responder retoma aos nveis prvios. Uma vez que a puni o pode modificar o comportamento humano, surgiro, invariavelmente, questes acerca da tica de sua aplicao. Mas no provvel que tais questes sejam resolvidas sem que seja feita uma anlise adequada de suas propriedades.

A RELATIVIDADE DA PUNIO Em experimentos sobre punio, os estmu los punitivos so escolhidos, freqentemente, por seu efeito fidedigno sobre uma variedade de res postas, porque tais estmulos revelam mais cla ramente os efeitos da punio. Um desses even tos o choque eltrico, que pode ser medido pre cisamente e que pode ser apresentado em intensidades efetivas, sem danificar o tecido orgni co. Tais estmulos, contudo, so apenas casos extremos de punidores. Por exemplo, como vi mos anteriormente, crianas com o desenvolvi mento cronicamente comprometido, apresentam comportamentos de bater a cabea, morder as mos e outros comportamentos autolesivos. Uma breve esguichada no rosto com um tipo de spray

112

A. C h a r le s C a ta n ia

utilizado para umedecer plantas em ambientes fechados , na pior das hipteses, um pequeno aborrecimento. No entanto, quando aplicado contingentemente a tais comportamentos, um punidor efetivo (Dorsey e col., 1980). Assim sendo, o estmulo relativamente inofensivo, especialmente se comparado aos srios danos que essas crianas podem exercer sobre si mesmas (porm, quem se ope a qualquer uso de puni o considera essa aplicao inaceitvel). A punio inevitvel, pois est embutida em muitas contingncias naturais. Uma criana que provoca um cachorro que est latindo pode ser mordida, e uma criana que brinca com fogo pode se queimar. Alm disso, mesmo os estmu los que geralmente servem como reforadores podem, sob certas condies, tomarem-se punidores. Por exemplo, a comida, que reforadora no incio de uma festa, pode se tomar aversiva ao final da refeio. Por outro lado, eventos que superficialmente parecem aversivos, como des pencar de lugares altos, podem ser reforadores sob certas circunstncias (consideremos o saltar de pra-quedas e andar na montanha-rassa). Da mesma forma que os reforadores, os punidores no podem ser definidos em termos absolutos, nem especificados em termos de propriedades fsicas em comum. Eles devem ser avaliados com base na relao entre as respostas punidas e as respostas ocasionadas pelo estmulo punitivo. O princpio de reforo de Premack (Captulo 5) afirmava que uma oportunidade de executar respostas mais provveis reforaria as respostas menos provveis. Essa anlise foi tambm es tendida punio (Premack, 1971). Retornemos ao equipamento que pode controlar as oportuni dades de um rato correr em uma roda de ativida de ou beber em um tubo de lquido. O equipa mento foi modificado por um motor que pode travar a roda de atividade numa posio, impe dindo o rato de correr, ou gir-la a uma veloci dade fixa, forando o rato a correr. Nesse aparato, o ato de privar um rato da oportunidade de correr, enquanto ele tem acesso livre gua, toma o correr mais provvel que o beber, e priv-lo de gua, enquanto ele tem opor tunidade de correr, toma o beber mais provvel que o correr (cf. as probabilidades relativas de correr e beber nas duas partes da Figura 5.10).

Pode-se, ento, tornar o girar da roda uma con seqncia do beber: cada vez que o rato bebe, a roda comea a girar, e o rato forado a correr. Quando o correr mais provvel que o beber, esta operao aumenta o beber, e apropriado dizer que o beber reforado pelo correr. Mas, quando o correr menos provvel que o beber, esta operao tem um efeito oposto: agora o be ber diminui quando o correr a sua conseqn cia, e apropriado dizer que o beber punido pelo correr. Se suas probabilidades relativas po dem ser revertidas, como ilustradas neste exem plo, qualquer resposta em particular pode ser re forada ou punida por qualquer outra resposta. Os estmulos e as respostas em experimen tos tpicos de reforo e punio tm sido esco lhidos de modo a fazer com que esses procedi mentos funcionem (p. ex., com ratos privados de comida, comer muito mais provvel do que pressionar a barra). Eles obscurecem, assim, a reversibilidade potencial das conseqncias como reforadoras e punitivas. O responder pode ser aumentado ou reduzido pela mudana de suas conseqncias, e esses efeitos so determinados pelas propriedades comportamentais, e no pe las propriedades fsicas, das conseqncias.

EFEITOS COLATERAIS DA PUNIO Da mesma forma que os reforadores, os es tmulos punitivos podem ter efeitos independen tes de sua relao de contingncia com as res postas. Se um organismo recebe um choque, uma queimadura ou uma beliscada, algumas de suas respostas podem ter pouco a ver com o fato de esses eventos terem sido ou no produzidos pelo prprio comportamento desse organismo. Sur gem dificuldades para analisar a punio por que tais efeitos devem ser distinguidos daqueles que dependem da relao entre as respostas e suas conseqncias. Alguns efeitos do choque podem ser primariamente fisiolgicos, por exem plo, quando choques sucessivos reduzem, siste maticamente, a resistncia da pele de um rato. Dependendo da natureza da fonte do choque, a efetividade dos choques subseqentes pode, en to, variar com a resistncia do rato. Outros efei tos so primariamente comportamentais, como

A p re n d iz a g e m

113

quando o aparato possibilita a ocorrncia de res postas por meio das quais o organismo pode re duzir seu contato com a fonte de choque (p. ex., o plo um isolante, e os ratos, s vezes, conse guem minimizar os efeitos do choque, pressio nando a barra enquanto se deitam de costas; Azrin & Holz, 1966). Em qualquer caso, tais efeitos co laterais devem ser levados em considerao.

Efeitos Eliciadores dos Estmulos Punitivos A Figura 6.3 foi extrada de um experimento (Camp, Raymond & Church, 1967) que compa rou os efeitos de choques produzidos pelas res postas e de choques independentes de respostas. As presses barra foram mantidas por reforo alimentar em trs grupos de ratos. Medido em relao a um grupo de controle que no recebeu choque, o responder dos dois grupos expostos a choque diminuiu, mas o choque produzido pela resposta suprimiu o responder mais do que o cho que independente da resposta (ver tambm Chur ch, 1969). Com base nessa diferena, parece

Sesses

FIGURA 6-3. Efeitos de choques independentes das respostas e de choques produzidos pelas respostas sobre presses barra mantidas por reforo alimentar em ratos. A taxa de choques no grupo que recebeu choques independen tes das respostas fo i emparelhada com a do grupo que recebe choques produzidos pelas respostas, mas estes reduziram mais o responder do que os cho ques independentes das resposta. (Camp, Raymond, & Church, 1967, Figura 5.)

apropriado afirmar que o choque produzido pela resposta era um estmulo punitivo. Os eventos afetam mais o comportamento quando, em tro ca, o comportamento pode afetar esses eventos (Rachlin, 1967, p. 87). Do mesmo modo que de vemos distinguir entre os efeitos das aplicaes do reforador e os efeitos da relao contingen te entre as respostas e os reforadores, assim tam bm devemos distinguir os efeitos das aplica es do estmulo punitivo daqueles efeitos da relao contingente entre as respostas e os est mulos punitivos. A punio de duas classes de comportamen to tpicas de uma espcie de ratos do deserto (Mongolian gerbil) representa um outro exem plo (Walters & Glazer, 1971; ver tambm Shettleworth, 1978). O ato de escavar na areia, que parte do comportamento de construo de sua toca, consiste em cavar a areia e chut-la para trs; postar-se alerta, uma reao defensiva oca sionada por estmulos sbitos ou aversivos, con siste em postar-se ereto nas patas traseiras com as orelhas levantadas. Aplicar o choque na cai xa de areia em que o experimento foi conduzido era difcil, ento um som foi estabelecido como estmulo aversivo, emparelhando-o repetidamen te com o choque em uma situao diferente. Quando contingente ao escavar, o som funcio nou como um estmulo punitivo eficaz. O esca var diminuiu quando produzia o som e aumen tou novamente aps a suspenso da contingn cia; enquanto o escavar diminuiu, postar-se em alerta, aumentou. No entanto o som contingente ao postar-se em alerta no foi efetivo. Postar-se em alerta aumentou e no voltou aos nveis pr vios durante vrias sesses depois que a contin gncia foi interrompida; neste caso, no houve mudanas apreciveis no escavar. O efeito eliciador do som sobre a postura de alerta foi mais poderoso que seus efeitos punitivos. Assim, na punio como no reforo, importante reconhe cer os efeitos separados das contingncias resposta-estmulo e das apresentaes de estmulos. Como outro exemplo, consideremos um ma caco em uma cadeira de restrio, com eletro dos de choque ajustados em sua cauda, (p. ex., Morse & Kelleher, 1977, pp. 193-198). A inter valos de 5 minutos, uma presso barra pelo macaco produz um choque em sua prpria cau-

114

A . C h a r le s C a ta n ia

da. Logo aps a colocao do macaco na cadei ra, ele comea a pressionar a barra. Finalmente, 5 minutos se passam e a prxima presso pro duz um choque (essa programao denomina da de esquema de intervalo fixo 5min; ver Cap tulo 10). O macaco salta e guincha brevemente e, durante certo tempo, deixa de pressionar a bar ra. Mas logo ele recomea a pressionar, respon dendo cada vez mais rapidamente, at que ele prprio ocasione o choque ao final do prximo intervalo de 5 minutos. Esse desempenho se re pete ao longo de sesses dirias. Quando o cho que suspenso, as presses barra praticamen te cessam; quando o choque reintroduzido, o pressionar retorna. Se o nvel de choque au mentado, o pressionar a barra aumenta; se o n vel de choque diminudo, ele diminui. Os cho ques dependem inteiramente do comportamento do macaco; ele no os receberia se no pressio nasse a barra. Por que o macaco simplesmente no pra de pressionar? O paradoxo que o mesmo choque que man tm o responder, quando produzido pelo pressi onar de acordo com o esquema de intervalo-fixo 5min, suprime o responder quando produzido por cada presso barra; o mesmo choque tam bm pode ser empregado para iniciar e manter comportamentos de fuga e esquiva (p. ex., Bar rett & Stanley, 1980). Ento, como podemos decidir se a terminologia da punio apropria da? Se cada presso barra produz um choque, podemos chamar o choque de estmulo puniti vo, porque ele reduz o responder. Mas quando as presses barra produzem choques apenas a intervalos de 5 minutos, deveramos chamar o choque de reforador, porque ele gera mais res postas? (De nada adianta ceder tentao de cha mar o macaco de masoquista. Masoquismo sim plesmente um nome que usamos quando um es tmulo, o qual acreditamos que deveria ser um punidor funciona como reforador; o termo no explanatrio). Outro experimento mostrou que um esque ma em que as presses barra produzem um choque a cada dois minutos, geralmente man tm taxas de pressionar mais altas do que as pro duzidas por um esquema em que as respostas produzem um choque a cada seis minutos; quan do os macacos tinham oportunidade de escolher

entre os dois esquemas, eles alternavam para o esquema com um intervalo mais longo entre os choques (Pitts & Malagodi, 1991). Em outras pa lavras, dentre os choques mais e menos freqen tes, os macacos preferiram aplicar em si mes mos os menos freqentes. Talvez nos lembre mos da efetividade da restrio fsica como re forador com algumas crianas que se engajam em comportamentos autolesivos (Captulo 5); elas preferem a situao com restrio, em que no podem machucar a si mesmas, s situaes sem restrio, em que elas poderiam se machu car (e machucam-se). Se o comportamento humano inclui proble mas como comportamentos autolesivos, nossa preocupao com tal fenmeno justificada. Temos visto que, s vezes, mais apropriado comparar o choque produzido pela resposta com o choque independente da resposta do que com uma situao sem choques. O choque eltrico elicia respostas manipulativas, como pressionar a barra, nos macacos. Esses efeitos eliciadores do choque podem ser fortes o suficiente para anu lar seus efeitos punitivos, de modo que o pressio nar a barra ocorre a despeito, e no por causa, da contingncia punitiva. Nesse sentido, o caso pode ser anlogo quele em que o pai tenta fazer uma criana parar de chorar punindo o choro e tem pro blemas, visto que o estmulo punitivo elicia a mes ma resposta que ele est tentando suprimir.

Efeitos Discriminativos dos Estmulos Punitivos Um outro efeito colateral da punio pode ocorrer, porque os estmulos punitivos podem adquirir propriedades discriminativas, como quando uma resposta reforada apenas quan do tambm punida. Um experimento planeja do para fazer com que um choque produzido por uma resposta sinalizasse a disponibilidade de comida programou duas condies alternativas (Holz & Azrin, 1961). Em uma delas, as bicadas do pombo no tinham conseqncias; na outra, cada bicada produzia um choque e algumas bi cadas produziam um alimento. O bicar era man tido a uma taxa baixa, quando as respostas no produziam um choque porque, neste caso, tam

A p re n d iz a g e m

115

bm no produziam alimento; mas o bicar au mentou assim que as respostas comearam a pro duzir choques, pois elas apenas ocasionalmente produziam alimento. Amostras dos registros em que o reforo com comida foi completamente sus penso so mostradas, com dois pombos, na Figura 6.4. Na ausncia de choque a taxa de bicadas foi baixa. Quando as respostas comearam a produzir choques, a taxa aumentou. Quando o choque foi suspenso, um breve aumento na taxa (setas) foi seguido por uma reduo aos nveis prvios. Novamente poderamos nos perguntar se os choques poderiam ser chamados de estmulos punitivos. De fato, deveramos concluir, com base na Figura 6.4, que o choque era um reforador. A principal diferena aqui entre o choque e outros reforadores mais familiares que o cho que adquiriu seu poder de reforar por meio de sua relao com o alimento; ele perde seu poder se a relao for interrompida. Talvez esses pro cedimentos sejam relevantes para o comporta mento humano. Por exemplo, uma criana que apanhou pode ter provocado o pai a ponto de ser

Sem Choque

Choque Produzido pela Resposta

Sem Choque

Minutos

FIGURA 6.4 Efeitos discriminativos do choque. Pri meiro, duas condies se alternaram: as bicadas do pombo no produziam nem alimento nem choque, ou as bicadas sempre produziam choque e, ocasionalmente, alimento. Nas sesses mostradas aqui, nenhuma comi da era apresentada. Para ambos os pombos, as taxas de resposta, inicialmente baixas, aumentaram quando comearam a produzir um choque e decresceram aos nveis prvios, quando o choque fo i descontinuado. (Holz & Azrin, 1961, Figura 3.)

surrada, porque a surra geralmente seguida por uma quantidade de ateno do pai arrependido que maior do que a ateno nas interaes menos traumticas entre o pai e a criana. Neste exemplo, a surra anloga ao choque na Figura 6.4 e a ateno do pai, anloga comida. A aten o de um pai pode ser um reforador poderoso e, freqentemente, pode superar os efeitos das conseqncias que, de outra forma, serviriam como estmulos punitivos. Assim, uma anli se comportamental pode ser relevante para problemas humanos como a violncia contra a criana. Vimos que a punio o oposto do reforo; ela definida pelas redues no responder conseqenciado, enquanto o reforo definido pe los aumentos. A terminologia da punio pa ralela quela do reforo: os punidores so est mulos, e a punio uma operao ou processo. Os efeitos da punio geralmente so tempor rios; o responder freqentemente retoma aos n veis prvios da linha de base, depois que a puni o interrompida. Ao estudar a punio, a taxa de respostas em linha de base deve ser alta o su ficiente para tomar a reduo no responder fa cilmente visvel; por essa razo, os experimen tos com a punio normalmente superpem a pu nio a uma linha de base de respostas mantidas pelo reforo. A efetividade dos punidores, as sim como a dos reforadores, determinada pe las probabilidades relativas da resposta punida e das respostas ocasionadas pelo estmulo puniti vo; a punio ocorre quando uma resposta mais provvel fora o organismo a se engajar em uma resposta menos provvel. A punio pode ser complicada pelos efeitos eliciadores ou discri minativos dos estmulos punitivos. A tarefa de uma anlise experimental separar tais efeitos colaterais dos efeitos primrios do estmulo pu nitivo. Esses efeitos ocorrem porque a punio inclui, necessariamente, tanto apresentaes de estmulo quanto uma contingncia entre as res postas e os estmulos; os efeitos das apresenta es do estmulo devem ser separados dos da contingncia. Deixemos agora a punio e voltemos ao re foro. Veremos que h complicadores de dife rentes tipos quando o responder, em vez de ser punido pela apresentao de um estmulo aver-

116

A . C h a r le s C a ta n ia

sivo, reforado pela remoo ou preveno desse estmulo.

contemporneo predominante, resumido a se guir: 1. O reforo faz a resposta reforada aumen tar. 2. A punio faz a resposta punida diminuir. 3. O adjetivo positivo significa que a conse qncia do responder a adio de um es tmulo ao ambiente do organismo. 4. O adjetivo negativo significa que a conse qncia do responder a.subtrao de um estmulo do ambiente do organismo. 5. Os reforadores e punidores so estmulos e a no ausncia de estmulos (supondo que seja possvel fazer uma distino clara). O ltimo item acima seguido por uma res trio entre parnteses porque, s vezes, a dis tino difcil. Por exemplo, ser mais apropria do conceber os efeitos de uma multa de trnsito pela apresentao do formulrio, no qual a mul ta est registrada ou pela perda de dinheiro quan do a multa paga? Do mesmo modo, o que ser mais apropriado: conceber os efeitos de um bom desempenho em uma prova pela apresentao de uma nota alta ou pela esquiva de uma nota bai xa?

Seo B

Reforo Negativo: Fuga e Esquiva

Os organismos podem se livrar dos estmu los, bem como produzi-los. Por exemplo, um rato normalmente no se expe ao choque, e se o cho que vier a ocorrer, o rato fugir dele na primeira oportunidade. Se a apresentao de um estmulo aversivo pune uma resposta, remover ou preve nir tal estmulo deve reforar a resposta. Quan do uma resposta termina ou evita um estmulo aversivo e, assim, toma-se mais provvel, o es tmulo denominado reforador negativo e a operao chamada de reforo negativo. A dis tino entre reforo positivo e reforo negativo depende se uma resposta produz ou remove um estmulo. Mais tarde encontraremos alguns problemas na terminologia do reforo positivo e negativo. A terminologia, no entanto, tem precedentes substanciais. A utilizao padro tem sido a de que positivo e negativo, como modificadores do termo reforo, referem-se conseqncia pro duzida pelo responder (se a resposta acrescenta ou retira algo do ambiente), e que reforador ne gativo refere-se ao estmulo em si mesmo, e no sua remoo (se a remoo do choque refora pressionar a barra, por um rato, o choque, no o perodo sem choque que segue a resposta, o reforador negativo). Essa terminologia foi es tabelecida gradualmente (houve uma poca em que o reforo negativo foi definido, em alguns livros texto, como mencionado acima, mas em outros ele foi definido como equivalente puni o; tais equvocos ainda aparecem ocasional mente: p. ex., Kimble, 1993). Conforme indica do pelas sees de etimologia, no incio de cada um dos captulos deste livro, a linguagem evo lui. Assim, a evoluo da linguagem do reforo pode, eventualmente, tomar a distino entre reforo positivo e negativo de valor marginal (cf. Michael, 1975). No obstante, quando fizermos aso do vocabulrio de reforo positivo, reforo negativo e punio, estaremos adotando o uso

FUGA Os procedimentos de fuga so os exemplos mais simples de reforo negativo: a resposta de um organismo suspende um estmulo aversivo. Os procedimentos de fuga diferem dos procedi mentos de esquiva, nos quais uma resposta evita ou atrasa um estmulo aversivo. Essa terminolo gia consistente com o uso cotidiano: fugimos de circunstncias aversivas presentes, mas nos esquivamos de circunstncias potencialmente aversivas que ainda no ocorreram. Por exem plo, podemos sair de uma festa para fugir de uma companhia que j est ali ou para nos esquivar de algum que estaria para chegar mais tarde. Em situaes institucionais para crianas com atrasos de desenvolvimento, as crianas, s ve zes, comportam-se agressivamente, porque des ta maneira fogem das exigncias simples impos tas sobre elas, como realizar tarefas planejadas

A p re n d iz a g e m

117

para ensin-las, por exemplo, a abotoar e desa botoar as roupas. Para duas dessas crianas, a agresso caiu para nveis prximos de zero, quan do elas podiam fugir das situaes de exigncia engajando-se em outro comportamento que era incompatvel com a agresso (Carr, Newsom, & Binkoff, 1980). Entretanto, tais casos de fuga podem implicar em que as situaes tpicas de exigncia nestes ambientes no fornecem os reforadores suficientes. As condies de fuga podem ser criadas, para um rato, pela construo de um compartimento com um piso de grades eletrificadas. A locomo o de um lugar para outro, como resposta de fuga, em uma pista de corrida eletrificada, ilus trada na Figura 6.5 (Fowler & Trapold, 1962). A velocidade da corrida foi maior quando o cho que era desligado assim que o rato alcanava o fim da pista. Quanto mais longo o atraso entre chegar ao fim da pista e o trmino do choque, tanto mais lento o correr. Esse um dos muitos exemplos dos efeitos quantitativos do reforo. Por exemplo, tanto no caso do reforo positivo como no do reforo negativo, o reforo imedia

to mais eficaz do que o reforo atrasado (par metro de atraso), e os reforadores grandes so mais eficientes que reforadores pequenos (pa rmetros de magnitude ou intensidade; ver pa rmetro no glossrio). A locomoo de um lugar para outro toma as respostas de fuga eficazes, mas as respostas dis cretas como a presso barra so mais fceis de registrar. As presses barra por um rato na pre sena de um choque podem desligar o choque ou, na presena de uma luz muito forte, podem desligar a luz (p. ex., Keller, 1941). Se, em qual quer dos casos, o responder aumenta devido s suas conseqncias, dizemos que a resposta foi reforada. Comparemos, ento, o reforo positi vo e o negativo: na ausncia de alimento, o res ponder que produz alimento aumenta; com a pre sena de choque, o responder que remove o cho que aumenta. O paralelo direto. Contudo, os procedimentos de fuga recebem menos ateno do que os procedimentos mais complexos. A pes quisa em reforo negativo dominada pela es quiva, em que estmulos aversivos so preveni dos ou evitados por respostas que ocorrem em sua ausncia.

Responder Eliciado e Fuga O motivo da relativa negligncia em se pes quisar a fuga que geralmente fcil aumentar a probabilidade de respostas (pressionar a barra, com ratos ou bicar o disco, com pombos) utili zando reforo positivo, mas, s vezes, difcil fazer isso, utilizando o reforo negativo em pro cedimentos de fuga (p. ex., Hoffman & Fleshler, 1959). Essa dificuldade ocorre, ao menos em par te, porque a relao temporal entre as respostas reforadas e as respostas produzidas por um reforador difere, no reforo positivo, daquela pro duzida por reforo negativo. As duas condies so diagramadas na Figura 6.6. No reforo positivo, o reforador est ausen te quando a resposta reforada emitida. Aps a resposta, o reforador apresentado e ocasiona outras respostas. Por exemplo, se a presso barra por um rato a resposta reforada, e o ali mento o reforador, o alimento est ausente enquanto, o rato est pressionando; o comer no

Atraso no Trmino do Choque (Segundos)

FIGURA 6.5 Velocidade relativa da corrida de ratos em funo do atraso na suspenso do choque para res postas de fuga em uma pista de corrida. Quanto mais longo o atraso entre o alcance do fim do corredor e a suspenso do choque, tanto mais lentamente os ratos corriam. Cada ponto baseado nas ltimas 4 de 28 ten tativas de fuga. (De Fowler e Trapold, 1962, Figura 1.)

118

A . C h a r le s C a ta n ia

REFORO POSITIVO: REFORO PELA PRODUO DE COMIDA


Presso Barra

Comida

Roer, etc.

REFORO NEGATIVO: REFORO PELA REMOO DE CHOQUE

Presso Barra

Choque

Pular, etc. Tempo

FIGURA 6.6 Diferentes relaes temporais entre as respostas reforadas e outras respostas produzidas pelo reforador, no reforo positivo (parte superior) e no reforo negativo (parte inferior). No reforo alimentar, as respostas de presso barra reforadas j ocorreram quando a apresentao de alimento produz um comportamento (p. ex., manipular a comida), de modo que essas respostas no competem muito com as de pressionar. Na fuga do choque, as respostas produzidas pelo choque (p. ex., pular) ocorrem ao mesmo tempo em que a resposta reforada de pressionar a barra deve ocorrer, desta forma, tais respostas competem com as de pressionar.

ocorre seno depois da presso barra, quando o alimento apresentado. Pressionar a barra e comer ocorrem em momentos diferentes, no competindo diretamente entre si. No reforo negativo, contudo, o reforador negativo est presente antes que a resposta a ser reforada seja emitida; somente depois da res posta que o estmulo removido. Por exem plo, se a presso barra por um rato a resposta reforada, e o choque o reforador negativo, o choque est presente antes da ocorrncia da pres so barra. O choque produz certas respostas como o saltar eliciado ou algum comportamento que reduza o contato com a fonte de choque. En quanto o choque est presente e produz estas res postas, algumas delas competiro com pressio nar a barra. Uma vez que uma presso barra desligue o choque, as outras respostas diminu em de freqncia e no mais competem com o pressionar. Mas uma vez que o choque esteja ausente, novas respostas de pressionar no po dem ter a conseqncia de deslig-lo.

Da mesma forma, se o reforador negativo for uma luz brilhante, da qual o rato possa fugir ao pressionar a barra, o rato pode reduzir os efei tos da luz fechando os olhos e escondendo a ca bea em um canto da cmara experimental. Qual quer movimento de sair dessa posio pode ser punido pela maior exposio luz e, assim, pequena a probabilidade de que o rato saia do canto e pressione a barra. Fazer com que um rato apresente um comportamento de fuga da luz por meio da presso barra requer procedimentos que reduzam a probabilidade de tais respostas competitivas (Keller, 1941).

A Ambigidade da Distino entre Reforo Positivo e Reforo Negativo Se os estmulos so apresentados ou removi dos, isso pode ser um critrio menos importante na distino entre um reforo positivo e um re foro negativo do que se as respostas geradas

A p re n d iz a g e m

119

pelo reforador ocorrem em momentos em que elas podem competir com a resposta reforada. Um experimento sobre fuga do frio pode servir de ilustrao para isso (Weiss & Laties, 1961). Um rato foi colocado em uma cmara fria, em que as presses barra eram reforadas pela operao de um aquecedor. Por um lado, tal pro cedimento pode ser considerado como reforo positivo: ele implica em adicionar energia ao am biente, sob a forma de calor, quando ocorre uma presso barra. Por outro lado, o frio pode fun cionar como um estmulo, pelos seus efeitos so bre os receptores de temperatura na pele do rato. O frio a ausncia de calor, mas tambm um evento ambiental significativo e potencialmente aversivo. De acordo com essa interpretao, o procedimento deveria ser chamado de reforo ne gativo, pois ligar o aquecedor depois de uma res posta suprime os efeitos do frio. Na fuga do frio, pode-se facilmente argumen tar que o reforo envolve tanto a apresentao quanto a remoo de um estmulo. fcil en contrar ambigidades em outras instncias do reforo. Poderamos dizer, por exemplo, que en quanto reforador, a gua suprime estmulos aversivos gerados pela boca seca, ou que o ali mento suprime estmulos aversivos gerados pela depleo de nutrientes na corrente sangnea (cf. Hull, 1943). Por que, ento, a distino entre re foro positivo e reforo negativo chegou a ad quirir importncia comportamental? Vamos retomar ao exemplo do rato no frio. Antes que as presses barra reforadas ocor ressem, o rato se encolhia em um canto e tremia. Essas respostas reduziam a probabilidade de que ele pressionasse a barra. Quando uma presso barra ocorria, o aquecedor era ligado e as res postas competitivas tomavam-se menos prov veis, mas um rato que no est mais com frio no pode fugir do frio. As respostas que compe tiam com a resposta reforada ocorreram antes, e no depois do reforo, assim este exemplo se parece mais com a fuga do choque do que com a produo de alimento ou gua (cf. Figura 6.6). Portanto, talvez seja mais apropriado considerar que este seja um caso de reforo negativo e no de reforo positivo. Mas no eliminamos completamente a ambi gidade. O reforo sempre envolve uma mudana

no ambiente do organismo e, inevitavelmente, conduz a diferenas no responder antes e aps a mudana. Na melhor das hipteses, podemos considerar tais mudanas que produzem um con tnuo de efeitos, que variam entre aqueles em que outras respostas tm alta probabilidade de preceder e competir com a resposta reforada, at aqueles em que elas no o fazem ou talvez at mesmo contribuam para um aumento da pro babilidade de ocorrncia da resposta reforada.

ESQUIVA Na esquiva, o estmulo aversivo no est pre sente quando a resposta reforada ocorre. As duas principais variantes da esquiva so deno minadas cancelamento e adiamento. O procedi mento de cancelamento anlogo ao matar um pernilongo antes que ele pique voc: ao mat-lo, voc evita permanentemente que aquele perni longo em particular venha a picar algum. O pro cedimento de adiamento anlogo ao colocar fichas em telefones pblicos; neste caso, voc adia a interrupo da ligao enquanto continua a colocar fichas, mas quando pra de colocar as fichas, o tempo da ltima se esgota e a ligao interrompida. Como exemplo de um procedimento de can celamento, imagine um rato colocado em uma cmara com uma barra e um piso de grades, por meio do qual podem ser aplicados choques el tricos breves. Os choques so programados para serem apresentados uma vez por minuto, mas se o rato pressionar a barra antes do prximo cho que, ele omitido. Neste procedimento o rato pode evitar completamente o choque pressionan do a barra pelo menos uma vez por minuto. Os procedimentos de cancelamento so algumas ve zes conduzidos em tentativas discretas. Por exem plo, uma luz acende por um perodo de 30s. Se o rato pressionar a barra durante os 30s, nenhum cho que apresentado ao final da tentativa; ele somen te apresentado se o rato no pressionar a barra. Vamos considerar agora, um exemplo de pro cedimento de adiamento (Sidman, 1953). Dois relgios controlam a apresentao do choque. Qual dos dois relgios est ativado, depende de se o ltimo evento foi um choque ou uma pres

120

A . C h a r le s C a ta n ia

so barra. O primeiro relgio mede o intervalo choque-choque ou intervalo SS, o tempo entre choques sucessivos quando o rato no pressiona a barra. Cada vez que o choque apresentado, este relgio volta a zero e comea a marcar um novo intervalo SS. Sempre que o rato pressiona a barra o controle muda para o segundo relgio. Este mede o intervalo resposta-choque, ou in tervalo RS, o tempo pelo qual cada presso barra adia o prximo choque possvel. Enquan to este relgio est marcando o tempo, cada pres so barra zera o relgio e inicia um novo inter valo RS. Sob essas circunstncias, o rato pode adiar o choque indefinidamente, pressionando sempre a barra antes que termine o intervalo RS em vigor. Se nenhuma resposta ocorre e um cho que apresentado ao final de um intervalo RS, o relgio do intervalo SS reiniciado. Com este procedimento, chamado de esquiva de Sidmati ou esquiva contnua, o responder de esquiva pode ser estudado independentemente do responder de fuga; o choque pode ser evitado por respos tas de esquiva, mas uma vez aplicado, ele to breve que h pouca ou nenhuma oportunidade para a emisso de comportamentos de fuga. Os dados para a presso barra por um rato so mostrados na Figura 6.7, que apresenta a taxa de respostas em funo do intervalo RS, enquan to o intervalo SS mantido como parmetro. Comparando as funes, v-se que o intervalo RS que produziu a taxa mxima de presso barra dependeu do intervalo SS. Primeiro consi deremos um esquema de esquiva com um inter valo RS de 6 segundos e um intervalo SS de 2 segundos. Qualquer resposta reduz o choque, e uma taxa de uma resposta a cada 4 segundos, aproximadamente, evita completamente os cho ques. Quando o intervalo RS mais curto do que o intervalo SS, contudo, alguns padres de pres so barra podem aumentar a taxa de choques em vez de diminu-la. Por exemplo, considere mos agora um esquema de esquiva com um in tervalo RS de 2 segundos e um intervalo SS de 5 segundos. Um rato que nunca pressiona a barra recebe um choque a cada 5 segundos ou 12 cho ques por minuto. Mas, se o rato pressiona a cada 3 segundos, um choque apresentado 2 segun dos depois de cada presso barra, e o rato rece ber, portanto, 20 choques por minuto (estrita

Intervalo RS (Segundos)

FIGURA 6.7 Taxa de respostas de presso barra pelo Rato 46 em funo do intervalo RS, tendo o intervalo SS como parmetro. O intervalo SS o tempo entre cho ques, quando nenhuma resposta ocorre entre eles. O intervalo RS o tempo pelo qual cada presso adia o prximo choque possvel. (Sidman, 1953, Figura IA)

mente falando, se esse aumento na taxa de cho ques reduz o responder, apropriado dizer que o responder punido). O rato pode evitar por completo os choques respondendo to rpido que os 2 s nunca se esgotem sem uma presso bar ra, mas o aumento nos choques produzido por taxas mais baixas pode impedi-lo de alcanar tal desempenho. O comportamento de esquiva pode ser per sistente depois de uma longa histria de esqui va; como veremos abaixo, sua extino pode ser lenta. No entanto, a conseqncia de uma res posta de esquiva efetiva que nada acontece: o evento aversivo esquivado com sucesso. En to, embora seja fcil manter a persistncia do comportamento de esquiva, difcil instalar este comportamento. Isso pode explicar por que me didas de segurana e outros procedimentos pre ventivos no so modelados com muita freqn cia por contingncias naturais. Uma pessoa que nunca esteve envolvida em um srio acidente de carro pode estar menos propensa a utilizar o cin to de segurana do que outra que esteve, e al gum que nunca teve uma m experincia com incndio pode estar menos propenso a instalar um detector de fumaa do que outra pessoa que

p r e n d iz a g e m

121

j tenha tido. Um problema importante na medi cina a adeso do paciente s medicaes pres critas. Muitos pacientes param de tomar suas me dicaes aps o desaparecimento dos sintomas, mesmo que doses adicionais pudessem trazer benefcios. E com vitaminas ou suplementos minerais que podem prevenir deficincias na die ta, no h conseqncias claras e imediatas que possam ser observadas. Esse problema comum a um grande nmero de medidas preventivas, da imunizao ao controle da natalidade e da puri ficao da gua de beber ao uso de instrumentos cirrgicos esterilizados. No deveria causar sur presa que tais medidas sejam muitas vezes dif ceis de modelar e de manter.

Reaes de Defesa Especficas da Espcie Uma vantagem dos procedimentos de esqui va sobre os procedimentos de fuga que a res posta reforada ocorre na ausncia do estmulo aversivo. Assim, outras respostas geradas pelo estmulo aversivo no competem continuamen te com a resposta de esquiva. No obstante, as sim como mais fcil fazer com que algumas respostas e no outras funcionem como respos tas de fuga, pode ser tambm mais fcil fazer com que algumas respostas e no outras funcio nem como respostas de esquiva. Por exemplo, os pombos evitam choques mais prontamente se eles puderem faz-lo atravs da locomoo de um lado para outro da cmara do que atravs de bicadas (p. ex., Macphail, 1968). Em procedimentos de es quiva, mais difcil argumentar que tais diferen as dependem da competio entre as respostas reforadas e outras respostas geradas pelo estmu lo aversivo. Tem sido argumentado que as dife renas surgem porque os organismos so equipa dos, de maneira variada, com respostas de defesa que so especficas da espcie. Sendo assim, o su cesso com procedimentos de esquiva depender de o experimentador escolher uma resposta que o organismo esteja preparado para emitir em situa es aversivas (Bolles, 1970; Seligman; 1970). Bolles resume o argumento como segue:
O que mantm os animais vivos na selva que eles tm reaes defensivas matas muito eficazes, que ocorrem quando eles encontram qualquer tipo de

estmulo novo ou sbito... Essas reaes defensivas so eliciadas pela apario de um predador e pela sbita apario de objetos inofensivos. Elas esto sempre prximas do limiar, de modo que o animal fugir, ficar congelado ou ameaar sempre que ocorrer qualquer evento de estmulo novo. No necessrio que o evento de estmulo seja empare lhado com o choque ou a dor, ou algum outro est mulo incondicionado. O rato no corre da coruja porque aprendeu a escapar das garras dolorosas do inimigo; ele corre de qualquer coisa que suija em seu ambiente e faz isso meramente porque um rato. A gazela no foge do leo que se aproxima porque tenha sido mordida por lees; ela foge de qualquer objeto grande que se aproxime e faz isso porque esta uma das reaes de defesa especficas de sua es pcie. Nem o rato nem a gazela podem se dar ao luxo de aprender a se esquivar; a sobrevivncia urgente demais, a oportunidade de aprender limi tada demais, e os parmetros da situao tomam im possvel a aprendizagem necessria. (Bolles, 1970, p. 33)

A esquiva, como citado por Bolles, implica em foco de controvrsias. A observao de Bol les diz respeito ao grau em que o comportamen to de esquiva aprendido. Sem dvida, o com portamento atual pode ser, significativamente, determinado por variveis evolutivas (at mes mo a capacidade do responder a ser reforada deve ter evoludo de alguma forma). E geralmen te aceito que o comportamento especfico da es pcie, freqentemente, limita o que pode ser aprendido. Consideremos, por exemplo, a transio do comportamento eliciado ao ser emitido na aqui sio de esquiva sinalizada em ratos (um proce dimento de cancelamento). Neste procedimento um estmulo-aviso, tal como uma campainha, precede o choque. Se o rato responde durante a campainha e antes do choque, o choque omiti do; se o rato responde aps o incio do choque, o choque removido. Em outras palavras, o rato esquiva-se do choque, respondendo durante o estmulo-aviso; se o rato falha em esquivar-se e o choque tem incio, ento ele foge do choque quando responde. Em tais experimentos, uma resposta freqen temente escolhida uma forma de locomoo, tal como saltar um obstculo ou correr de um lado para outro da cmara. Alm disso, a res posta de esquiva , tipicamente, a mesma que a resposta de fuga. Mas, com ratos, tais respostas

122

A. C h a r le s C a ta n ia

locomotoras tendem a ser eliciadas por estmu los aversivos, mesmo na ausncia de uma con tingncia resposta-choque. Uma vez que tais res postas tenham sido produzidas pelo choque, elas podem continuar quando o choque estiver au sente. Assim, as primeiras poucas respostas de esquiva do rato podem ocorrer, principalmente, por causa de sua eliciao anterior pelo choque (cf. Captulo 4 e Azrin, Hutchinson, & Hake, 1967). Aps o incio do responder de esquiva, saber se ele continua porque tem a conseqn cia importante de prevenir o choque ou porque ele um caso de comportamento especfico da espcie, facilmente gerado por situaes aversi vas, uma questo experimental. Algumas diferenas tambm podem depen der dos determinantes especficos da espcie para o que aversivo. Por exemplo, demons traes de fuga ou de esquiva do som das cor rentezas de gua, por parte de castores, levan tam a intrigante possibilidade de que a aversividade de tais sons contribua para a cons truo e manuteno de suas represas e tocas (cf. Hartman, 1975).

A Natureza do Reforador na Esquiva Outra questo especificar o que refora o responder de esquiva. Quando uma resposta de esquiva bem-sucedida ocorre, a conseqncia importante que nada ocorre ao organismo. Como pode a ausncia de um evento afetar o comportamento? De acordo com um ponto de vista, o responder de esquiva mantido porque o organismo est fugindo de algumas proprieda des da situao que acompanharam os estmulos aversivos passados. Essa noo evoluiu a partir dos primeiros procedimentos em que um estmulo-aviso precedia o choque, e o organismo evitava o choque, respondendo na presena do estmulo-aviso. A esquiva era mais facilmente adquirida quando terminava o estmulo-aviso e evitava o choque. Supunha-se que a aversividade do estmulo-aviso era estabelecida por meio de sua relao consistente com o choque e, por tanto, que essa conseqncia imediata, fuga do estmulo-aviso, era o reforador efetivo. De fato, um dos propsitos do esquema de esquiva de

Sidman era demonstrar o responder de esquiva sem um estmulo-aviso. Esta concepo de que o estmulo-aviso ad quire suas propriedades aversivas a partir de uma relao consistente com o estmulo aversivo e de que o trmino do estmulo-aviso, portanto, reforava a resposta de esquiva foi chamada de teoria dos dois processos da esquiva (p.ex., Ka min, 1956). A questo principal era a natureza do reforador. Alguns tericos estavam dispos tos a aceitar o fato da esquiva, sem apelar para nenhum evento reforador que ocorresse no mo mento da resposta de esquiva. Outros acredita vam que era necessrio especificar tal evento. Quando, como na esquiva de Sidman, o evento no podia ser localizado em algum estmulo-avi so ambiental, que terminasse com a resposta de esquiva, esses tericos passavam, ento, a con ceber o evento com estando dentro do organis mo. Argumentava-se, por exemplo, que o esta do do organismo, logo aps uma resposta de es quiva, quando o choque no era iminente, era reforador em relao a seu estado muito tempo aps a resposta, quando um choque poderia ocor rer a qualquer momento. O ltimo estado adqui riria certas propriedades aversivas por sua rela o com o choque e, como um estmulo-aviso, era suspenso pela resposta. Tal mudana de estado supostamente ocorria imediatamente com cada res posta de esquiva, assim, supunha-se que uma ex plicao baseada em outros eventos, em algum tempo distante da resposta, seria desnecessria. Debates acerca do status de tais teorias so bre a esquiva tm uma histria complexa (p. ex., Anger, 1963; Herrnstein & Hineline, 1966; Hineline, 1977), com alguns at mudando de lado ao longo do tempo (p. ex., Schoenfeld, 1950, 1969). Gradualmente, as divergncias reduziramse a questes experimentais a respeito das con dies sob as quais as respostas de esquiva po dem ser mantidas: necessrio que o organismo seja capaz de reduzir o nmero total de choques em uma sesso ou ser suficiente para o orga nismo que ele seja capaz de adiar os choques individuais, embora o mesmo nmero total de choques seja apresentado? Ocorre que qualquer uma destas condies pode manter o responder de esquiva, assim essas questes foram rapida mente substitudas por outras sobre as operaes

A p re n d iz a g e m

123

estabelecedoras que tomam os reforadores ne gativos eficazes (Hineline, 1970, 1981). Uma operao estabelecedora que toma os reforadores positivos mais eficazes a priva o. Uma operao anloga para os reforado res negativos a apresentao de um estmulo aversivo que toma sua retirada reforadora (esta operao seria denominada saciao, se o est mulo fosse comida e no um choque). Mais ain da do que no reforo positivo, esses efeitos estabelecedores devem ser distinguidos dos efeitos discriminativos, eliciadores e de outros efeitos de estmulos. Alm disso, a relatividade do re foro se mantm para o reforo negativo, tanto quanto para o positivo. Um procedimento de es quiva envolve transies contingentes a respos tas de uma situao para outra, e sua eficcia determinada pela situao que se segue resposta de esquiva, assim como pela que a precede. Um caso em que nem todo choque pode ser esquivado um exemplo. O responder de esqui va pode ser mantido quando reduz a probabili dade do choque, mas diferente da esquiva de Sidman, no atrasa sistematicamente todo cho que? Hermstein e Hineline (1966) programaram um esquema de esquiva em que o choque era aplicado a um rato, com uma probabilidade es pecificada, ao final de cada 2 segundos. O cho que ocorria com certa probabilidade se nenhu ma presso barra ocorresse e, com uma proba bilidade diferente, se ocorresse uma presso barra. Por exemplo, em uma dada condio, as presses barra reduziam a probabilidade de cho que de 0,3 para 0,2: se o rato pressionasse a barra pelo menos a cada 2 segundos, ele reduzia a taxa de choques de 9 para 6 choques/min. O pressionar barra foi mantido por este procedimento. Consideremos agora um caso em que cada presso barra aumenta a probabilidade de cho que de 0,1 para 0,2: pressionando pelo menos uma vez a cada 2 s, o rato aumenta a taxa de choque de 3 para 6 choques/min. Mesmo que a conseqncia do pressionar seja ainda uma pro babilidade de choque de 0,2, o rato pra de pres sionar. Em relao probabilidade inicial de cho que de 0,3, a transio para uma probabilidade de choque de 0,2, refora o responder; em rela o a uma probabilidade incial de 0,1, a mesma probabilidade de 0,2 pune o responder.

Neste procedimento, os choques eram admi nistrados probabilisticamente, sendo assim, mes mo com uma probabilidade de choque que man tinha o responder de esquiva (p. ex., 0,3 reduzi da para 0,1 pelas presses a barra; algumas pres ses eram imediatamente seguidas por choque e, alguns perodos sem presso passavam sem o choque. Deste modo, no existia uma relao temporal consistente entre respostas individuais e choques individuais. Contudo, a probabilida de de choque aumentava mais rapidamente, em mdia, depois de um perodo sem respostas do que depois de uma resposta. Assim, quem de fendia que a conseqncia imediata do respon der era importante podia argumentar que a re duo na aversividade mdia produzida pelo pressionar a barra foi suficiente para reforar o responder de esquiva. E assim o debate con tinuou. Essas posies ilustram a diferena entre as orientaes molecular e molar em anlise do comportamento. A primeira abordagem lida com o comportamento em termos de seqncias de eventos, momento a momento, em um dado con texto; a segunda lida com propriedades que po dem ser medidas apenas ao longo de extensos perodos de tempo. Por exemplo, uma aborda gem molecular da esquiva examina os interva los de tempo individuais que separam respostas particulares de choques individuais, enquanto uma viso molar examina a relao mais geral entre as taxas de resposta e as taxas de choque ao longo de uma amostra grande de respostas e choques (note-se que a taxa pode ser determina da apenas por meio da amostragem de eventos ao longo de extensos perodos de tempo). Essas divergncias no foram e talvez no possam ser resolvidas. As propriedades mole culares e molares do comportamento podem ser importantes em contextos diferentes. Tambm razovel supor que a evoluo equipou os orga nismos com a capacidade de responder, diferencialmente, a muitas propriedades das situaes em que se encontram. Situaes em que um rato adie choques entre as tentativas, que no reduza a taxa total de choques ou que reduza a taxa to tal de choques, mesmo que o responder encurte o perodo para o prximo choque, podem ser criadas (Hineline, 1981). Assim, parece no ha

124

A . C h a r l e s C ata n ia

ver nenhuma justificativa para supor que um or ganismo, cujo responder seja determinado pelas propriedades moleculares de uma situao (p. ex., as relaes temporais consistentes entre o responder e os choques, criadas pelos intervalos RS e SS da esquiva de Sidman), seria incapaz de responder de acordo com as propriedades mola res de outra situao (p. ex., as relaes gerais consistentes entre a taxa de respostas e a taxa de choques estabelecidas por um esquema probabilstico de esquiva). Se isso assim, no se tra ta de escolher uma ou outra abordagem, mas sim decidir qual abordagem mais apropriada an lise de uma dada situao.

EXTINO Como no reforo positivo e na punio, os efeitos do reforo negativo so temporrios. E, da mesma forma que nessas operaes, os efei tos de terminar as contingncias entre as respos tas e os estmulos aversivos devem ser distin guidos dos efeitos de simplesmente terminar os estmulos aversivos. Em fuga de choque, desli gar o choque elimina o responder simplesmente porque no h uma ocasio de fuga na ausncia do estmulo aversivo. No entanto, em esquiva, desligar a fonte de choque , algumas vezes, con siderado uma operao de extino. Se o respon der em esquiva for mantido a uma taxa tal que os choques sejam raros, a ausncia de choques far pouca diferena, e o responder continuar por um longo perodo. De fato, uma proprieda de amplamente reconhecida do responder em esquiva sua persistncia, mesmo aps a inter rupo dos estmulos aversivos. Por essa razo, a esquiva tem sido considerada relevante para alguns casos de comportamentos humanos per sistentes, como em compulses. Consideremos as alternativas. Com reforo alimentar, podemos programar a extino, quer desligando o comedouro, quer interrompendo a conexo entre as respostas e o comedouro. Am bos os mtodos tm o mesmo efeito: o alimento no mais apresentado. No o que acontece com a fuga ou a esquiva ao choque. O choque continua se as respostas no puderem mais re mov-lo ou evit-lo. Na esquiva de Sidman, por

exemplo, todos os choques poderiam ser con trolados pelo relgio SS; as respostas no mais operariam o relgio do intervalo RS. Tal proce dimento interromperia a contingncia respostachoque, mas se o responder tivesse mantido uma taxa baixa de choques, ele tambm aumentaria substancialmente as apresentaes de choque. Desse modo, esse procedimento, por si s, no poderia separar os efeitos da mudana na taxa de choque daqueles da mudana na contingncia. Suspender as apresentaes do estmulo aver sivo tem sido o procedimento de extino mais comum em esquiva, mas apresentar o estmulo aversivo enquanto interrompe-se as conseqn cias do responder um paralelo mais prximo da extino aps reforo positivo. A durao da extino depende de qual operao usada e de que modo a operao altera a taxa de ocorrncia do estmulo aversivo (cf. Hineline, 1977, pp. 377 381). Em qualquer caso, um paralelo de nossa avaliao da extino aps o reforo positivo e da recuperao aps a punio mostra que, tam bm na extino aps o reforo negativo, os efei tos do reforo negativo so temporrios.

PUNIO POSITIVA E PUNIO NEGATIVA A distino entre reforo positivo e negativo facilmente estendida punio positiva e ne gativa (embora aqui tambm sejam possveis casos ambguos). As respostas podem ser puni das por alguns eventos como o choque ou o cor rer forado em uma roda de atividade. Elas tam bm podem ser punidas pelo trmino de even tos. Por exemplo, a remoo de alimento, con tingente ao pressionar a barra por um rato priva do de alimento, tende a reduzir a taxa do pres sionar. O problema que difcil demonstrar se isso uma punio negativa. Se o rato est pri vado de alimento e a comida est disponvel, ele provavelmente comer em vez de pressionar a barra. Assim, teramos poucas oportunidades de punir o pressionar a barra pela remoo do ali mento (considere a Figura 6.6, com comida e choque trocados). Por essa razo, os estudos em punio negativa, geralmente, no tm removi do o reforador positivo; pelo contrrio, eles tm

p r e n d iz a g e m

125

removido um estmulo na presena do qual as resposatas so reforadas, o que um paralelo da nfase na esquiva e no na fuga, em estudos de reforo negativo. Por exemplo, suponhamos que duas barras estejam disponveis a um macaco e que presses em uma barra produzam alimento sempre que uma luz estiver acesa. Podemos esperar algumas presses na outra barra, mas este pressionar pode ser punido, fazendo com que cada presso pro duza um perodo de tempo durante o qual a luz apagada e as presses na primeira barra no mais produzam alimento. Tais perodos so chama dos de suspenso discriminada das contingn cias de reforo (timeout). (Estes procedimentos so chamados, s vezes, de punio por timeout do reforo positivo : p. ex., Ferster, 1958. Os pro cedimentos que sinalizam punio negativa tm sido chamados de treino de omisso: Sheffield, 1965; ver tambm Captulo 12.) O timeout teve origem em experimentos com pombos, ratos e macacos, mas atualmente tal vez seja melhor conhecido em aplicaes ao comportamento humano (p. ex., Wolf, Risley, & Mees, 1964). Por exemplo, um perodo de tem po em uma sala isolada vem sendo empregado para punir os comportamentos problemticos de crianas institucionalizadas. Mas, como vimos em outros exemplos, o julgamento a respeito de se alguns eventos particulares sero reforadores ou punitivos, s vezes, difcil. Quando o time-out foi empregado sozinho com o objetivo de punir a agressividade de uma menina autista de 6 anos de idade, sua agressividade aumentou substancialmente, em vez de diminuir. Essa criana se engajava freqentemente em compor tamentos auto-estimulatrios (p.ex., criava esti mulao visual, mexendo rapidamente os dedos em frente e bem prximos aos olhos), no entan to, esse comportamento era freqentemente in terrompido pelos atendentes. Para ela, um per odo isolada em uma sala era reforador, porque ela podia se engajar em comportamentos de autoestimulao sem ser interrompida (Solnick, Rin cover, & Peterson, 1977). Assim como com qualquer forma de puni o, a funo principal do timeout reduzir cer tos comportamentos, mas ele freqentemente aplicado sem uma ateno para os comportamen

tos alternativos que poderiam ser reforados (Winett & Winkler, 1972). A utilizao do ti meout sem a compreenso de suas bases comportamentais pode ser contraproducente. Por exemplo, os berrios diurnos modernos para cri anas pr-escolares tendem a usar uma rea des tinada ao timeout e no uma sala isolada. Uma criana que perturba outras crianas em um gru po que est brincando pode ser colocada para sentar por 5 min em um carpete prximo rea de brinquedo, vista de outras crianas. Supo nhamos que a criana fique quieta por 4 min e depois comee a chorar ou a fingir que esteja chorando. A atendente que exigir rigidamen te 5 min de timeout, provavelmente, ir deixar que a criana retome ao grupo justamente no mo mento em que ela est agindo novamente de for ma inadequada; seria melhor surpreender a cri ana quando ela estivesse agindo adequadamente e permitir que ela retomasse ao grupo aps 3 ou 4 min (afinal, 4 min sentada quieta um longo perodo de tempo para uma criana pr-escolar).

A LINGUAGEM DO CONTROLE AVERSIVO A apresentao ou a remoo de estmulos pode reforar ou punir o comportamento. O re foro mais eficaz se a resposta reforada com patvel com o responder ocasionado pelo refor ador. Inversamente, a punio mais efetiva se a resposta punida for incompatvel ou, ao me nos, independente do responder ocasionado pelo estmulo punitivo. Assim, pode ser fcil refor ar o saltar com a remoo do choque (fuga), mas pode ser difcil punir o saltar com a apre sentao de choque. Os estmulos que podem reforar por meio de sua apresentao podem tambm punir por meio de sua remoo e vice-versa. Temos fala do, portanto, de estmulos punitivos, de reforadores negativos e de estmulos aversivos. Cada um foi apresentado em um contexto diferente, mas isso foi apropriado porque o contexto que determina as funes comportamentais de qual quer estmulo. Assim, os estmulos aversivos fo ram apresentados em conexo com os fenme nos de eliciao, os estmulos punitivos foram

126

A . C h a r l e s C a ta nia

apresentados durante a discusso de conseqn cias que reduzem o responder, e os reforadores negativos foram includos como classes de con seqncias que aumentam a probabilidade da res posta. Seria conveniente se pudssemos supor que cada termo identifica diferentes aspectos de uma categoria nica de eventos. Poderamos, ento, falar da permutabilidade do choque como um estmulo aversivo, um estmulo punitivo ou um reforador negativo, dependendo da situao. Para muitos estmulos, na maior parte do tem po, tal premissa possivelmente correta. Se sou bssemos que um estmulo to eficaz como um punidor, esperaramos, com razo, que ele fosse eficaz como reforador negativo; esta consistn cia parte de nossa justificativa para cham-lo de aversivo. Consistncias devem ser esperadas, porque as categorias tm origem nas relaes entre as probabilidades de diferentes classes de respostas. Mas estas mesmas probabilidades de veriam nos lembrar da relatividade dos refora dores e punidores. Devemos ter cuidado para no considerar tal premissa como garantida. O fato de podermos reforar facilmente o saltar, remo vendo o choque, enquanto no podemos punir efetivamente o saltar apresentando choque, de monstra que a simetria entre reforo e punio tem limites. A falta de simetria entre o reforo e a puni o, talvez tenha encorajado algumas tentativas de reduzir um deles a um caso especial do outro. Alguns casos de punio tm sido descritos em linguagem de esquiva passiva: ao no respon der, o organismo estaria passivamente evitando o estmulo programado como um estmulo puni tivo para o responder. Mas, ento, da mesma for ma, poderamos dizer que o no responder (p. ex., no descer de uma plataforma para um piso eletrificado) uma resposta que pode ser refor ada. Se a linguagem funciona neste caso, por que no o faria em qualquer caso de punio? A questo do que conta como comportamen to est implcita nestes argumentos. Sempre que o responder punido, podemos dizer que o no responder reforado, e sempre que o respon der reforado, podemos dizer que o no res ponder punido. Quando estendemos nossa ter minologia dessa maneira, a diferena entre re foro e punio desaparece. Contudo, geralmente

podemos reconhecer a diferena entre os casos de reforo e os casos de punio. De fato, as di ferenas so freqentemente tpicos de interes se. Por exemplo, nossa sociedade no indife rente a um pai se este refora o comportamento cooperativo com elogio ou se ele pune o com portamento no-cooperativo com castigos. Podemos falar mais facilmente em termos de respostas discretas do que em termos de ausn cia de respostas. E, portanto, sempre que poss vel, so preferveis as descries diretas, em ter mos de respostas registrveis como presses barra ou bicadas no disco, do que as descries indiretas em termos do que no est ocorrendo. Um organismo pode exibir mais ou menos com portamento em momentos diferentes, e no pre cisamos supor que todas os casos sem agir se jam, em si mesmos, aes. Assim como no pre cisamos alcanar uma temperatura de zero ab soluto para reconhecer a temperatura como uma dimenso da matria que varia em quantidade, tampouco temos que produzir um organismo completamente no responsivo para reconhecer que o comportamento de um organismo uma dimenso que pode mudar em quantidade. O comportamento denominado no-responder (ou outro comportamento) uma classe que permite que a totalidade do comportamento seja cons tante, de modo que quando somadas, as proba bilidades atingem um, mas isso nos permite um grau de liberdade grande demais. Se punimos uma resposta, deveramos saber o que acontece com ela antes que procuremos encontrar uma explicao em termos de outros comportamen tos e deveramos saber o que mais o organismo est fazendo antes que comecemos a falar do noresponder como comportamento.

A tica do Controle Aversivo As propriedades comportamentais do contro le aversivo tm implicaes que so consisten tes com os argumentos ticos contra o controle aversivo. Por exemplo, um pai que programa conseqncias aversivas para o comportamento de uma criana pode adquirir propriedades aver sivas. Na medida em que a criana, ento, apren de a fugir da companhia do pai ou a evit-la, con

A p r e n d iz a g e m

127

tingncias outras que no aquelas disponveis ao pai podero comear a influenciar o comporta mento da criana. Mas se a punio parecer a nica tcnica disponvel para reduzir o perigoso comportamento autolesivo de uma criana au tista, ento, ela poderia representar um mal me nor do que o dano permanente que a criana po deria infligir a si prpria. Os preceitos ticos expressam a preocupao com os resultados acei tveis ou inaceitveis de nossas aes, o que implica que as conseqncias de nossas aes no devem ser ignoradas. Em uma discusso sobre o status de nossa cultura e seu progresso na descoberta de alter nativas para o controle aversivo, B. F. Skinner chegou seguinte concluso:
Mesmo na poltica e no governo, o poder da puni o tem sido suplementado por um apoio mais posi tivo do comportamento que est de acordo com os interesses das agncias governamentais. Mas ainda estamos longe de explorar as alternativas e no provvel que faamos qualquer avano real, enquan to nossa informao sobre a punio e sobre as al ternativas punio permanecer no nvel da obser vao casual. (Skinner, 1953, pp. 192-193)

Skinner inclua tcnicas de reforo entre suas alternativas para a punio. Infelizmente, se olhamos para o comportamento das pessoas que detm o controle de reforadores e punidores, veremos que os efeitos do reforo com freqn

cia, aparecem bastante tempo aps a apresenta o do reforador (o efeito de reforar diaria mente a dedicao da criana s tarefas de casa pode no ficar evidente, at que vrios dias te nham-se passado), enquanto que os efeitos da punio geralmente aparecem imediatamente (um efeito de dar uma palmada ou xingar uma criana que esteja provocando algum de sua famlia o que far com que o provocar pare imediatamente). Dessa forma, muito mais pro vvel que se obtenha conseqncias imediatas apresentando um estmulo punitivo do que apre sentando um reforador. Isso significa que uma pessoa, provavelmente, acha mais fcil apren der tcnicas de controle aversivo do que tcni cas de reforo. No entanto, isso no significa que as tcnicas aversivas sejam melhores. Algumas pessoas argumentam contra qual quer tipo de modificao de comportamento, tan to envolvendo estmulos aversivos quanto refor adores positivos. Os que fazem uso de tal argu mento deveriam reconhecer que nosso compor tamento modificado a todo instante, tanto por contingncias naturais como por contingncias artificiais criadas pelos que esto nossa volta. Negar isso no eliminar tais contingncias, e um contra-argumento que nossa melhor defe sa contra o mau uso das tcnicas comportamentais aprender tanto quanto possvel a respeito de como elas funcionam.

128

A . C h a r l e s C a ta n ia

Operantes: A Seleo do Comportamento

A. Modelagem: Reforo Diferencial de Aproximaes Sucessivas Seleo Natural e Seleo Artificial na Modelagem B. Diferenciao e Induo Classes de Respostas Alguns Exemplos de Reforo Diferencial Classes Operantes: Funo versus Topografia C. A Estrutura Operante Reforo Diferencial da Organizao Temporal Comportamento Complexo: a Aprendizagem em Labirinto Seqncias de Respostas: Encadeamento versus Unida des Temporaimente Extendidas Classes Operantes e Comportamento Novo

A palavra operante, que designa uma classe de respostas, origina-se do latim opus, work (traba lho), que tambm est na origem de operation (operao) e copy (cpia). A palavra classe ori gina-se do latim classus , uma parcela dos cida dos romanos elegveis para o servio militar e, talvez, portanto, uma convocao ou chamado. Em classify (classificar), ela est vinculada pelo sufixo -fy, uma forma do latim facere, a fazer. Variaes de facere aparecem em fact (fato), modify (modificar), difpcult (dificultar) e effect (efei to). Em especificar, classe est relacionada a speci es (espcies), um nome para um outro tipo de classe que selecionada. Pela forma em latim, esta ltima vem do indo-europeu spek-, to see (ver) ou observe (observar), e est muito relacionada a expect (espe rar), introspect (introspeco), telescope (telesc pio), skeptic (ctico) e spy (espionar). Em ofcio, a partir de opi- mais -ficere. e assim em fazer o traba lho, a palavra est conectada a operante. O termo work (trabalho) tem, ele prprio, origens gregas e est relacionado a organismo, pelo grego organon, tnol (ferramenta).

Vimos como podemos mudar o comporta mento por meio da apresentao de estmulos e da programao de conseqncias para o respon der. Uma maneira de se discutir os efeitos des sas operaes em termos das posies relati vas de respostas na hierarquia comportamental: o comportamento do organismo consiste de um repertrio de respostas, cada uma com uma pro babilidade diferente. Mas, se restringimos nossa ateno apenas a essas respostas, ignoramos uma das caractersticas mais interessantes das mudan as no comportamento que so denominadas aprendizagem; ignoramos as circunstncias nas quais um organismo passa a responder de ma neiras novas. Ento, devemos examinar como novas respostas podem ser adicionadas ao reper trio de um organismo. Neste captulo, comea mos por considerar a modelagem, um procedi mento para gerar novas respostas. Isso nos leva r a considerar como as classes de respostas so definidas como unidades de comportamento, no conceito de operante. Esse conceito fornece a base para se discutir a estrutura do comporta mento. A resposta pressionar a barra de um rato e a de bicar um disco de um pombo tem servido como nossos exemplos de respostas. Mas, se sim plesmente colocamos um rato diante de uma bar ra ou um pombo diante de um disco, podemos no observar as presses ou as bicadas. Com al guns organismos podemos ter sorte e tais res postas ocorrero depois de uma espera no mui to longa; mas outros organismos podem perma necer tanto tempo sem responder que nossa pa

cincia esgotar-se-. O reforo no pode ter qual quer efeito se a resposta a ser reforada nunca for emitida. Felizmente, h uma alternativa. Em vez de esperar pela resposta, o experimentador pode gerar uma resposta, reforando sucessiva mente outras respostas que se aproximem dela, cada vez mais estreitamente.

Seo A

Modelagem: Reforo Diferencial de Aproximaes Sucessivas

Consideremos a resposta de bicar de um pom bo. Quando o pombo comea a comer sempre que o comedouro operado, o experimentador passa a oper-lo somente quando o pombo se vira em direo ao disco; depois de reforar 2 ou 3 movimentos em direo ao disco, o experimen tador refora no qualquer movimento em dire o ao disco, mas somente aqueles que apresen tarem o deslocamento do bico para a frente. Neste ponto, o pombo comea a passar a maior parte do tempo em frente ao disco, e o experimenta dor pode mudar a ateno dos movimentos em direo ao disco para os movimentos do bico para a frente. Esses movimentos se aproximam mais estreitamente do bicar o disco do que os movi mentos em direo ao disco e, uma vez que re for-los garante que eles continuaro a ocorrer, no ser mais necessrio reforar o virar-se em direo ao disco. Neste ponto, os movimentos do bico para a frente so praticamente bicadas completas e logo uma delas atingir o disco. O experimentador pode, ento, retirar-se, porque o equipamento pode ser programado de modo que as prximas bicadas operaro o comedouro automaticamente. Um experimentador experiente capaz, em geral, de modelar a resposta de bicar o disco, em um pombo, com dez a quinze reforos. Alguns aspectos das habilidades envolvidas em mode lar podem ser descritos explicitamente. Por exemplo, reforar um movimento tende a mode lar o responder mais eficientemente do que re forar uma postura. Outros aspectos no podem ser formulados to prontamente. Por exemplo, modelar implica sempre em um meio termo en tre os extremos da apresentao freqente e da

apresentao no-freqente de reforadores. A apresentao freqente de reforadores leva a uma saciao mais rpida e pode fortalecer, ex cessivamente, algumas respostas que, mais tar de, no faro parte da resposta a ser modelada. Por outro lado, a apresentao no-freqente de reforadores pode reduzir o responder em geral e, uma vez que o organismo se toma inativo, todo o progresso na modelagem, at este momento, pode ser perdido. Assim, o experimentador deve trabalhar dentro de limites impostos por esses dois extremos, mas no existem regras explci tas para julgar exatamente quais seriam esses li mites para qualquer organismo em particular (cf. Platt, 1973; Eckerman e col., 1980). Alm disso, algumas caractersticas da mo delagem so bastante especficas dos organismos e das respostas particulares em estudo, enquan to outras so, geralmente, pertinentes modela gem de uma variedade de respostas, em diferen tes organismos. Por exemplo, um experimenta dor que tenha trabalhado, freqentemente, com pombos sabe que reforar um pequeno movimen to do bico direcionado diretamente para o disco estabelecer a resposta de bicar mais efetiva mente do que reforar um amplo movimento lateral do bico que termina em frente do dis co. Por outro lado, quaisquer que sejam a res posta e o organismo, o experimentador no deveria perder uma oportunidade de reforar uma resposta caso ela se aproxime mais es treitamente da resposta a ser modelada do que qualquer outra resposta que tenha sido refor ada antes.

SELEO NATURAL E SELEO ARTIFICIAL NA MODELAGEM A modelagem uma variedade de seleo que seria o paralelo ontogentico da seleo filogentica que ocorre na evoluo biolgica (Donahoe, Burgos, & Palmer, 1993). Essa seleo mais bvia quando usada por um treinador hu mano, como no ensino de habilidades a um co de cego (cf. Pryor, 1985; Squier, 1993). Esses casos so exemplos de seleo artificial, assim como a criao de gado consiste suma seleo artificial no caso filogentico. Mas, a modela

130

A . C h a r l e s C a ta nia

gem pode tambm ocorrer como um resultado de contingncias naturais. Por exemplo, os pssaros pretos machos, em diferentes partes dos EUA, cantam diferentes dialetos de cantos de pssaros (o pssaro preto fmea no canta, fato comum quanto ao canto dos pssaros). mais provvel que uma fmea responda com uma postura de acasalamento s canes que se paream mais com as ouvidas na sua juventude, presentes no dialeto dos machos locais. Quando um macho estrangeiro introdu zido, ele comea cantando no seu prprio diale to. Mas, ele canta com variaes e quanto mais tempo passa na presena da fmea, mais seu can to toma a forma do dialeto local. Seu dialeto adquirido um produto da seleo ontogentica natural: as reaes diferenciais da fmea so reforadoras e modelam seu canto (p. ex., King & West, 1985). Normalmente, a modelagem envolve mudan as quantitativas ao longo de uma ou mais di menses de um comportamento do organismo, mas algumas vezes parece produzir mudanas qualitativas. Consideremos o seguinte exemplo envolvendo a modelagem da fora exercida por um rato ao pressionar a barra (Catania & Harnad, 1988, p. 476). O rato produz comida pressi onando uma barra que possui um contrapeso e que se projeta dentro da cmara, a uma altura que requer que o rato fique em p em suas patas traseiras para alcan-la. Comeamos com o con trapeso ajustado para um nvel modesto. Nesta situao o rato pressiona facilmente, apoiando uma ou ambas as patas dianteiras sobre a barra. Com o passar de reforos sucessivos, aumenta mos gradualmente o contrapeso, at a fora re querida ficar prxima do peso do prprio rato. Uma vez que a fora exceda o peso do rato, a resposta de pressionar ser efetiva somente se emergir uma nova topografia. Empurrar a barra para baixo, com ambas as patas traseiras no cho, no faz mais efeito. Em vez disso, as patas do rato sobem do cho. Enquanto suspenso na bar ra, o rato deve agora levantar suas patas trasei ras at a parede da cmara, onde uma engrena gem de arame permite que ele se agarre firme mente. Mesmo com o contrapeso excedendo o seu prprio peso, o rato pode agora pressionar a barra, puxando-a entre suas pernas traseiras e di

anteiras. Se o rato vai ou no mudar para a nova topografia, depender conjuntamente do seu comportamento, da sua anatomia e do equipamnento. Por exemplo, ser menos provvel que ele produza a nova topografia envolvendo tanto as patas traseiras e dianteiras, se ele tiver come ado a pressionar com muita fora alta pulando sobre a barra, em vez de pression-la. Esse exemplo ilustra dois tipos de seleo ontogentica, uma gradual e outra relativamente abrupta. A primeira ocorreu com o contrapeso abaixo do peso do rato, e a segunda ocorreu quan do o seu peso foi excedido. (Existem analogias na seleo filogentica quando, por exemplo, as mudanas quantitativas graduais relativas m dia da populao, produzidas pela seleo, so contrastadas com mudanas mais abruptas, pro duzidas por eventos ambientais catastrficos. Na evoluo filogentica, as ltimas mudanas so al gumas vezes chamadas de saltos', cf. Captulo 3). Como ilustrado por esse exemplo, as diferen tes propriedades de diferentes respostas que de vem ser modeladas fazem da modelagem uma arte. Essa arte pode ser aplicvel a uma varieda de de habilidades como fazer ginstica, namo rar, tocar um instrumento musical, seduzir, es crever mo ou colocar algum como vtima de um jogo de argumentao. Como esses exem plos sugerem, a modelagem pode ser usada para o bem ou para o mal, e muitos utilizam-se dela mesmo sem saber o que esto fazendo (esses ca sos tambm podem ser chamados de seleo na tural ontogentica). Assim como no caso do re foro e da punio, quando a modelagem usa da para o bem, deve ser feita com eficincia; e quando usada para o mal, a melhor defesa conhecer como ela funciona. A modelagem baseada no reforo diferen cial: em estgios sucessivos, algumas respostas so reforadas e outras no. Alm disso, medi da que o responder se altera, os critrios para o reforo diferencial tambm mudam, em aproxi maes sucessivas da resposta a ser modelada. A propriedade do comportamento que torna a modelagem efetiva a variabilidade do compor tamento. Duas respostas nunca so uma mesma resposta e o reforo de uma resposta produz um espectro de respostas, cada uma das quais difere da resposta reforada ao longo de algumas di

p r e n d iz a g e m

131

menses como topografia (forma), fora, mag nitude e direo. Dessas respostas, algumas es taro mais prximas da resposta a ser modelada do que outras e podem, ento, ser selecionadas, para serem reforadas em seguida. Reforar es tas respostas, por sua vez, ser seguido de ou tras mais, algumas das quais podem estar ainda mais prximas da resposta a ser modelada. As sim, o reforo poder ser usado para mudar o espectro de respostas, at que a resposta a ser modelada ocorra. Tal aspecto da modelagem algumas vezes suplementado por outros efeitos de reforado res. Alguns reforadores aumentam a atividade geral. Por exemplo: a apresentao de comida toma o pombo privado de comida mais ativo ( difcil, por isso, usar comida para reforar uma postura; cf. Blough, 1958). Assim, uma resposta mais prxima daquela a ser modelada ocorre, ocasionalmente, porque a apresentao de um reforador toma o organismo mais ativo. H um paradoxo na modelagem. Diz-se que o reforo aumenta a probabilidade da resposta que reforada. Mas, uma resposta nunca re petida exatamente. Ento, como podemos ape lar para o reforo como a base da resposta mo delada, quando os reforadores so apresenta dos somente depois de respostas que apenas se aproximam dela? De fato, se as respostas indivi duais nunca so repetidas, como podemos sequer falar de reforo? Apontamos esse problema no Captulo 1, mas no o resolvemos. A seguir, ve remos que no podemos lidar apenas com res postas singulares; devemos lidar com classes de respostas.

fizesse movimentos semelhantes no outro extre mo da cmara, distante da barra, no chamara mos essas respostas de presso barra, no im porta o quanto elas se assemelhassem a outras respostas que antes operaram a barra. No podemos discutir o comportamento ape nas em termos de respostas isoladas. As respos tas individuais so instncias de comportamen to, e cada uma pode ocorrer apenas uma nica vez; as respostas podem ter propriedades em co mum, mas no podem ser indnticas em todos os aspectos. O reforo de uma resposta produz, mais tarde, respostas que se aproximam mais ou menos estreitamente da resposta reforada, mas as respostas subseqentes no podem ser exata mente a mesma resposta. Por outro lado, no po demos agrupar todas as respostas sem distino, porque ficaramos sem nada para falar a no ser do comportamento em geral. Temos que encon trar um nvel intermedirio de anlise, em que no nos referimos nem a respostas individuais, nem a comportamento em geral, mas sim zelas ses de respostas definidas por propriedades em comum (Skinner, 1935a).

CLASSES DE RESPOSTA Em experimentos sobre respostas de pressio nar a barra com ratos, a barra conectada a uma chave que se fecha sempre que o rato desloca suficientemente a barra para baixo e com a fora necessria. A propriedade comum a todas as res postas de presso barra esta conseqncia: toda presso barra que feche o circuito preen che o requisito. Definir classes de resposta em termos de efeitos ambientais em comum a base tanto para registrar respostas na classe quanto para programar conseqncias para elas. Por exemplo, um experimentador poderia registrar as presses barra contando o nmero de vezes que o circuito se fecha e programando reforos com alimento para todas essas respostas. Mas, essa classe de respostas estabelecida pelo experimentador tem importncia comportamental apenas se for afetada pelas operaes impostas a ela. Devemos acrescentar uma ques to fundamental: as conseqncias modificam a probabilidade de respostas nesta classe? Se sim,

Seo B

Diferenciao e Induo

Se observarmos as respostas de presso barra por um rato, podemos notar que o rato pres siona a barra com uma pata, com ambas as pa tas, sentando-se sobre ela ou at mesmo mor dendo-a. Cada uma delas uma resposta dife rente; mesmo quando duas respostas so emiti das com a mesma pata, elas no seriam idnti cas. Contudo, denominamos todas essas respos tas de presso barra. Por outro lado, se o rato

132

A . C h a r l e s C a ta n ia

ela pode ser chamada de uma classe operante ; uma classe operante uma classe de respostas afetada pela maneira pela qual ela opera sobre ou funciona no ambiente. As presses barra e as bicadas no disco so exemplos convenientes, mas as classes operantes englobam casos mais extensos e complexos. Nos primrdios da Psicologia da Aprendiza gem, quando o comportamento operante era de nominado instrumental ouvoluntrio, supunhase que somente as respostas da musculatura es queltica poderiam fazer parte de classes de res postas modificveis por suas conseqncias. Ou tras classes de respostas, chamadas de auton micas., tais como as das glndulas e dos mscu los lisos, no haviam se mostrado modificveis da mesma maneira. Tais respostas eram tipica mente eliciadas e os procedimentos de condicio namento de Pavlov (ver Captulos 2 e 12) ha viam mostrado como estmulos novos poderiam passar a elici-las. Naquela poca, era negligencivel a evidncia de que essas respostas pode riam ser modificadas por meio de reforo ou de punio. Alm disso, era possvel argumentar que tais mudanas nas respostas autonmicas eram mediadas por outros tipos de comportamentos (como quando exerccios aumentam a taxa de batimentos cardacos). Apesar das controvrsias (p. ex., Dworkin & Miller, 1986), algumas respostas autonmicas parecem modificveis por suas conseqncias. Consideremos a resposta de salivar. A salivao pode tanto ocorrer espontaneamente como ser eliciada por um estmulo como o alimento na boca (p. ex., Zener & McCurdy, 1939; cf. Cap tulo 4). Podem-se programar conseqncias para a salivao espontnea ou emitida, medida em gotas de salivas. Contudo, a conseqncia para a salivao no pode ser um alimento, porque seria difcil distinguir o efeito do alimento como reforador de seu efeito como um eliciador de salivao. Como a gua no elicia salivao, ela poderia ser usada para reforar a salivao em cachorros privados de gua (Miller & Carmona, 1967). A salivao aumentou quando produzia gua (reforo) e diminuiu quando impedia a apre sentao de gua (punio). Essas respostas au tonmicas de salivao foram modificadas por suas conseqncias; em outras palavras, a sali

vao emitida poderia ser apropriadamente cha mada de uma classe operante, e essas respostas de salivao seriam membros desta classe (cf. Harris & Turkkan, 1981, sobre modelagem da elevao da presso sangnea). Um operante uma classe que pode ser mo dificada pelas conseqncias das respostas in cludas na classe. Essa definio de classe de res postas depende de propriedades comportamentais do responder e no de propriedades fisiol gicas, como a distino somtica-autonmica. As propriedades comportamentais de classes ope rantes so baseadas na operao denominada reforo diferencial, isto , o reforo de apenas algumas das respostas que se incluem em uma determinada classe. Essa operao torna o res ponder subseqente cada vez mais estreitamen te ajustado s propriedades definidoras da clas se. A caracterstica essencial de um operante a correspondncia entre uma classe de respostas definida por suas conseqncias e o espectro de respostas geradas por essas conseqncias.

ALGUNS EXEMPLOS DE REFORO DIFERENCIAL Coloquemos um rato privado de alimento em um cmara com uma fenda horizontal de 30 cen tmetros de comprimento em uma das paredes (30 cm equivalem a aproximadamente 12 pole gadas). Clulas fotoeltricas registram onde o rato introduz seu nariz, ao longo da fenda. Rotu laremos cada segmento sucessivo de 2 centme tros ao longo da extenso da abertura como posies 1 a 15, da esquerda para a direita. Pelotas de alimento podem ser apresentadas em um comedouro na parede oposta da fen da. As apresentaes de pelotas so acom pa nhadas por um rudo caracterstico, e o rato rapidamente vai ao comedouro e come sem pre que uma pelota apresentada (cf. Antonitis, 1951). De incio, o rato passa apenas um tempo cur to prximo fenda na parede. Ocasionalmente, cheira a fenda e introduz o focinho nela, ao mes mo tempo que se movimenta ao longo da pare de, mas essas respostas so relativamente infreqentes e no tm qualquer relao sistemtica

p r e n d iz a g e m

133

com as posies ao longo da fenda. Uma distri buio de freqncia das respostas do rato em funo da posio mostrada em A, na Figura 7.1. Agora vamos reforar a resposta do rato, de introduzir o focinho na fenda, mas somente se as respostas ocorrerem nas posies de 9 a 12. O efeito inicial do reforo, ilustrado no painel B, no se restringe somente quelas posies cor relacionadas com o reforo; ele aumenta o res ponder em todas as posies. Esse fenmeno, a extenso do efeito do reforo a outras respostas no includas na classe reforada, denominado induo (um sinnimo ocasional o de genera lizao de respostas). No exemplo, reforar as respostas nas posies de 9 a 12 afetou no so mente o responder naqueles locais, mas tambm o responder nas outras posies ao longo de toda a fenda. medida que continuamos o reforo dife rencial, reforando as respostas nas posies 9 a 12, mas no em outras posies, o responder aumenta gradualmente nas posies correlacionadas com o reforo, enquanto decresce nas demais posies, como mostrado em C,D e E. Fi nalmente, a maioria das respostas ocorre dentro dos limites que determinam se uma resposta deve ser reforada, como em E, e pode-se chegar a um ponto onde, mesmo que ainda ocorram algu mas respostas no-reforadas, a distribuio de

No-reforadas Reforadas

-r-n -T l PI
1 5 10

~ l I
15

r b

-rrr^TTrlM-7-n
1 5 10 f C |--------------1

15

R ir

FIGURA 7.1 Distribuies hipotticas de respostas, que ilustram os efeitos de reforo diferencial sobre a localizao da resposta. Um rato introduz o focinho ao longo de uma fenda horizontal, em uma das paredes da cmara; clulas fotoeltricas registram essa resposta em qualquer uma das quinze posies da esquerda para a direita. A dis tribuio de posies de resposta, quando nenhuma resposta refor ada, mostrada em A. De B a E, as respostas nas posies de 9 a 12 (demarcadas pelas linhas tracejadas verticais) so reforadas com alimento; as reas cheias representam as respostas reforadas. Em B, os efeitos do reforo estendem-se a respostas ao longo da fenda; esta disperso chamada de induo. De C a E, as respostas ficam mais e mais restritas faixa de posies correlacionadas com o reforo; esse estreitamento ou concentrao do efeito do reforo denominado di ferenciao. Com a continuao do reforo diferencial, a distribuio de respostas toma-se estvel e corresponde bem estreitamente, como em E, classe de respostas correlacionada com o reforo.

10 Posio

15

134

A . C h a r l e s C a ta n ia

respostas ao longo das posies no muda com a continuao do reforo diferencial. Neste exemplo, a distribuio de respostas emitidas passou a se circunscrever estreitamen te aos limites da classe de respostas reforadas. Esse processo chamado de diferenciao, e o responder estabelecido dessa maneira denomi nado diferenciado. O reforo diferencial estabe leceu uma classe de respostas definida em ter mos de posio da resposta. Contudo, se a dis tribuio de respostas em E representa a dife renciao mxima possvel, o que dizer sobre as respostas que continuam nas posies 6, 7, e 8 ou nas posies 13,14 e 15? Elas esto fora dos limites da classe de respostas correlacionadas com o reforo e, de acordo com uma interpreta o rigorosa das propriedades definidoras de ope rantes, no podem ser contadas como membros da classe operante. Elas podem, no mximo, ser descritas em termos de induo: essas respostas esto to prximas da classe de respostas refor adas ao longo do contnuo de posio que os efeitos do reforo da classe reforada se esten deram a elas, a partir da classe reforada. Essa perspecdva simplesmente atribui o responder, dentro dos limites da classe reforada, diferen ciao e o responder fora desses limites, indu o. A mesma operao gera tanto o responder dentro como fora desses limites e este responder pode ser representado como uma distribuio ao longo de um contnuo. A dificuldade pode ser resolvida reconhecen do-se que esse exemplo, de fato, envolve duas classes diferentes. A primeira classe (1) a base para a operao de reforo e representada pe las linhas tracejadas verticais na Figura 7.1; es tas linhas mostram como as conseqncias (co mida) dependem da posio da resposta. As li nhas mostram as probabilidades condicionais da comida, dada uma resposta, em funo da posi o; a probabilidade 1,0, dadas as respostas nas posies 9 a 12; e zero em qualquer outra posio. Essa distribuio define uma classe de respostas em termos das conseqncias das res postas dentro daquela classe. A segunda classe de respostas (2) dada pelo desempenho efeti vamente produzido pelo reforo. Esta classe representada, a qualquer momento, pela distri buio real de respostas (p. ex., no incio do cur so do reforo diferencial, como em C, ou mais

tarde, como em E). As duas classes no preci sam corresponder exatamente. De fato, o grau de correspondncia entre (1) o comportamento que reforado e o (2) comportamento gerado por esse reforo uma dimenso fundamental de qualquer classe de respostas reforadas. O comportamento que reforado chamado de (1) classt descritiva ou nominal, o comportamento gerado pelo refor o chamado de (2) classe funcional. Consideremos agora um outro exemplo hi pottico, ilustrado na Figura 7.2. Usamos nova mente clulas fotoeltricas para registrar as po sies nas quais o rato introduz seu focinho na fenda, mas desta vez a fenda vertical, e no horizontal. As quinze posies so numeradas consecutivamente de baixo para cima. Inicial mente, o rato introduz o focinho na fenda, oca sionalmente, medida que explora a cmara, mas essas respostas ocorrem predominantemente nas posies mais baixas, como emA, na Figura 7.2. Talvez uma resposta ocorra na posio 15, no topo da fenda, se formos pacientes o bastante para esperar. Mas pode ser que no. A modela gem uma opo melhor. O reforo programado inicialmente para respostas nas posies de 7 para cima, como em B. O responder aumenta, mas a maioria das res postas permanece nas posies mais baixas. Mais tarde, o critrio de reforo diferencial aumen tado para 9, como em C. Neste ponto, o respon der nas posies mais baixas da fenda chegou a diminuir, a distribuio mudou para posies mais altas e, pela primeira vez, ocorreram res postas na posio 13. Quando a modelagem con tinua, com o aumento do critrio para a posio 11, o responder torna-se mais concentrado na regio correlacionada com o reforo, em D. Fi nalmente, em E, o critrio elevado para a posi o 13. Se este critrio tivesse sido imposto ao desempenho inicial, em A, talvez no tivesse ocorrido nenhuma resposta reforvel. Com o reforo diferencial de aproximaes sucessivas, entretanto, a distribuio de respostas mudou para as posies mais elevadas, com uma fre qncia mxima de respostas na posio 12. Contudo, esse mximo permanece abaixo do li mite que separa as respostas reforadas das noreforadas e, nessas circustncias, h mais res postas no-reforadas do que reforadas. A base para esse resultado simples: o rato pode alcanA
p r e n d iz a g e m

135

No-reforadas

052 Reforadas

100

100

ilL.-L.i i

u f n m

tn I I I
15

10

100

.r f - r n - r
10

15

ar algumas posies mais facilmente do que ou tras. Mas quais so as implicaes desse resul tado para a definio de classes de respostas em termos de suas conseqncias? Neste caso, a classe de respostas definida pelas conseqncias (respostas nas posies 13 e acima, que eram reforadas) diferiu da classe de respostas gerada por aquelas conseqncias (responder at a posio 15, mas com um mxi mo na posio 12). O responder foi obviamente modificado por suas conseqncias, mas parte dele permaneceu fora dos limites do critrio de reforo. No podemos falar de qualquer classe separadamente; os operantes devem ser defini dos em termos da relao entre (1) o ambiente (as conseqncias que ele programa para as res postas) e (2) o comportamento (o responder pro duzido por essas conseqncias). Por conveni ncia, ocasionalmente falaremos de um operan te apenas em termos de uma classe definida pe las conseqncias ou somente em termos da dis tribuio gerada por essas conseqncias, mas importante lembrar que o operante mais rigo rosamente definido em termos da correspondn cia entre as duas classes. O reforo inclui, inevitavelmente, diferencia o. Respostas como presses barra e bicadas em um disco devem ocorrer em um local parti cular e ter fora suficiente, caso contrrio no

Respostas

100
FIGURA 7.2 Exemplos hipotticos de modelagem (reforo dife rencial de aproximaes sucessivas a uma resposta). A situao similar quela da Figura 7.1, exceto que a fenda vertical, e no horizontal, e as quinze posies so numeradas de baixo para cima, ao longo da fenda. Novamente, as reas vazias representam as respostas no-reforadas e as reas cheias representam as res postas reforadas. Antes do reforo, em A, ocorrem mais respos tas nas posies mais baixas do que nas posies mais altas, ao longo da fenda. Em B, so reforadas as respostas da posio 7 para cima; o limite inferior de respostas reforadas mostrado pela linha tracejada vertical. Depois que esse reforo diferencial tem algum efeito, o critrio de posio mudado para 9, em C. Mais tarde, o critrio passa para a posio 11, em D e, finalmen te, para a posio 13, em E, quando a modelagem produz algu mas respostas na posio 15, a posio superior da fenda, o que no havia sido observado antes do reforo. Contudo, a distribui o de respostas mantidas neste ponto tem sua freqncia mxi ma na posio 12, logo abaixo da posio mnima requerida para reforo.

100

136

A . C h a r l e s C a ta n ia

produziro as conseqncias programadas para elas. Poderamos repetir os exemplos das Figu ras 7.1 e 7.2, substituindo a localizao da res posta por dimenses como fora da presso barra ou da bicada no disco. Esses exemplos ilus tram a seleo do comportamento por suas coseqncias. Ao longo da vida de um organismo individual, a seleo de populaes de respostas anloga seleo de populaes de organis mos ao longo do tempo evolucionrio. Ambos os tipos de seleo envolvem classes criadas pelas contingncias (cf. Captulos 3 e 21).

CLASSES OPERANTES: FUNO VERSUS TOPOGRAFIA Vimos como classes de comportamento po dem ser criadas por meio de reforo diferencial. Parece, de incio, que essas classes so defini das por suas propriedades topogrficas (o que elas parecem). Mas no assim. Consideremos, mesmo que superficialmente, uma simples resposta como a presso barra pelo rato. O rato pode pres sionar a barra com sua pata esquerda ou com a direita ou com ambas as patas. Ele pode tambm pressionar a barra para baixo com o focinho ou pulando nela ou sentando sobre ela. Essas respos tas parecem bem diferentes umas das outras, mas todas elas contam como presses barra; todas so membros de uma mesma classe operante. Ape sar de suas diferenas, elas so membros daquela classe porque compartilham uma funo comum: todas produzem as mesmas conseqncias. Em outras palavras, os operantes so defini dos por suas funes e no por suas formas. O problema do comportamento autolesivo em crianas com atrasos no desenvolvimento ilus tra a importncia desta distino (p. ex., Iwata e col., 1990; 1994; Lovaas & Simmons, 1969; Wahler, 1975). Este comportamento pode incluir bater a cabea com fora, morder a prpria pele at sair sangue, colocar o dedo no espao entre o globo ocular e a cavidade ocular e muitas outras topografias. Esse um comportamento perigoso e as crianas que se engajam nele podem oca sionar danos permanentes para si mesmas. Consideremos trs crianas do sexo mascu lino que apresentam um comportamento autole sivo. Elas esto alojadas em um centro de trata

mento e passam o tempo batendo a cabea com fora e mordendo-se, de modo que no pode mos distinguir entre as crianas pela topografia de seus comportamentos. Contudo, descobrimos que a primeira criana aumenta esse comporta mento quando as pessoas esto por perto, mas no prestam ateno nela; a segunda criana au menta o comportamento autolesivo quando os outros pedem a ela que complete alguma tarefa (p. ex., leitura ou aritmtica simples); e a tercei ra apresenta o comportamento independentemen te do contexto social. Para esses trs meninos, os comportamentos autolesivos so muito simi lares em topografia, mas suas funes so com pletamente diferentes. Para a primeira criana o comportamento de autoleso chama a ateno; para a segunda, ele evita ter que obedecer a exigncias; e para a terceira, o comportamento no parece de pender de qualquer contingncia do meio. Tais anlises recomendam programas de tra tamento muito diferentes para cada menino. Ao primeiro devem ser ensinadas outras formas mais efetivas de conseguir a ateno dos outros, e ele deve ser colocado em situaes onde ser me nos privado de ateno. As tarefas selecionadas para a segunda criana devem ser apropriadas para sua competncia e seu sucesso nestas tare fas deve ser reforado (seu comportamento su gere que foi freqentemente punido no passa do). A fonte do comportamento autolesivo da terceira criana desconhecida, e devemos considerar a possibilidade de que ele tenha alguma fonte orgnica (talvez a criana tenha nascido de uma me usuria de drogas e te nha sofrido danos no desenvolvimento cere bral pr-natal). O fato que mais importante definir as clas ses de comportamentos por suas conseqncias do que por suas topografias. Embora o compor tamento autolesivo seja parecido para as trs crianas, a ateno produzida pelo comportamen to da primeira criana o distingue do comporta mento de esquiva da segunda criana; algum as pecto de auto-estimulao pode estar envolvido no comportamento da terceira criana, mas infe lizmente no sabemos o bastante sobre tais ca sos. Vamos agora nos concentrar na primeira criana. Suponhamos que tentssemos extinguir o comportamento autolesivo, ignorando-o. Em
A
p r e n d iz a g e m

137

primeiro lugar, poderamos ter problemas para faz-lo, porque no podemos tolerar os danos que a criana pode provocar em si mesma. Contudo, se formos persistentes, poderemos descobrir que o comportamento autolesivo no diminui. Uma possibilidade que no tenhamos identificado adequadamente a classe de comportamentos re levante. A topografia novamente nos enganou. Se a funo deste comportamento chamar a ateno, ele provavelmente parte de uma clas se de comportamentos muito maior, que inclui gritaria e fazer diabruras, bater ou at agredir os atendentes no centro de tratamento, e um grande nmero de outras respostas que devem funcio nar para conseguir ateno. Isso nos diz o quan to a ateno importante para esta criana. Isso tambm nos lembra que no podemos definir as classes de respostas pela sua aparncia. Neste caso, devemos definir um programa de tratamen to que use ateno para reforar comportamen tos efetivos e apropriados. Tanto a criana como os seus atendentes sero beneficiados se o pro grama tiver sucesso. O comportamento autolesivo era uma classe de comportamentos embutida em uma classe maior de comportamentos de chamar a ateno (cf. Lalli e col., 1995). A classe maior foi esta belecida como classe por causa das conseqn cias comuns dos seus membros, assim como as vrias topografias de presso barra (pata direi ta ou esquerda, ambas as patas, sentar na barra) passaram a fazer parte de uma mesma classe pela conseqncia comum de produzir comida. As conseqncias comuns so o elo que une as clas ses de comportamentos (cf. Malone, 1990, p. 296). Alm disso, quando uma classe de respos tas parece insensvel s suas conseqncias, como quando o comportamento autolesivo da primeira criana parecia no se extinguir, deve mos considerar a possibilidade de que tenhamos definido mal a classe e de que ela seja parte de uma classe maior, de modo que os outros membros desta classe mais ampla continuam a ter as conseqncias que, antes, comparti lhavam com a subclasse que estamos focali zando (p. ex., o comportamento de chamar a ateno do presente exemplo; cf. Captulo 9, sobre as classes de comportamento de ordem superior).

Seo C

A Estrutura Operante

Vimos que o responder pode variar no so mente quanto ao local ou fora, mas tambm quanto topografia ou forma, direo e assim por diante. O reforo diferencial pode ser basea do em qualquer dimenso de resposta, de modo que qualquer dimenso ou combinao de dimen ses pode fornecer as propriedades definidoras de uma classe operante. Vamos explorar agora a diferenciao de classes operantes ao longo das dimenses que tem sido objeto de temas teri cos significativos na histria da Psicologia da Aprendizagem. Nossos exemplos incluem a or ganizao temporal do comportamento, seu pa dro seqencial e a novidade e a variabilidade comportamental.

REFORO DIFERENCIAL DA ORGANIZAO TEMPORAL As propriedades temporais do responder in cluem a latncia, a durao e o ritmo. Quaisquer dessas propriedades podem servir de base para o reforo diferencial. Por exemplo, em um pro cedimento que reforce diferencialmente longas latncias, as bicadas de um pombo em um disco iluminado podem ser reforadas com alimento somente se um intervalo mnimo de tempo tiver transcorrido desde a iluminao do disco. Quan do a latncia-critrio menor do que 10 segun dos, a latncia-mdia do pombo geralmente ex cede o critrio e h mais respostas reforadas do que no-reforadas, mas medida que o critrio de latncia se toma mais longo, menos respostas tm latncias longas o suficiente para preenche rem o requisito para reforo, e propores me nores de bicadas so reforadas (a tendncia do responder a ultrapassar o critrio para reforo nas duraes mais curtas e a ficar abaixo dele nas duraes mais longas uma caracterstica comum a inmeros desempenhos gerados pelo reforo diferencial de propriedades temporais do comportamento, tanto em humanos como em infra-humanos: Catania, 1970). A diferenciao de propriedades temporais do comportamento relevante para os esquemas

138

A . C h a r l e s C a ta nia

de reforo, tratados em detalhe no Captulo 10. Veremos que quantidades substanciais de com portamento podem ser mantidas, mesmo quan do as respostas produzem o reforador apenas ocasionalmente. Nos esquemas de reforo, as respostas podem ser elegveis para reforo com base no nmero de respostas j emitidas, no tem po transcorrido desde algum evento ou em algu ma combinao dessas condies. Uma proprie dade de particular interesse a separao de res postas no tempo. Por exemplo, um motorista pode ter xito em ligar um carro afogado apenas se esperar o sufi ciente depois da ltima tentativa de lig-lo; de modo inverso, algum pode conseguir encher o pneu de uma bicicleta, com uma bomba defei tuosa, que vaza ar, apenas se bombear bem rapi damente. De maneira anloga, o reforo pode ser programado para uma bicada de um pombo so mente se aquela bicada tiver sido precedida por 10 segundos sem nenhuma outra bicada, ou so mente se o bicar tiver sido emitido to rapida mente que ao menos 20 bicadas tenham ocorri do nos ltimos 5 segundos. No primeiro caso, o bicar diminui de freqncia, no segundo ele au menta. Contudo, se focalizamos apenas o bicar, so mos levados a dizer que o primeiro caso no era uma instncia de reforo. De fato, a unidade do responder reforada no primeiro caso no era uma bicada e sim uma seqncia, incluindo uma pausa mais uma bicada. Na medida em que essa combinao toma-se mais provvel (demonstran do assim o efeito dos reforadores sobre a classe de respostas que os produziu), a taxa de bicar necessariamente diminui. O procedimento no primeiro exemplo, no qual uma resposta reforada somente se for precedida por um tempo mnimo sem uma res posta, denominado reforo diferencial de taxa baixa ou esquema DRL (Ferster & Skinner, 1957); o procedimento denominado, tambm, esquema de tempo entre respostas ou reforo de IRTs (Mallot & Cumming, 1964), porque o re foro baseado no espaamento temporal de res postas individuais, e no na taxa mdia gerada por muitas respostas que ocorrem ao longo de um perodo extenso de tempo. Em geral, quanto mais longo o tempo entre as respostas ou o IRT requerido para reforo, mais baixa a taxa do res

ponder. No desempenho em DRL a taxa do res ponder diminui, porque a probabilidade de res postas precedidas por pausas longas (IRTs lon gos) aumenta. Assim, no responder em DRL, o IRT deve ser considerado um componente de um operante complexo, consistindo de um IRT mais uma resposta, nesta ordem. No segundo exemplo, em que o reforo de pende da emisso de 20 ou mais bicadas em no mais que 5 segundos, o responder pode aumen tar, mas apenas porque a taxa alta de respostas foi reforada diferencialmente. Tal esquema denominado reforo diferencial de taxa alta ou esquema DRH. O esquema DRH tem recebido menor ateno do que o DRL, simplesmente porque mais difcil de trabalhar com esquemas DRH do que com DRL. Considere um pombo cuja bicada tenha tido a taxa aumentada para mais do que 4 respostas por segundo, por um esque ma DRH que requeira 20 bicadas em 5 segun dos. (De fato, um experimentador habilidoso pode, aumentando gradualmente o critrio, pro duzir rotineiramente taxas que excedam 10 bi cadas por segundo, em pombos.) Enquanto o pombo mantiver esta taxa, as bicadas produzi ro reforadores freqentemente. Mas, se, por alguma razo, o pombo reduz a velocidade do responder, bicando a uma taxa que atinge o cri trio de reforo menos freqentemente, as bica das produziro reforadores menos freqentes. Isso, por sua vez, reduz ainda mais a taxa de bi cadas, o que leva, novamente, a um decrscimo na freqncia de reforadores. Esse crculo vi cioso pode terminar em uma taxa de respostas to baixa que o critrio para reforo nunca atingido, e as bicadas do pombo podem cessar completamente. Para reinstalar o responder, o ex perimentador ter que estabelecer novamente o desempenho de taxa alta por meio de modelagem. No esquema de DRL, no entanto, um efeito inicial dos reforadores que seguem as bicadas que as bicadas ocorrem mais freqentemente. Essa taxa mais alta de bicadas significa que elas ocorrem mais prximas no tempo e, ento, me nos IRTs so longos o bastante para atingir o cri trio de reforo. Assim, a apresentao de refor adores diminui, e a taxa de resposta, por sua vez, tambm diminui. Mas esse decrscimo na taxa simplesmente toma os IRTs longos o bas tante para atingirem com maior probabilidade o
A
p r e n d iz a g e m

139

critrio de reforo. Assim, o bicar oscila entre taxas altas acompanhadas por decrscimo no re foro e taxas reduzidas acompanhadas por au mento no reforo. O bicar pode ser mantido, por essas contingncias, por extensos perodos de tempo. Estes exemplos indicam que devemos ser cautelosos quando tomamos a taxa de respostas como uma medida fundamental dos efeitos do reforo. A taxa de respostas j chegou a ser con siderada uma medida fundamental dos efeitos do reforo (cf. fora do reflexo, no Captulo 4; Nevin, 1992), mas, com o reconhecimento de que a taxa era apenas uma propriedade do comporta mento que poderia ser diferenciada, como ou tras propriedades tais como fora e topografia, essa noo se tomou menos defensvel. Embora o responder sob DRL ocorra a uma taxa baixa, o responder facilmente estabelecido e sustenta do; e embora o responder sob DRH ocorra a uma taxa alta, ele difcil de se estabelecer e frgil, quando estabelecido. Existem vrias outras classes de esquemas de reforo diferencial, como o reforo diferencial de responder espaado , que estabelece limites tanto inferiores quanto superiores para os IRTs que precedem uma resposta reforada e que ten de a gerar uma taxa de respostas razoavelmente constante. O reforo diferencial de outro com portamento (geralmente abreviado como DRO e ocasionalmente chamado de reforo diferen cial de comportamento zero) apresenta um re forador na condio de que decorra um tempo definido sem uma resposta especificada. Este , de fato, o nome tcnico para o procedimento geralmente usado para programar o reforo para um responder alternativo, durante a extino de um comportamento, em situaes de aplicao (cf. o exemplo do comportamento autolesivo, no fim da sesso A, Captulo 5). Consideremos, por exemplo, um esquema de DRO de 10 segundos programado para as bica das de um pombo. Esse esquema refora a clas se de todas as respostas que consistam em 10 segundos sem bicar. Mas, se um reforador apresentado depois de cada 10 segundos sem uma bicada, ento, cada resposta deve atrasar o re foro por, pelo menos, 10 segundos. Se as bica das ocorrerem menos freqentemente, j que im pedem ou adiam o reforo, seria apropriado di
140 A . C h a r l e s C a ta nia

zer que elas so punidas negativamente. Nesse caso, assim como no caso de distinguir entre o reforo positivo do no-responder e a punio negativa do responder, seria prefervel falar de respostas especficas, em vez de falar de sua au sncia. Mas a terminologia do DRO est bemestabelecida e, embora potencialmente proble mtica, pelo menos especifica um procedimen to, em vez de atribuir propriedades funcionais a eventos como o no-responder.

COMPORTAMENTO COMPLEXO: A APRENDIZAGEM EM LABIRINTO A maioria de nossos exemplos at agora en volveu unidades de respostas relativamente dis cretas, como pressionar a barra, para ratos, e bi car discos, para pombos. Mas nossa anlise da diferenciao indica que as seqncias comple xas de respostas tambm podem ser tratadas como classes operantes. Por exemplo, o percur so de um rato em um labirinto pode ser conside rado uma resposta nica, mas muito complexa. Consideremos o labirinto mais simples, o labi rinto em T (C, na Figura 5.2). Se a caixa-alvo esquerda est vazia, e a caixa-alvo direita con tm alimento, a seqncia de respostas que in clui correr da caixa de sada at o ponto de esco lha, virar direita e, ento, correr caixa-alvo da direita ser reforada. As seqncias que in cluam virar esquerda no sero reforadas ou, pelo menos, no levaro ao reforador to rapi damente (se o rato tiver oportunidade de refazer o caminho da caixa-alvo esquerda para a caixaalvo direita). A medida que o rato comea a es colher mais e mais freqentemente a trilha da direita, podemos dizer que esse desempenho no labirinto em T tomou-se diferenciado. Mas a aprendizagem em labirinto pode en volver seqncias mais complexas. Considere mos a seqncia de respostas no problema de alternao dupla (p. ex., Hunter, 1928). Ao fi nal de uma pista central, um ponto de escolha fornece a oportunidade para uma virada esquer da (E) ou direita (D), mas ambas as trilhas le vam de volta outra extremidade do labirinto. Sem ser removido do aparato, o organismo pode retomar ao ponto central do labirinto e, ento, novamente no ponto de escolha, escolher virar

esquerda ou direita. Se ele completa uma srie de viradas esquerda e direita na ordem apro priada, o alimento apresentado quando ele re torna ao corredor central do labirinto. Nesses equipamentos, a questo era saber se os organismos poderiam aprender uma seqn cia de dupla alternao, EEDD ou DDEE. A se qncia era aprendida com diferentes graus de xito, por espcies diferentes e por organismos diferentes da mesma espcie, mas a questo mais geral era se o comportamento do organismo, em um certo momento, poderia determinar seu com portamento em um momento posterior. Um or ganismo no poderia completar, com sucesso, uma seqncia de alternao dupla, a menos que seu comportamento no ponto de escolha levasse em conta, de alguma maneira, as viradas que ele havia feito nas vezes anteriores (no Captulo 14 verificaremos que a discriminao das caracte rsticas do prprio comportamento crtica para alguns aspectos da linguagem). Uma diferena fundamental entre este e os exemplos prvios de diferenciao est na espe cificao da classe de respostas. Em uma escala linear, a posio, a fora ou a durao so di menses nicas, ao longo das quais as respostas podem ser localizadas, mas seqncias de res postas em aprendizagem de alternao dupla no podem ser ordenadas sem ambigidades ao lon go de uma dimenso nica. Por exemplo, a se qncia EEED contm uma nica transio de E a D, e a seqncia EDED contm tantos Es quanto Ds, mas ento, qual delas est mais es treitamente relacionada seqncia reforada EEDD? Outra questo se devemos tratar uma seqncia de alternaes como uma unidade nica de comportamento ou subdividi-la em com ponentes menores. Por exemplo, se h mais al ternaes direita do que esquerda na apren dizagem de seqncia EEDD, porque somente D seguida imediatamente por um reforador; viradas individuais deveriam ser tratadas como unidades em vez de seqncias inteiras? medida que um organismo aprende uma seqncia de respostas nesta tarefa e em outras relacionadas, o reforo diferencial age sobre o comportamento que o organismo traz para o ex perimento. Esse comportamento geralmente sistemtico. Por exemplo, um rato que esteja aprendendo a correr em um labirinto pela pri

meira vez pode sempre virar esquerda, depois mais tarde, virar sempre direita, depois, mais tarde, ainda alternar entre direita e esquerda e assim por diante, at que os vrios componentes do labirinto sejam dominados. Em uma platafor ma de saltos de Lashley com luz e escuro como estmulos, em que as escolhas do estmulo escu ro levam ao alimento, e a luz e o escuro, muda de lado irregularmente, um rato poderia, primei ramente, escolher com mais freqncia o est mulo luz, depois escolher com mais freqncia o estmulo da esquerda, e depois escolher, prin cipalmente, o estmulo da direita, at que final mente comeasse a escolher consistentemente so mente o lado escuro. Esses padres sistemticos foram notados por Krechevsky (1932), que os denominou de hipteses e discutiu suas implica es como segue:
Quase toda descrio de aprendizagem animal apre senta frases tais como movimentos exploratrios aleatrios; entradas ao acaso; erros ao acaso. E implicitamente suposto ou explicitamente afirma do, na maioria das descries de aprendizagem, que no incio do processo o animal um animal ao aca so. Suas respostas no tm propsito, forma nem significado. Ensaio e erro desordenado parecem ser a regra no incio e depois que o comportamento te nha levado o animal a experimentar, finalmente, o padro correto, as vrias leis da aprendizagem operam para fixar (stamp in) as respostas corretas e apagar (stamp out) as incorretas. (Krechevsky, 1932, p. 157)

Baseado nesses dados, Krechevsky contras tou esta noo com uma diferena, de acordo com a qual o animal
traz para cada nova situao uma histria completa de experincias. Ele est pronto para usar essas ex perincias. Desde o primeiro momento, o animal talvez comece a resolver seu problema de uma ma neira direta, compreensiva de seu comportamento total. Ao executar uma srie de movimentos que denominamos perfeito, sem erro, aprendido, integrado, o animal no est fazendo algo que te nha emergido de uma srie de respostas imperfei tas, no integradas, ao acaso. Ele est agora meramente desempenhando um conjunto diferente de respostas integradas, srie esta que foi precedida por outra srie de respostas to integrada quanto aquela. Tais respostas, falsas solues, tentati vas sistemticas iniciais etc. so rotuladas com o nome dbio de hipteses...Quando um indivduo humano se comporta exatamente da mesma maneiA
p r e n d iz a g e m

141

ra, tambm podemos dizer que ele tem uma hip tese. No entanto, estamos primordialmente interes sados no em defender nossa terminologia, mas em descrever certo comportamento. O termo hipte se foi escolhido meramente como um rtulo con veniente para esse comportamento. (Krechevsky, 1932, pp. 528-529)

SEQNCIAS DE RESPOSTAS: ENCADEAMENTO VERSUS UNIDADES TEMPORALMENTE ESTENDIDAS Quando quebramos uma seqncia de com portamento em seus componentes, podemos co mear a tratar a seqncia como uma sucesso de operantes diferentes, cada um definido pela conseqncia reforadora de produzir uma opor tunidade de emitir o prximo, at que a seqn cia seja terminada por um reforador. Esse tipo de seqncia denominado uma cadeia de res postas. Um exemplo de cadeia foi apresentado no Captulo 5, pela anlise detalhada, feita por Sidman, da presso barra de um rato reforada com alimento. Erguer-se at a barra produzia contato com ela, o que estabelecia a ocasio para pression-la, o que produzia a viso do alimen to, o que estabelecia a ocasio para se aproxi mar do comedouro, e assim por diante. Qualquer segmento da seqncia serve dupla funo de reforar a ltima resposta e de produzir as con dies que ocasionam a resposta seguinte. Um estmulo discriminativo que exerce tal funo re foradora denominado um reforador condici onado (alguns experimentos sobre reforo condi cionado so tratados no Captulo 11). Algumas seqncias de comportamento po dem ser reduzidas a unidades menores e, dessa forma, a anlise dos componentes pode ser con firmada experimentalmente, verificando-se o quanto os componentes so independentes uns dos outros ( Skinner, 1934). Por exemplo, se pres sionar a barra no produz mais alimento, o pres sionar a barra pode diminuir de freqncia, mas podemos verificar tambm, apresentando alimen to independentemente do comportamento, que a viso da pelota continua a ocasionar o movimen to para o comedouro. Esse procedimento de monstra que a integridade de um componente no

afetada pela alterao das contingncias de re foro para outro. Algumas seqncias, no entanto, apresentam problemas diferentes. Por exemplo, em uma s rie de experimentos (Straub e col., 1979), quatrc discos em uma cmara de pombos eram ilumi nados com as cores verde, branco, vermelho e azul, com a localizao de cada cor variando de tentativa a tentativa. Se o pombo bicasse os dis cos verde, branco, vermelho e azul, nesta ordem, a bicada final no disco azul produzia alimento; se ele bicasse os discos fora de ordem, a tentati va era cancelada. O pombo aprendeu a bicar o branco depois do verde, o vermelho depois do branco e o azul depois do vermelho, mesmo quando a localizao das cores mudava a cada tentativa e mesmo que bicadas sucessivas na se qncia no produzissem mudana de estmulo. Alm disso, as bicadas tendiam a ocorrer con forme a seqncia reforada, mesmo se uma das cores estivesse ausente (p. ex., depois de bicar o branco, bicar o azul e no o verde, se o verme lho estivesse faltando). Como no problema de alternao dupla na aprendizagem em labirinto, a presente resposta na seqncia deve depender do comportamento passado do organismo. A mesma questo surge sempre que um organismo aprende uma seqncia arbitrria em que respos tas no so acompanhadas de mudanas de est mulos (p. ex., Boren & Devine, 1968). Pode o prprio comportamento do organismo prover os estmulos discriminativos que ocasionaro o comportamento futuro? A questo crtica, porm, no tanto se al gumas seqncias de comportamento so man tidas interligadas desta maneira; , antes, se essa a nica base para o desenvolvimento de se qncias de comportamento. Na histria da Psi cologia da Aprendizagem, as posies defendi das em relao a essa questo eram freqente mente sintomas de srias divises entre pesqui sadores de orientaes diferentes, alguns susten tando que o comportamento seqencial sempre poderia ser interpretado com base em uma concatenao de componentes (denominados, de for ma variada, associaes, cadeias, ligaes, estmulo-resposta ou reflexos condicionados), e ou tros afirmando que comportamento seqencial no poderia ser interpretado adequadamente em

142

A . C h a r l e s C a tania

tais termos. Nossa concluso a de que possvel o comportamento seqencial de ambos os tipos; a questo experimental relevante, em qualquer caso, determinar a natureza da ordenao seqencial. Talvez o argumento mais veemente seja o apresentado por Lashley (1951), que resumiu as concepes precedentes da seguinte maneira:
...a nica teoria estritamente fisiolgica que foi ex plicitamente formulada para explicar a integrao temporal a que postula cadeias de reflexos, nas quais o desempenho de cada elemento da srie for nece a excitao para o seguinte. Essa concepo est na base das teorias motoras do pensamento que...tentavam identificar o pensamento com movi mentos inaudveis de rgos vocais, ligados em ca deias associativas. Os...impulsos cinticos de cada movimento servem como um estmulo nico para o prximo da srie. (Lashley, 1951, p. 114)

Os golpes digitais de um msico podem tocar o te clado at 16 vezes por segundo em passagens que demandam uma ordem definida e mutvel de movi mentos sucessivos dos dedos. A sucesso de movi mentos rpida demais, at mesmo para o tempo de reao visual. Em uma leitura visual rpida im possvel ler as notas individuais de um arpejo. As notas devem ser lidas em grupos...O controle sen sorial dos movimentos parece estar descartado em atos como estes. (Lashley, 1951, p. 123)

Lashley, ento, descreveu casos, incluindo ilus traes tanto de linguagem como de msica, que tomavam estas explicaes pouco plausveis. Por exemplo, em resposta ao argumento de que cada movimento serve como um estmulo nico para o prximo, Lashley considerou a seqncia comple xa de movimentos requerida para pronunciar o som da palavra right na ordem correta. A ordem no dada pelos prprios sons, porque os sons podem ocorrer em uma variedade de ordens e combina es (p. ex., na ordem oposta como em tire). As sim, a seqncia de sons no pode ser baseada so mente em conexes diretas, mas deve depender de alguma organizao mais ampla. Lashley ex pandiu o caso de seqncias de sons em palavras, para seqncias de palavras em sentenas:
A palavra right, por exemplo, um substantivo, ad jetivo, um advrbio e um verbo e tem quatro modos de soletrar e, pelo menos, dez significados. Em uma sentena como The millwrght on my right thinks it right that some conventional rite should symbolize the right o f every man to write as he pleases", o arranjo de palavras , obviamente, devido no a quaisquer associaes diretas da palavra right em si com outras palavras, mas aos significados que so determinados por algumas relaes mais amplas. (Lashley, 1951, pp. 115-116)

O argumento de Lashley era que certos pa dres seqenciais de responder no podem ser reduzidos a uma sucesso de unidades estmulo-resposta ou S-R. Quando um datilografo efi ciente tecla rapidamente as letras the, essas le tras no podem ser estmulos dicriminativos para o prximo toque, primeiro porque o datilografo estar executando o prximo toque antes mes mo que as letras impressas na pgina possam ter qualquer efeito como estmulo e, segundo, porque elas no podem ser um estmulo discriminativo ni co, se elas podem ocasionar o teclar a barra de es pao ou qualquer outra tecla, dependendo do que o datilografo esteja datilografando (p. ex., a pala vra the, these, then ou thennometer). O problema histrico foi que, diante de tais argumentos, os pesquisadores provavelmente sentiram-se forados a escolher entre aceitar o pressuposto de que o comportamento seqencial dependia de seqncias estmulo-resposta ou supor que ele dependia de unidades de compor tamento temporalmente estendidas, no redut veis a tais seqncias. Mas a questo pode ser considerada, claramente, como uma questo ex perimental. Certamente algumas seqncias po dem ser compostas de tal modo que cada res posta produz condies para a prxima respos ta, enquanto outras devem ser integradas de tal modo que as respostas aparecem na ordem apro priada, sem que cada uma dependa das conse qncias da anterior. Para qualquer seqncia de comportamento em particular, a questo deci dir que tipo de seqncia aquela.

E Lashley usou a msica para ressaltar que a mera rapidez de algumas seqncias limitam o modo como as seqncias podem ter sido gera das:

CLASSES OPERANTES E COMPORTAMENTO NOVO A estreita correspondncia entre uma classe de respostas com conseqncias e uma classe de
A 143

p r e n d iz a g e m

respostas geradas por essas conseqncias o critrio para se falar em uma classe operante. Como vimos, essas classes podem ser definidas ao longo de dimenses simples como fora ou localizao, ou podem ter propriedades mais complexas. Nossos exemplos incluram esque mas de reforo diferencial, labirintos e seqn cias de respostas integradas. Em cada caso, nosso interesse principal est nas dimenses ao longo das quais o responder se conforma classe de respostas que refora da. A estrutura do comportamento tal que nem sempre podemos definir tais dimenses indepen dentemente das contingncias de reforo. Por exemplo, considere o reforo de respostas no vas em golfinhos (Pryor, Haag, & O Reilly, 1969). Os desempenhos novos foram modela dos reforando-se, a cada sesso, alguma classe de respostas no-reforada em qualquer sesso prvia. Por exemplo, se saltar para trs fosse re forada em uma sesso, bater na gua com a cau da poderia ser reforada na prxima sesso e pular na borda da piscina em outra sesso. De pois de algumas sesses, a cada nova sesso o golfinho comeava a emitir respostas que o ex perimentador nunca tinha visto antes, como sal tar para fora da gua com um giro em espiral. A novidade das respostas foi diferenciada, mas como esta classe operante pode ser especifica da, exceto pela descrio do critrio de reforo? O fato de que temos dificuldade em medir a ori ginalidade ou outras dimenses complexas do comportamento no as elimina como proprieda des que possam definir as classes operantes. Um comportamento novo deve ser emitido, antes que possa ser incorporado em outro comportamento. Mesmo a variabilidade do responder pode ser tomada como base para o reforo diferencial

(Neuringer, 1986; Page & Neuringer, 1985). Mas o reforo diferencial da novidade (originalida de) ou da variabilidade suscita algumas questes. Os reforos so produzidos por respostas indi viduais, contudo as propriedades como a novi dade e a variabilidade no podem ser proprieda des de respostas individuais. Elas somente po dem ser propriedades de respostas no contexto de outras respostas que ocorreram antes. Uma resposta em particular pode ser varivel no con texto de uma seqncia de respostas passadas e estereotipada no contexto de outra. Assim, o fato de que a novidade (originalidade) e a variabili dade podem ser diferencialmente reforadas sig nifica que os organismos so sensveis a popu laes de respostas e de conseqncias ao longo de extensos perodos de tempo, e no meramen te a seqncias individuais resposta-estmulo (cf. Captulo 6, sobre anlises molares e molecula res). Retornaremos a estas questes de classes de comportamento mais tarde, especialmente em conexo com o comportamento verbal, quando trataremos da descoberta de que algumas estru turas gramaticais so mais facilmente aprendi das do que outras, do mesmo modo que trata mos a descoberta de que os ratos aprendem as seqncias de alternao simples (EDED) mais facilmente do que as seqncias de alternao dupla (EEDD). Em cada caso, o problema iden tificar a dimenso por meio da qual o responder pode passar a se conformar classe de respostas que tem conseqncias. Algumas vezes essas di menses talvez possam ser especificadas somen te por uma descrio verbal (p. ex., a classe de todas as respostas no-reforadas em ocasies prvias, como no reforo das respostas novas do golfinho).

144

A . C h a r l e s C a ta n ia

Operantes Discriminados: Controle de Estmulo

A. A Natureza dos Operantes Discriminados Atentar para as Propriedades dos Estmulos Aprendizagem de Lugar versus Aprendizagem de Resposta Gradientes de Controle de Estmulo Gradientes de Generalizao Gradientes de Ps-Discriminao Gradientes de Inibio Esvanecimento ( Fading ): Controle de Estmulo por Aproximaes Sucessivas A Terminologia do Reforo Diferencial B. Cognio Animal Mapas Cognitivos Conceitos Naturais e Classes de Estmulo Probabilsticas Definio de Classes de Estmulos

indo-europeu deuk- (conduzir), a duke (duque), adduction (aduo), educate (educar) e conduct (conduta). A palavra discrimination, do latim dis apart (separado) mais crimen, judgm ent (julga mento), est relacionada, por meio do indo-eu ropeu skeri- a cortar ou separar, a crime, descri be (descrever) e criterion (critrio). E a palavra generalization (generalizao), do latim genere (produzir ou causar), est relacionada, por meio do indo-europeu gen- to give birth or beget (ge rar ou partejar), a ingenious (engenhoso), kind (tipo) e nat-ure (natureza).

As palavras latinas habere, to have (ter) e capere, to take ou size (tomar ou captar) reportam-se a razes indo-europias, intimamente ligadas. Habere um antecessor das palavras inglesas behavior (compor tamento), habit (hbito) e inhibit (inibir). Capere le vou a concept (conceito) e perception (percepo), palavras relevantes para classes de estmulo; assim, essas palavras e behavior so parentes distantes. No h elos bvios entre differentiation (dife renciao) e induction (induo), aplicadas a clas ses de resposta, e discrimination (discriminao) e generalization (generalizao), aplicadas a classes de estmulo. A palavra differentiation (diferencia o), do latim dis- (separado, distante) mais ferre (carregar), est relacionada, por meio do indo-euroeubher- (carregar ou sustentar), abirth (nascimen to), transfer (transferncia), preference (preferncia) e metaphor (metfora), mas no &interfere (interfe rir). A palavra induction (induo), do latim in-(em) mais ducere (conduzir), est relacionada, atravs do

Estudamos o reforo com base nas dimen ses das respostas, mas o reforo diferencial tam bm pode ocorrer com base nas dimenses do estmulo em cuja presena as respostas ocorrem. Por exemplo, as presses barra por um rato em presena da luz so diferentes de suas presses no escuro, e o reforo pode ser programado para presses barra na presena, mas no na ausn cia de luz. Do mesmo modo, as bicadas de um pombo no disco durante a luz verde so diferen tes das bicadas em presena da luz vermelha. Quando o responder reforado apenas na pre sena de alguns estmulos, dizemos que o refor o correlacionado com aquele estmulo. Uma classe de resposta criada por este reforo dife rencial em relao s propriedades do estmulo chamada de operante discriminado. Os operantes discriminados so um trao di fuso do comportamento. Ao dirigir um carro, avanamos por um cruzamento se o semforo estiver verde, mas no se ele estiver vermelho. Ao falar com algum, o que dizemos afetado pelo que a outra pessoa diz, por sua postura e

expresso facial, pela situao em que ocorre a conversa, e assim por diante. Muitos exemplos prvios de reforo incluram o controle discri minativo do responder. Ao discutir a aprendiza gem dos ratos em labirinto, enfatizamos o au mento de escolhas de viradas corretas, mas o rato que no discriminasse o local apropriado para virar direita ou esquerda poderia chocar-se repetidamente contra as paredes, medida que se locomovia pelo labirinto, e dificilmente iria aprender o labirinto como um todo. De fato, bem provvel que no exista uma classe operante sem estmulos discriminativos. As bicadas de um pombo no podem ser emiti das na ausncia de um disco, e as presses bar ra por um rato no podem ser emitidas na ausn cia de uma barra. As caractersticas que perma necem relativamente constantes ao longo de um experimento, como a prpria cmara e os demais dispositivos que ela contm, s vezes, so refe ridos como estmulos contextuais. Em geral, es tamos mais interessados nos estmulos que mu dam dentro das sesses experimentais, mas te mos que lembrar que o ambiente dentro do qual um pombo ou um rato responde existe em um contexto mais amplo, que inclui o biotrio onde vive, as balanas em que pesado e outras ca ractersticas do laboratrio fora da cmara expe rimental (cf. Donahoe & Palmer, 1994). Os estmulos discriminativos correspondem aos estmulos coloquialmente denominados de sinais ou pistas. Eles no eliciam respostas. Mais precisamente, eles estabelecem a ocasio em que as respostas tm conseqncias, e diz-se que eles ocasionam as respostas (cf. proviso: Gibson, 1979). Um exemplo do desenvolvimento de con trole de estmulos, o controle do responder por um estmulo discriminativo, pode ser visto na Figura 8.1 (Herrick, Myers, & Korotkin, 1959). Os ratos pressionavam uma barra na presena e na ausncia de luz, programadas alternadamen te. Quando a luz estava acesa, as presses bar ra eram ocasionalmente reforadas com alimen to. Quando a luz estava apagada, as presses barra no eram reforadas. A notao para o es tmulo correlacionado ao reforo SD, para o estmulo discriminativo, ou S+, para o estmulo positivo; a notao para o estmulo correlacio nado com o no reforo ou extino SA , tam

bm para o estmulo discriminativo (A delta, a letra grega d), ou S', para o estmulo negativo (rigorosamente falando, S seria mais apropria do, pois nada removido em presena desse est mulo, mas S' o emprego mais comum). No procedimento da Figura 8.1, a luz e o es curo altemavam-se irregularmente; quando a lmpada estava acesa, ela permanecia ligada por perodos que variavam de 5 a 30 segundos. As presses barra eram reforadas de acordo com um esquema de reforo de intervalo varivel ou VI: em mdia, apenas uma presso barra a cada 30 segundos era reforada enquanto a luz estava acesa. As caractersticas importantes desse esque ma so que (1) ele mantm uma taxa de respostas moderada e relativamente constante e (2) os tem pos variveis entre os reforadores sucessivos tor nam o tempo a partir do ltimo reforador um preditor no fidedigno de quando a prxima resposta ser reforada. Com essa programao, as mudan as de estmulo e as apresentaes do reforo va riam assistematicamente ao longo do tempo, de modo que se o rato pressiona mais na luz, do que no escuro, podemos ficar confiantes de que o est mulo discriminativo funcional a luz, e no a re gularidade temporal daqueles outros eventos. Ao longo das sesses, o pressionar aumen tou durante a luz e diminuiu em sua ausncia. Este aumento freqentemente acompanha tais discriminaes (contraste comportamental: ver Captulo 10). A Figura 8.1 tambm mostra algu mas mudanas em um ndice de discriminao, o responder na presena da luz como porcenta gem do total de respostas. O ndice aumentou ao longo das sesses. Outras maneiras equivalen tes de se descrever esse resultado seriam dizer que pressionar a barra em presena da luz um operante discriminado ou que a luz funciona como um estmulo discriminativo para as pres ses barra, ou ainda que o pressionar a barra est sob controle do estmulo da luz.

Seo A

A Natureza dos Operantes Discriminados

Podemos ilustrar algumas caractersticas dos operantes discriminados com um exemplo hipo-

146

A . C h a r l e s C a ta n ia

FIGURA 8.1 Presses barra por um rato na presena e na ausncia de luz. A luz (SD) estava correlacionada ao reforo em inter valo varivel e sua ausncia (SA), extin o. O ndice de discriminao a porcen tagem do total de respostas emitidas na pre sena de luz (a taxa em SD dividida pela soma das taxas em SD e SA multiplicada por 100). Os dados so a mediana das taxas de oito ratos. (Herrick, Myers, & Korotkin, 1959, Figura 2)

ttico comparvel ao da Figura 7.1, no captulo anterior. Novamente temos um rato em uma c mara com uma fenda em uma parede, mas desta vez o rato no pode introduzir seu focinho na fenda. A fenda est coberta com plstico trans lcido, e uma srie de 15 lmpadas, por trs do plstico, pode iluminar os segmentos sucessivos da fenda. Em outras palavras, as lmpadas for necem uma dimenso de estmulo cujos compo nentes so anlogos queles da dimenso de res posta da Figura 7.1. Uma barra fica centralizada logo abaixo da fenda e acima de um comedouro. Agora acendemos as lmpadas por trs da fen da, uma por vez, em ordem irregular e registra mos as presses barra que ocorrem em presen a de cada lmpada. Se no reforarmos as pres ses barra, o responder ser infreqente e sem qualquer relao sistemtica com a regio da fen da que estiver iluminada. De fato, os dados po dem ser similares queles em A, na Figura 7.1, com a diferena de que o eixo X agora represen ta a posio do estmulo, e no a posio da res posta.

Neste ponto comeamos a reforar as pres ses barra apenas se a fenda estiver iluminada nas posies 9, 10, 11 ou 12; quando a luz apa rece em qualquer outra posio, no reforamos as presses. O efeito inicial do reforo bastan te semelhante quele em B, na Figura 7.1: o res ponder aumenta ao longo de todas as posies. Em outras palavras, o efeito do reforo no restrito apenas a estmulos em posies correla cionadas ao reforo; ele se dispersa para outras posies. A disperso do efeito do reforo na presena de um estmulo para outros estmulos no-correlacionados com o reforo denomina da generalizao. Neste exemplo, reforar o res ponder em presena de luzes nas posies 9 a 12 afetou o responder em presena no apenas da quelas luzes, mas tambm de luzes em todas as outras posies ao longo da fenda. Este exem plo difere essencialmente do anterior na dimen so correlacionada com o reforo: no Captulo 7, lidamos com uma dimenso de resposta, mas agora estamos lidando com uma dimenso de estmulo.

A p r e n d iz a g e m

147

Suponhamos que continuemos o reforo di ferencial com respeito localizao do estmu lo, reforando as respostas apenas quando ilu minamos as posies de 9 a 12. O responder au menta gradualmente quando essas posies es to iluminadas e diminui quando outras posies so iluminadas. Os efeitos so parecidos com aqueles da Figura 7.1 em C, D e E. Finalmente, a maior parte das respostas ocorre com as luzes nas posies correlacionadas com o reforo, como em E, e mesmo que algumas respostas ain da ocorram com as luzes em outras posies, pode-se alcanar um ponto em que a distribui o de respostas no muda muito com a conti nuao do reforo diferencial. Nesse exemplo, os estmulos que ocasiona ram o responder vieram a conformar-se estreita mente com a classe de estmulos correlacionada com o reforo. Esse processo denominado dis criminao e o responder sob tal controle de es tmulo denominado de comportamento discri minado. O reforo diferencial estabeleceu uma classe de respostas definida pelos estmulos em cuja presena elas ocorrem. E quanto s respos tas na presena de estmulos fora dos limites cor relacionados com o reforo (p. ex., posies 6,7 e 8, ou 13, 14 e 15)? De acordo com uma inter pretao estrita, elas no deveriam ser contadas como membros do operante discriminado; fala mos delas em termos de generalizao. Mas o reforo diferencial gerou respostas tanto dentro quanto fora desses limites; assim, elas so parte de uma distribuio contnua. A soluo a mesma que a do Captulo 7. Devemos reconhecer duas classes de estmulos: uma a classe correlacionada com uma contin gncia de reforo; a outra a classe em cuja pre sena o responder ocorre. No estamos interes sados em qualquer das classes em si, mas sim na correspondncia entre elas. Essa discusso acom panha de perto o que discutimos sobre a diferen ciao e a induo no Captulo 7. Isso apro priado, pois podemos considerar um estmulo em cuja presena uma resposta ocorre como uma outra propriedade daquela resposta, como sua fora, durao e topografia. Por que ento, nos referimos aos efeitos do reforo diferencial com respeito a propriedades da resposta em termos de diferenciao e induo, mas falamos de dis

criminao e generalizao quando nos referi mos aos efeitos anlogos do reforo diferencial com respeito a propriedades do estmulo? Um fator metodolgico pode ser crucial para essa distino. Quando estudamos o reforo di ferencial com respeito a propriedades da respos ta, registramos as respostas em diferentes clas ses, mas alm de programar as contingncias, no h muito mais que possamos fazer a respeito delas. Se vemos um rato prestes a introduzir seu focinho na posio 7 da fenda, no podemos im pedir que o rato emita aquela resposta naquele momento, mesmo que ele tenha respondido muito mais vezes naquela posio do que em qualquer outra. Suponhamos, porm, que esti vssemos trabalhando com propriedades do es tmulo. Poderamos escolher entre vrias ordens e freqncias relativas possveis para a apresen tao das luzes. Por exemplo, em vez de apre sentar luzes com a mesma freqncia em certas posies, poderamos apresent-las em certas posies, mas no em outras, de modo que o rato jamais tivesse uma oportunidade de pressionar a barra em presena de alguns estmulos. Essa a razo pela qual dizemos que, em procedimentos de discriminao, os estmulos estabelecem a ocasio para respostas: quando uma classe de respostas definida pela presena de um est mulo, as respostas nesta classe no podem ocor rer quando o estmulo est ausente. Mesmo essa distino metodolgica tem ex cees. Consideremos, por exemplo, o reforo diferencial de longos intervalos entre respostas (o esquema DRL: Captulo 7). Se as bicadas de um pombo forem reforadas somente depois de, pelo menos, 5 segundos sem bicar, o pombo pode comear a espaar suas bicadas cerca de 5 se gundos uma da outra. Discutimos esse compor tamento com base na diferenciao de um ope rante complexo, que consiste de uma pausa mais uma bicada. Poderamos, igualmente, tratar a du rao da pausa como uma propriedade de est mulo e argumentar que o comportamento deve ria ser considerado como uma discriminao ba seada no tempo transcorrido desde a ltima bi cada. De fato, neste caso, as terminologias so permutveis. Quando falamos de diferenciao e induo ou de discriminao e generalizao, a operao subjacente em cada caso o reforo

148

A . C h a r l e s C a ta nia

diferencial. Tanto a diferenciao como a discri minao envolvem correspondncias entre as di menses sobre as quais o reforo diferencial aplicado e as dimenses do comportamento re sultante. Apesar disso, vamos manter a distin o entre as terminologias de propriedades de resposta e propriedades de estmulo, porque elas tm uma fundamentao histrica extensa e am plamente aceita.

ATENTAR PARA AS PROPRIEDADES DOS ESTMULOS Ao discutirmos a correspondncia entre os estmulos com os quais as contingncias de re foro esto correlacionadas e os estmulos a que o organismo responde, falamos com base na di menso de estmulo selecionada pelo experimen tador. Mas os estmulos tm propriedades varia das e no h garantias de que o organismo v responder apenas quelas propriedades que se lecionamos. Na diferenciao, as presses barra por um rato podem ter uma forma relativamente constante, embora apenas a fora seja a base para o reforo diferencial. Por exemplo, o rato pode pressionar regularmente a barra com sua pata esquerda, embora essa propriedade no seja cr tica na determinao de se a resposta de pressio nar ser reforada. Do mesmo modo, na discri minao um rato pode responder com base na intensidade de um estmulo visual, embora o re foro diferencial seja baseado somente em sua forma; podemos dizer que o rato est atento intensidade. (As propriedades de estmulo s quais um organismo tende a responder discrimi nativamente so, s vezes, denominadas salien tes, mas a salincia no uma propriedade de um estmulo; uma propriedade do comportamen to do organismo com relao quele estmulo.) O conceito de ateno essencial em um tra tamento dos operantes discriminados, porque os organismos tendem a responder a algumas pro priedades de estmulos, e no a outras. Na medi da em que atentar para, ou prestar ateno a uma propriedade, ou a outra algo que os organis mos fazem, podemos trat-lo como um tipo de comportamento (ver Captulo 20). Uma razo im portante para tratar a ateno desta maneira que

o atentar (para) pode ter conseqncias. Por exemplo, se uma contingncia de reforo cor relacionada ao brilho de um estmulo visual, mas no com seu tamanho, far muita diferena se o organismo atenta para o brilho ou para o tama nho (e se atentar para o brilho ocorre mais fre qentemente devido s suas conseqncias, en to, apropriado falar sobre o atentar como um operante). Consideremos um pombo cujas bicadas ao disco sejam ocasionalmente reforadas com ali mento. Uma das duas combinaes de estmulo apresentada no disco: um tringulo sobre um fundo vermelho ou um crculo sobre um fundo verde. Cada um apresentado por 3 minutos. Depois de 3 minutos de tringulo-sobre-verme lho, a prxima bicada na presena deste estmu lo reforada; aps 3 minutos de crculo-sobreverde, o estmulo desligado sem reforo. Esta programao em presena de tringulo-sobrevermelho denominada esquema de reforo de intervalo fixo ou FI; a programao em presen a de crculo-sobre-verde de extino. Exami naremos o esquema de intervalo fixo no Captu lo 10. Por ora, suficiente observar que este es quema, geralmente, mantm um responder cuja taxa aumenta medida que o tempo passa du rante o intervalo, ao contrrio da taxa relativa mente constante mantida por um esquema de intervalo varivel. Se cada bicada em presena de tringulo-sobre-vermelho produzisse um reforador, ento, as apresentaes do reforador por si s poderiam adquirir funes discrimina tivas, mas com reforo em FI no temos que nos preocupar com tais efeitos, uma vez que nenhu ma bicada reforada at que o intervalo tenha terminado. A Figura 8.2 (Reynolds, 1961a) mostra da dos da aplicao desse procedimento com dois pombos. Os grficos esquerda mostram taxas de bicar durante cada combinao de estmulo ao final de 18 horas de treino. Ambos os pom bos estavam emitindo mais de 40 bicadas por minuto durante a presena do tringulo-sobrevermelho, mas bicavam em taxas relativamente baixas durante a do crculo-sobre-verde. Em um teste sem reforo, cada componente da combi nao era apresentado separadamente. Para o Pombo 105, quase todas as bicadas ocorreram

p r e n d iz a g e m

149

Treino

Teste de Ateno

80

40

O'
AR 80 OG

40

I A_
AR OG Estmulo

FIG U RA 8.2. Respostas de bicar de dois pombos durante o reforo correlacionado ao tringulo sobre vermelho e durante a extin o correlacionada ao crculo sobre verde ( esquerda, treinamento), e durante testes de extino, quando as cores (verm elho-R , verde=G) e as formas (A, O) foram apresen tadas separadamente ( direita, testes de ateno). O Pombo 105 estava respondendo forma, mas no cor; o Pombo 107 estava respondendo cor, mas no forma. (Rey nolds, 1961a, Figura 1)

na presena do tringulo; o vermelho, cor corre lacionada com o reforo, ocasionou poucas res postas a mais do que o crculo ou a cor verde, componentes previamente correlacionados com a extino. Para o Pombo 107, por outro lado, quase todas as bicadas ocorreram durante o ver melho; embora o tringulo tivesse sido correlacio nado com o reforo durante o treino, este estmulo ocasionou ainda menos bicadas do que o crculo ou o verde. O Pombo 105 estava prestando aten o forma, e no cor, e o Pombo 107 estava atentando cor, e no forma. A forma e a cor haviam sido correlacionadas com o reforo durante o treino. Somente ao examinar separadamente os efeitos dos componentes que foi possvel dizer quais eram suas funes discriminativas. O responder dos pombos nessa situao no era apenas um caso de generalizao. O respon der do Pombo 105 generalizou-se de tringulosobre-vermelho para tringulo sem vermelho, mas no para vermelho sem tringulo. Geralmen te falamos da ateno no como uma resposta a um estmulo particular, mas como a ateno a

alguma dimenso de estmulo (prestar ateno cuidadosamente significa ouvir tudo o que dito, e no apenas algumas partes do que dito). Di zemos que o Pombo 105 atentou forma e no cor, porque o responder discriminado ocorreu ao longo de mudanas na forma, mas no ao longo das mudanas na cor. Quando os estmulos so discriminados ao longo de uma dimenso de es tmulo, mas no de outra, dizemos que o orga nismo est prestando ateno primeira dimen so, mas no segunda. Uma vez que um organismo tenha atentado para algumas propriedades de estmulo em uma situao, ele tambm tender a atentar quelas propriedades em situaes novas (p. ex., Lawren ce, 1949). Podemos tambm alterar a probabili dade de que um organismo venha a atentar para uma ou outra propriedade de estmulo simples mente mudando a maneira como o reforo est correlacionado com essas propriedades (John son & Cumming, 1968). Na fase de treino da Figura 8.2, a forma e a cor estavam igualmente bem-correlacionadas com o reforo. Por essa ra-

150

A . C h a r l e s C a ta n ia

zo, o experimento foi particularmente apropri ado para demonstrar algumas das propriedades da ateno. Mas, se nosso interesse principal fosse a discriminao de forma pelo pombo, te ramos que tomar a cor irrelevante e correlacio nar as mudanas no reforo somente com mu danas na forma.

Aprendizagem de Lugar versus Aprendizagem de Resposta As questes precedentes esto relacionadas indiretamente a uma antiga controvrsia em Psi cologia, sobre a aprendizagem de lugar versus a aprendizagem de resposta (p. ex., Restle, 1957). A resposta de deslocar-se de um lugar para ou tro tem ocupado freqentemente uma posio privilegiada em anlises comportamentais (p. ex., Olton, 1979). Ir em busca de alimento no o mesmo que produzir alimento permanecendo no mesmo lugar. Uma diferena importante entre os dois casos que o ambiente muda mais dras ticamente quando nos deslocamos para um novo lugar do que quando introduzimos um novo es tmulo no lugar onde estamos. Os humanos em particular tm encontrado algumas maneiras de substituir a locomoo comum por outras res postas: para irmos a diferentes lugares pisamos em aceleradores, giramos volantes, apertamos bo tes de elevadores e subimos em escadas ou estei ras rolantes. Alm disso, o movimento produz mu danas contnuas no ambiente, enquanto as seqn cias de outras respostas podem no produzir qual quer mudana at que a seqncia esteja comple ta. Alm dessas diferenas, ento, ser que impor ta se um organismo se desloca at um novo lugar ou se produz estmulos novos onde est? Questes desse tipo estavam implcitas na controvrsia sobre a aprendizagem de lugar ver sus a aprendizagem de resposta. Podemos dife renciar as viradas de um rato direita, no ponto de escolha de um labirinto em T, ao reforar vi radas direita, mas no esquerda. Podemos en to perguntar se o responder do rato est basea do em dimenses da resposta (movimentos di reita e no esquerda) ou em dimenses de est mulo (movimentos em direo a um local parti cular, sem levar em considerao a direo a

partir da qual o rato se aproxima). Por exemplo, suponhamos que o brao direito de um labirinto em T aponte em direo parede mais iluminada, a parede leste de um laboratrio, onde ficam as janelas. O rato poderia aprender a virar direita, ou poderia aprender a correr em direo janela. Poderamos testar essas alternativas, girando o la birinto em T, de modo que o brao direito agora apontasse para o oeste, e o rato se aproximasse do ponto de escolha a partir do norte. Se o rato vira direita, e, portanto, na direo oposta da janela, ele demonstra aprendizagem de resposta. Se vira esquerda, rumo janela, exibe aprendizagem de lugar, ele se desloca para o mesmo lugar, embora faa isso virando em uma direo diferente. A ques to se o rato aprende a virar direita versus esquerda ou a virar a leste versus a oeste. O desempenho do rato depende, em grande parte, dos estmulos disponveis tanto dentro quanto fora do labirinto. O labirinto tpico cos tumava ser coberto por uma tela de arame ou por alguma outra cobertura que permitisse ao experimentador observar o que o rato estava fa zendo. Se o experimentador podia olhar para dentro do labirinto, o rato tambm podia olhar para fora. Embora ratos sejam mopes, o rato comum pode discriminar a direo geral de lu zes e outros aspectos genricos de um ambiente. Enquanto houver estmulos disponveis do lado de fora do labirinto, eles podem tornar-se a base a partir da qual o rato vira em uma direo parti cular. Mas se esses estmulos so eliminados co locando-se uma cobertura opaca sobre o labirin to, a orientao espacial do labirinto em relao sala toma-se irrelevante, e o rato no pode mos trar outra coisa que no a aprendizagem de res posta. A aprendizagem de lugar ou a aprendiza gem de resposta dependem, portanto, de como o experiementador prepara o problema para o rato. Ao escolher criteriosamente as condies, um ex perimentador pode tomar qualquer um dos re sultados mais provvel do que o outro. Em ambientes naturais, o alimento em um dado local no necessariamente reabastecido como no compartimento-alvo de um labirinto de laboratrio. Ao forragear, um animal pode tor nar-se mais propenso a deslocar-se para um novo local do que a retornar a um local onde j consu miu o alimento que estava disponvel. Uma vez

p r e n d iz a g e m

151

mais, as propriedades do ambiente s quais um organismo presta ateno podem variar com as limitaes impostas pelo experimentador (cf. Collier & Rovee-Collier, 1981; Lea, 1979). Por exemplo, quando um rato exposto a sesses dirias em um aparato em que o alimento colo cado nas extremidades de cada um dos vrios becos, e os becos no so reabastecidos durante a sesso, o rato aprende a no retomar aos becos em que j comeu (Olton & Samuelson, 1976). As propriedades espaciais do ambiente so par ticularmente importantes, mas, em circunstnci as apropriadas, um rato pode aprender outras pro priedades do ambiente.

GRADIENTES DE CONTROLE DE ESTM ULO Os procedimentos de discriminao colocam uma pesada responsabilidade sobre o experimen tador. Em um procedimento de diferenciao, o organismo determina a ordem das respostas, mas em um procedimento de discriminao o expe rimentador deve decidir-a ordem em que os est mulos so apresentados. Um experimentador que esteja interessado em algum contnuo de estmulo (isto , alguma dimenso ao longo da qual os estmulos podem variar, como a intensidade ou posio de uma luz) deve preocupar-se com quantos estmulos apresentar, por quanto tempo e em que ordem e de que forma os estmulos de veriam ser correlacionados com o reforo e com o no-reforo, para mencionar algumas das pos sibilidades mais importantes. A pesquisa sobre gradientes de controle de estmulo busca os efei tos de algumas dessas variveis. Esses procedi mentos geralmente envolvem uma fase de trei no, durante a qual programada alguma corre lao entre os estmulos e as respostas refora das, seguida por uma fase de teste, durante a qual o reforo suspenso, enquanto os estmulos no vos e velhos so apresentados.

Gradientes de Generalizao Se uma resposta reforada durante um est mulo, e alguma propriedade daquele estmulo

ento variada, o responder pode depender de quanto o estmulo mudou. Por exemplo, se du rante uma fase de treino as bicadas de um pom bo no disco forem reforadas quando o disco estiver iluminado por amarelo, o pombo geral mente bicar com taxas cada vez mais baixas medida que a luz do disco mudar para o laranja, depois para o vermelho e para o violeta, na fase de teste. Isso demonstra generalizao: os efei tos do reforo na presena do amarelo estendemse para as outras cores. A Figura 8.3 apresenta dados sobre a gene ralizao de bicadas de pombos no disco, a tons de diferentes freqncias depois que as bicadas foram reforadas apenas em presena de um tom de 1000 ciclos por segundo (Jenkins & Harri son, 1960). Em um procedimento (sem treino de discriminao), o tom estava sempre presente, e as bicadas eram reforadas segundo um esque ma de intervalo varivel ou VI. Em um segundo procedimento (treino de presena versus ausn cia), o tom estava presente em algumas vezes e ausente em outras, e as bicadas eram reforadas de acordo com o esquema de VI apenas durante o tom. Aps o treino, o reforo foi interrompido, e tons de outras freqncias foram apresentados pela primeira vez, intercalados com a ausncia de tom e com a apresentao do tom original. Durante essa fase, cada estmulo era apresenta do 8 vezes, em ordem mista. Para os trs pombos sem treino prvio de dis criminao (Figura 8.3, acima), nem a freqn cia do tom, nem sua presena ou sua ausncia tiveram qualquer efeito substancial sobre o bi car. O gradiente de generalizao foi relativa mente achatado ou, em outras palavras, o efeito do reforo na presena do tom original esten deu-se uniformemente a todos os outros estmu los. Podemos dizer que esses pombos no esta vam atentando para o tom, porque as mudanas na freqncia do estmulo no fizeram qualquer diferena para eles. Para os cinco pombos que receberam treino prvio de discriminao (Figura 8.3, abaixo), a freqncia original produziu taxas de respostas mais altas do que qualquer outra freqncia du rante a fase de teste; em geral, quanto mais pr xima uma freqncia estivesse da freqncia original, maior era a taxa de respostas nessa nova

152

A. C

harles

a t a n ia

30
SEM TREINO DE DISCRIMINAAO Tom Apenas SD 0 70 71 V 72

20

O
V

10
SD

_L

-h-

TREINO DE PRESENA-AUSENCIA Tom SD - Ausncia de Tom SA

300

450

670

1000

1500

2250

3500

FIGURA 8.3 Gradientes de generalizao para pombos individuais como funo da freqncia de um tom aps o reforo de bi cadas no disco durante um tom de 1000 ci clos p o r segundo (acima, 3 pombos), ou depois do reforo em presena daquele tom e extino em sua ausncia (abaixo, 5 pom bos). Sem o treino de discriminao os gra dientes foram relativamente achatados; aps o treino de presena-ausncia, eles foram relativamente agudos, com seu pice correspondendo ao estmulo em cuja pre sena ocorria o reforo (SD). (Jenkins & Harrison, 1960, Figuras 1 e 2)

Freqncia (Ciclos/Segundo)

freqncia. No foi surpresa o fato de que taxas baixas ocorressem quando o tom estava ausen te; sua ausncia estava correlacionada com a extino. Mas para esses pombos, a taxa de res postas variou com a freqncia do tom, embora o responder discriminado dependesse somente da presena ou ausncia do tom, e no de sua freqncia. Podemos dizer, ento, que os pom bos estavam prestando ateno ao tom. (A for ma dos gradientes de generalizao tambm afetada por outras variveis, como o nvel de privao ou o esquema de reforo durante o trei no: p. ex., Hearst, Koresko &, Poppen, 1964.)

Gradientes de Ps-Discriminao Os gradientes de controle de estmulo tam bm podem ser obtidos aps uma discriminao entre dois ou mais estmulos ao longo de uma

dimenso. A Figura 8.4 compara tal gradiente de ps-discriminao com um gradiente de ge neralizao (Hanson, 1959). Para um grupo de pombos (generalizao), as bicadas ao disco em presena de um nico comprimento de onda no disco foram reforadas segundo um esquema de VI, depois do que a taxa de bicar em presena deste e de uma variedade de diferentes compri mentos de onda foi determinada durante um pe rodo sem reforo. O pico do gradiente (o ponto com freqncia mais alta) ficou no estmulo cor relacionado com o reforo; em outras palavras, a taxa diminuiu medida que aumentou a dis tncia entre o estmulo de teste e o estmulo de treino. Para um segundo grupo (ps-discriminao), as bicadas ao disco foram reforadas de acordo com um esquema de VI durante o mesmo com primento de onda que o do primeiro grupo, mas este comprimento de onda se alternava com ou153

p r e n d iz a g e m

Comprimento de Onda (mu)

FIGURA 8.4 Gradientes de controle de es tmulo. O gradiente de generalizao mos tra bicadas aps o reforo sob um com primento de ondas de 550 milimicrons (SD). O gradiente apresenta um pico no SD. O gradiente de ps-discriminao mostra respostas de bicar depois do reforo em presena de um comprimento de onda de 550 milimicrons (SD) e extino sob um comprimento de onda de 570 milimicrons (SA); o pico se deslocou: o mximo de res postas desviou-se do SD em direo opos ta do SA. O expectro vai do violeta ao azul nos comprimentos de onda mais cur tos e ao vermelho nos comprimentos de onda longos, assim o SD e o SA estavam na regio verde-amarelo do espectro. (Han son, 1959, Figura 1)

tro, durante o qual as bicadas no eram refora das (extino); como no primeiro grupo, a taxas de bicar durante este e outros comprimentos de onda foram determinadas durante um perodo de no-reforo. Neste caso, o pico do gradiente foi deslocado do estmulo de reforo, em direo oposta ao estmulo de extino; esse deslocamen to chamado de deslocamento de pico. (Efeitos semelhantes tambm ocorrem quando a discri minao baseada em uma freqncia de refor o mais alta durante um estmulo do que outro: Guttman, 1959.) Uma explicao para a forma do gradiente de ps-discriminao (Spence, 1937) supunha que o reforo na presena de um estmulo criava um gradiente de responder aumentado, centrado naquele estmulo (gradiente excitatrio), que a extino em presena do outro estmulo produ zia um gradiente de responder reduzido, centra do neste segundo estmulo (gradiente inibitrio), e que, depois do treino de discriminao, o res ponder produzido por outros estmulos poderia ser previsto, subtraindo-se o gradiente inibitrio do excitatrio. O gradiente terico de Spence mostrava um deslocamento de pico: o ponto mais alto do gradiente era deslocado do estmulo de reforo em direo oposta do estmulo de ex tino. Mas o novo gradiente, produzido pela subtrao, era mais baixo do que o gradiente ex citatrio original em toda a sua extenso; assim, ele era consistente com a forma, mas no com os valores absolutos do gradiente de ps-dis154 A . C harles C
a t a n ia

criminao (cf. Hearst, Besley, & Farthing, 1970). Efeitos do treino discriminativo sobre a for ma dos gradientes levou a questes sobre as ori gens dos gradientes de generalizao com picos agudos. Uma das sugestes foi a de que os gra dientes poderiam ser mais agudos ou mais acha tados dependendo se os estmulos naquela re gio do gradiente eram mais fceis ou mais dif ceis de discriminar. Mas, quando os graus de in clinao dos gradientes de generalizao em torno de estmulos em diferentes regies do es pectro foram comparados com os limiares para a deteco de uma mudana no comprimento da onda naquelas regies, no foi possvel encon trar qualquer relao simples entre a generaliza o e a discriminabilidade (Guttman & Kalish, 1956). Outra sugesto foi a de que os gradientes agu dos dependem da aprendizagem de discrimina o que ocorre antes que o organismo seja ex posto situao experimental. Por exemplo, um pombo supostamente aprende a discriminar en tre os gros que come muito antes de ver o ama relo projetado em um disco; suas discriminaes de cor devem ser mais marcantes na regio do amarelo no espectro, simplesmente porque o amarelo predomina na cor de seu alimento. E di fcil controlar as discriminaes de cor adquiri das nos ambientes naturais, mas poderamos criar ambientes em que as discriminaes de cor no fossem possveis. Em um ambiente iluminado

apenas por luz monocromtica, em uma faixa muito estreita de comprimentos de onda como o amarelo emitido por uma lmpada de sdio a vapor, os objetos no tm cor; para uma pessoa em um ambiente assim, tudo aparece em tons de cinza. Um organismo criado em tal ambi ente no tem oportunidade de aprender as dis criminaes de cor. Um organismo apropriado para um experi mento sobre a criao em um ambiente mono cromtico o patinho, que capaz de andar e bicar logo que sai da casca do ovo; portanto, os procedimentos de reforo podem ser iniciados cedo. Gradientes de generalizao ao longo de comprimentos de ondas, obtidos com patinhos que haviam sido criados em ambientes mono cromticos, s vezes, so achatados (Peterson, 1962; cf. Figura 8.3, acima) e, outras vezes so agudos (p. ex., Rudolph, Honig, & Gerry, 1969; cf. Figura 8.3, em baixo), sugerindo que o pati nho, s vezes, presta ateno cor, mesmo sem ter experincia com as cores. Quando os pati nhos criados sob iluminao monocromtica fo ram treinados a discriminar entre dois compri mentos de onda, no entanto, seus gradientes de ps-discriminao foram semelhantes aos de pa tinhos criados em ambiente natural, e apresenta

ram um deslocamento de pico, embora os est mulos consistissem, principalmente, de compri mentos de onda que eles jamais haviam visto antes (Terrace, 1975).

Gradientes de Inibio Diante da proposio de Spence de lidar com a forma dos gradientes de ps-discriminao, surgiu o interesse em encontrar um modo de se medir diretamente o gradiente de inibio. As dificuldades eram tanto metodolgicas como te ricas. Para determinar se um estmulo redu zia a taxa de respostas, teria de haver alguma taxa para comear. Era necessrio um procedi mento que separasse a dimenso ao longo da qual o gradiente de extino seria determinado da quela correlacionada com o reforo. Tal proce dimento ilustrado na Figura 8.5 (Honig e col., 1963). Com um grupo de pombos, o estmulo correlacionado ao reforo era uma linha vertical sobre o disco, e o estmulo de extino era um disco iluminado sem uma linha; com um segun do grupo, esses estmulos eram invertidos. Para ambos os grupos, durante o treino foram usados esquemas de intervalo varivel (VI), e na fase

Graus

FIGURA 8.5 Gradientes de controle de es tmulo excitatrios e inibitrios depois do reforo de respostas de bicar, em pombos, em intervalo varivel na presena de um estmulo (SD) e extino em presena de outro (SA). Dados de pombos so mostra dos para dois estudos (smbolos cheios e vazios). Para um grupo, a linha vertical era correlacionada ao reforo, e sua au sncia era correlacionada extino ( cr culos cheios); para outro grupo; esses es tmulos eram invertidos (crculos vazios). Dados obtidos na ausncia de reforo mostram o responder na presena de dife rentes orientaes da linha e na ausncia da linha. (Honig, Boneau, Burstein, & Pennypacker, 1963, Figura 1)

p r e n d iz a g e m

155

de teste foram obtidos, na ausncia de reforo, os gradientes de controle de estmulo ao longo da dimenso de orientao da linha. No grupo com a linha vertical correlaciona da ao reforo e a ausncia da linha correlaciona da extino (crculos cheios), o bicar diminuiu com os maiores desvios da vertical; este um gradiente de reforo como o da Figura 8.3 (em baixo). Mas no grupo com a linha vertical corre lacionada extino e sua ausncia correlacio nada ao reforo (crculos vazios), o bicar aumen tou com os maiores desvios da vertical. Neste grupo, mudar a orientao da linha afetava sua distncia do estmulo de extino, mas no sua distncia do estmulo de reforo que era a au sncia de uma linha. Esse um gradiente inibi trio. Os gradientes inibitrios geralmente so mais achatados do que os gradientes excitatrios cor respondentes, provavelmente porque os organis mos tendem a atentar mais para as propriedades dos estmulos correlacionadas ao reforo do que para aquelas correlacionadas extino (cf. Dinsmoor, 1995). Uma condio como aquela do pri meiro grupo, em que uma linha era a caracters tica apresentada somente durante o reforo, de nominada discriminao da caracterstica posi tiva; uma condio como a do segundo grupo, em que a linha era a caracterstica presente so mente no durante a extino, denominada de discrim inao da caracterstica negativa (Jenkins & Sainsbury, 1970). Como mais fcil conseguir que os organismos atentem para os es tmulos correlacionados ao reforo do que ex tino, treinar uma discriminao com a carac terstica positiva mais fcil do que treinar uma discriminao com a caracterstica negativa. Al gumas implicaes desses fenmenos sero con sideradas mais detalhadamente no Captulo 11, em uma discusso sobre as respostas de observao. Consideramos at agora os quatro principais tipos de gradientes de controle de estmulo: (1) o gradiente de generalizao relativamente acha tado, sem ateno dimenso de estmulo rele vante; (2) o gradiente de generalizao com pico agudo, com ateno dimenso de estmulo rele vante; (3) o gradiente de ps-discriminao, que normalmente apresenta um deslocamento de pico depois do reforo correlacionado a um estmulo

ao longo da dimenso relevante e da extino correlacionada ao outro; e (4) o gradiente ini bitrio, depois do reforo na presena de um est mulo, mas no na dimenso relevante, e extino na presena de um estmulo naquela dimenso. Qualquer que seja o gradiente, podemos sem pre formular questes sobre as dimenses de estmulo a que de fato um organismo presta aten o. Por exemplo, suponhamos que o pombo olhe apenas para o contorno superior de um disco que tem uma linha projetada sobre ele. Se mudamos a direo da linha da vertical, a parte superior da linha se desloca daquela regio do disco, de modo que o contorno parece mais como ele era quan do no havia uma linha ali. Nesse caso, a linha o estmulo nominal, mas o estmulo funcional o que aparece junto ao contorno superior do dis co. A nica maneira de avaliar tal possibilidade pela experimentao (p. ex., removendo por es da linha e observando se isso produz os mes mos tipos de mudanas no comportamento do pombo que aquelas produzidas pela rotao da linha: cf. Touchette, 1969). O argumento pode parecer trivial com relao s respostas do pom bo, mas pode ser extremamente importante em situaes de aplicao, quando, por exemplo, um professor tenta descobrir se uma criana est atentando para as palavras, em um livro de his tria, ou se est fraudando a leitura e atentando essencialmente para as figuras.

ESVANECIMENTO (FADING): CONTROLE DE ESTM ULO PO R APROXIMAES SUCESSIVAS Do mesmo modo que as propriedades de res posta que definem uma classe operante podem ser gradualmente modificadas por meio de pro cedimentos de modelagem, as propriedades de estmulo que definem uma classe operante dis criminada podem ser gradualmente alteradas por procedimentos anlogos, denominados de esvanecimento ou esmaecimento. O treino no tem que comear com estmulos que so difceis de discriminar. Ele pode comear com aqueles es tmulos que so fceis de discriminar e, ento, mudar gradualmente para os estmulos mais di fceis. Por exemplo, para o bicar de um pombo

156

A. C

harles

a t a n ia

reforado com alimento, normalmente, mais difcil estabelecer uma discriminao entre as linhas verticais e horizontais do que entre o ver melho e o verde. Uma vez que uma discriminao entre vermelho e verde esteja estabelecida, contu do, a discriminao entre vertical e horizontal pode ser aproximada sucessivamente ao superpor verti cal sobre vermelho e horizontal sobre verde e, en to, gradualmente, remover ou esvanecer as cores (Terrace, 1963b). (Um pouco de esvanecimento grosseiro vem sendo programado neste captulo, pela substituio da expresso completa intervalo varivel, em favor de sua abreviatura, VI, depois que ambas apareceram juntas mais de uma vez.) O estabelecimento de controle de estmulo por meio da alterao gradual de estmulo geral mente bastante efetivo (p. ex., Sidman & Stod dard, 1967) mas, como no caso da modelagem, no h regras simples para determinar quo ra pidamente os estmulos devem ser gradualmen te introduzidos (fading in) ou removidos (fading out) em diferentes situaes. Por exemplo, se superpomos o vertical sobre o vermelho e o ho rizontal sobre o verde e, ento, esvanecemos par cialmente as cores, podemos descobrir mais tar de, aps remover completamente as cores, que o pombo aprendeu a discriminar entre o vertical e o horizontal. Por outro lado, o esvanecimento pode ser mal sucedido; se o pombo atenta apenas para as cores, mesmo quando elas se tomam muito fra cas, podemos descobrir que o responder discrimi nado desaparece toda vez que enfraquecemos as cores abaixo de certos nveis de limiar. Do mesmo modo que a modelagem requer que algum comportamento esteja disponvel para ser modelado, o esvanecimento requer que al gum comportamento sob controle discriminati vo esteja disponvel para ser mudado no contro le de uma nova dimenso de estmulo. Conside remos, por exemplo, a aprendizagem de discri minao sem erro (Terrace, 1963a). Logo depois que as bicadas de um pombo em um disco ver melho foram modeladas com reforo alimentar, o reforo durante o vermelho passou a ser pro gramado de acordo com um esquema de inter valo varivel. Perodos de trs minutos de ver melho se alternavam com um outro estmulo, durante o qual as bicadas no eram reforadas. De incio, este outro estmulo era um disco es

curo, durando 5 segundos. Gradualmente, ao lon go de 3 sesses, sua durao foi, gradualmente, aumentada, e ele mudou de escuro para verde fraco, para verde um pouco mais forte, at um n vel final que, para o olho humano, igualava-se ao brilho do disco vermelho. Ao final dessas condi es, os 3 minutos de vermelho correlacionado ao reforo se alternavam com 3 minutos de verde cor relacionado com a extino. Cada pombo tratado dessa maneira bicava o disco de extino menos do que 10 vezes durante todo o treino; o bicar ocor ria, quase sem exceo, no disco vermelho, e no no verde. Pombos expostos a este procedimento mais tarde, depois de um treino inicial ou para os quais o verde foi introduzido abruptamente, com durao e intensidade plenas, bicaram no disco verde de extino centenas e mesmo milhares de vezes durante perodos equivalentes de treino. A introduo gradual do verde foi suficiente porque, entre outras coisas, escurecer o disco vermelho logo no incio do treino impedia o pom bo de bicar por uns poucos segundos (qualquer mudana de estmulo abmpta poderia ter tido tal efeito). Era pouco provvel que o bicar recome asse antes do trmino dos 5 segundos do est mulo de extino. Assim, uma diferena no res ponder aos dois estmulos foi estabelecida des de o incio, e as mudanas graduais na durao e intensidade do estmulo de extino foram esta belecidas a partir dessa diferena. Depois de uma histria como essa, podemos mudar o estmulo de extino para reforo e pode ser que o pombo nunca responda durante aquele estmulo para chegar a descobrir que fizemos isso. Em que sen tido este um desempenho sem erro no b vio. Devemos ter cuidado com a linguagem de erros; o termo erro implica um julgamento sobre o valor do responder e pode ser inapropriado a uma anlise do comportamento. O procedimento de es vanecimento no tem interesse apenas terico; suas possveis aplicaes educao conferem a ele uma importncia prtica (p. ex., ver Captulo 17).

A TERMINOLOGIA DO REFORO DIFERENCIAL Tanto a diferenciao quanto a discrimina o envolvem o reforo diferencial. A principal

p r e n d iz a g e m

157

diferena est em se o reforo diferencial im posto sobre as propriedades do responder ou so bre as propriedades do estmulo em cuja presen a o responder ocorre. A principal implicao dessa diferena diz respeito ao procedimento: em estudos de diferenciao, o experimentador deve esperar pelas respostas do organismo, enquanto em estudos de discriminao o experimentador controla a ordem e a durao das apresentaes do estmulo. A terminologia da diferenciao e da discriminao est resumida na Tabela 8.1. O reforo diferencial pode ser baseado em dimenses simples de estmulos, como a inten sidade ou a localizao. A questo experimental se o responder se conforma s conseqncias diferenciais, de modo que mais respostas ocor ram na presena dos estmulos correlacionados ao reforo do que na presena daqueles correla cionados com a ausncia de reforo. As impli caes so profundas. O que aprendemos a par tir do treino de discriminaes simples com ra tos e pombos tm sido empregado para desen volver mtodos para treinar primatas a discrimi nar entre os diferentes tipos de drogas que lhes so administradas (p. ex., Schuster & Balster, 1977), para ensinar pais jovens a discriminar doenas em suas crianas (p. ex., Delgado & Lutzger, 1988) e para instruir mulheres na reali zao do auto-exame da mama (p. ex., Pennypa cker & Iwata, 1990), s para mencionar algu mas das inmeras aplicaes bem-sucedidas. Como ilustrado por essas aplicaes, o reforo diferencial pode ser programado para proprie dades complexas dos estmulos que no so fa cilmente quantificveis. Por exemplo, crianas que esto aprendendo a ler devem ser capazes de nomear as letras do alfabeto. Mas as proprie dades importantes para distinguir entre algumas letras so diferentes das que so importantes para
TABELA 8.1 A Terminologia do Reforo Diferencial Reforo Diferencial (Operao) Em relao s propriedades da resposta Em relao s propriedades do estmulo Concentrao dos Efeitos do Reforo (Processo) Diferenciao

distinguir entre outras (p. ex., linhas retas ver sus linhas curvas so importantes para distinguir entre U e V, mas no entre V e N), e distines diferentes so importantes para letras minscu las e maisculas (p. ex., nenhum par de letras maisculas tem as reverses para cima e para baixo ou para a esquerda e a direita que devem ser dominadas para a leitura de b, p, d, e q). A maneira pela qual uma criana aprende a distin guir as letras do alfabeto depende da relao en tre as propriedades dos estmulos como a sime tria, a curvatura e o fechamento. As proprieda des essenciais para discriminar as letras diferen tes so chamadas de caractersticas crticas (p. ex., Gibson, 1965). No suficiente, porm, enumerar caracte rsticas crticas. Para algumas letras, as formas maiscula e minscula diferem mais entre si do que diferem de outras letras (p. ex., e, E e F, ou h, n, e N). Dada a multiplicidade de formas, o que ento define uma classe de estmulos que ocasiona a resposta de dizer A, ou B, ou C? Essa uma pergunta sobre a estrutura de estmulo das letras do alfabeto. O problema pode ser ainda mais complicado quando se consideram diferen tes contextos. Por exemplo, a letra O poderia ser uma letra ou um zero, e a letra I poderia ser uma letra ou um numeral romano. O conceito de um X, Y ou Z definido pela classe de estmulos a que respondemos com o nome da letra corres pondente, mas veremos que essas classes so ba seadas no comportamento, no em propriedades fsicas comuns (cf. Captulo 14). Os operantes discriminados so classes de comportamento definidas pelos estmulos que ocasionam o responder. Tais classes so freqen temente identificadas em nosso vocabulrio co tidiano, por exemplo, quando falamos de parar em um semforo vermelho ou de atender ao te-

Extenso dos Efeitos do Reforo (Processo) Induo

Reforo Diferencial por Aproximaes (Operao) Modelagem

Discriminao

Generalizao

Esvanecimento

'S T ".
158 A. C
harles

a t a n ia

lefone. A luz vermelha pode variar em brilho e tamanho e o toque do telefone em altura e tim bre, mas o responder razoavelmente indepen dente de variaes ao longo de tais dimenses, e assim falamos em termos dessas classes de even tos, e no de casos particulares. Freqentemente, tratamos os estmulos como se fossem restritos a objetos concretos ou a even tos ambientais. Mas, embora possamos apren der a responder consistentemente a objetos ou eventos em nosso ambiente, tambm discrimi namos entre as caractersticas, s vezes, chama das de abstratas ou de relacionais que so inde pendentes dos objetos ou dos eventos particula res. O termo estmulo, geralmente, funciona des se modo mais geral, no sentido de alguma pro priedade de eventos ambientais. Por exemplo, podemos dizer que uma cadeira foi colocada direita de uma mesa. Embora a cadeira e a mesa sejam objetos concretos, estar--direita-de no , e ainda assim podemos discriminar entre esta relao e estar--esquerda-de. Portanto, em alguns experimentos de discriminao, as relaes entre estmulos tm sido as dimenses de interesse.

Seo B

Cognio Animal

O campo da cognio animal interessa-se por aquilo que os animais sabem. O campo aborda esse problema identificando os eventos e as re laes que podem ser discriminados por dife rentes espcies. Os estudos da cognio animal tm examinado uma variedade de desempenhos discriminativos e apresentam especial quando envolvem discriminaes de propriedades rela cionais complexas do ambiente. Certos exem plos incluem o julgamento de simetria visual (p. ex., Delius & Nowak, 1982); discriminao de numerosidade (p. ex., Davis & Prusse, 1988); busca visual (Blough, 1989); controle discrimi nativo por contingncias de reforo ou por est mulos correlacionados com tais contingncias (p. ex., Washburn, Hopkins, & Rumbaugh, 1991); a organizao do comportamento dentro de uma seqncia discriminada sequencialmen te (Terrace & Chen, 1991); e o responder sob controle de estmulo do prprio comportamen

to do organismo (p. ex., Shimp, Sabuslky, & Childers, 1989) para mencionar apenas alguns. Muitos exemplos de pesquisas sobre a cogni o animal so apresentados em outros trechos neste livro, assim esta seo apresenta apenas uma amostra altamente seletiva. Consideremos um pombo que observa o mos trador de um relgio de pulso projetado no disco do centro de trs discos para pombos (Neiworth & Rilling, 1987). O ponteiro longo comea na vertical e gira at os 90; ento ele desaparece. Um pouco mais tarde ele reaparece mais longe, em 135 ou em 180. O momento de seu reapa recimento consistente ou inconsistente com uma taxa constante de rotao, enquanto ele est invisvel. Depois de uma tentativa consistente com uma taxa de rotao constante, as bicadas no disco da esquerda so reforadas; depois de uma tentativa inconsistente, as bicadas no disco da direita so reforadas. Sob condies como essas, os pombos aprenderam a discriminar as tentativas consistentes com uma taxa de rotao constante daquelas em que a taxa constante era violada, mesmo que o estmulo em rotao esti vesse ausente por algum tempo; a discriminao tambm se transferiu para novas localizaes do reaparecimento do mostrador do relgio. Esse desempenho no estava baseado em duraes das tentativas ou em localizaes especficas do mos trador do relgio. Ele demonstra, assim, o rastreamento visual na ausncia do estmulo visual; tal rastreamento chamado de representao (ou imaginao) visual (imagery, cf. Captulo 20). Coloquialmente, podemos dizer que o pombo sabia onde o estmulo estava, mesmo enquanto ele estava invisvel (uma habilidade til, quan do, por exemplo, um inseto comestvel passa por trs de uma obstruo, e o pssaro espera que ele surja do outro lado). Os estudos sobre cognio animal esto in teressados no que os organismos sabem, e as ex plicaes, geralmente, esto vinculadas estru tura dos estmulos relevantes (cf. Captulo 1, sobre linguagem estrutural e funcional). Por exemplo, se um organismo discrimina entre cer tos estmulos com base em alguma caractersti ca crtica, um cognitivista pode dizer que o or ganismo representa os estmulos para si mesmo com base naquela caracterstica (p. ex., no exem-

p r e n d iz a g e m

159

pio do mostrador de relgio, diria que o pombo representa ou imagina seu movimento constante ou no caso da busca da presa, o predador com para o alvo potencial com uma imagem de bus ca). Discutimos o papel da representao nas te orias biolgicas, no contexto da seleo natural, no Captulo 3. A questo ser retomada no con texto da memria e da recordao, como em re construir e ento reapresentar (no sentido lite ral de apresentar de novo) as caractersticas de eventos que j ocorreram, e no contexto das teo rias comportamentais e cognitivas, no Captulo 20, onde argumentaremos que o imaginar pode ser apropriadamente tratado como um tipo de comportamento.

MAPAS COGNITIVOS Sempre que os ambientes locais tm proprie dades diferentes, vantajoso para um organis mo ser capaz de encontrar sua rota de um lugar para o outro. Um ambiente com um suprimento de alimento rico e estvel prefervel a um em que existe o mesmo alimento, mas ele est me nos acessvel; um ambiente com reas seguras para procriar e para cuidar da prole prefervel a um que seja mais perigoso, e assim por diante. (O argumento vale para a maioria dos grupos ani mais. Seria ir longe demais considerar as vari veis flogenticas que operaram na evoluo das plantas, mas apropriado notar que muitas plan tas dispersam suas sementes; os animais esto fre qentemente envolvidos nesta disperso, por exemplo, quando as abelhas polinizam as flores). Uma vez que algum tipo de orientao tenha emergido, a seleo natural tende a acentu-la ao longo do tempo filogentico (cf. Captulo 3). Assim, no de se surpreender que muitas esp cies animais encontrem prontamente sua dire o no mundo. Algumas de suas habilidades de navegao so aprendidas, e outras so noaprendidas. Gallistel (1990) elaborou um trata mento detalhado que trata do forrageio em for migas, localizao pelo eco (ecolocao) em morcegos e escolha de rotas pelos chimpan zs, e que vai da orientao baseada em dimen ses simples do estmulo, como os gradientes de odor ou luz, a variedades que so funcionalmen

te equivalentes navegao celeste. Os organis mos que deixam seu territrio natal, devem ser capazes de retomar a ele; quanto mais precisa mente puderem fazer isso, mais amplamente podem forragear. Os organismos que armazenam alimento no invemo devem ser capazes de loca lizar o alimento mais tarde; quanto mais vari veis seus locais de armazenagem e quanto mais locais eles puderem rastrear, menor a probabili dade de que percam o que armazenaram para seus competidores (p. ex., Balda, Kamil, & Grim, 1986). Os organismos que se evadem de preda dores devem ser capazes de localizar rotas de fuga; os que se deixam perseguir para becos semsada no sobrevivem. Consideramos algumas questes relevantes orientao espacial, quando discutimos a apren dizagem de lugar versus a aprendizagem de res posta. Os dois tipos de comportamento foram distinguidos, principalmente, com base em se ha via estmulos disponveis para o rato fora do la birinto. Se havia, o rato podia orientar-se no com plexo mais amplo de estmulo, a sala em que o labirinto estava localizado; e assim ele aprendia os lugares. Se no, ele dominava apenas as vira das especficas dentro do labirinto e aprendia res postas. Complexidades adicionais foram intro duzidas em outros experimentos em labirintos (cf. Olton, 1979). Por exemplo, demonstrou-se que um rato, s vezes, escolhe a rota mais curta disponvel no labirinto, quando uma outra rota preferida anteriormente bloqueada ou que, s vezes, ele segue atalhos apropriados, que acaba ram de ser acrescentados ao labirinto, mesmo que nunca tenha percorrido aqueles atalhos antes. Os resultados justificam falar de mapas cognitivos (Tolman, 1948); a descoberta de que os organis mos podem localizar uma rea mesmo quando se aproximam dela por uma nova direo de monstra que eles podem aprender as relaes es paciais alm das, ou talvez em vez de, trilhas especficas. Os problemas para determinar as caracters ticas ambientais s quais os organismos prestam ateno, emergem em uma escala maior na ha bitao e na migrao animal medida que se deslocam de um lugar para outro. As vespas re tomam a seus ninhos, as abelhas retomam a suas colmias, os salmes retomam a seus rios de ori

160

A. C

harles

a t a n ia

gem, e os pssaros retomam a ninhos sazonais. Entre as caractersticas ambientais que so im portantes podem estar os marcos geogrficos, como a localizao e o movimento do sol e das estrelas, a luz polarizada, os gradientes qumi cos e os campos magnticos (p. ex., Tinbergen, 1972; Walcott, Gould, & Kirshvink, 1979). Em alguns casos, os organismos navegam isolada mente para regies que nunca visitaram antes; em outros eles o fazem em companhia de outros membros de suas espcies. Ambos os casos de vem envolver substanciais componentes filogenticos, com relao a importantes propriedades do ambiente ou com relao a contingncias que levam migrao em gmpo (ou ambos). Em re lao a migraes de longas distncias, as con tingncias filogenticas podem ter envolvido a seleo daqueles capazes de manter a orienta o no curso de jornadas cada vez mais longas, medida que os continentes foram lentamente se se parando ao longo do tempo geolgico (Skinner, 1975). Um tratamento mais detalhado desse fen meno est alm do escopo deste livro, mas ele ilus tra que uma anlise das propriedades do estmulo que determinam o comportamento relevante tanto para a flogenia quanto para a ontogenia.

CONCEITOS NATURAIS E CLASSES DE ESTM ULOS PROBABILSTICAS Podemos falar de conceitos como generali zao, dentro de uma classe de estmulos, e dis criminao, entre classes de estmulos (Keller & Schoenfeld, 1950). Assim, nosso conceito de vermelho deve envolver a generalizao entre todos os estmulos a que chamamos de verme lho, e a discriminao entre esses estmulos e todos os outros a que no chamamos de verme lho. Ento, os conceitos esto para as classes de estmulos como os operantes esto para as clas ses de respostas. (O responder com base em al guma propriedade singular de estmul os deno minado abstrao, e a linguagem de conceitos, s vezes, restringe-se ao responder baseado em alguma combinao de propriedades. Mas essas so distines ambguas. Por exemplo, estar-esquerda-de pode ser tratado como uma propri edade relacional singular ou como uma combi

nao de propriedades que inclui necessariamen te um ponto de referncia e um estmulo es querda daquele ponto de referncia.) J comentamos que difcil definir os e s t mulos discriminativos por dimenses fsicas. Por exemplo, as propriedades que definem a letra A variam dependendo se ela maiscula ou mi nscula ou se aparece em letra de forma ou ma nuscrita. A capacidade de discriminar entre tais estmulos existe em animais, assim como em humanos (p. ex., discriminaes entre vrias for mas da letra A e do dgito 2 foram estabelecidas em pombos: Morgan e col., 1976). Mas a difi culdade de definir os estmulos com base em pro priedades fsicas mensurveis no se limita a classes arbitrrias estabelecidas por humanos, tais como letras e nmeros. Elas existem tambm com objetos e eventos do cotidiano. O que distingue os cachorros dos outros animais? Com base em que generalizamos entre chihuahuas e huskies, cha mando-os de cachorros, enquanto discriminamos entre huskies e lobos, embora eles paream mais semelhantes entre si que huskies e chihuahuasl Pombos foram ensinados a discriminar entre certas figuras que continham uma forma huma na e figuras que no continham tal forma (p. ex., Herrnstein & Loveland, 1975). Essas discrimi naes foram denominadas conceitos naturais. Em um estudo (Herrnstein, Loveland, & Cable, 1976), diapositivos eram projetados em uma tela prxima ao disco de um pombo, e suas bicadas eram reforadas na presena de algumas figu ras, mas no na presena de outras. Alguns pom bos aprenderam discriminaes entre algumas fi guras com e sem rvores; outros aprenderam a discriminar entre figuras com e sem gua; ou tros ainda aprenderam discriminaes entre fi guras com e sem uma pessoa. Aps treino com um conjunto de figuras (p. ex., figuras com e sem rvores), os pombos discriminaram entre figu ras da mesma classe de estmulos que no ha viam sido apresentadas at ento. As novas fi guras, s vezes, eram discriminadas mais preci samente do que as empregadas no treino. As implicaes delineadas foram que:
...no podemos comear a esboar uma lista de ele mentos comuns. Para reconhecerem uma rvore, os pombos no requeriam que ela fosse verde, repleta de folhas, vertical, composta de madeira, tivesse

p r e n d iz a g e m

161

tronco grosso, muitos galhos, e assim por diante (dei xando de lado o problema de elementos em comum subjacentes a termos como repleto de folhas, verti cal, tronco grosso, etc). Alm do mais, para ser re conhecvel como uma no-rvore, uma figura no tinha que deixar de conter elementos como a cor verde, aparncia de madeira, ramificaes, traados verticais, e assim por diante. Tambm no pudemos identificar elementos em comum nos outros dois ex perimentos. Se no existem elementos em comum, ento qual a base para o responder? Nenhuma outra teoria to facilmente caracterizvel, embora uma al ternativa se imponha, ainda que em termos amplos. Os pombos respondem a agrupamentos de traos mais ou menos isomrficos como os agrupamentos a que ns mesmos respondemos. O verde deveria estar nas folhas, caso a cor verde ou as folhas este jam presentes. Contudo, nenhum deles necessrio ou suficiente. As partes verticais ou as ramificaes de galhos deveriam ser as partes da madeira, embo ra nenhum desses traos seja necessrio ou suficien te. O que vemos como rvores engloba uma lista complexa de conjunes e disjunes probabilsticas, cuja descoberta requereria muito mais esforo do que pareceria justificado por qualquer benefcio possvel. (Hermstein, Loveland, & Cable, 1976, pp. 298-299)

son, 1978; ver Glossrio) e as classes de equi valncia (que sero abordadas no prximo captu lo). De fato, a classe de classes de estmulo , ela prpria, uma classe de estmulo probabilstica, no sentido de que sua definio muda medida que expandimos os limites de pesquisa relevante.

DEFINIO DE CLASSES DE ESTMULOS O problema de definir as classes de estmu los generalizado. Ele no ser resolvido por meio do apelo a procedimentos de mensurao fsica, porque a leitura de instrumentos de medi da tambm um comportamento discriminativo. Como veremos no prximo captulo, as classes de comportamento dependem das contingncias co muns que as estabeleceram, e no de suas proprie dades fsicas. Mesmo o comportamento do cien tista depende de discriminaes aprendidas no la boratrio. Como j vimos, as distines entre re foro, punio, eliciao e outros processos comportamentais so baseadas em tais discriminaes. Elas so o ponto de partida para nossa taxonomia. O controle de estmulos um fundamento (um ele mento bsico) no que diz respeito a nosso prprio comportamento cientfico, tanto quanto no que concerne ao comportamento dos organismos que estudamos. Assim, qualquer filosofia da cincia efetiva deve lev-lo em considerao. Comeamos este captulo explorando os pa ralelos entre diferenciao e induo, de um lado, e discriminao e generalizao, de outro. Os quatro processos so resultado do reforo dife rencial; eles diferem, principalmente, se o refor o diferencial programado para as proprieda des de estmulo ou de resposta. Tratamos os as pectos funcionais de controle de estmulo no contexto de experimentos sobre a ateno, sobre os gradientes de controle de estmulo e sobre os procedimentos de esvanecimento. Ao lidar com as propriedades discriminveis do ambiente no contexto da cognio animal, consideramos de que modo as caractersticas relacionais complexas do ambiente poderiam definir as classes de estmulo. Os mapas cognitivos e os conceitos naturais for neceram os exemplos relevantes. No prximo ca ptulo, iremos explorar melhor as classes de est mulo complexas e verificar como elas so rele vantes para julgamentos humanos importantes.

Os conceitos naturais so exemplos de classes de estmulo probabilsticas, classes em que cada membro contm algum subconjunto de caracters ticas, mas nenhum comum a todos os membros. O nmero de caractersticas no subconjunto pode variar de um membro da classe para outro. As ve zes, estas classes denominadas conjuntos impreci sos ou indefinidos (fuzzy sets) no tm limites bem definidos, embora membros da classe possam ter semelhanas de famlias (Rosch, 1973). Algumas classes de estmulo probabilsticas so definidas por referncia a um prottipo. Um prottipo um membro tpico de uma classe probabilstica; derivado de uma mdia ponderada de todas as caractersticas de todos os membros da classe. Por exemplo, os pssaros constituem uma classe de estmulo probabilstica; a maioria deles voa, mas os avestruzes e os pingins no. Na produo de um pssaro prototpico, as pe nas devem ter um peso maior do que os ps, com membranas interdigitais, porque os pssaros tm mais penas do que ps com membranas. Assim, um tordo mais prototpico do que um pato, porque o tordo partilha mais caractersticas com outros pssaros do que o pato. Outros tipos de classes de estmulo incluem as classes de estmulo polimorfas (Lea & Harri162 A . C harles C
a t a n ia

Discriminao Condicional e Classes de Ordem Superior

A. Dimenses Relacionais de Estmulos Emparelhamento com o Modelo e Emparelhamento por Singularidade Comportamento Simblico: Classes de Equivalncia B. Classes de Comportamento de Ordem Superior Aprender a Aprender (Leaming Set) Propriedades de Classes de Ordem Superior Origens da Estrutura C. Fontes do Comportamento Novo

A palavra matching (emparelhamento) tem sua origem no ingls arcaico do indo-europeu mag- ou mak-, to knead (trabalho manual) ou fashion (moda); est relacionada a to make (fazer), among (em com panhia de) e mass (massa). A palavra sample (amos tra ou modelo) pode ser relacionada raiz indo-europia em-, to take (tomar) ou distribute (distribuir). Como example (exemplo), esta palavra combina a raiz latina ex-, fo rt (forte), e emere, to buy (com prar) ou obtain (obter); ela est relacionada a exempt (livre de uma obrigao), prompt (pista) e consume (consumo). Comparison (comparao) derivada do latim com-, with (com), mais par, equal (igual); est relacionada a part (parte), pair (par) e, talvez tambm a repertory (repertrio). Oddity (singular ou diferente) tem mais do que uma etimologia; derivado do antigo escandinavo odtdi, um ponto ou um tringulo. O conceito de classes est implcito na etimolo gia de symbolic (simblico), que ao combinar o ter mo grego sym-, together (junto), e ballein, to throw (lanar), sugere a criao de uma unidade de partes separadas. Combinado com dia-, across (de um lado para o outro), a palavra ballein fornece, atravs de diabolic (diablico), a raiz para devil (demnio), e combinado com pro-, before (antes de), fornece a raiz para problema.

Como contingncias, as discriminaes po dem ser efetivas sob algumas condies, mas no sob outras. Por exemplo, sua resposta a uma luz verde em um cruzamento depender de que lado voc est, se de frente para a luz ou olhando para ela do outro lado da rua. Tais discriminaes, em que o papel de um estmulo depende de ou tros que forneam o contexto para ele, so deno minadas discriminaes condicionais. Conside remos o caso da ateno em relao ao pombo, discutida no Captulo 8 (Figura 8.2). Os estmu los disponveis so tringulos ou crculos, sobre um fundo vermelho ou verde. Suponhamos que acrescentemos uma lmpada sobre o disco e que reforcemos as bicadas na presena de tringulos quando ela estiver acesa e bicadas na presena do vermelho quando ela estiver apagada. Sob essas circunstncias, quando a lmpada est ace sa o pombo passa a bicar os tringulos, mas no os crculos, independente da cor; quando ela est apagada, ele passa a bicar os discos vermelhos, mas no os verdes, independente da forma. Em outras palavras, se o pombo discrimina a forma ou a cor condicional a se a lmpada est acesa. Neste captulo iremos considerar diversos procedimentos experimentais em que as contin gncias discriminativas dependem do contexto em que elas so programadas. Veremos que es ses procedimentos geram classes de comporta mento de ordem superior, no sentido de que as classes so definidas no por estmulos ou por respostas particulares, mas por relaes que in cluem tais estmulos e respostas como casos es peciais (cf. Captulo 7). Sero revistos os pro

cedimentos de emparelhamento com o modelo, de emparelhamento por singularidade (oddity), de emparelhamento arbitrrio e o de aprendiza gem de sries de problemas sucessivos (lear ning set). Eles formam um contexto dentro do qual poderemos explorar as condies sob as quais um estmulo pode tornar-se o equivalente funcional de um outro estmulo (quando, por exemplo, em uma variedade de situaes, a le tra maiscula A e a letra minscula a funcionam como a mesma letra).

Seo A

Dimenses Relacionais de Estmulos

Muitas discriminaes condicionais envol vem relaes arbitrrias entre um estmulo dis criminativo condicional e as discriminaes para as quais ele estabelece a ocasio. Alguns casos em que tais relaes no so arbitrrias so de interesse especial. Por exemplo, se em uma si tuao um estmulo comparvel a um ou a v rios outros ou um estmulo singular, depende do, ou condicional ao, contexto no qual ele apresentado. Por exemplo, se os estmulos A e B so azuis e o estmulo C amarelo, ento, em relao a A, B um estmulo igual e C um estmulo diferente. Consideraremos, a seguir, algumas propriedades de tais discriminaes condicionais.

) Oo0
Ts
Bicada

ntervaio entre as tentativas

Modelo Resposta de observao

Estmulos de comparao Resposta de emparelhar j Conseqncia

1 Bicada

Bicada

Sem comida

1 Comida

FIGURA 9.1 Diagrama de uma tentativa de empare lhamento com o modelo em uma cmara para pombos, com trs discos. Depois de um intervalo entre as tenta tivas, de ts, um estmulo - modelo ou amostra (verde: G) aparece no disco do centro. Uma bicada no disco do centro ilumina os dois discos laterais. Um estmulo de comparao igual ao modelo; o outro (vermelho: R) no . Uma bicada no estmulo de comparao igual produz alimento, e inicia o prximo intervalo entre ten tativas; uma bicada no estmulo de comparao dife rente d incio ao prximo intervalo entre tentativas, sem a apresentao de comida. O estmulo modelo e as posies direita-esquerda dos comparaes variam de tentativa a tentativa.

EMPARELHAMENTO COM O M ODELO E EM PARELHAM ENTO POR SINGULARIDADE O procedimento de emparelhamento com o modelo ilustrado na Figura 9.1, como poderia ser programado em um cmara para pombos, com trs discos (cf. Skinner, 1950; Ferster, 1960). Durante um intervalo entre as tentativas, todos os discos esto escuros. Uma tentativa comea quando o disco do centro iluminado, apresen tando um estmulo modelo. Uma bicada , en to, requerida no disco do centro. Essa bicada, denominada resposta de observao, produz novos estmulos e tambm aumenta a probabili-

dade de que o pombo olhe para o modelo (cf. discusso de respostas de observao nos Cap tulos 8 e 11). Os dois estmulos laterais produzi dos pela resposta no disco do centro so deno minados estmulos de comparao (ou de esco lha)', um deles igual ao modelo e o outro no . Uma bicada no disco igual produz um reforador, seguido por um novo intervalo entre as ten tativas, mas uma bicada no disco com um est mulo diferente seguida diretamente pelo inter valo entre as tentativas, sem o reforador (s ve zes, respostas de no-emparelhamento tambm produzem um intervalo entre as tentativas mais

164

A . C harles C

a t a n ia

prolongado, que talvez funcione como um est mulo punitivo leve; cf. Holt & Shafer, 1973). Geralmente, tanto o estmulo modelo como a posio do estmulo de comparao correto mudam ao longo das tentativas. Uma caracters tica comum do emparelhamento com o modelo um procedimento de correo que repete o mesmo modelo e os estmulos de comparao na tentativa seguinte, se uma tentativa termina com uma bicada no disco com o estmulo noemparelhado. Esse procedimento impede o de senvolvimento do responder restrito a apenas um disco ou a uma cor (mas como veremos no Ca ptulo 10, ele tambm garante que erros sejam freqentemente seguidos de perto pelos reforadores produzidos por respostas corretas). Suponhamos que um pombo bique apenas no estmulo de comparao esquerda. Se o disco com o estmulo emparelhado se alterna irregular mente entre a esquerda e a direita, essas bicadas sero reforadas apenas na metade das tentativas (aquelas em que o estmulo emparelhado estiver esquerda). O reforo em metade das tentativas, pro vavelmente, ser suficiente para manter indefini damente as bicadas no disco da esquerda. No en tanto, com um procedimento de correo, o pom bo ter que mudar para o disco da direita mais cedo ou mais tarde, porque uma tentativa com um est mulo emparelhado na direita ser repetida at que uma resposta ocorra no disco da direita e seja re forada. Do mesmo modo, se um pombo sempre bica as comparaes vermelhas, essas bicadas se ro reforadas em metade das tentativas, a menos que um procedimento de correo force o pombo a mudar ocasionalmente para o verde. Um outro refinamento do procedimento con siste em aumentar a ateno do pombo ao modelo, modificando as contingncias programadas para as bicadas no disco do modelo. Por exemplo, se a produo dos estmulos de comparao depende de diferentes padres de responder a cada modelo (p. ex., diferentes taxas de respostas), os padres de respostas que o pombo produz podem nos in formar se ele est discriminando entre os mode los. Tais procedimentos, s vezes, produzem uma aquisio mais rpida do emparelhamento, mas infelizmente o aumento da ateno ao modelo, s vezes, tambm reduz a ateno aos estmulos de comparao (p. ex., Urcuioli, 1985).

De qualquer modo, suponhamos agora que um pombo esteja respondendo acuradamente dado o vermelho ( R) ou o verde (G), em um procedimento de emparelhamento com o mode lo. Como poderamos descrever esse desempe nho? Ele aprendeu apenas a bicar na esquerda, dadas as configuraes RRG e GGR e direita dadas as configuraes GRR e RGG? Ou ele aprendeu a emparelhar de modo geral, isto , aprendeu a relao de identidade? Se agora apre sentarmos a cor azul ou a cor amarela, e o pom bo faz o emparelhamento com as novas cores modelo, teremos mais confiana em falar de em parelhamento generalizado (de fato, o empare lhamento em pombos no se transfere facilmen te para as novas cores, embora a probabilidade dessa transferncia dependa de detalhes do trei no). Mesmo se vemos o emparelhamento com as novas cores, o que dizer se no obtemos o emparelhamento com figuras geom tricas? Podemos dizer apenas que o pombo aprendeu o emparelhamento de cor, mas no o de for ma, notando que o conceito humano de em parelhamento no parece to limitado por di menses especficas dos estmulos. O empa relhamento com o modelo tambm tem sido de nominado de emparelhamento por identidade , mas devemos reservar esse termo para os casos em que o emparelhamento se generaliza para novos estmulos modelo e de comparao, como o emparelhamento de forma, depois do treino com cores. Com um conjunto limitado de est mulos, o que parece emparelhamento de identi dade freqentemente nada mais do que um em parelhamento baseado em configuraes espe cficas de estmulos. H muitas variaes de emparelhamento com o modelo. Se o reforo programado para que haja bicadas no estmulo no-emparelhado, e no para o estmulo emparelhado, o procedimento toma-se um caso de emparelhamento por singu laridade (oddity), porque esse disco necessa riamente o diferente, dentre os trs discos. Essa verso de emparelhamento por singularidade requer um mnimo de duas bicadas por tentati va, uma no modelo e outra na comparao noemparelhada. Em outras verses de emparelha mento por singularidade, nenhum modelo apre sentado; com pombos em uma cmara de trs

p r e n d iz a g e m

165

discos, por exemplo, cada tentativa consiste em iluminar todos os trs discos, com o estmulo diferente em um deles. Esse procedimento re quer apenas uma bicada por tentativa. As relaes entre os estmulos tambm po dem implicar no emparelhamento arbitrrio. Por exemplo, poderamos treinar o pombo a bicar em um disco verde, dado um quadrado como mode lo, e a bicar em um disco vermelho dado um cr culo como modelo. Poderamos, ento, pergun tar se o pombo poderia bicar em um quadrado, dado o verde como modelo, e em um crculo, dado o vermelho como modelo. Geralmente es peramos essa reversibilidade quando lidamos com palavras e objetos, por exemplo, quando uma criana que aprendeu a apontar para a figu ra de um carro ao ver a palavra carro, pode apon tar para a palavra ao ver a figura. Esta reversibi lidade, uma propriedade do comportamento sim blico, no pode ser tida como certa. Por exem plo, uma criana pode mostrar tal reversibilida de sem treino explcito, mas um pombo, no. O emparelhamento arbitrrio tambm pode ser es tendido a casos em que a mesma resposta de em parelhar treinada com mais de uma compara o (p. ex., bicar uma comparao verde, dado um crculo ou uma elipse como modelo, e bicar uma vermelha, dado um quadrado ou um trin gulo; cf. Zentall & Urcuioli, 1993, sobre o em parelhamento de muitos-para-um e de um-paramuitos). As vrias tarefas que acabamos de conside rar envolvem, todas elas, relaes entre diferen tes classes de estmulo. Algumas so arbitrri as, como quando designamos bicadas ao verde como corretas, dado um quadrado como mode lo, e bicadas no vermelho como corretas, dado um crculo como modelo; mas outras, tais como o emparelhamento por identidade e por singu laridade, parecem envolver dimenses mais fun damentais. Como, ento, deveramos lidar com relaes como: o mesmo que, diferente de, e o oposto de; e o que podemos dizer sobre as con tingncias que as criaram (cf. Hayes, 1994, so bre molduras relacionais)? Questes sobre a es trutura do estmulo parecem estar inevitavelmen te interligadas com questes sobre a estrutura do comportamento (p. ex., Fujita, 1983; Lamb & Ri ley. 1981; Wasserman, Kiedinger, &Bhatt, 1988).

COMPORTAMENTO SIMBLICO: CLASSES DE EQUIVALNCIA Se as bicadas de um pombo so reforadas na presena do verde, mas no do vermelho, no consideraramos a possibilidade de que o pom bo esverdeasse na presena das bicadas. Tal reverso no teria sentido como comportamen to. Mas isso no ocorre assim no emparelhamen to. Tanto o estmulo modelo como a resposta de comparao so definidos pelos estmulos apre sentados nos discos. Poderamos perguntar so bre uma resposta vermelha ao estmulo verme lho, ou sobre a reversibilidade de uma resposta vertical a um estmulo diagonal, ou sobre se res postas redondas a estmulos esmaecidos podem ser criadas pelo treino de respostas redondas a estmulos grandes e depois de respostas grandes a estmulos esmaecidos. Estes casos ilustram as propriedades de rela es denominadas reflexividade, simetria e tran sitividade. As propriedades reflexivas so aque las que se mantm entre um termo e ele mesmo (p. ex., A = A); as propriedades simtricas so aquelas em que a ordem dos termos reversvel (p. ex., se A = B, ento B = A); e as proprieda des transitivas so aquelas em que os termos co muns em dois pares ordenados determinam um terceiro par ordenado (p. ex., se A = B e B = C, ento A = C). As relaes de equivalncia so aquelas que tm todas as trs propriedades, e os termos que entram nelas (aqui, A, B e C) so considerados membros de uma classe de equi valncia (Sidman, 1994). Outras relaes partilham apenas algumas dessas propriedades. Por exemplo, a relao de oposio simtrica (se D o oposto de E, E o oposto de D), mas no reflexiva (D no o oposto de si mesmo) nem transitiva (se D o oposto de E e E o oposto de F, D no o oposto de F; pelo contrrio, D o mesmo que F). E uma relao de magnitude como maior que transitiva (se G maior que H e H maior que I, ento G maior que I), mas no reflexiva nem simtrica. A Figura 9.2 ilustra como os procedimentos de emparelhamento de identidade e emparelha mento arbitrrio podem ser usados para demons trar a reflexividade, a simetria e a transitividade. Cada procedimento inclui dois estmulos mode

166

A. C

harles

a t a n ia

Disco de comparao correto REFLEXIVIDADE Emparelhamento de cor Emparelhamento de forma SIMETRIA Emparelhamento arbitrrio (cor-forma) Teste de reverso (forma-cor) TRANSITIVIDADE Emparelhamento ar bitrrio 1 (cor-forma) Emparelhamento ar bitrrio 2 (forma-intensidade) Teste de transitivida de (cor-intensidade) Teste combinado de reverso-transitividade (intensidade-cor)

Disco de Modelo comparao A incorreto

Disco de comparao correto

Modelo B

Disco de comparao incorreto

O o o o o
de cores como comparaes. As duas linhas de baixo (transitividade) mostram como os estmu los comuns nos dois procedimentos de empare lhamento simblico (cor emparelhada forma e forma emparelhada intensidade) podem ser combinados em um teste de transitividade (cor e intensidade). Um teste alternativo, ilustrado na ltima linha, combina os testes de reverso e de transitividade (intensidade e cor); ele denomi nado de teste de equivalncia, e a relao entre os estmulos do teste de equivalncia denomi nada uma relao de equivalncia. As relaes dos testes de reverso e de equivalncia nunca foram explicitamente ensinadas. Se ocorre um emparelhamento apropriado nesses testes, as novas relaes demonstradas por esse compor tamento so denominadas relaes emergentes, no sentido de que emergiram sem treino explci to; elas so exemplos de comportamento novo,
A
p r e n d iz a g e m

FIGURA 9.2 Procedimentos de emparelhamento para estudar as trs propriedades de relaes de equivalncia: reflexividade (emparelhamento por identidade), simetria (reverso do emparelhamento arbitrrio) e transitividade (transferncia entre pares ordenados, de emparelhamentos arbitrrios). Cada matriz de trs discos mostrada em apenas um dos dois arranjos possveis, com o estmulo de comparao correto esquerda. Os estmulos incluem as cores vermelho (R) e verde (G), tringulos, crculos, disco iluminado e apagado.

lo, mostrados como em A, na matriz de trs dis cos esquerda, e como B, na matriz da direita. Por convenincia, o estmulo de comparao correto sempre mostrado esquerda na matriz de trs discos, embora na prtica as posies la terais dos estmulos de comparao variem de tentativa a tentativa. Como na Figura 9.1, uma bicada no estmulo-modelo produz compara es, e uma bicada no estmulo de compara o correto produz comida, enquanto uma bi cada no estmulo de comparao incorreto no produz. As duas linhas superiores na Figura 9.2 (re flexividade) ilustram os procedimentos padro de emparelhamento com cor e com forma. As duas linhas seguintes (simetria) ilustram o em parelhamento simblico com as cores como mo delos e as formas como comparaes e, depois, um teste de reverso de formas como modelos e

167

produzido por contingncias de emparelhamen to arbitrrio. Quando dizemos que um pombo que bica em presena de verde no pode esverdear na pre sena de bicadas, estamos dizendo que as rela es entre os estmulos antecedentes e as res postas que eles ocasionam em uma contingncia de trs termos no so simtricas. Isso significa que no podemos reduzir as classes de equiva lncia a classes de estmulos discriminativos. As relaes de equivalncia so simtricas, mas as relaes entre os termos de uma contingncia de trs termos no so. J questionamos se o desempenho do pombo no procedimento padro de emparelhamento depende da relao de identidade em geral ou somente das relaes entre os estmulos espec ficos. Poderamos supor que a relao de identi dade entre os estmulos modelo e os de compa rao tomaria o emparelhamento por identidade mais fcil do que o emparelhamento arbitrrio. Para os pombos, no entanto, a aquisio do em parelhamento depende mais das dimenses de estmulo escolhidas para os modelos e compara es do que do tipo de procedimento, se se tratar de um emparelhamento por identidade ou de um emparelhamento arbitrrio. Por exemplo, o de sempenho nos dois tipos de procedimento de senvolve-se mais rapidamente com modelos ver melhos e verdes do que com modelos verticais e horizontais (p. ex., Carter & Werner, 1978). A simetria e a transitividade tm sido demonstra das de maneira limitada com pombos, mas os efeitos geralmente no tm sido robustos (p. ex., DAmato e col., 1985; Richards, 1988). Alm disso, existem certas armadilhas tcnicas e lgi cas a serem evitadas na anlise de relaes de equivalncia atravs dos testes de transferncia, tais como se as discriminaes condicionais re levantes foram aprendidas como a seleo do comparao correto ou como a excluso ou a re jeio do estmulo incorreto (p. ex., Carrigan & Sidman, 1992). Assim, a evidncia de relaes de equivalncia no comportamento de empare lhamento do pombo , no mnimo, pouco con vincente (provavelmente todas as relaes com ponentes poderiam ser explicitamente ensinadas, mas esse resultado teria interesse apenas do ponto de vista do procedimento).

As relaes de equivalncia so facilmente geradas em humanos. Por exemplo, jovens re tardados que j haviam mostrado reflexividade (emparelhamento de identidade) foram ensina dos a fazer emparelhamentos envolvendo (A) pa lavras ditadas, (B) figuras correspondentes que las palavras e (C) as palavras impressas corres pondentes (p. ex., carro, cachorro, menino: Sid man, Cressom, & Wilson-Morris, 1974). Inicial mente dado um grupo de 20 palavras ditadas, a tarefa consistia em selecionar a figura correspon dente, dentre um conjunto de comparaes (AB). Ento, dado o mesmo conjunto de 20 palavras ditadas, os jovens aprenderam a selecionar as pa lavras impressas correspondentes, dentre um conjunto de comparaes (AC). Para todas as 20 palavras, esses dois tipos de emparelhamento (fi guras com palavras ditadas e palavras impressas com palavras ditadas) tambm geraram quatro outras relaes sem treino adicional: duas novas relaes atravs da simetria (BA, dada uma fi gura, dizer seu nome; e CA, dada uma palavra impressa, dizer a palavra) e duas atravs da tran sitividade (BC, dada uma figura, selecionar a pa lavra impressa correspondente; e CB, dada uma palavra impressa, selecionar a figura correspon dente). Quarenta relaes foram ensinadas (20 de cada em AB e em AC), e outras 80 emergi ram indiretamente (em BA, CA, BC e CB). O reforo de emparelhamento arbitrrio criou o incio de um repertrio de leitura nesses jovens. As relaes emergentes justificam chamar seus desempenhos de emparelhamento simblico, e no apenas de emparelhamento arbitrrio. Cada uma das 20 classes de equivalncia consistia em uma figura, a palavra falada e a palavra impres sa correspondentes. Novas classes poderiam ter sido adicionadas, com novas figuras e as pala vras correspondentes, e o nmero de equivalncias poderia ter sido expandido pela adio de novas relaes (p. ex., palavras impressas e pa lavras escritas em letras cursivas ou figuras e objetos reais). No h limites bvios para o n mero de classes que podem ser criadas ou para o nmero de estmulos que podem ser includos em cada classe. O status desses tipos de classes no comportamento de no-humanos permanece como objeto de controvrsias (p. ex., Dube e col., 1993; Home & Lowe, 1996; Schusterman &

168 A.

C h a r le s C a ta n ia

Kastak, 1993; Zentall & Urcuioli, 1993). Mas as classes de equivalncia definem comporta mento simblico, e assim, pode ser que elas se jam uma propriedade exclusiva do comporta mento humano, ou pode ser que partilhemos essa propriedade apenas com nossos parentes mais prximos, os primatas. De fato, o grande inte resse nas classes de equivalncia deriva de sua possvel relevncia para os fenmenos da lin guagem, que iremos considerar nos Captulos 14 a 16. Os membros de uma classe de equivaln cia so equivalentes no sentido de que podem ser permutveis uns pelos outros no contexto de procedimentos de emparelhamento arbitrrio. Mas isso no significa necessariamente que eles sejam funcionalmente equivalentes, no sentido de que um seja substituvel pelos outros em ou tros contextos. Em outras palavras, a equivaln cia funcional no o mesmo que ser membro de uma classe de equivalncia, e no se pode supor que as propriedades lgicas dessas relaes se jam completamente consistentes com suas pro priedades comportamentais (Saunders & Green, 1992). A equivalncia funcional de membros de uma classe de equivalncia tem que ser testada experimentalmente. A questo se uma funo adquirida por um membro de uma classe de equi valncia, como uma funo discriminativa, por exemplo, pode se transferir para os outros mem bros daquela classe (cf. Sidman e col., 1989). Consideremos um exemplo. Uma criana aprendeu a obedecer s palavras de um pai, v e pare, quando est em um cruzamento com o pai. Em uma situao separada, a criana ensinada que ir e luz verde so equivalentes e que parar e luz vermelha so equivalentes (em outras pala vras, ir e luz verde tomam-se membros de uma classe de equivalncia, e parar e vermelho tor nam-se membros de outra classe). Se as funes discriminativas das palavras v e pare se trans ferem para as respectivas luzes de trfego, a criana obedecer s luzes, sem necessidade de instruo adicional. Um tipo anlogo de transfe rncia foi experimentalmente documentado com crianas: taxas de respostas altas e baixas, oca sionadas cada uma por um conjunto de estmu los, transferiram-se para outros conjuntos quan do os estmulos nos conjuntos foram estabeleci dos como membros de classes de equivalncia

(Catania, Home, & Lowe, 1989; cf. de Rose e col., 1988).

Seo B

Classes de Comportamento de Ordem Superior

Em nossos exemplos de procedimentos de emparelhamento com o modelo e outros proce dimentos relacionados, descrevemos desempe nhos em mais de um nvel de anlise. Descreve mos respostas de bicar em um estmulo de com parao vermelho, dado um modelo vermelho, como discriminao condicional, mas tambm perguntamos se poderamos caracterizar esse de sempenho como um emparelhamento de identi dade. Nossa deciso dependia de se havamos criado uma classe operante definida por estmu los particulares em um contexto particular ou uma classe que se generalizasse por meio de re laes com uma ampla gama de estmulos. Faz diferena se um pombo que emparelha verde ao verde e vermelho ao vermelho tambm empare lha outras cores, ou se um pombo que empare lha com uma ampla gama de cores tambm o faa quando apresentamos problemas que envol vam formas ou texturas ou outras dimenses. Da mesma maneira, faz diferena se o desempenho de um pombo em emparelhamento arbitrrio uma classe operante restrita a um conjunto par ticular de modelos e comparaes ou se inclui todas as relaes reflexivas, simtricas e transi tivas que definem as classes de equivalncia. Esses exemplos apresentam classes embuti das em outras classes. Se demonstramos empa relhamento por identidade, cada emparelhamento especfico define uma classe, mas o emparelha mento de identidade , ento, uma classe de or dem superior que inclui, como seus componen tes, todos os emparelhamentos especficos. No emparelhamento com o modelo, o emparelha mento de verde ao verde ou de vermelho ao ver melho podem existir como operantes separados. Eles podem ser tratados como instncias de em parelhamento por identidade somente se puder ser demonstrado que so componentes de um nico operante de ordem superior, definido pela relao de identidade entre modelo e compara

p r e n d iz a g e m

169

o. Um teste para o operante de ordem superior se relaes novas podem ser demonstradas, como o emparelhamento de novas cores (p. ex., azul a azul, ou amarelo a amarelo); um outro teste se todas as subclasses de emparelhamento se mantm juntas como classe, caso mudemos as contingncias somente para um subconjunto de las. Examinaremos, a seguir, algumas classes de ordem superior, faremos uma reviso de suas pro priedades e consideraremos algumas implicaes que podem ser tiradas das mesmas.

APRENDER A APRENDER cLEARNING SET) A aprendizagem de uma nova discriminao pode depender daquilo que o organismo j apren deu (s vezes chamamos o que foi aprendido no laboratrio d&histria experimental). Como ilus trado pelo fenmeno conhecido como leaming set (Harlow, 1949), o responder pode depender das relaes entre as propriedades do estmulo, independentes de estmulos especficos. Nos es tudos de Harlow, dois objetos diferentes eram apresentados a um macaco privado de comida, em tentativas sucessivas. Suas posies varia vam de tentativa a tentativa. A comida era colo cada apenas sob um deles e assim, selecionar aquele era diferencialmente reforado. Depois
100
r-

de um certo nmero de tentativas, o macaco do minava a discriminao. Ento, um novo pro blema, com um novo par de objetos, era apre sentado, com o reforo diferencial novamente programado para selecionar apenas um dos dois objetos. Novamente, uma discriminao emer gia. Um novo problema, com outro novo par, era ento apresentado e mais tarde um outro, e as sim por diante. Dados mdios de oito sujeitos so mostrados na Figura 9.3. Cada conjunto de pontos mostra a porcentagem de respostas cor retas s seis primeiras tentativas ao longo de blo cos sucessivos de problemas. Com os oito pri meiros problemas (1-8), as respostas corretas au mentaram gradualmente ao longo das tentativas; pela sexta tentativa, elas ainda no haviam atin gido 80%. No bloco seguinte de oito problemas (9-16), as respostas corretas aumentaram mais rapidamente ao longo das tentativas. Ao longo de blocos sucessivos, o responder correto aumen tou mais e mais rapidamente a cada tentativa, at que, no ltimo bloco (tentativas 289-344), o responder atingiu aproximadamente 100 % de acurcia na segunda tentativa de cada novo pro blema. Em outras palavras, quanto mais proble mas o macaco havia aprendido, mais rapidamente ele aprendia um novo. Nesse procedimento, no podemos descrever o operante discriminado apenas com base em um par de estmulos. Quando um macaco adquire

C 289-344 - 133-232 233-288 33-132 17-32 9-16

o O

Tentativas em Cada Problema

FIGURA 9.3 Leaming set ou aprender a aprender. Oito macacos aprenderam uma variedade de problemas de discri minao de duas escolhas. Cada con junto de pontos mostra a porcentagem de respostas corretas ao longo das seis primeiras tentativas de cada problema, para blocos de problemas sucessivos (o eixo y comea em 50%, o nvel do aca so). A taxa de aprendizagem aumentou ao longo de problemas sucessivos. No ltimo bloco de problemas (problemas 289-344), o responder apresentava qua se 100% de acurcia na segunda tenta tiva de cada novo problema. (Adaptada de Harlow, 1949, Figura 2)

170

A. C

harles

a t a n ia

discriminaes sucessivas to rapidamente que ele consistentemente seleciona o estmulo cor relacionado com o reforo, depois de uma nica tentativa com um novo par, seu desempenho de pende de relaes entre os estmulos e suas con seqncias correlacionadas, ao longo de proble mas sucessivos, e no de pares particulares de estmulos que aparecem dentro de problemas par ticulares. Em cada problema inicial, o macaco tinha que aprender muitas outras caractersticas do procedimento, alm de qual era o estmulo correlacionado com a comida. Ele devia apren der que a comida era correlacionada apenas com um dos dois estmulos, e no com a posio nem com outras dimenses da situao e que esta cor relao no mudava dentro de um mesmo pro blema, assim como no havia reforo para pe gar, simultaneamente, os dois estmulos e assim por diante. Durante os primeiros problemas, a aprendizagem ocorreu lentamente, porque o ma caco estava aprendendo muitas coisas como estas; finalmente, quando o macaco tinha aprendido es tas outras coisas, tudo o que ele tinha que apren der em qualquer novo problema, qual era o est mulo que estava correlacionado ao reforo. Nesse ponto, podemos definir o operante dis criminado como segue: se a resposta de selecio nar um dos objetos reforada na primeira ten tativa de um novo problema, selecione aquele objeto em todas as tentativas subseqentes; se a resposta no reforada, mude para o outro ob jeto nas tentativas subseqentes. Na aprendiza gem de problemas sucessivos, esse o desem penho que reforado e nisso que o comporta mento do organismo se transforma. Assim, a correspondncia entre as contingncias de refor o e o comportamento gerado por essas contin gncias permanece como um critrio apropria do para essa classe operante. Aprender a apren der qualifica-se como uma classe de ordem su perior, porque definida por essas relaes, e no pelos estmulos e pelas respostas a qualquer problema particular. Um fenmeno que pode ser visto como uma variao de leaming set o desamparo aprendi do (Maier, Seligman, & Solomon, 1969). Por exemplo, ratos que receberam choques eltricos inescapveis e inevitveis em uma situao ten dem a no aprender uma resposta de esquiva

quando esta se torna disponvel em uma nova situao, ao contrrio dos ratos que nunca foram expostos a choques inescapveis e inevitveis (cf. Maier, Albin, & Testa, 1973). Aqui, novamente, difcil definir a classe de respostas, exceto se notarmos que os ratos que receberam choques inevitveis e inescapveis aparentemente apren deram que suas respostas no tinham conseqn cias importantes; o comportamento gerado por essas contingncias se transfere para situaes nas quais o responder poderia ter conseqncias. Talvez o desamparo aprendido, como uma clas se de ordem superior, pudesse ser colocado sob controle de estmulos discriminativos, por meio de contingncias diferenciais. O learning set ilustra a amplitude e a com plexidade do que os organismos podem apren der; esse fenmeno tambm mostra que no po demos tratar como um caso simples o que acon tece quando introduzimos um organismo expe rimentalmente ingnuo na situao de laborat rio (cf. Captulo 5, sobre a aquisio). Para estu dar a aprendizagem, alguns investigadores tm, ento, voltado-se para a aquisio repetida de dis criminaes simples ou de seqncias simples de respostas. Paradoxalmente, eles tm passado a estudar a aprendizagem, definida como mu danas no desempenho, no contexto de procedi mentos de estado estvel, definidos pela estabi lidade no desempenho. Por exemplo, em uma c mara de macacos, com quatro grupos de trs bar ras em cada um, somente uma seqncia parti cular de presses era reforada dentro de uma mesma sesso (p. ex., barra da esquerda, do gru po 1; barra da direita do grupo 2; barra do meio, do grupo 3, e barra da direita, do grupo 4), mas a seqncia mudava de sesso para sesso (Boren & Devine, 1968). Quando a taxa de aprendiza gem do macaco para um novo problema a cada dia se tornava estvel, essas aquisies repeti das tornavam-se uma linha de base para o estu do de uma variedade de fenmenos: efeitos de diferentes procedimentos de esvanecimento; efeitos de drogas sobre a aprendizagem; efeitos de diferentes tipos de conseqncias para as res postas em vrias posies da seqncia; efeitos da criao de uma seqncia como um todo, em oposio a constru-la pelo comeo ou pelo fi nal, e assim por diante.

p r e n d iz a g e m

171

PROPRIEDADES DAS CLASSES DE ORDEM SUPERIOR Uma propriedade significativa das classes de ordem superior estava implcita no tratamento do comportamento autolesivo no Captulo 7. Naquele exemplo, o comportamento autolesivo mantido pela ateno no foi facilmente reduzi do pela extino, na medida em que ele perma necia como parte de uma classe mais ampla (a de obter ateno), cuja maioria dos membros continuava efetiva na obteno de conseqn cias. Sempre que as contingncias que mantm uma classe de ordem superior so diferentes das que mantm uma ou mais de suas subclasses, podemos nos perguntar quais das contingncias prevalecero. Por exemplo, imaginemos uma classe de ordem superior que consista nas imita es, por uma criana, das aes apresentadas como modelo por um boneco. Quando o boneco bate palmas, a criana bate palmas; quando o bo neco ri, a criana ri; quando o boneco pula, a criana pula, e assim por diante. Vamos identifi car uma dezena de imitaes diferentes com as letras de A a L. Uma vez que tenhamos refora do essas imitaes, uma maneira pela qual pode mos dizer se criamos uma classe de ordem supe rior verificar se a criana tambm imita novas aes que o boneco nunca tenha modelado antes. Agora suponhamos que paremos de reforar a G, enquanto continuamos a reforar todas as outras imitaes, de A a F e de H a L. Se as imi taes de G iro decrescer ou se elas persistiro por muito tempo depois de terem sido excludas das contingncias de reforo uma questo ex perimental. Se elas diminurem, teremos demons trado que podemos separar G dos outros mem bros da classe de ordem superior. Caso contr rio, teremos que supor que ainda est funcionan do como membro da classe de ordem superior chamada de imitao, que definida pelas cor respondncias entre o que o boneco faz e o que a criana faz. Enquanto a classe de ordem supe rior mantm sua integridade, suas subclasses so mantidas juntamente com os outros membros, mesmo que no estejam consistentemente en volvidas nas contingncias que mantm as outras. Quando isso acontece, as subclasses de ordem inferior parecero insensveis s mu

danas nas contingncias que so program a das para elas. Quando programamos novas contingncias para as subclasses das classes de ordem supe rior, geralmente, esperamos que aquelas subclas ses, eventualmente, sejam diferenciadas das ou tras. Mas se as subclasses se superpem de di versas maneiras com outras classes que partilham de outras contingncias, isso pode no aconte cer. Por exemplo, imitar o que algum disse par tilha a participao na classe com outras imita es, mas tambm pode participar de contingn cias sociais que no envolvem a imitao. Isso pode ser suficiente para manter o comportamen to como uma subclasse, quando as contingnci as mudam para ele, mas no para outros tipos de imitao. Essas complexidades esto implcitas na seguinte explicao da seleo ontogentica em que regras, princpios, estratgias e simila res correspondem ao que temos chamado de classes de ordem superior:
Em seres humanos mais maduros, uma grande par te do comportamento instrumental e, mais especial mente, do comportamento verbal est organizado em rotinas de ordem superior e , em muitas ins tncias, melhor entendido em termos da operao de regras, princpios, estratgias e similares, do que em termos de sucesses de respostas a estmulos particulares.... Nessas situaes, a seleo de es tratgias, mais do que a seleo de reaes particu lares a estmulos, que modificada pela experin cia passada com conseqncias reforadoras ou pu nitivas. Se algum que est tentando descrever e predi zer o comportamento de um aprendiz humano adul to deixa de levar em conta essas organizaes comportamentais e tenta construir uma explicao com base somente nas unidades estmulo-resposta indi viduais, os princpios de operao de reforadores e punidores podem parecer muito diferentes daqueles revelados em experimentos mais simples com ani mais ou com aprendizes humanos menos am adu recidos. De fato, pode ser que os princpios de operao desses fatores sejam os mesmos em to dos os casos e que a diferena resida na natureza das unidades comportamentais, cujas probabili dades esto sendo modificadas como resultado da experincia com vrios tipos de resultados. (Estes, 1971, p. 23)

Vimos considerando as classes de ordem su perior potenciais no emparelhamento com o mo delo, nas aprendizagens sucessivas e na imita

172

A. C

harles

a t a n ia

o. Nestes e em outros casos, o treino com mui tas instncias especficas, s vezes, pode ser prrequisito suficiente para as classes de ordem su perior ou classes generalizadas (p. ex., o treino com muitos problemas de simetria pode produ zir simetria generalizada, o treino com muitos problemas de transitividade pode produzir tran sitividade generalizada, e etc.; tais classes gene ralizadas tambm tm sido denominadas moldu ras (ou quadros) relacionais: Hayes, 1994). Encontraremos muitos exemplos de classes de ordem superior em outros contextos, como quan do lidamos com a aprendizagem social e o com portamento verbal. Por exemplo, iremos retor nar imitao generalizada no Captulo 13 e con sideraremos as classes de respostas verbais, como a nomeao, no Captulo 14, e o seguimento de instrues, no Captulo 15.

ORIGENS DA ESTRUTURA A maioria das classes que consideramos at aqui tem sido as classes estruturais. As proprie dades que as definem no eram arbitrrias, mas sim derivadas de relaes sistemticas entre as propriedades de eventos ambientais (p. ex., o emparelhamento, a singularidade, a simetria). Va mos agora examinar algumas classes arbitrrias, como as criadas em um experimento por Vau ghan (1988). Um grupo de slides de fotografias foi arbitrariamente dividido em dois subconjun tos de 20 slides cada. Os slides eram apresenta dos um por vez, no disco de uma cmara para pombos, e as bicadas do pombo eram reforadas na presena dos slides de um conjunto, mas no na presena dos slides do outro conjunto. De pois de vrios blocos de sesses com um desem penho bastante consistente, a correlao entre os conjuntos &slides e o reforo era ocasionalmen te revertida. Depois de vrias reverses, os pom bos comearam a mudar o responder de um con junto de slides para outro depois que somente alguns dos slides haviam sido mostrados. Em outras palavras, as contingncias comuns pro gramadas para os 20 slides em um conjunto fi zeram com que eles se tomassem funcionalmente equivalentes, no sentido de que uma vez que as contingncias mudavam para apenas alguns sli

des do conjunto, o comportamento mudava de modo apropriado para todos eles. Essa equiva lncia funcional emergiu porque as mesmas con seqncias foram programadas para as respos tas na presena de todos os estmulos, dentro de um mesmo conjunto. Esse procedimento criou dois operantes dis criminados arbitrrios, bicar um conjunto de sli des e bicar outro conjunto de slides, pela pro gramao de contingncias para os membros dentro de cada conjunto. A correlao com as bicadas reforadas era a nica coisa que distin guia uma classe da outra. E provvel que pense mos sobre classes de modo diferente, quando seus constituintes so arbitrrios, como no estu do de Vaughan, do que quando os constituintes tm coerncia natural (p. ex., quando so seleci onados de uma faixa estreita do espectro de est mulos ou so todos instncias de algumas cate gorias naturais: cf. Captulo 8). Mas o ponto cen tral do argumento que as contingncias comuns selecionam os membros de classes operantes. As presses barra por um rato com a pata esquer da, com a pata direita e com ambas as patas tam bm so arbitrrias, at que partilhem as contin gncias comuns no deslocamento da barra. Po demos ver o experimento de Vaughan apenas como um outro exemplo do emprego de contin gncias comuns para criar um operante discri minado; ele difere dos outros, principalmente, nas classes particulares que criou. Ento, qual quer estrutura existente nos dois conjuntos de slides foi imposta pelos dois conjuntos de con tingncias comuns (reforo para um e extino para o outro). Uma expresso do problema de como a es trutura emerge a partir de um incio indiferen ciado familiar aos psiclogos na forma da des crio metafrica de William James, das respos tas de um recm-nascido ao mundo como uma grande e explosiva confuso (James, 1890, p. 488). James apelou para as primeiras discrimi naes da criana como a base para que ela or ganizasse o que comeava como desorganizado. Atualmente sabemos muito mais sobre discrimi nao do que estava disponvel para James. Ele no teve o benefcio da pesquisa de Thomdike sobre as conseqncias do responder ou da de Pavlov, sobre as funes sinalizadoras de est-

p r e n d iz a g e m

173

mulos, ou da de Skinner sobre as classes ope rantes e as contingncias de trs termos. Para atacar o problema de James, podemos comear por considerar como os operantes dis criminados so criados pelas contingncias. Os operantes, definidos com base nas propriedades de suas respostas e dos estmulos na presena dos quais elas ocorrem, so selecionados por suas conseqncias. Mas devemos distinguir entre contingncias comuns e conseqncias comuns. As conseqncias comuns no so suficientes para criar classes diferenciadas, porque um ni co reforador pode manter duas ou mais classes diferentes. Por exemplo, quando as bicadas de um pombo esquerda produzem comida de acor do com um esquema de intervalo, ao passo que suas bicadas direita produzem a mesma comi da de acordo com um esquema de intervalo di ferente, as bicadas esquerda e direita so clas ses diferentes, embora elas produzam a mesma conseqncia, a comida. Em outras palavras, cada operante criado no apenas por conseqncias comuns, mas por conseqncias comuns que dependem de con tingncias comuns. As contingncias operantes tomam todos os membros de um operante fun cionalmente equivalentes e o experimento de Vaughan demonstrou um operante discriminado totalmente arbitrrio, baseado apenas em con tingncias comuns. Mas as explicaes de dis criminao complexa freqentemente apelam para a contribuio relativa do estmulo e do or ganismo, sem incluir as contingncias (p. ex., Fetterman, 1996). Consideramos algumas des sas questes no Captulo 8, no contexto de con ceitos naturais. Quando os membros da classe no tm caractersticas fsicas comuns, ento qualquer abordagem que olhe para as proprie dades do estmulo para definir como tal classe foi formada pode fracassar (Lakoff, 1987). ne cessrio, em vez disso, olhar para os processos que criaram essas classes, e a nica caractersti ca consistentemente comum de seus membros so as contingncias nas quais eles se inserem. Acabamos de argumentar que contingncias comuns podem criar as classes funcionais arbi trrias denominadas operantes. Mas quando membros da classe de fato partilham as mesmas propriedades fsicas, classes funcionais no-ar-

bitrrias podem emergir, no por causa dos efei tos diretos daquelas propriedades partilhadas, mas porque, devido a elas, todos os membros da classe esto necessariamente envolvidos em con tingncias comuns. Por exemplo, passar a mo por uma esfera difere de passar a mo sobre um cubo; somente no segundo caso, encontra-se uma extremidade angulosa. Essas contingncias na turais podem, ento, ser a base para se poder dis criminar entre esferas e cubos. Em outras pala vras, bem possvel que as categorias que pare ciam ser categorias naturais no-arbitrrias pos sam ser criadas da mesma maneira que as arbi trrias, ao longo de uma vida de experincia com as contingncias comuns que elas engendram (cf. a discusso das conseqncias sensoriais no Ca ptulo 5). No verdade que qualquer coisa que seja significativa envolva contingncias de al gum tipo e esteja plena de oportunidades para aquelas contingncias que tragam ordem, na for ma de operantes discriminados, a partir de uma grande e explosiva confuso ? Sem dvida, alguns aspectos da seleo ope rante devem ser limitados pelas propriedades dos sistemas sensoriais e motores e das organizaes neurais que foram selecionadas filogeneticamente (exploraremos alguns desses limites e restri es no Captulo 12). Skinner falou desses tipos de limitaes como as linhas naturais de fratu ra ao longo das quais o comportamento e o am biente de fato se quebram (Skinner, 1935a, p. 40); Ns dividimos o comportamento em clas ses fortes e rpidas e ento nos surpreendemos ao descobrir que o organismo desconsidera os limites que estabelecemos (Skinner, 1953, p. 94). Mas as contingncias ontogenticas so to pervasivas que nunca devemos desconsider-las, quando estamos tentando identificar as origens do comportamento. A estrutura do comportamen to determinada por contingncias, mas as con tingncias so determinadas, por sua vez, pela estrutura ambiental.

Seo C

Fontes do Comportamento Novo

Um tema presente nas discusses de muitos dos exemplos que consideramos de onde vem

174

A . C harles C

a t a n ia

o comportamento novo. A seleo ontogentica deve dispor de variaes sobre as quais realizar seu trabalho e, assim, de especial interesse iden tificar as fontes da novidade e da variao. Identificamos um mtodo para produzir o comportamento novo, quando examinamos a mo delagem no Captulo 7, e um outro quando exa minamos o esvanecimento no Captulo 8. Tam bm vimos que a novidade e a variabilidade eram, por si mesmas, propriedades do comportamento que podem ser reforadas (p. ex., Neuringer, 1986; Page & Neuringer, 1985; Pryor, Haag, & OReilly, 1969). Mas essas no so as nicas pos sibilidades, como descobrimos quando explora mos as classes de equivalncia e as classes de ordem superior. Os testes de equivalncia tm demonstrado relaes emergentes, relaes que emergem sem treino explcito. Por exemplo, de pois dos emparelhamentos arbitrrios AB e AC, crianas de modo geral desempenharam acura damente emparelhamentos envolvendo outras re laes que nunca haviam visto antes, como BA, AC ou CA. E um de nossos critrios para cha mar uma classe de um operante de ordem supe rior era a emergncia de novas instncias. Por exemplo, uma maneira de dizer se um desempe nho de emparelhamento com o modelo se quali fica como um emparelhamento de identidade verificar se o emparelhar se generaliza para no vos estmulos, como no emparelhamento de for mas, depois do treino com cores. De modo se melhante, uma maneira de dizer se as imitaes de uma criana aos comportamentos apresentados como modelo se qualificam como uma classe de ordem superior verificar se a criana imita aes que nunca foram modeladas antes. Muitos exemplos de comportamento novo envolvem implicitamente a combinao nova de classes j existentes. Nosso exemplo da transfe rncia de funo entre os membros de classes de equivalncia envolveu a combinao de operan tes discriminados (atravessar a rua diante da pa lavra falada v e parar diante da palavra falada pare ) com classes engendradas por relaes de equivalncia (v e luzes verdes nos semforos, e pare e luzes vermelhas nos semforos). A novi dade que tem origem na juno de operantes se parados tem sido denominada aduo (Andronis, 1983; Johnson & Laying, 1992).

Consideremos o seguinte exemplo (cf. Esper, 1973, e ver Captulo 15). Suponhamos que ar ranjamos uma matriz de trs por trs discos pr ximos a uma janela, na qual podemos projetar, para um pombo, estmulos de diferentes cores, formas e tamanhos. Primeiro restringimos o bi car do pombo linha do meio dos discos na matriz, e fazemos o alimento ser contingente a bicadas na esquerda, se o estmulo na janela for vermelho, a bicadas no disco do meio, se o est mulo for azul, e a bicadas na direita, se o est mulo for verde. Depois que o desempenho do pombo tiver se tomado acurado em relao cor, restringimos as bicadas do pombo coluna do meio dos discos e agora tomamos a comida contingente a uma bicada em cima, se o estmulo for um crcu lo azul, a uma bicada no meio, se for um quadrado azul, e a uma bicada em baixo, se for um tringulo azul. E depois que o desempenho do pombo tiver se tomado acurado com respeito forma, restrin gimos suas bicadas apenas ao disco do meio da matriz e reforamos o bicar rpido, se o estmulo for um quadrado azul grande, o bicar moderado, se for um quadrado azul mdio, e o bicar devagar, se for um quadrado azul pequeno. Teremos criado trs classes de operantes dis criminados, baseados, respectivamente, na cor, na forma e no tamanho. Agora a questo o que acontecer quando deixarmos todos os discos da matriz disponveis e apresentarmos combinaes de cor, forma e tamanho que o pombo nunca viu antes. Se apresentarmos um crculo azul peque no, o pombo bicar devagar, no disco do meio, da linha de cima? Se apresentarmos um quadra do grande verde, o pombo bicar depressa, no disco do meio, da coluna da direita? E se apre sentarmos um tringulo mdio vermelho, o pom bo bicar com uma taxa moderada, no disco da esquerda, na linha de baixo? O exemplo hipottico e, se a aduo ocorre com qualquer nova combinao de dimenses de estmulos em particular, isso depender dos detalhes do treino, da seqncia dos vrios est gios do procedimento, da acurcia do desempe nho do pombo no momento em que os testes so conduzidos e de outros detalhes. Por exemplo, provavelmente ajudaria, depois do teste de cada nova combinao de estmulo, adicionar esta di menso ao conjunto de estmulos envolvidos no

p r e n d iz a g e m

175

treino por algum tempo, antes de prosseguir para um novo teste. As condies acima envolvem 27 possveis combinaes de estmulos e as con dies de treino envolveram apenas 7 delas; a transferncia para uma nova combinao, pro vavelmente, seria muito mais efetiva depois que o pombo tivesse dominado 20 ou mais das com binaes de estmulo do que apenas depois das 7 originais. possvel, tambm, que a transfe rncia para as novas combinaes tome-se mais provvel medida que os nveis de acurcia se tomem mais elevados no treino (cf. Johnson & Laying, 1992, sobre fluncia). Em qualquer caso, tal treino ao longo dessas trs dimenses de estmulos e de respostas cer tamente exeqvel (cf. Catania & Cerutti, 1986). Mas mesmo que, com esses procedimentos, no fssemos capazes de demonstrar a aduo em

pombos, poderamos ser capazes de encontr-la em outros contextos. Por exemplo, uma criana que tenha aprendido a identificar as cores e que possa distinguir um cavalo de outros animais, certamente, ser capaz de identificar um cavalo de cor diferente ao v-lo pela primeira vez. De fato, veremos nos Captulos 14 e 15 que a ocor rncia conjunta de diferentes dimenses de res posta, dadas novas combinaes de estmulos discriminativos, uma propriedade importante do comportamento verbal humano. Alm disso, o que temos considerado at aqui pode consti tuir apenas uma parcela das fontes de comporta mento novo. De fato, nossos vrios exemplos sugerem que a taxonomia dos processos que podem gerar o comportamento novo ainda no foi esgotada.

176

A. C

harles

a t a n ia

Esquemas de Reforo
1 0

A. Esquemas de Razo Varivel e de Intervalo Varivel Esquemas Acoplados Conteno Limitada (Limited Hold) Esquemas de Reforo e Causao B. Esquemas de Razo Fixa e de Intervalo Fixo Atraso de Reforo C. A Terminologia dos Esquemas de Reforo

A palavra schedule (esquema) derivada do ingls medieval sedule, um pedao de pergaminho ou pa pel, que, por sua vez, derivado do latim scheda, folha de papiro e do grego skhizein, to split (divi dir). A raiz indo-europia skei-, to cut (cortar) ou to split (dividir), relaciona schedule a schizo-, como em schizofrenia (esquizofrenia) e a Science (cin cia) e conscious (conscincia), do latim scire, to know (saber), saber no sentido de ser capaz de sepa rar uma coisa da outra.

Nem todas as classes de respostas tm con seqncias consistentes. O reforo de algumas respostas, mas no de outras, chamado de Re foro intermitente ou parcial, uma caracters tica geral do comportamento. Encontrar um pro duto particular no conseqncia invarivel de ir a um supermercado; obter uma resposta nem sempre uma conseqncia de se fazer uma per gunta. Pense em fazer uma ligao telefnica para um amigo. Algumas vezes, essa resposta reforada pela oportunidade de falar com o ami go; outras vezes o amigo no atende, a linha est ocupada ou a chamada atendida pela secret ria eletrnica. O reforo contnuo ou regular, que

o reforo de cada resposta dentro da classe ope rante, a exceo mais do que a regra. Por isso, devemos examinar os efeitos dos esquemas de reforo, arranjos que especificam que respostas, dentro de uma classe operante, sero reforadas. Os trs tipos mais bsicos de esquemas so (1) aqueles que permitem que uma resposta seja reforada depois de algum nmero de respostas (Esquemas de razo); (2) os que permitem que uma resposta seja reforada depois de um tempo transcorrido, desde algum evento anterior (Es quemas de intervalo); e (3) aqueles que permi tem que uma resposta seja reforada, dependen do da taxa ou do espaamento temporal das res postas prvias (esquemas que reforam diferencialmente a taxa ou tempos entre as respostas). As exigncias de nmero, taxa e tempo tambm podem ser combinadas de diversas maneiras, para produzir esquemas mais complexos. Con sideramos os esquemas de intervalo no Captulo 8 e os esquemas de reforo diferencial no Cap tulo 7. Neste captulo nos concentraremos nos esquemas de razo e em algumas propriedades dos esquemas de intervalo que estavam alm do escopo do Captulo 8. Vamos nos preocupar com os efeitos dos esquemas de reforo no apenas como instrumentos experimentais valiosos, mas tambm como propriedades ubquas do compor tamento em si mesmo (cf. Ferster & Skinner, 1957; Schoenfeld & Cole, 1972). Voltemos ao exemplo do telefone. Suponha mos que voc telefone para um amigo que no tem secretria eletrnica e no obtenha respos ta. A probabilidade de obter uma resposta mais

tarde vai depender do momento e no do nme ro de vezes que voc ligar. Seu amigo ir aten der somente se voc ligar quando ele estiver no local; se seu amigo no estiver, no faz qualquer diferena o nmero de vezes que voc tenta li gar. Da mesma maneira, suponhamos que a liga o receba um sinal de ocupado. O fato de ligar de novo no vai interferir na durao do sinal de ocupado. Vai passar um perodo varivel de tem po, que depende de quanto o amigo utiliza o te lefone. Para obter uma resposta, voc tem que ligar na hora certa. Esses casos so aproxima es dos esquemas de reforo em Intervalo Va rivel ou VI (yariable interval) na vida quotidi ana. Esses esquemas reforam uma nica res posta que ocorre aps a passagem de um pero do determinado de tempo, e este perodo varia de uma ocorrncia para outra; as respostas que ocorrem antes do trmino do intervalo no tm efei to. Um esquema de VI designado pelo tempo mdio para a disponibilidade de um reforador. Vejamos agora uma situao diferente. Te mos que fazer uma ligao de um telefone p blico, mas no temos ficha. Podemos tentar com prar uma ficha com algum que passa e conse guir. Nesse caso, obter a ficha no depende de quando voc faz isso. De fato, somente algumas poucas pessoas estaro dispostas a vender a fi cha. Teremos que continuar perguntando, at en contrarmos uma dessas pessoas. Podemos ter su cesso depois de solicitar primeira pessoa ou pode ser necessrio pedir a duas pessoas ou mais. Em outras palavras, conseguir a ficha depende do nmero de vezes que voc pede, e esse n mero varia de uma ocasio para outra. Tais es quemas so chamados de razo varivel ou VR. So designados pelo nmero mdio de respos tas exigidas por reforador ou, em outras pala vras, a razo mdia de respostas por reforador. Na reviso que se segue, iremos nos concen trar em respostas simples, como as bicadas de um pombo no disco, e em reforadores simples, como as apresentaes de alimento. importante lembrar, porm, que a aplicao precisa da lin guagem dos esquemas de reforo a situaes fora do laboratrio requer que especifiquemos cui dadosamente as repostas e os reforadores que entram em tais contingncias. Por exemplo, con sideremos a resposta de telefonar para diferen

tes pessoas, a fim de obter fundos para uma obra de caridade ou para uma campanha poltica. Se alguma chamada em particular respondida, isso depende de quando voc liga, mas o nmero de doaes que ser obtido depender do nmero de ligaes feitas. Do ponto de vista de se uma chamada respondida, as contingncias so aquelas de esquemas de intervalo; mas, se con sideramos a obteno de doaes, as contingn cias so as de esquemas de razo. Alm disso, quando se est fazendo as chamadas telefnicas, faz diferena se sua ltima ligao teve como resultado no obter uma resposta ou se a linha estava ocupada; telefonar para algum que man tm um esquema irregular difere de ligar para um endereo comercial que abra, impreterivel mente, em um determinado horrio; ligar depois de um sinal de ocupado, para algum que deixa a linha livre, difere de ligar para um nmero ati vo, no qual a linha no permanece aberta por muito tempo.

Seo A

Esquemas de Razo Varivel e de Intervalo Varivel

Em um esquema de razo varivel ou VR, a apresentao de um reforador depende da emis so de um nmero varivel de respostas, inde pendentemente da passagem de tempo. Em um esquema de intervalo varivel ou VI, a apresen tao de um reforador depende da passagem de um perodo varivel de tempo e da emisso de uma nica resposta; as respostas que ocorrem antes do final do intervalo no tm efeito. Algu mas propriedades das contingncias programa das por esquemas de VI e VR so ilustradas pe los registros cumulativos hipotticos da Figura 10.1. Trs curvas que poderiam ter sido produ zidas por um esquema de razo varivel de 100 respostas (VR 100) so mostradas esquerda (A, B e C); trs curvas que poderiam ter sido produ zidas por um esquema de intervalo varivel de lmin (VI lmin) so mostradas direita (D, E e F). Geralmente, um esquema de razo varivel programado por um computador que seleciona aleatoriamente as respostas a serem reforadas;

178

A . C harles C

a t a n ia

Tempo (Minutos) ------

FIGURA 10.1 Segmentos hipotticos de registros cumulativos do responder mantido por um esquema de razo varivel de 100 respostas (VR 100) e por um esquema de intervalo varivel 1 minuto (VI lmin). A tira vertical esquerda da escala de respostas para VR e a tira horizontal abaixo da escala de tempo para VI representam partes de fitas perfuradas, empregadas para selecionar as respostas a serem reforadas (mas, os laboratrios modernos usariam computadores para programar esses esquemas). Os trs registros esquerda (A B C) mostram que a taxa de respostas em VR afeta a taxa de reforo, mas no o nmero de respostas por reforador; os trs registros direita (D E F) mostram que a taxa de respostas em VI afetam o nmero de respostas por reforo, mas no a taxa de reforos.

um esquema de VR que seleciona aleatoriamen te alguma frao de respostas para serem refor adas denominado de esquema de razo randmica ou esquema RR. Antes que os computa dores estivessem disponveis, os esquemas de VR eram programados com o auxlio de uma fita de filme, que girava em um dispositivo, at um interruptor. Cada resposta movimentava a fita, de modo que ela avanava uma pequena distn cia constante. A fita tinha furos e quando o in terruptor detectava um furo na fita, a resposta seguinte era reforada. Para ilustrar, uma parte de uma fita desse tipo mostrada verticalmente direita da escala de respostas que acompanha os registros de VR, na Figura 10.1. Em um es quema de VR 100, uma resposta reforada a cada 100 respostas, em mdia, mas o nmero varia de um reforador para outro. A figura mos tra a relao entre os orifcios na fita e as respos tas reforadas, identificadas pelos pequenos tra os oblquos no registro. Na Figura 10.1, a taxa de respostas mais alta, A, produz reforadores mais rapidamente; a taxa de respostas mais baixa, C, produz os refora

dores menos rapidamente. Em outras palavras, nos esquemas de VR uma taxa de respostas mai or tambm produz uma taxa de reforos maior. Com um pombo bicando um disco, um esquema de VR 100 real, provavelmente, produziria um desempenho que seria prximo do registro em A. Com razes moderadas de respostas por re foros, os esquemas de VR, geralmente, geram taxas de respostas altas e aproximadamente cons tantes entre os reforos. Quando uma razo tor na-se muito alta (p. ex., centenas ou milhares de respostas por reforador), a taxa de respostas de cresce; isso acontece no tanto porque a taxa de respostas diminui no seu total mas, muito mais por que a taxa de respostas alta e contnua freqente mente interrompida por pausas ps-reforo. Assim como nos esquemas de VR, antes da utilizao dos computadores, os esquemas de VI tambm eram tipicamente programados por uma fita que se movia na direo de um interruptor. Nestes esquemas, a fita era controlada por um motor em velocidade constante, e no pelas res postas. Sempre que o interruptor detectava um orifcio, a prxima resposta era reforada. Esses

p r e n d iz a g e m

179

arranjos possibilitavam que as respostas fossem reforadas aps algum tempo ter transcorrido, e no depois de algum nmero de respostas. Uma poro de uma dessas fitas apresentada acima da escala do tempo, direita da Figura 10.1. Mais uma vez, a figura mostra a correspondncia en tre os orifcios da fita e as respostas reforadas, indicadas pelas marcas nos registros. Sempre que o interruptor era operado em um esquema de VI, a fita parava at o reforo ser apresentado; neste ponto, dizia-se que o reforo estava disponvel, no sentido de que a prxima resposta seria elegvel para produzir um reforador. Um mtodo alternativo, agora utilizado quando os esquemas de VI so programados em computador, consite em gerar pulsos com taxa constante e selecionar, aleatoriamente, uma cer ta proporo deles para programar um reforador para a prxima resposta; por exemplo, se pulsos a uma taxa de l/s so selecionados com uma probabilidade de 0,1, a disponibilidade do reforo iria ser criada uma vez a cada 10 s em mdia, programando dessa forma um esquema de V I 10 s. Esquemas programados deste modo so chamados esquemas de Intervalo Randmico ou esquemas de R I . Os registros de D a F, da Figura 10.1 ilus tram uma importante propriedade dos esquemas de VI: mesmo que as taxas de respostas nos trs registros sejam consideravelmente diferentes, todos eles incluem o mesmo nmero de reforadores. Esse esquema fornece uma taxa de refor o relativamente constante para uma variedade substancial de possveis taxas de respostas. Con tudo, os reforadores no so apresentados a no ser que as respostas ocorram. Desta forma, a fre qncia de reforadores produzidos por respos tas ser menor do que a especificada pelo esque ma de VI se o intervalo entre as respostas suces sivas se tornar longo em relao ao intervalo entre os reforadores programados. Na prtica, com classes de respostas como as bicadas de um pombo, as diferenas entre as taxas de reforos programadas e as taxas reais obtidas, geralmente, so pequenas. Essa indepen dncia relativa entre a taxa de reforos e de res postas, associada taxa de respostas relativamen te constante que ele produz, faz com que o es quema de VI seja o preferido como linha de base,

um esquema que pode ser usado para estudar os efeitos de outras variveis, como drogas ou po luentes qumicos (cf. Captulo 8, sobre gradien tes de controle de estmulo). Um esquema real de VI lmin, com um pombo bicando um disco, provavelmente, produz um desempenho com a taxa de respostas moderadas similar ao visto no registro D. Note-se que a taxa moderada do re gistro em D no muito diferente daquela taxa observada no registro do esquema de VR, no re gistro C. Um esquema de DRL 10 s, como dis cutido no Captulo 7, provavelmente produziria um registro com taxa baixa, como no registro de esquema de VI, no registro F. O ponto importante que os vrios registros apresentados nesta figura mostram como diferentes taxas de respostas afe tam as taxas de reforos, dados os esquemas de VR ou VI; eles no representam desempenhos t picos produzidos por cada um dos esquemas. Taxas de respostas mantidas por esquemas de VI e VR so ilustradas nas Figuras 10.2 e 10.3. Ambas as figuras mostram os dados obtidos com as respostas de bicar o disco, por pombos, refor adas por comida. Na Figura 10.2, a taxa de bi car representada como uma funo da razo, programada por um esquema de VR, ou seja, do nmero de respostas por reforador. Em VR1 (ponto mais esquerda) todas as respostas so reforadas. Mesmo excluindo-se a durao do reforo, o responder pouco maior que 25 res postas por minuto. A taxa de respostas subs tancialmente maior em VR 10 (segundo ponto) e atinge o mximo, mais de 200 respostas por minuto, em VR 50. A taxa de respostas, a se guir, diminui gradualmente, com aumentos no tamanho da VR. Na Figura 10.3, a taxa de bicar representa da como uma funo da taxa de reforos forne cida por um esquema de VI (p. ex., VI 1 min fornece, no mximo, 60 reforos por hora). A taxa de bicar aumentou em funo da taxa de re foros, mas a funo foi negativamente acelerada; a mudana na taxa de respostas produzida por uma dada mudana na taxa de reforos tomou-se me nor medida que a taxa de reforos aumentou. As duas figuras mostram que os esquemas de VR e VI diferem consideravelmente. Por exemplo, as diferentes escalas, no eixo das or denadas de ambas figuras, mostram que as taxas

180

A. C

harles

a t a n ia

Respostas por minuto

Respostas por reforo

I____ I____ I_________ I___________________ I


1,0 0,02 0,01 0,005 Probabilidade de reforo 0,0025

FIGURA 10.2 Taxa de respostas de bicar o disco como funo do esquema de VR, para trs pombos. A duas escalas abaixo mos tram as correspondncias entre o nmero de respostas por reforo e a probabilidade de reforo. (Adaptado de Brandauer, 1958, Tabela 2)

Respostas por minuto

Reforos por hora

120

60

30 Intervalo entre reforos (segundos)

15

FIGURA 10.3 Taxa de respostas de bi car o disco como funo da taxa de re foros em VI, para seis pombos. As duas escalas abaixo mostram as correspon dncias entre a taxa de reforos e o in tervalo mdio entre os reforos em es quemas de VI. (Adaptado de Catania & Reynolds, 1968, Figura 1)

p r e n d iz a g e m

181

de respostas em VR so maiores que em VI, ao longo da maior parte dos valores de cada esque ma; as taxas em VR freqentemente ultrapassam 200 respostas/min, enquanto as taxas sob esque ma de VI raramente excedem 100 respostas/min. Mesmo assim, os efeitos detalhados de cada es quema podem variar com outras condies. Por exemplo, as formas das funes podem ser afe tadas pelo fato do organismo receber toda sua comida exclusivamente durante as sesses expe rimentais ou se recebe algum alimento fora das sesses (essas duas situaes tm sido denomina das economias fechadas e abertas: Hursh, 1980). Os esquemas de razo e de intervalo tambm diferem na maneira como o desempenho afe tado quando o reforo reduzido ou interrompi do. Os registros acumulados idealizados da Fi gura 10.4 ilustram o responder mantido por es quemas de VR e de VI e o responder durante a extino, aps o reforo em VR ou em VI. No reforo em VR, a taxa de respostas diminuiu com razes maiores (cf. VR50 e VR1000). Esse de crscimo em razes altas ocorre, em parte, por que o responder comea a ser interrompido por longas pausas (o aparecimento de pausas longas durante o desempenho em razo, s vezes, cha mado de distenso da razo). A extino aps o

reforo em VR, em geral, tambm produz tran sies abruptas de taxas altas de respostas para perodos sem respostas (um padro de acelera o de respostas seguido por uma pausa e nova mente por acelerao das respostas - break-andrur). Com os esquemas de VI, por outro lado, uma taxa alta de reforos produz um responder mais alto do que um VI com uma baixa taxa de reforos (cf., V I 1 min e V I 15 min) mas, em am bos os casos, o responder se distribui de uma ma neira razoavelmente uniforme ao longo do tempo. Alm disso, a extino aps o reforo em VI pro duz decrscimos graduais na taxa de respostas, di ferente do padro de pausas e de acelerao obser vado na extino depois do reforo em VR. Quais so as propriedades dos esquemas de VI e de VR responsveis pelas diferenas nos desempenhos que eles geram? Parece razovel que os esquemas de VR deveriam produzir ta xas mais altas de respostas do que os esquemas de VI; as apresentaes do reforador tomamse mais freqentes quando o responder em VR aumenta, o que no ocorre com o responder em VI. Porm, em ambos os esquemas, a separao entre os reforadores sucessivos varivel, ento, como essas relaes diferentes entre o responder e os reforadores afetam o comportamento?

FIGURA 10.4 Padres de resposta duran te o reforo em VR e VI e durante a extin o depois do reforo em VR ou VI. Esses registros acumulados hipotticos comparam os efeitos dos dois tipos de esquemas: em VR, o responder mantido em taxas mais altas e ocorre uma transio abrupta entre as taxas altas e as pausas longas, com exi gncias muito grandes de respostas ou du rante a extino; em VI, o responder rela tivamente constante e ocorre uma diminui o gradual durante a extino. Ambos os esquemas geram um montante substancial de respostas em extino.
182 A. C
harles

a t a n ia

ESQUEMAS ACOPLADOS O procedimento de cmaras acopladas (Ferster & Skinner, 1957) permite o estudo de algu mas variveis que atuam nos esquemas. Em c maras acopladas, o desempenho de um organis mo em uma caixa determina os eventos que ocor rero na caixa de um segundo organismo. O pro cedimento pode ser usado para igualar as taxas de reforos em esquemas de VR e de VI: cada reforador produzido pelas bicadas de um pom bo em VR, programa um reforador em VI para a prxima bicada, para um segundo pombo. Em outras palavras, as bicadas do segundo pombo so mantidas por um esquema de VI, no qual os intervalos sucessivos entre os reforos igualamse queles produzidos pelo desempenho em VR, do primeiro pombo. Nessas circunstncias, o dois esquemas diferem quanto ao nmero de respos tas por reforador, mas no quanto ao intervalo de tempo entre os reforadores sucessivos.

De forma inversa, o nmero de respostas por reforador pode ser igualado para os dois esque mas, fazendo com que o nmero de respostas emitidas para cada reforador, por um pombo, determine as razes de um esquema de VR para um segundo pombo. Nesse caso, as bicadas do segundo pombo so mantidas por um esquema de VR, no qual as razes sucessivas so iguala das quelas produzidas pelo desempenho em VI, do primeiro pombo. Registros acumulados de ambos os tipos de acoplamento so mostrados na Figura 10.5 (Ca tania e col., 1977). Com um grupo de pombos, pares de sujeitos eram atribudos a esquemas acoplados nos quais o nmero de bicadas de um pombo, por reforador, em um esquema de VI 30 s, gerava um esquema de VR para um segun do pombo, conforme ilustrado pelos pombos 402 e 410. Para um outro grupo, pares eram atribu dos a esquemas acoplados nos quais os interva los entre os reforos de um pombo em esquema

FIGURA 10.5 Registros acumulados da terceira sesso do procedimento acoplado para dois pares de pombos. As respostas por reforo em VI, para o pombo 402, produziam um esquema acoplado de VR para as bicadas do pombo 410. Os intervalos entre os reforos em VR, para o pombo 414, produziam um esquema acoplado de VI para as bicadas do pombo 406. Ai setas horizontais que ligam os registros da esquerda mostram a correspondncia entre o nmero de respostas por reforo para aquele par de esquemas; as setas verticais que ligam o par de registros da direita mostram a correspondncia de intervalos entre os reforos. Em ambos os casos, a taxa de respostas em VR fo i maior do que em VI. (Catania, Mattews, Silverman, & Yohalem, 1977, Figura 1)
183

p r e n d iz a g e m

le VR 25 geravam um esquema de VI para um segundo pombo, como ilustrado pelos pombos 414 e 406. Os esquemas de VR produzem taxas mais altas que os esquemas de VI, independentemente de estar o VR acoplado ao VI ou o VI ao VR. Mais ainda, a diferena aparece rapidamente: os regis tros so da ltima de apenas trs sesses de 50 reforos cada. O fenmeno to fidedigno que os registros das Figura 10.5 foram obtidos em um exerccio rotineiro de laboratrio, em um curso de graduao de Psicologia Experimental. O experimento de caixas acopladas mostra que a diferena de taxas entre os esquemas de VR e VI no pode ser atribuda, exclusivamen te, s respostas por reforador ou ao tempo por reforador, uma vez que a diferena entre as ta xas permanece, mesmo quando essas variveis so as mesmas em ambos os esquemas. Uma outra possibilidade que, mesmo com o acopla mento, a taxa de reforos, em mdia, mude com a taxa de respostas em esquemas de VR, mas no nos de VI. Pode-se argumentar que o orga nismo simplesmente aprende que responder mais rpido produz reforo mais rpido em VR, mas no em esquemas de VI. Uma outra possibilidade deriva de uma rela o entre os intervalos entre as respostas (IRTs) e a probabilidade de reforo (Anger, 1956). O intervalo entre as respostas ou IRT apenas o tempo entre duas respostas sucessivas (cf. esque mas de DRL, no Captulo 7). Nos esquemas de VR, a probabilidade de uma resposta ser refor ada depende apenas da razo; no varia com o tempo decorrido desde a resposta anterior. Por outro lado, em esquemas de VI, quanto mais tem po tiver transcorrido desde a ltima resposta, maior a probabilidade de que o intervalo tenha passado e, portanto, de que a prxima resposta seja reforada. Em outras palavras, uma propor o relativamente maior de IRTs longos refor ada em esquemas de VI do que em esquemas de VR; e, assim, os esquemas de VI reforam diferencialmente os IRTs longos, em relao aos esquemas de VR. Um aumento nestes intervalos maiores entre as respostas implica, necessaria mente, em taxas mais baixas de respostas. Em bora possa contribuir para o desempenho em es quemas, o reforo diferencial de IRTs no pode ser a histria completa. Por exemplo, quando es

quemas de DRL programam explicitamente o re foro diferencial de longos IRTs, desenvolve-se, de maneira relativamente lenta, um responder temporalmente espaado, que no consistente com a separao rpida das taxas de resposta nos esquemas de VR e VI acoplados.

Conteno Lim itada (Limited Hold) Uma contingncia temporal freqentemente acrescentada aos esquemas a chamada de con teno limitada (limited hold ou LH). Com a con teno limitada, um reforador programado per manece disponvel apenas por um perodo limi tado de tempo; se nenhuma resposta ocorrer neste perodo, o reforador perdido. Novamente, a ao de telefonar serve como ilustrao. Se ob tivermos um sinal de ocupado em uma linha so brecarregada, possvel que no consigamos mais completar a chamada e sermos atendidos medida que o tempo passa, porque a linha nunca permanece livre por muito tempo. Se a linha des te tronco sobrecarregado tornar-se ocupada no vamente apenas uns poucos segundos aps al gum desligar, o esquema ser um VI com uma conteno limitada. A probabilidade de se con seguir a ligao ser maior se a pessoa que cha ma desligar imediatamente aps ouvir o sinal de ocupado e discar de novo. Nesse exemplo do te lefone, a conteno limitada ir variar em dura o; no laboratrio, ela geralmente constante. Uma conteno limitada tipicamente produz au mentos nas taxas de respostas, mas uma conten o muito curta pode permitir to poucas res postas reforadas que o esquema deixa de man ter o responder (Hearst, 1958).

ESQUEMAS DE REFORO E CAUSAO Os efeitos dos reforadores dependem das respostas s quais se seguem, mas eventos re foradores podem se seguir a respostas quando produzidos por respostas ou quando apresenta dos independentemente delas. O responder muda da mesma maneira quando ele produz um refor ador ou quando seguido acidentalmente por

184

A. C

harles

a t a n ia

um evento que funciona como reforador quan do contingente a respostas? Consideramos essa questo quando examinamos brevemente o fe nmeno chamado superstio (Captulo 5). A citao seguinte sugere que a relao entre as respostas e o reforador pode ser afetada de ma neira diferente por contigidades resposta-reforador causais ou acidentais:
E possvel que as correlaes acidentais no tempo entre as respostas, os estmulos e os reforadores no exeram controle sobre o comportamento?... Uma das caractersticas das correlaes acidentais entre os eventos comportamentais e ambientais a variabilidade. Cada aspecto do comportamento pode variar e, contudo, ser contguo com um reforador independente do comportamento. Por outro lado, o comportamento que instrumental deve ter ao me nos um aspecto correlacionado mais ou menos cons tantemente com o reforador. Se os animais forem sensveis a essa diferena, eles podero detectar aqueles eventos sobre os quais seu comportamento no tem controle real. (Hermstein, 1966, pp. 42-43)

Em um experimento (Lattal, 1974), as bica das de um pombo em um disco eram reforadas de acordo com um esquema de VI. Quando o desempenho em VI estava bem-estabelecido, o esquema foi mudado: ao final de alguns interva los, o reforador era apresentado imediatamen te, sem se considerar o responder. A taxa de res postas diminuiu com a diminuio da porcenta gem de reforadores produzidos pelo responder. Quando a porcentagem de reforos produzidos pelas respostas era zero, de modo que toda a co mida era completamente independente do com portamento, as taxas de respostas se aproxima ram de zero. Essa diminuio na taxa de respos tas tem implicaes interessantes. Por exemplo, quando 33% dos reforadores eram produzidos por respostas, a taxa de respostas era aproxima damente a metade daquela quando todos os re foradores eram produzidos pela resposta; mas mesmo o pombo com a menor taxa de respostas respondia cerca de 30 vezes por minuto ou a uma taxa de uma resposta a cada 2 s. Um tero dos reforadores (reforadores produzidos por res postas) seguiam imediatamente as respostas, e todos os outros tinham uma probabilidade de seguir a ltima resposta dentro de um ou dois segundos, se as respostas estivessem ocorrendo

mais ou menos a cada 2 s. Por que, ento, essas contigidades temporais acidentais entre as res postas e os reforadores no mantinham o res ponder a uma taxa prxima daquela que ocorria, quando todos os reforadores eram produzidos por respostas? Quando os reforadores so apresentados in dependentemente das respostas, provvel que o intervalo entre a resposta mais recente e o re forador varie de um reforador para outro. Os dados de Lattal sugerem que essa variabilidade se contrape ao responder supersticioso. Mas, o que ocorre nos casos em que o intervalo entre a resposta mais recente e o reforador varia, mesmo que o reforador seja produzido pela resposta? Isso ocorre, por exemplo, quando um atraso de reforo acrescentado a um esquema (Dews, 1960). Um caso ilustrado no registro de eventos da Figura 10.6 ( esquerda). As linhas verticais representam as respostas; as setas, os reforado res. O registro superior mostra um segmento de um esquema padro de VI: o intervalo termina na linha pontilhada e a prxima resposta, a, seguida imediatamente por um reforador. Um segmento de um esquema de VI, ao qual foi acrescentado um atraso de reforo de 3 s, mos trado no registro do meio: o intervalo termina na linha pontilhada, e a resposta b produz um re forador 3 segundos mais tarde. O intervalo en tre a ltima resposta e o reforador, c, menor do que o perodo de atraso, d, porque outras res postas ocorrem durante esse perodo; o interva lo entre a resposta e o reforador varia depen dendo do espaamento de respostas durante o atraso. O registro inferior mostra um trecho de um esquema que fornece reforadores indepen dentemente da respostas (tecnicamente, esse um esquema de Tempo Varivel ou VT): quando o intervalo termina, na linha pontilhada, o refor ador apresentado, e o intervalo (e) entre a l tima resposta e o reforador varia porque este apresentado independentemente da resposta. O grfico de barras, na Figura 10.6 mostra dados de trs pombos, obtidos com esses esque mas (Sizemore & Lattal, 1977). As taxas de bi car mantidas pelo VI com atraso ficaram entre as taxas moderadas mantidas pelo esquema de VI, e as taxas baixas, mantidas pelos reforado res independentes da resposta do esquema de VT.

p r e n d iz a g e m

185

VI 1 i.l

vi
VI com atraso VT

VI com atraso I I hl

c i
~d

\*>

r
T

i i

VT 1 1 i 11 t

e ! 11
4

Segundos(atraso de 6s)

Pombo 33 (atraso de 3s)

I 'll

Pombo 61 (atraso de 3s)

FIGURA 10.6 Segmentos hipotticos de registros de eventos de esquemas de reforo em VI, VI com atraso e VT (esquerda); e taxas de respostas de bicar o disco, para trs pombos, mantidas por esses esquemas (direita). A taxas de respostas mais altas foram mantidas pelo reforo em VI e as mais baixas pelo VT. (Adaptado de Sizemore & Lattal, 1977, Tabela 1)

Acabamos por concluir que a diferena entre VI e VT deve depender, de alguma forma, dos in tervalos variveis entre a ltima resposta e o reforador (c e e). Ento, por que as taxas produ zidas por reforo em VI com atraso so maiores do que aquelas produzidas por reforo em VT? Essas questes permanecem abertas anli se experimental. Os diferentes efeitos dos reforadores dependentes e independentes das respos tas dependem, de uma forma complexa, de como as correlaes entre os eventos so integradas no tempo. A complexidade talvez seja melhor ilustrada por uma analogia humana (cf. Catania & Keller, 1981).Senaportade um elevador no existe uma indicao do andar, a nica conse qncia de nosso comportamento de apertar o boto para chamar o elevador pode ser a sua che gada, aps um perodo de atraso. Mas o eleva dor pode chegar tambm porque, antes de ns, algum apertou o boto e depois subiu pela es cada; ou porque algum, dentro do elevador, apertou o boto para aquele andar; ou porque o elevador sempre retorna quele pavimento aps ter atendido a outros chamados. Um dia, a porta do elevador pode se abrir exatamente no momen to em que alcanamos o boto para apert-lo; em outra ocasio, ele pode chegar, ir embora e chegar de novo, mesmo que, por algum motivo, no tenhamos apertado o boto durante esse pe rodo. Quando o elevador chega, podemos no ter certeza se isso se deve nossa chamada. Con tudo, provavelmente continuaremos a apertar o boto de elevadores. Nossos julgamentos sobre
186 A. C
harles

a causalidade dependem no de conjunes cons tantes de eventos, mas de uma amostragem de con tingncias que, s vezes, so muito complexas. A pesquisa sobre os efeitos de contingncias mostra o quanto os organismos so sensveis s conseqncias de seu prprio comportamento. Essa sensibilidade pode depender das relaes detalhadas ou moleculares entre as respostas e os reforadores ou das propriedades globais ou molares de taxas de respostas e de reforadores, e mesmo de ambas em combinao (cf. Captulo 6). A distino entre os eventos causados pelo comportamento e os eventos acidentalmente cor relacionados com o comportamento central para os nossos conceitos de causao. Por esse motivo, o estudo dos esquemas de reforo es sencial. As demonstraes de que seres huma nos so igualmente sensveis s conseqncias de seu prprio comportamento podem ter signi ficado no apenas prtico, mas tambm terico. Por exemplo, em tarefas de vigilncia, como ob servar uma tela de radar, a deteco e o relato de um sinal podem ser usados para reforar o com portamento de observar a tela. Uma taxa alta de observao mantida se um observador tem um boto que ilumina a tela e sinais detectveis so apresentados, em esquema de VR, aps as pres ses a este boto; este observador vai detectar com mais preciso alvos reais, no programados pelo experimentador, do que um observador sen tado em frente a uma tela de radar continuamente iluminada, na ausncia de um esquema semelhan te (Holland, 1958; ver tambm Captulo 15).

a t a n ia

Seo B

Esquemas de Razo Fixa e de Intervalo Fixo

Se a probabilidade de uma resposta ser re forada for maior em alguns momentos do que em outros, provvel que a taxa de respostas seja maior nestes momentos do que nos outros (Catania & Reynolds, 1968). Suponhamos, por exemplo, que a maioria dos intervalos em um esquema de VI seja de 10 segundos e que os in tervalos restantes estejam entre 50 e 100 segun dos. Provavelmente, a taxa de respostas ser maior cerca de 10 segundos aps o reforo e, se uma resposta no for reforada, a taxa pode en to decair pelos prximos 20 ou 30 segundos, antes de aumentar novamente. Falamos, princi palmente, de esquemas de VI e VR planejados para manter a probabilidade de reforo aproxi madamente constante ao longo do tempo (no VI) ou do nmero de respostas (no VR). Mas, po dem-se programar esquemas nos quais o nme ro de respostas por reforador ou o intervalo para disponibilidade de um reforador seja constante de um reforo para outro; tais esquemas so cha mados, respectivamente, de razo fixa ou FR e de intervalo fixo ou FI (alm desses, esquemas nos quais o intervalo entre as apresentaes su cessivas de reforadores independentes da res posta constante so chamados de tempo fixo ou FT). Uma propriedade importante dos esque mas fixos que eles introduzem perodos discri minveis, durante os quais no ocorrem refora dores. Vamos ver primeiramente os esquemas de razo fixa ou FR. Nesses esquemas, a ltima res posta de uma srie fixa reforada. Por exem plo, se uma mquina de refrigerante funciona apenas com moedas de 25 centavos, e o refrige rante que se quer custa R$ 1,00, ao inserir a quar ta moeda voc completa uma razo fixa de exa tamente quatro respostas (supondo que a mqui na esteja funcionando bem). Cada razo fixa ter mina com um reforador. A contagem no reco mea se o responder em FR interrompido. A primeira resposta da razo nunca reforada; assim o responder em FR consiste tipicamente de uma pausa, seguida por uma alta taxa de res postas. A durao mdia das pausas ps-reforo

aumenta com aumentos no valor da FR (Felton & Lyon, 1966). A pausa chamada pausa psreforo ou PRP, mas pode ser mais apropriado pensar nela como uma pausa pr-responder: por exemplo, as pausas em FR ocorrem to consis tentemente quando uma razo comea depois de um estmulo, como quando ela comea depois de um reforo ser produzido ao fim da ltima razo. Uma vez comeado, aps a pausa ps-refor o, o responder ocorre, tipicamente, em uma taxa alta e sem interrupo, at que o reforador seja apresentado (pausas e taxas altas em FR so ou tro exemplo do responder alternado com pau sas; cf. esquemas de VR). O grau de coeso com o qual o responder em FR se mantm, uma vez iniciado, sugere que uma seqncia de FR deve ser encarada como uma unidade comportamental em si mesma e no apenas como uma suces so de respostas. O tratamento do desempenho nos esquemas como unidades de respostas em si mesmas le vou ao desenvolvimento de esquemas de refor o de ordem superior. Por exemplo, se o reforo depende de se completar um nmero varivel de razes fixas, a programao consite em um es quema de segunda ordem no qual esquemas de FR sucessivas so reforados de acordo com um esquema em VR (p. ex., Findley, 1962). Uma anlise do desempenho no componente em tais esquemas est relacionado com a estrutura do comportamento e anlogo ao exame das pro priedades que definem uma classe operante (c.f. Captulos 7 e 11). Em geral, o desenvolvimento do responder em FR ocorre to rapidamente que seus detalhes no podem ser vistos com facilidade. A Figura 10.7, entretanto, mostra um exemplo de desen volvimento gradual do responder em FR. Em uma caixa de condicionamento para pombos equipada com dois discos, as bicadas do pombo em um disco eram reforadas de acordo com um esquema de FR 100, enquanto um esquema de VI vigorava concorrentemente na outra chave. O esquema de VI em vigor neste disco retardou o desenvolvimento de um desempenho tpico de FR e tomou possvel examin-lo em cmara len ta; a mudana no padro temporal, que geral mente emerge em duas ou trs sesses, deman dou mais de 150 sesses. Nas primeiras sesses,

p r e n d iz a g e m

187

FIGURA 10.7 Desenvolvimento do desempenho em FR 100para bicadas de um pombo reforadas por comida. O desenvolvimento comumente rpido do responder em FR fo i retardado pela operao concorrente de um esquema de reforo em VI (no mostrado), que operava para bicadas em um segundo disco. Os segmentos dos registros cumulativos so do incio das sesses numeradas para reforo em FR.

o responder era espaado uniformemente entre os reforadores. Com a exposio continuada ao esquema, aps os reforadores comearam a ocorrer taxas mais baixas e, finalmente aparece ram as pausas. A parte da razo que consistia em um responder ininterrupto, em taxa alta, tor nou-se gradualmente mais longa, de modo que nas sesses subseqentes, o responder continuou com pouca ou nenhuma interrupo aps cada pausa. medida que as sesses se sucediam, a srie de FRs pareceu se construir de trs para frente, a partir do reforador. Agora retomemos ao esquema de Intervalo Fixo ou FI: uma resposta reforada apenas aps a passagem de um perodo constante de tempo, a partir de algum evento ambiental; as respostas que ocorrem antes deste momento no tm qual quer efeito. Um exemplo olhar para o relgio medida que se aproxima o final de uma aula; neste caso, estamos supondo que o reforador seja ver que chegou o momento de sair da classe sem chamar muito a ateno. Olhar para o rel gio em momentos anteriores no faz o tempo

andar mais depressa. Uma caracterstica do res ponder em FI o fato de ocorrer com taxa baixa ou zero no comeo do intervalo e de aumentar medida que se aproxima o final do mesmo. De modo que esperaramos que voc olhasse rara mente para o relgio no incio da aula e muito mais freqentemente medida que ela se apro ximasse do final (obviamente, possvel dizer outras coisas sobre os reforos envolvidos em uma aula, se ela mantm o ouvinte to interessa do que ele nunca olha para o relgio at que a mesma tenha terminado). Duas amostras de registros cumulativos do desempenho em FI so mostradas no Captulo 5 (ver B e C , na Figura 5.6). Cada registro mostra uma seqncia de intervalos fixos. O padro cn cavo, voltado para cima, desses registros cha mado de curvatura do FI ou padro meia-lua. Dependendo da quantidade de sesses de expo sio ao esquema FI e de outras variveis, as curvaturas do FI podem mostrar transies re lativamente abruptas de ausncia de respostas para um responder relativamente constante,

188

A. C

harles

a t a n ia

como em B, ou um aumento gradual da taxa depois que comea o responder, como em C. O padro de respostas em FI tende a ser consis tente ao longo da posio relativa de cada mo mento dentro do intervalo, e no da passagem de tempo em termos absolutos. Por exemplo, se o responder atinge metade de sua taxa final ou terminal em 40 s dentro de um intervalo fixo de 100s, provvel que o mesmo ocorra em 20 s e no em 40 s, dentro de um intervalo fixo de 50 s. Qualquer modelo terico do desempenho em FI deve levar em considerao o fato de que a curvatura de FI se mantm, apesar das interrup es repetidas. O fenmeno ilustrado na Figu ra 10.8 (Dews, 1962). As bicadas ao disco, emi tidas por 4 pombos, eram reforadas de acordo com um esquema de FI 500 s. O grfico es querda mostra a taxa mdia de bicar em segmen tos sucessivos de intervalos de 50 s. Em outro procedimento, a luz da caixa, que fornecia uma iluminao difusa, era ligada e desligada em seg mentos sucessivos de 50 s ao longo do interva lo; aps o ltimo segmento de 50 s, a luz perma necia acesa at que uma bicada no final do inter valo fosse reforada. A ao de bicar no era reforada na ausncia de luz, e a taxa desta res posta diminuiu nestes perodos (barras escuras na Figura 10.8). Entretanto, o aumento no res ponder, em perodos sucessivos, quando a luz estava acesa (barras sombreadas) tinha forma se melhante ao aumento que ocorria quando o de

sempenho em FI no era interrompido durante o intervalo. Descobertas como estas levantaram questes sobre as contribuies relativas, para a curvatu ra de FI, de um gradiente de discriminao tem poral de FI (em que as taxas de respostas dife rentes de um organismo, em momentos diferen tes do intervalo, implicariam na discriminao do tempo decorrido) e um gradiente de atraso do reforo (no qual respostas em vrios momentos do intervalo so consistentemente seguidas pelo reforador no final do intervalo). Os dois gradi entes podem existir juntos, porque responder a qualquer tempo de um intervalo depende do que aconteceu depois daquele tempo no intervalo anterior; ele no pode depender do reforo no fim do intervalo atual, uma vez que esse reforo ainda no foi apresentado.

ATRASO DE REFORO A sugesto de que a curvatura de FI envolve algum tipo de gradiente de atraso do reforo implica que o reforo produzido pela ltima de uma seqncia de respostas tem efeitos que de pendem de sua relao com todas as respostas precedentes, e no simplesmente com aquela que o produziu. Nos primeiros estudos sobre os es quemas de reforo, os efeitos dos esquemas eram discutidos como reforo parcial e era visto como um paradoxo que mais comportamentos pudes-

Fl e Estmulos Adicionados

100
Tempo no intervalo (Segundos)

300

500

FIGURA 10.8 Taxas de bicar em perodos de 50 segundos, durante um esquema padro de reforo em FI 500 s (FI, esquerda) e em um esquema de FI 500 segundos no qual uma luz e sua ausncia se alternavam a cada 50 s (FI e estmulos adicionados, direita), para 4 pombos. Nos perodos em que a luz estava apagada, a taxa de respostas era baixa e, portanto, interrompia o responder no FI. Porm, quando a luz estava acesa, a taxa aumentava de modo exatamente igual ao do FI padro. (Adaptado de Dews, 1962, Figura 2)

p r e n d iz a g e m

189

sem ser gerados pelo reforo de cada frao do total de respostas do que pelo reforo de cada resposta especificamente. Olhar os esquemas com base no atraso de reforo de todas as respostas que precederam a resposta reforada, contudo, sugere que o reforo parcial ou intermitente funciona como tal porque permite que cada conseqncia re force muitas respostas, e no apenas uma. As respostas iniciais em uma seqncia que termina com um reforo contribuem menos para o responder futuro do que aquelas emitidas pos teriormente, devido aos atrasos mais longos que as separam do reforo (Dews, 1962). Isso signi fica que ao interpretar os efeitos dos esquemas, precisamos conhecer a forma do gradiente de atraso. O gradiente de atraso tem sido descrito com sucesso com alguns modelos matemticos do comportamento operante (p. ex., Killeen, 1994), mas, certos problemas tcnicos compli cam sua determinao experimental. Por exem plo, se programamos reforadores atrasados em pregando um tempo fixo depois de uma respos ta, devemos permitir que respostas adicionais ocorram neste nterim, em cujo caso o tempo real entre a ltima resposta e o reforo ser, freqente mente, mais curto do que aquele programado ou podemos, ainda, reiniciar o atraso a cada resposta subseqente, caso em que o reiniciar do tempo ir reforar diferencialmente pausas pelo menos to longas quanto o atraso do intervalo e esta diferen ciao ser confundida com os efeitos atrasados do reforador (p. ex., Catania & Keller, 1981). E no podemos evitar esses problemas apresentan do um estmulo durante o atraso, porque ento es taremos, simplesmente, substituindo um refora dor condicionado imediato por um atrasado. Mais do que isso, sob muitas circunstncias no podemos atribuir um determinado respon der mais tardio inequivocamente a uma relao entre respostas e reforadores particulares. Ima ginemos que a segunda resposta de bicar um dis co, emitida por um pombo, produza um refora dor e, ento, vrias bicadas adicionais ocorrem em seguida. Esse responder adicional ocorreu porque o bicar foi reforado, mas quantas des sas respostas ocorreram porque a segunda res posta produziu um reforo e quantas ocorreram porque o primeiro bicar, depois de um atraso, foi seguido pelo reforador?

Algumas implicaes prticas podem ser mais importantes do que esses problemas tcni cos. Sabemos que os efeitos do reforo atrasado sobre as respostas que precedem aquela que pro duz um reforador no se restringem a respostas em uma nica classe operante. Por exemplo, as bicadas de um pombo em um disco podem ser mantidas porque elas so seguidas, posteriormen te, por bicadas reforadas em um outro disco (Catania, 1971). Vamos considerar uma tarefa que envolve respostas corretas e erros em tenta tivas sucessivas (p. ex., um experimento sobre conceitos naturais: cf Captulo 8). Podemos usar um procedimento em que todas as respostas cor retas sero reforadas, e toda tentativa com erro ser repetida, at que o pombo possa responder de forma correta. Com esse procedimento, po rm, garantimos que qualquer seqncia de er ros ser seguida, depois de algum atraso, por uma resposta correta reforada. As respostas corre tas finalmente passaro a ser dominantes, por que elas so seguidas mais de perto pelo refor ador, mas os erros podem diminuir mais lenta mente e podem, at mesmo, persistir em um n vel modesto, embora eles nunca realmente pro duzam o reforador, porque so sistematicamente seguidos, depois de um atraso, por uma resposta correta reforada. (Os procedimentos de apren dizagem sem erro podem ser efetivos, porque er ros que nunca ocorrem nunca so seguidos de perto por um reforador subseqente para res postas corretas: cf. Captulo 8). A moral dessa histria que os professores devem estar atentos para as seqncias nas quais os erros dos estudantes so seguidos por corre es, de forma que eles no fortaleam as res postas incorretas juntamente com as respostas corretas que esto fortalecendo. Provavelmente, um reforador que segue uma seqncia de res postas corretas funcionar melhor do que aque le que segue uma nica resposta correta depois de vrios erros. O melhor professor ser aquele que puder julgar se as respostas corretas so to infreqentes que deveriam ser reforadas, mesmo se precedidas por erros ou se so freqentes o su ficiente para que o reforador possa esperar at que o estudante tenha apresentado vrias respos tas corretas em uma srie. Exemplos como esses deveriam nos lembrar que a modelagem freqen-

1 9 0 A . C h a r l e s C a t a n ia

temente, muito mais uma arte do que uma cincia (mas ver Galbicka, Kautz, & Jagers, 1993).

Seo C

A Terminologia dos Esquemas de Reforo

Consideramos, at esse momento, uma va riedade de esquemas de reforo. Alguns elemen


TABELA 10.1 Esquemas Bsicos Nome e Abreviao Intervalo varivel (intervalo randmico) Intervalo fixo Razo varivel (Razo randmica) VI

tos da terminologia dos esquemas so lgicos, mas outros so admitidamente idiossincrticos. Por exemplo, os nomes dos esquemas de FI e VI versus FT e VT so arbitrrios (cada par pode ria, com igual facilidade, ser denominado dura o fixa e durao varivel, supostamente abre viadas com o FD e VD). Alm disso, nomes di ferentes so correlacionados com contingncias muito diferentes. Embora os esquemas de FI, DRL e FT requeiram igualmente a passagem de

Contingncia* t s, ento 1 resposta

Comentrio t varia; com intervalos randmicos, a taxa de respostas apro ximadamente constante t constante; gera curvaturas de FI n varivel; taxas de respostas al tas e constantes, entretanto n grande pode produzir distenso de razo n constante; produz pausa psreforo; pausas seguidas por ta xas altas t varivel; reforadores indepen dentes de resposta t constante; reforadores indepen dentes de resposta Todas as respostas reforadas; tambm abreviado como CRF Como procedimento, freqente mente usado mesmo que a res posta nunca tenha sido refora-

(RI)
FI VR t s, ento 1 resposta n respostas

(RR)
FR n respostas

Razo fixa

Tempo varivel Tempo fixo Reforo Contnuo Extino

VT FT

ts ts 1 resposta

(FR 1)
EXT

da
Conteno lim itada (L im ited hold) LH Reforo cancelado se nenhu ma resp o sta refo rad a ocorrer em t s t s sem resposta, ento 1 res posta t constante, se no for especifica do; LH, sempre adicionado a outro esquema, no pode ocor rer sozinho Mantm o responder facilmente; reduo no responder aumenta o reforo e, assim, previne a ex tino Alternativamente, pelo menos n respostas em t s; algumas ve zes difcil de ser mantido, por que o decrscimo do responder reduz o reforo. Estabelece limites, inferior e su perior, das taxas de respostas reforveis. Um procedimento de omisso ou de punio negativa; geralmen te reduz a taxa da resposta es colhida.

Reforo diferencial de baixas ta xas (ou IRT longo)

DRL

Reforo diferencial de altas ta xas (ou IRTs curtos)

DRH

1 resposta dentro de s o u menos de / s da ltima res posta

Reforo diferencial de responder espaado Reforo diferencial de outro comportamento

DRP

1 resposta entre t e ts da l tima resposta t s sem respostas

DRO

*t s = tempo em segundos; n = nmero de respostas


A
p r e n d iz a g e m

191

um tempo constante, o que as respostas podem produzir diferente em cada um deles. Um es quema de FI no impe restries sobre o res ponder durante o intervalo, mas uma resposta deve ocorrer no final dele. Passa-se algum tem po, durante o qual as respostas no tm efeito e, ento, a prxima resposta reforada. Um es quema de DRL exige que se passe um tempo especfico sem que ocorram respostas e, ento, a prxima resposta reforada. As respostas que ocorrem muito cedo tm algum efeito: elas rei niciam a contagem de tempo. Finalmente, em um esquema de FT, o reforador apresentado ao final do intervalo especificado, quer as respos tas tenham ocorrido, quer no. Nesse esquema, as respostas nunca tm efeito. Estes nomes de esquemas emergiram incidentalmente, medida que a pesquisa evoluiu, e agora esto to bem estabelecidos que seria difcil mud-los. Das vrias tentativas importantes que foram feitas para classificar os esquemas de reforo de forma mais sistemtica (p. ex., Schoenfeld & Cole, 1972; Snapper, Kadden, & Inglis, 1982), nenhuma conseguiu passar a ter um uso geral. A Tabela 10.1 resume alguns dos principais esque mas. As definies de esquemas aplicam-se, quer os reforadores sejam programados sucessiva mente e sem interrupo, quer ocorram em ten tativas separadas (p. ex., geralmente, o intervalo em um FI contado a partir do ltimo refora

dor mas, se outros eventos forem programados entre os intervalos sucessivos, a contagem do tempo pode comear com a apresentao de al gum estmulo, como uma cor, projetada no dis co do pombo). O glossrio oferece detalhes adi cionais sobre os esquemas. As duas primeiras colunas da Tabela 10.1 apresentam os nomes dos esquemas e suas abre viaes padronizadas. Na prtica, as designaes de tempo ou nmero, geralmente, acompanham as abreviaes (p. ex., V I30 s, LH 5 s, DRL 10 s e FR 50). A terceira coluna descreve as contin gncias do esquema, as condies sob as quais as respostas so elegveis para produzir refora dores (cf., FI versus FT e DRL versus DRO). A ltima coluna mostra comentrios breves sobre cada esquema. O vocabulrio dessa tabela, apre sentado com base em esquemas de reforo, tam bm pode ser estendido a esquemas de punio (p. ex., Azrin, 1956). A simetria entre o reforo e a punio, ilustrada no Captulo 6 (na Figura 6.1), aplica-se tambm aos efeitos dos esquemas. Por exemplo, a superposio de um esquema de punio em FI sobre o responder mantido pro duz uma curvatura invertida, uma taxa de res postas gradualmente decrescente, medida que se aproxima o final do intervalo, e no a taxa crescente que um esquema de reforo em FI ge ralmente produz.

192

A. C

harles

a t a n ia

Combinaes de Esquemas: Sntese Comportamental

ii

A. Esquem as M ltiplos e Mistos Respostas de Observao Interaes entre Esquemas: Contraste Comportamental B. Esquemas Encadeados, Tandem e de Segunda O rdem Reforo Condicionado Estmulos Breves em Esquemas de Segunda Ordem C. Esquemas Concorrentes Igualao, Maximizao e Escolha Esquemas Encadeados Concorrentes Forrageio Natural e Sntese Comportamental Preferncia por Escolha Livre Autocontrole D. Combinaes de Esquem as e Sntese C om portam ental

conjugado est relacionada a to juxtapose (justapor), a to conjugate (conjugar), yoga (ioga) e a to yoke (unir, acoplar).

A terminologia das combinaes dos esquemas ofe rece um pacote etimolgico misto. A palavra mlti plo, do indo-europeu mel-, strong (forte) ou great (grande), mais pel-,fold (juntar) est relacionada a to meliorate (aperfeioar), to imply (implicar) e to complicate (complicar). A palavra misto, do indo europeu meik-, to mix (misturar) ou mingle (combi nar-se) est relacionada a promiscous (promscuo) e miscellaneous (miscelnia). A palavra cadeia vem de uma palavra latina de origem obscura, catena, e pode estar relacionada a to enchant (encantar). Tan dem, aplicado a ciclos duplos (bicycles) do latim tandem, lengthwise (comprido), est relacionado a tantamount (ter fora igual) e though (posto que). Concorrente e conjugado partilham o prefixo latino con-, with (com). Do latim currere, to run (correr), concorrente est relacionado a to carry (carregar), a intercourse (intercurso) e curriculum (currculo); do latim iungere, to join (juntar, agregar), a palavra

Os esquemas no operam isoladamente. Eles podem se alternar uns com os outros, com est mulos correlacionados (esquemas mltiplos) ou no (esquemas mistos). A conseqncia de com pletar um esquema pode ser o incio de um outro esquema, com estmulos correlacionados (esque mas encadeados) ou sem eles (esquemas tan dem ); em tal contexto, um esquema pode ser a unidade do comportamento sobre a qual outro esquema opera (esquema de ordem superior). Os esquemas podem operar ao mesmo tempo, para respostas diferentes (esquemas concorrentes) ou para uma mesma resposta (esquemas conjuga dos); os esquemas que operam concorrentemen te podem produzir outros esquemas (esquemas encadeados concorrentes). Mas essas combina es de esquemas no tm interesse em si mes mas. Elas esto relacionadas a problemas que ti veram importncia histrica, como a aprendiza gem de discriminao (esquemas mltiplos), o reforo condicionado (esquemas de segunda or dem e esquemas encadeados) e a escolha (es quemas concorrentes e cadeias concorrentes). Uma anlise experimental implica em decom por comportamentos complexos, para descobrir do que eles so constitudos. A taxonomia do comportamento que temos desenvolvido neste livro prov unidades comportamentais para nossa anlise. Quando terminamos uma anlise, pela separao das partes, podemos valid-la exami-

nando se podemos reconstituir novamente o com portamento analisado. A reverso de uma anli se a sntese (como na qumica, quando um com posto sintetizado, depois de uma anlise ter de terminado seus elementos e sua estrutura). Em pregaremos vrias combinaes de esquemas para sintetizar o comportamento complexo. O su cesso de nossa sntese nos dir algo sobre a ade quao de nossa anlise. Dentre as questes que discutiremos ao revisarmos as reas especficas de pesquisas que envolvem a combinao de es quemas esto os estmulos de natureza informa tiva, escolha livre e autocontrole.

As substncias que agem sobre o comportamento podem ser classificadas com base em tais efeitos (p. ex., Dews, 1970; Weiss & Laties, 1969).

RESPOSTAS DE OBSERVAO Os estmulos discriminativos so efetivos apenas se o organismo os observa. Podemos fa zer um pombo observar certos estmulos ao exi gir que bique um disco para produzi-los. Vamos comear com a alternao irregular do reforo em VR e a extino da resposta de bicar o disco de um pombo. Nesse esquema misto (mix EXT VR), mantemos a luz do disco branca na presen a de ambos os esquemas, de forma que o pom bo vai bicar tanto no componente de EXT como no de VR. Mas agora acrescentamos um disco de observao, um segundo disco no qual as res postas produzem os estmulos correlacionados com os esquemas componentes. Durante a EXT, as respostas sobre esse disco mudam a cor dele para vermelho durante algum tempo; durante VR tornam o disco verde. Na verdade, as bicadas no disco de observao transformam o esquema misto em mltiplo (mult EXT VR); na presena dos estmulos do esquema mltiplo, o pombo passa a bicar com taxa prxima de zero durante o vermelho, o estmulo do esquema em EXT, e com taxa alta durante o verde, o estmulo do es quema de VR. (Essas contingncias diferem da quelas para as respostas de observao no pro cedimento de emparelhamento com o modelo que produzem os estmulos de comparao, por que as contingncias aqui correlacionadas com os esquemas mltiplos operam quando estes es tmulos esto ausentes, assim como quando es to presentes: cf. Captulo 9.) As bicadas no disco de observao so man tidas pelos procedimentos de resposta de obser vao que acabamos de descrever (Kelleher, Ri ddle, & Cook, 1962). Mas, o que mantm essa observao? Uma possibilidade que os efeitos reforadores dos estmulos discriminativos de pendam de sua relao com o reforador alimen tar programado pelos esquemas; outra que os estmulos sejam observados, porque permitem ao pombo se comportar de forma mais eficiente em relao aos esquemas componentes (o pom

Seo A

Esquemas M ltiplos e Mistos

Falamos dos esquemas mltiplos como exem plos de controle de estmulo (p. ex., mltiplo VI EXT na Figura 7.1; ver Tabela 10.1, para abre viaes). Dois esquemas se alternam, cada um correlacionado com um estmulo diferente; fala mos de controle de estmulos quando o desem penho apropriado a cada esquema ocorre em pre sena do estmulo correspondente. Por exemplo, se um esquema de FI opera para bicadas de um pombo sob luz verde e um esquema de VI para bicadas no vermelho, a curvatura de FI (padro meia-lua) no verde pode alternar com uma taxa de respostas aproximadamente constante, tpica de VI, no vermelho (o reforo pode se alternar com extino em esquemas mltiplos, mas nes te exemplo temos dois esquemas de reforo di ferentes, cada um correlacionado com um est mulo). Os esquemas mltiplos tm sido freqente mente usados como linha de base em estudos de variveis que afetam o comportamento. Por exemplo, com esquemas mltiplos FI FR, os efei tos de uma droga sobre o responder em FI e FR podem ser obtidos com um nico conjunto de doses; os efeitos de drogas freqentemente vari am com o esquema que mantm o responder. Em farmacologia comportamental e toxicologia comportamental, tais linhas de base algumas vezes re velam amplos efeitos comportamentais de subs tncias, tais como como poluentes, em concentra es que apresentam poucos efeitos fisiolgicos.

194

A. C

harles

a t a n ia

bo no pra de bicar durante a EXT, quando o disco est sempre branco, mas pra quando ele fica vermelho). A questo pode ser colocada em termos de se a resposta de observao manti da, porque estmulos discriminativos so refora dores condicionados ou porque so informativos. Se a informao est envolvida, ento os dois estmulos discriminativos deveriam ser igual mente informativos, mesmo que um esteja cor relacionado com a extino e outro com o refor o. Suponhamos que as respostas de observao simplesmente iniciem o vermelho durante a EXT e no o faam durante o VR. Se as respostas de observao ocorrem, porque permitem ao pom bo se comportar mais eficientemente com rela o aos esquemas componentes, ligar unicamente a luz vermelha neste novo procedimento to til quanto ligar ambas as luzes. Mas foi verifi cado que o comportamento de observar clara mente mantido quando produz apenas o estmu lo correlacionado com o esquema de VR, mas no quando produz unicamente o estmulo cor relacionado com a extino (Dinsmoor, 1983). Da mesma forma, estmulos correlacionados com punio diferencial (reforo em um componen te e reforo mais punio no outro) no mantm bem as respostas de observao; se existem quaisquer efeitos informativos, eles so sobre pujados pela aversividade do estmulo correla cionado com reforo e punio, mesmo quando este estmulo permitiria ao pombo responder mais eficientemente, diminuindo o responder somente quando o mesmo aparece (Dinsmoor, 1983). Em outras palavras, a efetividade reforadora de um estmulo discriminativo no depende do carter informativo, mas, muito mais das con seqncias particulares com as quais est corre lacionado. Assim, um problema central na apren dizagem da discriminao pode ser simplesmente o de levar o organismo a observar os estmulos relevantes. Por exemplo, os organismos esto provavelmente mais atentos s caractersticas dos estmulos correlacionadas com um esquema de reforo do que com aquelas correlacionadas com a extino. Suponhamos que os estmulos de uma discriminao reforo-extino consistem em uma matriz de crculos ou a mesma matriz com um tringulo substituindo um dos crculos. O tri

ngulo a caracterstica distintiva desses est mulos, e um pombo, provavelmente, adquirir essa discriminao mais rapidamente se o trin gulo estiver correlacionado ao reforo (caracte rstica positiva) do que se estiver correlaciona do com a extino (caracterstica negativa), por que olhar para um estmulo uma resposta de observao. O pombo tender a olhar mais para o tringulo no primeiro caso do que no segundo. (Jenkins & Sainsbury, 1970, e Captulo 8, sobre discriminao de caractersticas positivas). Ns humanos no estamos imunes a tais con tingncias. Por exemplo, suponhamos que al gum mostre a voc alguns cartes com letras de um lado e nmeros do outro, e diga-lhe que cada carta com uma vogal em um dos lados tem um nmero mpar do outro. Quatro cartas so apresentadas com A, 8, X e 7 voltados para cima e voc solicitado a virar o nmero mnimo de cartas para verificar a regra: se forem vogais, en to, teremos nmeros mpares (cf. Wason & Johnson-Laird, 1970). Quantas cartas voc viraria para examinar e quais seriam elas? Muitas pes soas iro virar a carta contendo o A, para ver se h um nmero mpar do outro lado. Aqueles que viram uma segunda carta geralmente tentam o 7, para confirmar a vogal do outro lado. Mas a regra no ser negada se eles encontrarem uma consoante, porque a regra no diz que consoan tes no podem ter nmeros mpares tambm. Voc precisa virar duas cartas, mas a outra carta a ser examinada o 8, que negar a regra se exis tir uma vogal do outro lado. Somente um nme ro pequeno de pessoas escolhe esta carta. Por qu? O ponto que as pessoas esto, pro vavelmente, procurando mais confirmar do que negar suas hipteses. Virar uma carta uma resposta de observao, e todos temos longas his trias de verificar nossas suposies sobre as coisas. Presumivelmente checamos coisas que so importantes para ns, ento, no passado ter sido muito mais agradvel ter tido nossas supo sies confirmadas do que negadas. Com o tem po, provavelmente, aprendemos que alguns ti pos de suposies podem somente ser confirma das e que outras podem unicamente ser negadas, e fazemos suposies de acordo com isso. Se no verdade, infelizmente significa que algumas vezes pensamos ter confirmado alguma coisa

p r e n d iz a g e m

195

quando no confirmamos; talvez ento a verda de fosse alguma coisa que no queramos saber. A efetividade de uma mensagem depende mais de se seu contedo reforador ou aversivo, do que se est correta ou completa. E consis tente com esta descoberta, por exemplo, que pes soas freqentemente hesitam em procurar diag nsticos mdicos para certos sintomas. O fen meno tem sido longamente reconhecido na sa bedoria popular, como naquelas histrias sobre o tratamento infeliz dado aos mensageiros que traziam ms notcias. Que os organismos traba lham mais por informaes correlacionadas com reforadores do que por informaes em si mes mas, simplesmente mais um fato do comporta mento que tem sido derivado da anlise do com portamento, e algumas vezes um fato contra o qual resistimos. Quando isso acontece, um fato que ilustra a si mesmo.

INTERAES ENTRE ESQUEMAS: CONTRASTE COMPORTAMENTAL Em esquemas mltiplos, o comportamento em um componente freqentemente afetado pelo que acontece no outro componente. Por exemplo, se o esquema que mantm o compor tamento de um pombo de bicar o disco em pre sena de um estmulo alterado de Reforo em VI, para Extino, enquanto o Reforo em VI continua durante o segundo estmulo, a reduo

do bicar o disco na presena do primeiro est mulo freqentemente acompanhada de aumento em presena do segundo, mesmo que o esquema programado durante o segundo se mantenha inal terado. O fenmeno, chamado de contraste comportamental, ilustrado na Figura 11.1 (Reynol ds, 1961b). Um esquema mltiplo V I3 min V I3 min estava programado para as respostas de um pombo, de bicar o disco tanto em presena da luz vermelha quanto da luz verde. O esquema em verde foi mudado de esquema de VI para. EXT e ento foi mudado novamente para VI, enquanto o reforo em VI foi mantido na pre sena do vermelho. A taxa de respostas no ver melho aumentou enquanto vigorava EXT em pre sena do verde, mesmo no tendo havido mu dana no VI em presena da luz vermelha; am bas as taxas retomaram a seus valores anteriores, quando o esquema de VI foi reinstalado no verde. Efeitos de contraste variam com as respos tas, os reforadores e os organismos (p. ex., Hemmes, 1973), variando desde aumentos prolonga dos at aumentos que duram apenas segundos ou minutos aps a mudana do esquema (p. ex., Catania & Gill, 1964). Esses efeitos tm sido in terpretados como a somatria de dois tipos de bicar: o bicar operante mantido pelo reforo ali mentar, e o bicar respondente produzido pela correlao de estmulos discriminativos com re foradores (p. ex., a apresentao de reforado res durante o VI, mas no durante o estmulo em EXT do mltiplo VI EXT: cf. o tpico de auto-

FIGURA 11.1 Efeitos da extino em um componente de um esquema mltiplo, sobre o responder mantido por reforo em VI, no outro componente. Ai apresentaes do vermelho e do verde no disco eram al ternadas a cada 3 minutos. Durante as ses ses, o esquema na luz verde fo i mudado de V I3 min para a extino e novamente para VI 3 min; no vermelho, fo i mantido um esquema de VI3 min para todas as con dies. O contraste comportamental refe re-se ao aumento no responder no compo nente inalterado (vermelho), quando di minui o reforo no outro componente (ver de). (G. S. Reynolds, 1961b, adaptado de Terrace, 1966, Figura 10)
Sesses -

196

A. C

harles

a t a n ia

modelagem, no Captulo 13). As duas classes tm diferentes duraes e topografias (Keller, 1974; Schwartz, Hamilton, & Silberberg, 1975).

Seo B

Esquem as Encadeados, Tandem e de Segunda Ordem

Os esquemas encadeados tm sido extensi vamente empregados para estudar os reforado res condicionados, isto , aqueles reforadores que adquirem sua capacidade de reforar por meio da relao com outros estmulos j efeti vos como reforadores (Kelleher & Gollub, 1962). Por exemplo, a luz do comedouro torna se um reforador somente por sua relao com a comida no comedouro. Uma vez que a oportuni dade de se engajar em uma resposta altamente provvel pode reforar uma resposta menos pro vvel somente se a oportunidade sinalizada, as funes condicionadas dos estmulos tm algu ma coisa em comum com as funes discrimi nativas dos estmulos.

REFORO CONDICIONADO Vamos supor que aumentssemos gradual mente o tamanho de um esquema FR programa do para as bicadas de um pombo sobre um disco branco para um valor de FR 200. Nesta condi o, sendo a comida produzida unicamente pelo bicar, o pombo mantinha facilmente uma rao diria adequada. De fato, visto que o pombo po dia comer sua dieta diria em um tempo to pe queno, durante 4 ou 5 minutos, e que cada apre sentao do alimento durava somente 4 a 5 s (in cluindo o tempo para ir do disco ao comedou ro), o pombo podia ter completado a rao do dia depois de apenas 60 reforos. Ento, em FR 200, o pombo deveria bicar 12.000 vezes ao dia para ganhar essa quantidade de comida. Pode mos esperar um desempenho tpico de FR: pau sas ps-reforo seguidas pelo bicar rpido e inin terrupto. Nosso pombo iria ganhar bastante co mida diria para manter-se vivo e saudvel por um tempo indefinido (sua expectativa de vida pode chegar a 15 anos).

Mas os pombos no podem contar muito bem, e podemos imaginar se o pombo est em des vantagem cada vez que ele cumpre suas 200 bi cadas. Suponhamos que tentssemos ajud-lo a estimar quantas bicadas faltam para completar a razo, mudando a cor do disco depois de cada 50 respostas. Cada razo comea com o disco azul para as primeiras 50 respostas; a luz do dis co muda para verde nas prximas 50, amarelo nas 50 seguintes e vermelho nas 50 respostas fi nais, a ltima das quais produz o reforador. O bicar por reforador permanece o mesmo; so mente as cores do disco mudaram. Sem estmulos distintivos, o pombo trabalha bem o suficiente, ganhando sua rao diria. Teramos ajudado provendo as cores? Os est mulos tm o surpreendente efeito de tornar o pombo mais lento. A pausa durante a razo ini cial, quando o disco est azul, aumenta. Quando o pombo finalmente responde, o bicar que ante riormente acontecia em sucesso rpida, agora ocorre esporadicamente. Quando a luz do disco se torna verde, depois das 50 bicadas, o pombo pode parar novamente antes de comear as pr ximas 50 bicadas. Quando o disco estava sem pre branco, o pombo no apresentava pausa neste ponto. Outras 50 bicadas no verde e o disco se torna amarelo. Neste momento, o pombo tem menos probabilidade de apresentar a pausa; mais 50 bicadas tornam o disco vermelho, e o pombo completa mais rapidamente as ltimas 50 bica das e a comida apresentada. Mas ento o disco est novamente azul e tem incio outra longa pausa. A introduo das cores no ajudou. O pom bo leva muito mais tempo para ganhar a comida do que quando o disco permanecia branco. De fato, embora este pombo mantivesse uma dieta adequada na condio de 200 bicadas por ali mento quando o disco estava sempre branco, seria aconselhvel examinar cuidadosamente para ter certeza de que sua ingesto diria de comida no diminuiu drasticamente. E produzi mos essas mudanas somente pela adio de al guns estmulos. Quando adicionamos as cores, quebramos as 200 bicadas em 4 unidades distintas de 50 bica das cada. Chamamos a isso d e. esquema encade ado de FR: os estmulos separados correspon

p r e n d iz a g e m

197

dem aos elos da cadeia. Mas a cadeia quebra a seqncia de 200 bicadas em quatro componen tes de FR 50, em vez de mant-las juntas de for ma mais coesa. Quando o disco estava sempre branco, bicar no incio da seqncia no era to diferente de bicar no fim, imediatamente antes do reforo. Uma vez que os estmulos foram adi cionados, contudo, bicar durante os estmulos iniciais tornou-se menos provvel do que bicar nos estmulos posteriores. No azul, por exem plo, o bicar nunca produzia comida; na melhor das hipteses ele produzia a luz verde, mas o bicar tambm nunca produzia comida durante a luz verde. Com o bicar reduzido no incio da cadeia, o tempo para completar cada conjunto de 200 bicadas aumentou. Em esquemas enca deados, quanto mais longe um estmulo estiver do fim da seqncia, menos ele manter o res ponder. Nem mesmo uma privao severa de co mida poder contrabalanar este efeito. Efeitos comparveis dos esquemas encadea dos ocorrem com outros organismos, alm de pombos, com diferentes tipos de respostas e di ferentes tipos de esquemas, com diferentes tipos e ordenao dos estmulos (Kelleher & Gollub, 1962). Dado que esses efeitos tm tal generali dade, podemos perguntar se eles so relevantes para o comportamento humano. As coisas que as pessoas fazem, naturalmente, dependem de conseqncias mais complexas do que a produ o de comida. De qualquer forma, tanto do que fazemos envolve o comportamento seqencial que podemos imaginar se algumas vezes agimos sob o peso de muitos elos em nossas cadeias. A habilidade para formular e atingir objetivos de longo prazo parece ser uma caraterstica peculi ar da espcie humana. Mas, se adicionando um nico elo cadeia pode ser to devastador para o comportamento do pombo, talvez devssemos estar atentos para efeitos similares em nosso pr prio comportamento. Neste exemplo, o responder foi fortemente mantido quando cada um dos componentes su cessivos do esquema era programado na presen a de um nico estmulo (esquemas tandem). A introduo de diferentes estmulos em cada com ponente (esquemas encadeados) reduziu subs tancialmente o responder nos componentes ini ciais da seqncia. Efeitos similares ocorrem

com esquemas encadeados de intervalo: como em nosso exemplo com o esquema FR, os dife rentes estmulos reduziram o responder com re lao ao responder que era mantido com um ni co estmulo. Como podemos conciliar essa des coberta com a afirmativa de que os estmulos su cessivos de uma cadeira deveriam tomar-se re foradores condicionados devido sua relao com o alimento no fim da seqncia? A taxa baixa nos componentes iniciais do esquema encadeado combina os efeitos discri minativos de cada estmulo (o responder nunca reforado com comida durante esses estmu los) com os efeitos reforadores da apresenta o do prximo estmulo. Com componentes de duraes comparveis, tanto os esquemas ml tiplos como os encadeados envolvem uma se qncia de estmulos que termina com um refor ador; a nica diferena entre esses dois esque mas reside no aspecto referente s mudanas dos estmulos: se so ou no produzidas por respos tas (compare um encadeado FI FI FI e uva mlti plo EXT EXT FI; ambos terminam com um ni co reforador, mas somente o esquema encadea do exige respostas no fim dos dois primeiros componentes). Com as outras condies iguala das, taxas no componente prximo ao final so normalmente um pouco maiores no esquema en cadeado do que no esquema mltiplo equivalen te, mas difcil detectar diferenas nos compo nentes iniciais (Catania, Yohalem, & Silverman, 1980). Em outras palavras, as mudanas de est mulo nos esquemas encadeados tm algum efei to reforador, mas ele fica restrito, principalmen te, aos ltimos componentes, prximos aos re foradores alimentares. Tais efeitos dependem da ordem constante dos estmulos encadeados. As pausas longas di minuem marcadamente se a ordem dos estmu los muda de um reforador para o prximo (Go llub, 1977). Efeitos anlogos, porm inversos, tambm so mantidos por esquemas de punio; comparados ao esquemas tandem, os esquemas encadeados de punio reduzem muito mais o responder nos ltimos componentes da cadeia (Silverman, 1971). Uma implicao que a pu nio depois que um delito cometido, prova velmente, tem um efeito maior sobre o compor tamento que precede o ser apanhado e efeitos

198

A. C

harles

a t a n ia

mnimos sobre os comportamentos emitidos bem antes, e que levaram ao comportamento delituoso.

Estmulos Breves em Esquemas de Segunda O rdem Os estmulos nos esquemas encadeados po dem tomar-se reforadores condicionados, mas seus efeitos como reforadores se combinam com os efeitos discriminativos, de forma que o res ponder atenuado. Contudo, esse resultado pa rece inconsistente com os efeitos de alguns est mulos que adquirem propriedades reforadoras. No comportamento humano, por exemplo, o di nheiro, supostamente, toma-se um reforador em funo das vrias coisas pelas quais pode ser tro cado (s vezes, chamado de reforador gene ralizado . , porque no depende de um reforador primrio especfico; cf. Ayllon & Azrin, 1968, sobre economia de fichas). Os primeiros experimentos sobre reforado res condicionados foram realizados durante a ex tino, depois de uma histria de empalhamen tos consistentes de um estmulo com um refor ador primrio (p. ex., tornar um som refora dor condicionado fazendo com que fosse segui do por comida e testando, depois, apenas o som). Embora esse procedimento tenha encontrado a objeo de que o responder poderia estar sendo mantido diretamente pelo reforador primrio prvio, mais do que pelo reforador condiciona do em si, era tambm um procedimento no qual a eficcia dos reforadores condicionados dimi nua rapidamente, quando o reforador primrio era removido. Algumas demonstraes convin centes de reforadores condicionados surgiram somente quando os esquemas de reforo foram aplicados sua anlise: os esquemas foram pro gramados no somente para que produzissem re foradores condicionados pelas respostas, mas tambm para a relao entre os reforadores pri mrios e os condicionados (Zimmerman, Han ford, & Brown, 1967). Por exemplo, um som pode funcionar como reforador condicionado, mesmo que seja seguido por comida somente 1 vez a cada 20. Em esquemas de segunda ordem, completar um esquema considerado como uma unidade

comportamental reforada de acordo com outro esquema, como quando o esquema de segunda ordem FR 10 (DRL 5 s) programa um refora dor para cada dcimo IRT mais longo que 5 s (este arranjo, com um estmulo breve ao termi nar cada um dos esquemas de primeira ordem, um dos vrios tipos de esquemas de segunda or dem). Consideremos um esquema programado para bicadas de um pombo no qual a bicada que completa cada intervalo fixo de 60 s produz uma breve luz verde no disco e a cada dez desses in tervalos uma bicada seguida tambm por co mida; a notao para este esquema pode incluir o estmulo breve: FR 10 (FI 60 s: verde). Nor malmente, esse esquema manteria a curvatura de FI dentro dos intervalos, embora a maioria des ses intervalos no terminasse com comida. Em contraposio aos esquemas encadeados, os esquemas de segunda ordem com estmulos breves podem ampliar bastante o responder re forado. Por exemplo, quando as respostas de pressionar um boto por um chimpanz eram re foradas com comida, de acordo com um esque ma FR 4000, as pausas ps-reforo duravam de muitos minutos at horas. Mas, quando a luz que acompanhava a apresentao de alimento acen dia brevemente aps cada 400 respostas, o res ponder aumentou e as pausas ps-reforo tpi cas decresceram para 5 min ou menos. A luz transformou o esquema simples de FR 4000 em um esquema de segunda ordem FR 10 (FR 400: luz) que ampliou substancialmente a quantidade de comportamento mantido pelos reforadores alimentares (Findley & Brady, 1965). Variveis tais como a relao entre os estmulos breves e os reforadores primrios determinam a efetivi dade dos esquemas de segunda ordem (Gollub, 1977). Os esquemas encadeados e de segunda or dem com estmulos breves envolvem os refora dores condicionados, mas seus efeitos opostos ilus tram quo criticamente os efeitos dos esquemas dependem de relaes detalhadas entre os estmu los, as respostas e as conseqncias (Morse & Kelleher, 1977; Malone, 1990, pp. 294-296). Os esquemas de segunda ordem podem tam bm incluir outros tipos de operantes, por exem plo, quando as respostas corretas em um esque ma de pareamento com o modelo (cf. Captulo 9) so reforadas de acordo com vrios esque

p r e n d iz a g e m

199

mas. Em tal contexto, nveis de preciso mais baixos podem ser correlacionados queles mo mentos em que o responder tem menor probabi lidade de ser reforado. Por exemplo, os erros so mais provveis no incio do FR ou na por o inicial da curvatura do FI do que no respon der que ocorre mais tarde e, dessa forma, mais prximo da produo do reforador (p. ex., Bo ren & Gollub, 1972; Thomas, 1979). Classes de finidas seqencialmente podem tambm impli car em classes de ordem superior. Por exemplo, as bicadas individuais so unidades funcionais, mas dentro do desempenho de FR a razo intei ra pode funcionar como uma unidade. O desem penho em FR tem uma propriedade que con sistente com as classes de ordem superior: uma vez que as classes de ordem superior sejam re foradas, as subclasses dentro dela tambm po dem ser mantidas, mesmo que deixem de ser re foradas (em outras palavras, a primeira bicada de uma razo fixa no se extingue, mesmo que ela prpria nunca produza o reforador).

Seo C

Esquemas Concorrentes

Qualquer resposta reforada tem probabili dade de ocorrer em um contexto de outro com portamento mantido por outras conseqncias. Devemos, ento, examinar os efeitos, sobre uma resposta, de um esquema de reforo operando para outras respostas. Os esquemas concorren tes so esquemas programados, simultaneamen te, para duas ou mais respostas. Considere um esquema de reforo com comida em FR 25 para as bicadas de um pombo em um disco, e um es quema de FR 50 programado concorrentemente para bicadas em um segundo disco. Cada esque ma sozinho mantm o responder, mas quando ambos operam concorrentemente, provvel que o responder seja mantido exclusivamente no dis co com o esquema de FR 25. O resultado no surpreendente. Cada reforador exige apenas 25 bicadas no primeiro disco, mas exige 50 no se gundo. Consideremos, agora, os esquemas concor rentes de intervalo, com reforos em V I30 s para bicadas em um disco e em VI 60 s para bicadas

no outro. Neste caso, o pombo produz 120 reforadores/hora, bicando apenas no primeiro dis co, e 60 reforadores/h, bicando apenas no se gundo. Bicando em ambos os discos, contudo, poderia produzir os reforadores de ambos os es quemas, ou 180 rf/h. Nesse caso, o responder pro vavelmente ser mantido em ambos os discos. Embora os pombos distribuam suas bicadas em ambos os discos com esquemas concorren tes VI VI, existe uma complicao. Se as bica das em um disco so imediatamente seguidas por reforo no outro disco, o reforador pode agir sobre a seqncia de bicadas, de forma que as bicadas em um disco so parcialmente mantidas por reforadores programados para o outro es quema (cf. Captulo 10, sobre atraso de refor o). Por isso, procedimentos concorrentes de VI incorporam um atraso sobre a mudana (COD, de cliangeover delay), que evita que qualquer resposta seja reforada imediatamente aps uma mudana (Herrnstein, 1961). Com um atraso sobre a mudana, o pombo distribui suas respos tas entre os esquemas concorrentes VIVI de for ma aproximadamente proporcional distribui o dos reforadores programados (Herrnstein, 1961); no exemplo, o pombo bica duas vezes mais freqentemente o disco de VI 30 s do que o de VI 60 s.

IGUALAO, M AXIMIZAO E ESCOLHA Este fenmeno tem generalidade o suficien te para ter sido proposto como uma lei geral do comportamento, chamada de lei da igualao (Davison & McCarthy, 1988; Herrnstein, 1970). A lei afirma que a freqncia relativa de uma resposta iguala a freqncia relativa dos refor os produzidos por aquela resposta. A lei se man tm mesmo para os esquemas concorrentes de razo, porque o responder exclusivamente em um esquema significa que todos os reforadores se ro apresentados de acordo com esse esquema. A proposio de Herrnstein tem sido aplicada tambm ao responder mantido por esquemas sim ples de reforo (p. ex., Figura 10.3), na suposi o de que outros eventos, alm dos reforado res programados pelo experimentador, tambm

200

A . C h a r le s C a ta n ia

possam ter efeitos reforadores, mesmo que no possamos identific-los. De fato, a lei da igualao resume o desem penho em uma variedade de esquemas, mas seu status como uma descrio ou como uma pro priedade fundamental do comportamento depen de de se ela pode ser derivada de processos mais simples (Catania, 1981; Rachlin, 1971). Por exemplo, consideremos como esquemas concor rentes de VI atuam quando programados para as bicadas de um pombo em dois discos. medida que um pombo bica um disco, vai passando o tempo durante o qual o esquema de VI para o outro disco pode ter tornado um reforador dis ponvel. Em um certo momento, a probabilida de de reforo para mudar ser maior do que a probabilidade de reforo para continuar a bicar no mesmo disco. Se o pombo emite a resposta com a maior probabilidade de reforo no mo mento, e se essa probabilidade muda de um dis co para o outro medida que o tempo passa, o pombo ir distribuir suas respostas em ambos os discos nos esquemas concorrentes VI VI (Hinson&Staddon, 1981;Shimp, 1966). Essa estra tgia tem sido denominada maximizao', com vrias respostas disponveis, maximizar signifi ca emitir as respostas com a maior probabilida de de reforo. Com os esquemas concorrentes de VR ou FR desiguais, essa probabilidade mai or est sempre na razo menor, mas com esque mas concorrentes de VI VI, a resposta com a maior probabilidade de reforo muda de momen to a momento; o desempenho em concorrente VI VI, assim, tem sido denominado de maximiza o momentnea. Assim, a maximizao mo mentnea no nvel molecular pode levar igua lao no nvel molar. A igualao e a maximizao parecem ser al ternativas contraditrias, mas so medidas de for mas diferentes. No podemos falar em iguala o sem alguma amostra de respostas e de refor adores, para os quais possamos estimar as fre qncias relativas, mas podemos falar em ma ximizao com respostas isoladas, observando sim plesmente se ela era a resposta com maior proba bilidade de reforo. At certo ponto, a questo diz respeito ao nvel de detalhe no qual os desempe nhos so analisados (cf. distino molar-molecu lar: Captulo 6). Alm disso, a igualao e a maxi

mizao no esgotam todas as possibilidades. Por exemplo, outras anlises tem examinado se desem penhos concorrentes podem ser descritos como otimizao (o organismo produz a mais alta taxa de reforos possvel), satisfao (alcana um re quisito mnimo, como uma dada ingesto de co mida), ou melhorao (equilibra o desempenho de tal forma que produz uma taxa igual de reforos sob diferentes condies); em seus detalhes quan titativos, esses tratamentos esto alm do escopo do presente trabalho (cf. Mazur, 1991). Uma caracterstica do desempenho concor rente a de que aumentos no reforo de uma resposta reduzem a taxa de outras respostas (p. ex., Catania, 1969; Catania, Sagvolden, & Kel ler, 1988: Rachlin & Baum, 1972). Se a taxa de respostas produzida por uma dada taxa de refor os em VI for independente de como esses re foradores so distribudos entre os dois discos, segue-se que aumentar o reforo de uma respos ta reduzir a taxa de outra. A relao est ilus trada na Figura 11.2, em que a linha curva mos tra uma verso hipottica da funo que relacio na a taxa de respostas taxa de reforos em VI (cf. Figura 10.3). A barra marcada com A mos tra a taxa de respostas quando somente as res postas em A so reforadas. Se um esquema de VI igual programado para as respostas em B, a taxa total de reforos dobra (de X para 2X). De acordo com o lei da igualao, o responder total ser distribudo igualmente entre os dois discos, como mostra a barra em 2x, marcada A e B. A taxa de A mais baixa agora, concorrente com B, do que quando A era reforada sozinha. Experimentos que observam os efeitos que ocorrem sobre as bicadas em um disco, quando as respostas e os reforos so independentemente variados em um segundo disco, demonstram que as mudanas em taxas de respostas observadas em esquemas concorrentes VIVI dependem mais dos reforadores que cada resposta produz do que da competio entre as respostas pelo tem po disponvel (Catania, 1963b; mas cf. Henton & Iversen, 1978). Em outras palavras, a reduo em uma das duas respostas concorrentes pode ser atribuda, freqentemente, a aumentos nos reforos da outra resposta, mais do que ao au mento na freqncia da outra resposta. A rela o entre as duas taxas semelhante quela do

A p re n d iz a g e m

201

Rtf/h Disco A: Disco B:

X VI EXT

2X VI VI

FIGURA 11.2 Combinao do princpio de igualao e da funo da taxa em VI (linha curva; cf. Figura 10.3) para derivar a redu o na taxa de uma resposta (A) produzida pelo reforo de uma resposta concorrente (B). O parntesis mostra quanto o reforo de B reduz a taxa de A.

contraste comportamental, mas, mesmo que haja similaridades superficiais entre esquemas con correntes e mltiplos, arriscado generalizar de um para o outro (cf. Killeen, 1972, e a seo sobre contraste comportamental, neste captulo). Variveis que tm pouco efeito em esquemas para uma resposta isolada, freqentemente, tm grandes efeitos em esquemas concorrentes. Os esquemas concorrentes so, portanto, teis para estudar os efeitos das variveis de reforo (p. ex., durao de reforo: Catania, 1963a; fora da res posta: Chung, 1965). Alm disso, os esquemas concorrentes colocam conseqncias diferentes simultaneamente disponveis, provendo proce dimentos de linha de base apropriados para o es tudo de escolha ou preferncia.

ESQUEMAS ENCADEADOS CONCORRENTES Uma programao para estudar a prefern cia o procedimento de esquemas encadeados concorrentes, ilustrado na Figura 11.3 (Herrns tein, 1964b). Dois esquemas iguais operam nos elos iniciais ; a conseqncia programada para cada um um outro esquema, um elo terminal. Esse procedimento separa a eficcia reforadora do elo terminal, das contingncias que man tm o responder neste elo terminal. Por exem plo, taxas de respostas mantidas por esquemas

concorrentes VR DRL no nos diriam se um pombo prefere os esquemas VR a DRL; taxas altas no VR e taxas baixas em DRL, mantidas por essas contingncias, no implicam em uma preferncia pelo VR. Dada uma escolha entre o responder mais baixo no DRL e mais rpido no VR, o pombo pode preferir o DRL. As cadeias concorrentes permitem esse tipo de escolha quan do programam os esquemas de VR e DRL como elos teminais (p. ex., esquemas A e B na Figura 11.3), porque o bicar no elo inicial, que produz os esquemas de VR ou DRL, no partilha ne nhuma das contingncias do VR ou do DRL. Julgamos as preferncias entre situaes no pela quantidade de comportamento que elas produ zem, mas pelas probabilidades relativas com que um organismo chega a elas. As cadeias concorrentes mostraram que a taxa de reforo um determinante mais importante da preferncia do que o nmero de respostas por reforo (p. ex., Neuringer & Schneider, 1968) e que esquemas variveis so preferidos a esque mas fixos (Hermstein, 1964a). Estudos de pre ferncias entre vrios parmetros de esquemas de reforo podem ser tecnicamente complexos, porque devem controlar diferenas no tempo ou nas respostas por reforo nos elos terminais, alm de vieses ocasionais por cores ou posies parti culares. Um controle para tais vieses pode ser obtido pela reverso ocasional das condies do elo terminal nas sesses.

202

A . C h a r l e s C a ta n ia

Elos iniciais

Reforador

Reforador

FIGURA 11.3 Diagrama esquemtico de um procedimento de cadeias concorrentes, programado para o bicar no disco pelo pombo. Nos elos iniciais, ambos os discos so brancos (W) e esquemas iguais, porm independentes (geralmente VI), operam em ambos os discos. De acordo com esse esquema, bicar no disco da direita produz o elo terminal A; no elo terminal A, o disco da esquerda fica verde (G), o disco da direita fica escuro, e bicar no verde produz reforadores conforme o esquema A. Do mesmo modo, de acordo com o esquema em vigor para o disco da da direita, bicar nele produz o elo terminal B; no elo terminal B, o disco da direita vermelho (R), o disco da esquerda est apagado, e bicar 110 vermelho produz reforos cle acordo com o esquema B. Ai taxas relativas de bicar os dois elos iniciais do disco define preferncias pelos respectivos elos terminais. Por exemplo, se um pombo bicou o disco branco da direita mais freqentemente do que o disco branco da esquerda, seria apropriado dizer que o pombo preferiu o esquema B ao esquema A.

Forrageio Natural e Sntese Comportamental Alm de seu emprego nos estudos de prefe rncia, as cadeias concorrentes tm sido empre gadas, tambm, na sntese de comportamento complexo. Se a interpretao do comportamen to complexo em um ambiente natural sugere que ele consiste em vrios componentes mais sim ples, a interpretao pode ser testada tentando co locar juntos esses componentes, em um ambiente de laboratrio. Um sucesso na sntese d suporte interpretao; um fracasso na sntese, provavel mente, revelar inadequaes nas suposies sobre o que estava acontecendo no ambiente natural. No campo da ecologia comportamental, essa estratgia ilustrada pelos estudos do forrageamento natural (p. ex., Fantino & Abarca, 1985; Kamil, Yoerg, & Clements, 1988). Em seu for rageio, os animais se deslocam de uma fonte de alimento para outra, no ambiente selvagem, per manecendo em uma rea ou mudando para ou tra, dependendo do que eles encontram. Por

exemplo, um pssaro pode voar para um arbusto no qual os ovos de um inseto comestvel tenham sido depositados. Ao com-los, o pssaro gra dualmente depreda sua presa, e o momento em que ele muda para outra fonte depender de fa tores como quanto restou de alimento, quo dis tante ele deve ir para descobrir um outro arbusto e quais as chances que existem de encontrar ou tras fontes de alimento neste local (cf. Wanchisen, Tatham, & Hineline, 1988). Alguns destes fatores podem ser simulados em cadeias concorrentes. Por exemplo, variar os esquemas programados nos elos iniciais an logo a variar o tempo e o esforo envolvidos em viajar de um arbusto para outro, e variar os es quemas nos elos terminais anlogo a variar a disponibilidade ou a depredao de fontes dife rentes de alimento em locais diferentes. Esque mas encadeados concorrentes no laboratrio, que simulam estas condies dos habitats naturais, tm revelado algumas propriedades do forrageio. Por exemplo, certos organismos so menos se letivos com relao ao alimento que eles aceiA
p r e n d iz a g e m

203

tam, se levam mais tempo viajando (mais tempo nos elos iniciais) entre fontes potenciais de ali mento; e se preferem um alimento a outro, a disponibilidade do alimento preferido (o esquema que opera durante o elo terminal no qual o alimen to o reforador) um determinante fundamental nas escolhas de uma rea de alimento (como visto pelo responder no elo inicial). Em outras palavras, o forrageio natural pode ser tratado em termos de esquemas encadeados concorrentes; as proprieda des do forrageio natural, por outro lado, podem sugerir variveis que so importantes no desem penho em cadeias concorrentes.

Preferncia por Escolha Livre Consideremos agora outra tentativa de sinte tizar o comportamento complexo, utilizando os esquemas encadeados concorrentes. Questes a respeito da liberdade so questes sobre se os organismos preferem ter alternativas disponveis. Fazendo com que dois discos fiquem dispon veis em um elo terminal enquanto um nico dis co fica disponvel no outro, podemos perguntar se os pombos preferem a escolha livre escolha forada (Catania & Sagvolden, 1980). No elo ter minal de escolha livre, bicadas em qualquer dos dois discos produzem um reforador ao final de um intervalo fixo; no elo terminal de escolha forada, o mesmo esquema de FI vigora para bicadas em um nico disco. Em esquemas como esses, os pombos preferem a escolha livre es colha forada. Tais preferncias no dependem das diferenas nas propriedades do desempenho no elo terminal, como a quantidade de respostas por reforo, nem da distribuio do responder nos dois discos na situao de escolha livre. Qual , ento, a base para a preferncia? Tal vez, o pombo tenha aprendido que existem con tingncias diferentes na escolha forada e na es colha livre. Se um disco falha durante uma esco lha livre, o outro disco est disponvel como al ternativa; se o nico disco falha durante a esco lha forada, nenhum disco est disponvel para substitu-lo. Se a preferncia por escolha livre aprendida desse modo, devemos ser capazes de revert-la ao apresentar mais reforadores du rante a escolha forada do que durante a escolha

livre. Mas, quando o fazemos, os efeitos so ape nas temporrios; a preferncia pela escolha livre retorna quando igualamos novamente os refor adores nos dois elos terminais. No podemos estabelecer uma preferncia duradoura pela es colha forada. Talvez a preferncia pela escolha livre tenha uma base filogentica. Por exemplo, dado que as fontes de alimento algumas vezes so perdi das para os competidores ou podem desapare cer, por outras razes, um organismo que esco lhe ambientes nos quais haja duas ou mais fon tes de alimento, provavelmente, ter vantagens sobre aqueles que escolherem ambientes com uma nica fonte. Se existem preferncias por es colha livre mesmo no comportamento de pom bos, elas no podem ser simplesmente produto das culturas humanas. As preferncias por esco lha livre podem ocorrer, porque contingncias evo lucionrias vem selecionando organismos que pre ferem as escolhas livres s escolhas foradas. Po demos, ento, ser capazes de mascar-la tempora riamente (p. ex., punindo as respostas durante a escolha livre, mas no durante a forada), mas no seremos capazes de elimin-la. Essa concluso baseada em dados com pombos, mas isso simples mente toma a preferncia pela escolha livre mais fundamental, porque sugere que nosso conceito humano de liberdade tem razes biolgicas. Uma sntese comportamental pode revelar propriedades do comportamento que no esta vam acessveis nas situaes fora do laborat rio, de onde ela foi derivada. Nesse exemplo, a preferncia pela escolha livre, uma vez demons trada pode, por sua vez, ser utilizada para defi nir o que se qualifica como escolha livre. Por exemplo, o pombo prefere dois discos de FI a um nico disco em FI, mas no prefere dois dis cos, um em FI e um outro em EXT, a um nico disco em FI. Em outras palavras, a escolha livre no consiste apenas na disponibilidade de duas respostas; ambas devem ser capazes de produzir um reforador.

Autocontrole Outro exemplo de sntese comportamental em esquemas concorrentes encadeados fornecido

204

A. C

harles

a t a n ia

pelo procedimento ilustrado na Figura 11.4 (Rachlin & Green, 1972). Os elos iniciais consisti am de esquemas concorrentes FR 25 FR 25 (di ferentemente dos elos iniciais com esquemas de VI, que so os mais comuns e igualam as expo sies do pombo a cada elo terminal ao tornlos igualmente disponveis, com estes ltimos esquemas o pombo pode encontrar um elo ter minal mais freqentemente do que outro). No elo terminal A, os discos ficavam escuros por T s e depois eram iluminados por vermelho e verde, respectivamente. Uma bicada no disco verme lho produzia imediatamente 2 s de comida; uma bicada no disco verde produzia 4 segundos de

comida, depois de um atraso de 4 s. No elo ter minal B, os discos tambm ficavam escuros du rante T s, mas depois disso apenas o disco verde era iluminado. Como no outro elo terminal, uma bicada no disco verde produzia um reforador maior, aps um atraso de 4 segundos. Confrontado com os discos vermelho e ver de no elo terminal A, o pombo quase que invari avelmente bica o vermelho, produzindo o refor ador pequeno, mas imediato, e no aquele mai or com atraso (Isso tem sido chamado de impul sividade). Frente ao disco verde, nico no elo terminal B, o pombo necessariamente produz o reforador grande e com atraso. Mas qual a pre-

Elos iniciais

Eio terminal A

Elo terminal B

1 resposta

1 resposta

FIGURA 11.4. Um procedimento de cadei as concorrentes que sintetiza algumas pro priedades da impulsividade, do compromis so e do autocontrole. De acordo com esque mas de FR 25, as bicadas nos discos bran cos (W) dos elos iniciais so seguidas, aps T s, pelos elos terminais. No elo terminal A, os discos vermelho (R) e verde (G) tornam disponveis, respectivamente, um reforador pequeno imediato, ou um reforador maior, porm com atraso. No elo terminal B, o dis co verde sozinho torna disponvel apenas um reforador grande e com atraso. (Adapta do de Rachlin & Green, 1972)

p r e n d iz a g e m

205

ferncia do pombo por A versus B, dado o seu responder no elo inicial? A resposta depende de T, o intervalo de tempo at que os discos do elo terminal sejam iluminados. Quando ele curto (p. ex., 1 s), o pombo geralmente produz o elo terminal A e, depois, bica o disco vermelho. Quando T maior, o pombo tende a produzir o elo terminal B, no qual apenas o disco verde est disponvel. A Figura 11.5 mostra a taxa relativa de bicar o disco da esquerda no elo inicial (bica das no elo inicial da esquerda, divididas pelo to tal de bicadas nos elos iniciais) como uma fun o de T. medida que T aumentou de 0,5 para 16 s, a proporo de bicadas que produziam o elo terminal A diminuiu; o pombo tendia, mais e mais, a entrar no elo terminal B e a produzir os reforos maiores. Durante os elos iniciais, o intervalo at o ali mento igual a T para o reforador pequeno, mas igual a T mais 4 s de atraso para o refora dor maior. Quando T curto, essa diferena relativamente grande (p. ex., para T igual a i s , os atrasos, respectivos, so de 1 e 5 segundos) e o menor atraso compensa a diferena na magni tude do reforo. Contudo, quando T longo, a diferena se torna relativamente pequena (p. ex., para T igual a 10 s, os atrasos so, respectiva

mente, 10 e 14 segundos) e a diferena nas mag nitudes do reforador toma-se efetiva. Para pro duzir o elo terminal B quando T longo, o pom bo se compromete com o reforador maior, em bora ele no fizesse isso no incio do verde, se o vermelho tambm estivesse presente. Por isso, as bicadas que produzem o elo terminal B tm sido chamadas de respostas de compromisso: elas garantem o reforador maior e com atraso, fa zendo com que o reforador pequeno e imediato no fique disponvel. (Outras snteses podem ser criadas com outros arranjos temporais: p. ex., ver Mazur, 1996, sobre procrastinao em pombos.) As situaes humanas discutidas com base no autocontrole envolvem, tipicamente, duas di ferentes conseqncias do responder, que so co locadas uma contra a outra (Skinner, 1953; Rachlin, 1974). O exemplo do pombo envolveu dois reforadores. De forma semelhante, voc pode ria comprar alguma coisa disponvel no momen to, mas se economizasse o dinheiro, poderia ad quirir alguma coisa mais valiosa mais tarde. Outros casos podem envolver eventos aversivos, como quando um alcolatra recusa um reforo imediato de uma bebida e evita as conseqn cias aversivas da ressaca. Procedimentos como aqueles ilustrados pela Figura 11.4 trazem tais

T (Segundos para o aparecimento dos elos terminais nos discos)

FIGURA 11-5 Freqncia relativa de bicadas que produzem o elo terminal A (bicadas no elo inicial esquerdo, divididas pelo nmero total de bicadas no elo inicial), como funo de T, o tem po para a iluminao dos discos do elo termi nal. (cf. Figura 11.4; adaptada de Rachlin & Green, 1972, Tabela 1)

206

A. C

harles

a t a n ia

relaes para o laboratrio, ao criarem esque mas de reforo com propriedades temporais an logas. Com o procedimento de cadeias concorren tes, podemos investigar a impulsividade e o com promisso, com reforadores imediatos e atrasa dos ou com estmulos aversivos imediatos e atra sados (p. ex., Deluty, 1978). Podemos examinar se o compromisso modificvel e se os compo nentes desta sntese de autocontrole envolvem variveis comparveis quelas que funcionam para o comportamento humano (p. ex., Grosch & Neuringer, 1981). Ao contrrio do pombo, os seres humanos, s vezes, desistem de reforado res pequenos e disponveis no momento, para ob terem reforadores maiores, embora com atraso. Os exemplos humanos de autocontrole suposta mente tambm envolvem o comportamento ver bal (cf. Captulo 15). Porm, caso processos mais complexos funcionem no autocontrole humano, eles somente podero ser identificados a partir do exame de exemplos humanos e se esses forem in consistentes com as anlises em termos de atrasos de reforos. Por essa razo, a sntese comporta mental fornece uma base essencial para a anlise do autocontrole e ilustra a relevncia dos esque mas de reforo para o comportamento humano.

Seo D

Combinaes de Esquemas e Sntese Comportamental

Vimos que os esquemas de reforo so ins trumentos que podem ser aplicados ao estudo de uma variedade de fenmenos comportamentais relevantes para as preocupaes humanas. Nos sos exemplos tm variado de relaes causais entre o comportamento e o ambiente ao auto controle e a liberdade de escolha. Mesmo os cha mados esquemas simples no so simples; a com plexidade dos efeitos de esquemas tomou alta mente tcnica a anlise dos mesmos. Examina mos as propriedades de esquemas de razo e in tervalo no ltimo captulo; neste captulo exa minamos uma amostra breve de outros tpicos, incluindo os esquemas mltiplos, encadeados, de segunda ordem, concorrentes e encadeados con correntes. Freqentemente, omitimos detalhes de

procedimento. Talvez, isso fosse inevitvel. Di ferentemente da maioria das reas deste texto, os esquemas de reforo nem mesmo existiam como um objeto sistemtico de estudo at bem recentemente (Skinner, 1956; Ferster: Skinner. 1957). Uma preocupao da rea tem sido a manuteno do comportamento em estado est vel, embora a mudana de comportamento que acompanha qualquer transio de um esquerr.i para outro seja um caso de aprendizagem. Examinamos os esquemas mltiplos, mistos, encadeados, tandem, de segunda ordem, concor rentes e encadeados concorrentes, mas eles no esgotam as possibilidades de combinaes dos esquemas bsicos. Por exemplo, os reforos po dem ser programados para completar os requisi tos de qualquer um dos dois esquemas exigidos (esquemas alternativos) ou de ambos (esquemas conjuntivos). Em um esquema alternativo FI 30 s FR 50 ou as primeiras respostas depois de 30 s, ou a 50a resposta reforada, o que quer que ocorra primeiro. Em um esquema conjuntivo FI 100 s FR 20, uma resposta no reforada at que os 100 s do intervalo tenham passado e que 19 res postas j tenham sido emitidas. Esquemas ajus tveis variam como funo de alguma proprie dade do desempenho, como quando uma razo varia em proporo ltima pausa ps-reforo, ou como quando um choque apresentado muda o intervalo RS de um esquema de esquiva. Um esquema no qual a exigncia de tempo e nmero interagem um esquema intercruzado. Por exemplo, um esquema intercruzado FR FI pode encurtar o intervalo, como funo do nmero de respostas, ou o tamanho da razo como uma fun o do tempo (um exemplo dar corda no rel gio do vov, em que o reforador a tenso da corda completamente enrolada; at que a corda seja completamente desenrolada, o nmero de voltas requeridas para dar corda aumentado com o passar do tempo). Em um esquema pro gressivo, alguns parmetros de um esquema mudam sistematicamente durante os reforado res sucessivos ou os blocos de reforadores. Por exemplo, uma razo pode aumentar a cada 10 respostas depois de cada quinto reforo (algu mas vezes h uma segunda resposta disponvel que reajusta as progresses a algum valor ini cial, de acordo com algum esquema).

p r e n d iz a g e m

207

Por convenincia de referncia, as principais combinaes de esquemas so apresentadas na Tabela 11.1. A tabela apresenta as definies, exemplos, e as abreviaes padro. As designa es formais podem tornar mais bvias algumas

relaes entre os esquemas. Por exemplo, os es quemas mltiplos e mistos envolvem a alterna o de esquemas componentes, e os esquemas tandem e encadeados envolvem seqncias na qual completar um dos esquemas produz um

TABELA 11.1 Esquemas combinados Esquema Mltiplo Definio1 A, durante SA, alterna com B, durante SBExemplo (com Abreviao)2 (A) VI durante luz vermelha se alterna com (B) EXT durante luz verde (mult VI EXT) (A) DRL alterna com (B) FI, sem est mulos correlacionados (rnix DRL FI) Completar (A) VR em presena de luz azul, produz luz amarela; completar (B) FR na luz amarela, produz comida (ichain VR FR). Completar (A) VR produz (B) DRH e completar DRH produz comida, na ausncia de estmulos correlacionados (itand VR DRH). (A) Um esquema de VI vigora para bi cadas no disco da esquerda e (B) ou tro VI opera para bicadas no disco da direita (conc VI VI). (A) VI e (B) esquiva operam, simulta neamente, para presses em uma ni ca barra (conjt VI Esquiva). (A) FRs sucessivas so tratadas como unidades de respostas reforadas de acordo com (B), um esquema de FI (FI [FR]). O responder reforado ao satisfazer as contingncias de (A) VR ou de (B) VI, o que ocorrer primeiro (altem VR VI). O responder reforado ao satisfazer ambas as contingncias de (A) FR e de (B) FI, em qualquer ordem (conjunc FR FI). O responder reforado quando (A) a soma das respostas mais (B) o nmero de segundos decorridos, alcanam al gum valor constante (Inter FR FT). Depois de cada ensimo reforador. t s so adicionados ao FI (Progressive FI)

Misto Encadeado

A e B se alternam (como nos esquemas mltiplos, mas sem estmulos diferentes). Durante SA, completar A produz SB; durante SB, completar B produz o reforador.

Tandem

Completar A produz B; completar B pro duz o reforador (como no encadeado, mas sem estmulos diferentes). A opera para uma resposta; simultaneamen te, B opera para outra resposta.

Concorrente

Conjugado

De segunda ordem

Alternativo

A e B operam ao mesmo tempo, mas inde pendentemente, com uma nica resposta (como no concorrente, mas sem respos tas diferentes). Completar A reforado de acordo com B (reforar um esquema de segunda ordem, de acordo com um terceiro esquema, C, cria um esquema de terceira ordem e as sim por diante). 0 reforador depende de completar exign cias de A ou de B. 0 reforador depende de completar as exi gncias tanto de A quanto de B.

Conjuntivo

Intercruzado

0 reforador depende de completar algu ma funo combinada de A e B.

Progressivo

Alguns parmetros do esquema mudam, sis tematicamente, ao longo de reforos su cessivos ou para blocos de reforadores.

1 Por convenincia, cada caso definido em termos de apenas dois esquemas componentes arbitrrios, A e B, mas combinaes de esquemas podem incluir qualquer nmero de componentes. Os estmulos so designados por S, com um subescrito que identifica o esquema que o estmulo acompanha. 2 NT. As abreviaes dos esquemas foram mantidas como no original, em ingls.
208

A.

C h a r le s C a ta n ia

outro. Nos pares de esquemas misto-mltiplo e nos pares de tandem-encadeado, a nica distin o est em se os esquemas componentes ope ram com diferentes estmulos ou durante um nico estmulo. Da mesma forma, a nica dis tino entre os esquemas concorrentes e os con jugados se os dois esquemas simultneos so programados para respostas diferentes ou para uma mesma resposta. Esses esquemas combinados so nossas fer ramentas. Uma vez que empregamos de esque mas para explorar as propriedades de comporta mentos complexos por meio de uma anlise do comportamento, podemos estar na posio de uti lizar esses instrumentos para recolocar as partes analisadas em uma sntese comportamental. Por

exemplo, podemos testar nossa interpretao do comportamento complexo em um habitat natu ral ao tentar reunir seus componentes em um ambiente de laboratrio. No podemos criar uma sntese comportamental sem tornar explcitas nossas suposies sobre as propriedades do com portamento que tentamos sintetizar. Por isso, quando tentamos sintetizar, provavelmente, ga nhamos mais de nossas falhas do que de nossos sucessos. De fato, pode ser um princpio geral de pesquisa cientfica, que aprendemos mais quando nossos experimentos produzem dados que no esperamos. Afinal, qual a vantagem de realizar experimentos, se sabemos exatamen te no que eles resultaro?

p r e n d iz a g e m

209

Comportamento Respondente: Condicionamento

12

O condicionamento respondente um tpico que tem dominado a Psicologia da Aprendiza gem de tal maneira que compe o captulo de abertura de muitos livros-texto sobre aprendiza gem. Alm da expresso condicionamento res pondente, esse tpico tem sido referido por no mes como condicionamento clssico e condicio namento pavloviano. A linguagem dos reflexos condicionados, em alguma medida, penetrou no vocabulrio do cotidiano (embora, no uso popu B. Interaes Operante-Respondente: Emoo lar, haja confuso freqente com instncias de Condicionamento e Emoo comportamento operante). Estmulos Pr-aversivos e Pr-apetitivos O termo condicionado, da expresso russa C. Limites Biolgicos da Aprendizagem para reflexos condicionados, uslovnyi refleks, Limites Sensoriais poderia ter sido melhor traduzido como condi Limites Motores cional, porque o termo foi aplicado para desig Limites sobre as Conseqncias nar reflexos condicionais a relaes entre est Preparao mulos ambientais. O condicionamento respon dente uma instncia de controle de estmulo aplicado a operaes de apresentao de estmulo em vez de a contingncias envolvendo opera O vocabulrio relativo emoo inclui inme es de conseqenciao. Em outras palavras, ros grupos etimolgicos. Por exemplo, eager (dese em vez de sinalizar as conseqncias do respon joso), anger (clera) e anxiety (ansiedade) compar der, um estmulo simplesmente sinaliza a apre tilham as mesmas razes com choleric (colrico), melancholy (melancolia), glad (alegre) e glee (re sentao de um outro estmulo. O condiciona gozijo), wrath (ira) e worry (preocupao) e sad (tris mento, por Pavlov, de reflexos de salivao, for te) e satisfy (este ltimo par est relacionado a sati nece o exemplo prototpico: quando uma sineta, ate, saciar). A palavra fear (medo), do indo-eurorepetidamente, sinalizava a colocao de comi peu per- (tentar, arriscar, impulsionar, empurrar para frente ou liderar), tem um extenso grupo de paren da na boca de um co faminto, a salivao, que tesco que inclui experiment (experimento) e appa era eliciada pela comida, passou a ser eliciada ratus (aparato), probability (probabilidade) e oppor tambm pelo estmulo sinalizador. (Ironicamente, tunity (oportunidade), approach (abordagem) e de possvel que Pavlov nunca tenha usado uma si privation (privao), e dois sinnimos contempor neta em seus experimentos; sua rara meno a si neos de behavior (comportamento), comportment (comportamento) e performance (desempenho). netas ocorre somente em trabalhos posteriores e,
A. Reflexos Condicionais Tipos de Condicionamento Condicionamento e Contigidade Combinaes de Estmulo no Condicionamento Sombreamento e Bloqueio Estmulos Inibitrios em Compostos Pr-condicionamento Sensorial e Condicionamento de Segunda Ordem Contigidade e Conseqncias Automodelagem e Automanuteno

neste caso, provavelmente, referem-se a dispositi vos operados eletricamente. As onipresentes refe rncias sineta de Pavlov podem ter se originado a partir do uso comum, nos escritos de J. B. Wat son e outros, de exemplos sobre a salivao diante de um toque de sineta que avisa s pessoas que o jantar est pronto. Pavlov possua de fato uma si neta, mas a deixava sobre a escrivaninha, usandoa, provavelmente para chamar seus auxiliares.) Ao discutir sobre o comportamento operan te, falamos de classes de respostas, em vez de instncias individuais, porque as respostas indi viduais nunca so repetidas exatamente. Proble mas similares existem com o comportamento eliciado. Por exemplo, as eliciaes sucessivas de saliva pela comida podem diferir em latncia, quantidade, viscosidade e outras proprieda des. Portanto, apropriado estender a linguagem de classes de modo a abranger tambm as res postas definidas pelos estmulos que as produ zem. Essas classes, denominadas respondentes, correspondem ao comportamento anteriormen te denominado eliciado ou reflexo. Assim, a sa livao produzida pela comida na boca uma classe respondente; ela deve ser distinguida da salivao produzida pelo cido na boca, que uma classe respondente diferente, e tambm da salivao espontnea. Esta ltima no de modo algum uma classe respondente, uma vez que no h um estmulo eliciador (a salivao espont nea emitida, e no eliciada; se pudssemos iden tificar um estmulo eliciador no diramos que ela espontnea). Daremos incio a este captulo, discutindo o comportamento gerado por vrios tipos de con dicionamento pavloviano ou respondente. De pois, vamos considerar como tal comportamen to pode interagir com o comportamento operan te. Veremos que essas interaes so relevantes para o tpico da emoo. Terminaremos o cap tulo com uma seo sobre as restries biolgi cas sobre a aprendizagem.

Seo A

Reflexos Condicionais

Produzimos comportamento respondente atravs da apresentao de estmulos e modifi

camos o comportamento respondente atravs de modificaes em tais estmulos. Por exemplo, di ferentes concentraes de cido na boca (p. ex., diluies de vinagre) eliciam diferentes quanti dades de saliva. Isso significa que h limites na extenso pela qual podemos modificar o com portamento respondente. Podemos criar novos operantes atravs da modelagem, mas as proprie dades dos respondentes so determinadas por seus estmulos eliciadores, de modo que no h, para o comportamento respondente, um proce dimento anlogo modelagem. Mas podemos alterar os efeitos eliciadores dos estmulos. Exa minemos, com mais detalhes, o procedimento de Pavlov (1927) Comecemos com um co preso em arreios, com um de seus dutos salivares conectados a um sistema que registra a salivao. Usamos dois estmulos: o som de uma campainha e comida, esta ltima em uma forma que possa ser deposi tada diretamente na boca do co. Primeiro, exa minemos os efeitos de cada estmulo separada mente. Quando tocamos inicialmente a campai nha, o co levanta as orelhas e vira a cabea em direo ao som. Isso tem sido chamado de uma resposta de orientao. Ela diminui medida que a campainha repetidamente acionada, tornan do-se, talvez, at mesmo impossvel de detectar; ela pode ser restabelecida se esperarmos algum tempo antes de soar novamente a campainha (cf. habituao, Captulo 4). Quando a comida co locada na boca, o co engole e saliva. Essas res postas podem diminuir um pouco medida que a comida repetidamente colocada, mas a mag nitude delas permanece substancial durante o curso de uma sesso. Suponhamos agora que a campainha passe a sinalizar a comida, tocando por 5 s antes de cada apresentao de comida. Depois de um nmero de tentativas, a salivao passa a iniciar-se, al gumas vezes, no perodo de 5 s entre a campai nha e a comida, e, algumas vezes, a campainha seguida por salivao at mesmo em uma tenta tiva ocasional em que a comida for omitida. Em nenhum desses dois casos, podemos atribuir a salivao ao da comida como estmulo eli ciador: no primeiro caso, a salivao teve incio antes que a comida fosse apresentada, e no se gundo caso a comida nem mesmo chegou a ser

A p re n d iz a g e m

211

apresentada. Na medida em que a campainha ad quiriu o poder de eliciar a salivao, dizemos que criamos uma nova classe respondente, a sa livao eliciada pelo som da campainha. Ns de nominados a relao entre a campainha e a co mida de reflexo condicional, porque essa rela o condicional a uma relao prvia entre a campainha e a comida. A seqncia de eventos ilustrada na Figura 12.1. A campainha inicialmente elicia respostas de orientao, mas elas desaparecem com as apresentaes repetidas; neste ponto, a campai nha um estmulo neutro (NS). A comida elicia a salivao, em um reflexo incondicional; nessa relao, a comida um estmulo incondicional, ou US, e a salivao uma resposta incondicio nal, ou UR. O condicionamento se inicia quan do a campainha prediz com fidedignidade a co mida; neste ponto, a campainha ainda no tem efeito sobre a salivao e pode continuar a ser considerada como um estmulo neutro. Depois de um perodo de condicionamento, cria-se um reflexo condicional', a campainha elicia a saliva o antes que a comida seja apresentada (a) ou mesmo quando a comida omitida em uma tenta tiva ocasional (b). A campainha agora um est mulo condicional ou CS, e a salivao eliciada pela campainha uma resposta condicional, ou CR.

A diferena entre um estmulo condicional e um estmulo incondicional no simplesmente qual dos dois vem primeiro. Se invertessemos a ordem deles, os efeitos eliciadores da comida quando seguida pela campainha no seriam muito diferentes dos efeitos da comida quando apresentada sozinha. De fato, podemos ser ca pazes de predizer a eficcia relativa de estmu los como CSs e USs, a partir das probabilidades de que estes estmulos eliciem suas respectivas respostas (cf. Captulo 5 sobre a relatividade do reforo). Consideremos, por exemplo, a saliva o eliciada pela comida na boca de um co e a flexo da perna produzida por um choque na perna do co. Um choque brando pode tornarse um estmulo condicional, eliciando a saliva o, se a sua apresentao for sistematicamente seguida por comida, mas isso provavelmente no acontecer com um choque forte. Por outro lado, a comida pode tornar-se um estmulo condicio nal, eliciando a flexo da perna, se a sua apre sentao for sistematicamente seguida por um choque forte, mas isso provavelmente no acon tecer com a comida seguida por um choque fra co. As diferenas so consistentes com as pro babilidades relativas de que a comida elicie a salivao e de que o choque forte ou brando pos sa eliciar a flexo da perna.

Estmulo Neutro

Sineta | ' s%- (Resposta de Orientao) iC om idal v.

NS

(OR)

Reflexo Incondicional

| Sineta |

............

US Salivao

*- UR

Condicionamento

|ComidaJ Salivao

M C

u s

IIP

a. Condicionamento Reflexo b.

| Sineta

|com idaj

^-S alivao

Salivao

"

C S *-C R U S *-U R ou C S ------------------ CR

J Sineta *Tempo Salivao

FIGURA 12.1 Relaes entre estmulos e respostas no condicionamento respondente. Um estmulo inicialmente neutro (SINETA: NS) seguido por um estmulo incondicional (COMIDA: US) que elicia a salivao. Se o estmulo neutro comea a eliciar respostas como aquela eliciada pelo estmulo incondicional, o estmulo neutro passa a ser denominado estmulo condicional (CS). OR = resposta de orientao; UR = resposta incondicional; CR = respos ta condicional. (As siglas foram mantidas como no original, em ingls).

212

A . C h a r le s C a ta n ia

As diferenas entre a CR e a UR no so ape nas de ordem temporal. Por exemplo, a forma ou topografia de uma flexo condicional de per na tipicamente difere da forma de uma flexo incondicional eliciada por um choque eltrico. De modo geral, uma CR no meramente uma UR eliciada por um novo estmulo; em outras palavras, o condicionamento respondente no pode ser interpretado como substituio de est mulo; no caso clssico de Pavlov, por exemplo, a campainha no substitui a comida (o co no tenta comer a campainha). Um CS pode afetar uma ampla faixa de respostas, alm daquelas que se assemelham resposta eliciada pelo US. Muitos reflexos condicionais diferentes tm sido criados por meio de procedimentos respondentes (p. ex., ver Hull, 1934). O condiciona mento salivar de Pavlov provavelmente o mais familiar, mas outros estudos demonstraram con dicionamento, usando relaes incondicionais tais como o movimento de joelho, eliciado por uma batida no tendo patelar (Twitmyer, 1902/ 1974) e a retirada de um membro, eliciada por choque eltrico (Bechterev, 1933). O condicio namento tambm funciona com piscadas de olho eliciadas por um jato de ar sobre o olho (p. ex., Gormezano, 1972), mas o condicionamento da constrio pupilar eliciada por luz no olho, que j havia sido considerado factvel, no tem sido obtido (Young, 1958). A literatura especializa da russa inclui uma variedade de demonstraes de condicionamento (p. ex., Bykov, 1957). Por exemplo, um co foi colocado por vrios dias em uma rea de espera com temperatura neutra, antes de ser levado a uma sala aquecida, e seu metabolismo e consumo de oxignio comearam a decrescer na rea de espera assim como na rea aquecida. De modo inverso, quando a estadia na rea de espera era seguida por transporte para uma sala fria, o metabolismo e consumo de oxi gnio do co comeava a aumentar na rea de espera, assim como na rea fria (Bykov, 1957, pp. 183-210). Consideremos um outro exemplo. A libera o de insulina pelo pncreas uma UR produ zida pelo US do acar no intestino (Deutsch, 1974). Esse US sistematicamente precedido pelo sabor de acar, o que toma provvel que esse sabor torne-se um CS para a liberao de

insulina. Suponhamos, agora, que voc tenha acabado de deixar de beber refrigerantes com acar, mudando para suas verses dietticas, sem acar. Como um CS, o sabor doce do refri gerante elicia a liberao de insulina, que ordi nariamente utilizada medida que voc digere o acar. Mas agora o seu refrigerante no contm acar, de modo que voc pode esperar sentir-se fraco ou tonto medida que a insulina produz um decrscimo substancial no seu nvel de a car no sangue (hipoglicemia). Esse efeito era especialmente comum, quando os refrigerantes sem acar foram inicialmente introduzidos e as pessoas s tinham familiaridade com as verses padro. O efeito menos notado hoje em dia, porque uma substituio apenas ocasional de um refrigerante sem acar por um convencional pode enfraquecer substancialmente o efeito. Outros efeitos de condicionamento tm sido de monstrados com uma variedade de respostas fi siolgicas (p. ex., reaes do sistema imunolgico: Ader & Cohen, 1985). Com alguns tipos de USs, o condicionamen to respondente leva a CSs que eliciam respostas compensatrias, ou seja, respostas que agem contrariamente aos efeitos do US, em vez de res postas similares quelas eliciadas pelo US. Tais casos apresentam ainda um outro tipo de evidn cia de que o condicionamento respondente no uma mera substituio de estmulo. Um exem plo ocorre no condicionamento respondente com opiceos tais como morfina ou herona (Siegel, 1977). Dentre os efeitos destas drogas est a anal gesia, ou seja, um limiar elevado para a dor. Com doses continuadas, os eventos que conduzem administrao da droga (p. ex., preparar a serin ga) tm probabilidades de se tornarem CSs, que eliciam uma CR. Mas esta CR no fortalece a analgesia e outros efeitos das drogas; em vez disso, ela age em sentido contrrio a estes efei tos (por exemplo, ela produz hiperalgesia, um limiar rebaixado para a dor, isto , em outras palavras, o oposto da analgesia). Como resulta do, doses cada vez maiores da droga passam a ser necessrias para produzir os efeitos originais (esses so alguns dos fatores envolvidos no de senvolvimento de tolerncia droga). Resumin do, o US a droga na corrente sangnea, e um componente da UR a analgesia; o CS qual

p r e n d iz a g e m

213

quer evento que precede com fidedignidade a ad ministrao da droga, e a CR uma resposta fi siolgica que age em sentido contrrio analge sia e a outros efeitos da droga. Os viciados em herona, freqentemente, to mam suas drogas no mesmo lugar e com os com panheiros usuais, usando um ritual consistente de droga. Consideremos agora um viciado que, por uma razo qualquer, toma a droga em algum outro lugar e em companhia diferente. A dose grande, mas muitos dos CSs que, usualmente, a precedem esto ausentes, de tal modo que uma CR bem menor do que a usual eliciada. O efei to da droga ocorre, mas desta vez no contra balanado pela resposta compensatria usual. Sob tais circunstncias, uma dose de droga que seria ordinariamente tolerada pode vir a ser fatal (Siegel e col., 1982); internaes hospitalares e/ ou mortes por overdose de herona so especial mente provveis quando os viciados tomam a droga em condies diferentes daquelas que so usuais ou familiares.

TIPOS DE CONDICIONAMENTO As relaes temporais entre dois estmulos podem ser programadas de vrias maneiras. As situaes nas quais o incio do CS precede o in cio do US por no mais do que 5 s so algumas vezes arbitrariamente agrupadas em conjunto como instncias de condicionamento simultneo. Essa conveno baseada, talvez, em duas cir cunstncias: o intervalo timo entre um CS e um US aproximadamente de meio segundo (p. ex., Kimble, 1947) e omisses do US algumas vezes reduzem a fidedignidade da manuteno do con dicionamento respondente. Intervalos curtos, tais como meio segundo, do pouca oportunidade para que se observe o responder condicional. A escolha, ento, era a de omitir o US em algumas tentativas ou aumentar o intervalo entre o incio dos estmulos. Uma vez que o condicionamento tornava-se menos fidedigno com as omisses de estmulos, o prolongamento do intervalo entre o incio dos estmulos veio a ser preferido em re lao a omisses ocasionais do US, e a distino entre simultaneidade estrita e esses atrasos relati vamente pequenos acabou sendo negligenciada.

O efeito de omisses ocasionais do US tem ramificaes tericas. Em uma terminologia que vem-se tomando rara, as apresentaes do US no condicionamento respondente eram denomi nadas reforo e, portanto, o procedimento no qual este estmulo era omitido em tentativas ocasio nais era denominado reforo parcial. Assim, al guns argumentos a favor de uma distino entre condicionamento operante e respondente foram propostos, com base no chamado efeito de re foro parcial, ou PRE: o reforo parcial gerava quantidades substanciais de responder quando comparado com o reforo de todas as respostas, como vimos no Captulo 10, enquanto o proce dimento anlogo no condicionamento respon dente parecia reduzir o responder (ver, no en tanto, Gibbon e col., 1980). Agora que o termo reforo tornou-se mais restrito em seu mbito, essa comparao no mais parece relevante. H algum tempo atrs, no entanto, ela forneceu uma das bases mais convincentes para que se distin guisse entre os dois tipos de condicionamento. Alguns arranjos de CSs e USs so contrasta dos com o condicionamento simultneo na Fi gura 12.2. Tanto no condicionamento de trao quanto no condicionamento com atraso, um in tervalo relativamente longo de tempo transcorre entre o incio do CS e o incio do US; esses dois arranjos de condicionamento distinguem-se por que num deles o CS desaparece e no outro ele fica presente ao longo deste intervalo. (O tempo entre o incio do CS e do US pode variar inde pendentemente da superposio temporal entre CS e US. Por exemplo, no condicionamento com atraso, o CS pode terminar no momento do in cio do US ou pode terminar no momento do tr mino do US; esse aspecto do tempo de apresen tao de CS e US no relevante para as distin es de procedimento apresentadas na Figura 12.2.). Tanto no condicionamento de trao quanto no com atraso, o responder condicional de in cio ocorre pouco aps o incio do CS, mas, ao longo de tentativas sucessivas, ele gradualmen te se move de modo a situar-se mais perto do momento em que o US vir a ser apresentado. O condicionamento de trao adquiriu seu nome a partir da suposio de que o CS, para ser efeti vo, precisava deixar algum trao no sistema ner voso do organismo.

214

A. C

harles

a t a n ia

Condicionamento Simultneo

CS

US <5s

J o m id ^

Condicionamento de Trao

C S ______ I Sinetal

US

Condicionamento de Atraso

CS US

I Sineta

Condicionamento Temporal

US_

_ J c m id J _

Intervalos constantes entre as apresentaes de comida

Condicionamento Reverso

CS. L us

Condicionamento Diferencial US Tempo

FIGURA 12.2 Representao esquemtica da apresentao de vrios procedimentos respondentes, mostrando uma sineta como CS e a comida como US. No condicionamento simultneo, a sineta seguida por comida em menos de 5 s. Relaes temporais diferentes so ilustradas para o condicionamento de trao, condicionamento atrasado e condicionamento temporal, e a ordem do estmulo invertida no condicionamento reverso. No condi cionamento diferencial, a sineta seguida por comida, mas um tom no . CS = estmulo condicional; US = estmulo incondicional.

Mas apresentaes sucessivas do prprio US a intervalos regulares (por exemplo, a cada meia hora), tambm produzem um responder condi cional; esse procedimento denominado condi cionamento temporal, e diz-se, s vezes, que o responder condicionado ao tempo como um es tmulo (o condicionamento temporal envolve a apresentao repetida de um estmulo e, portan to, equivalente a algumas operaes de apre sentao de estmulo descritas no Captulo 4).

A reverso da ordem dos dois estmulos denominada condicionamento reverso. Por ra zes tericas, considerou-se, por longo tem po, que esse arranjo era ineficaz para a pro duo do responder condicional. Ele fre qentemente menos eficaz do que outros pro cedimentos de condicionamento, mas tem sido ocasionalmente demonstrado, particularmen te, com CSs aversivos:

p r e n d iz a g e m

215

...o senso comum nos leva a esperar que os animais tenham a habilidade de responder defensivamente a um estmulo novo detectado depois de um evento aversivo sbito. Um animal que tenha visto um pre dador no-familiar depois de um ataque malsucedi do, seguramente no se submeter a um novo ata que (i.e., a um pareamento entre predador e presa, nesta ordem) antes de reagir defensivamente. (Spetch, Wilkie, & Pinei, 1981, p. 163; cf. reaes de defesa especficas da espcie, no Captulo 6)

Finalmente, um procedimento no qual um estmulo torna-se um CS por meio de sua rela o com o US, enquanto um segundo estmulo no se toma CS, porque nunca precede o US, denominado condicionamento diferencial. Os estmulos so algumas vezes denominados est mulos condicionais positivo e negativo (CS+ e CS-). Em todos esses casos, o CS deve produzir a CR por causa de sua relao com o US e no por outras razes. Por exemplo, se um estmulo vi sual e um choque traumtico ocorrem juntos, uma futura resposta de susto diante do estmulo vi sual pode no significar necessariamente que este tenha tornado-se um CS. Uma resposta de susto pode ser eliciada por uma variedade de estmu los incuos, aps um choque traumtico, mes mo que esses estmulos nunca tenham ocorrido juntamente com o choque. Esses so os casos de pseudocondicionamento (cf. Ison & Hoffman, 1983, e sensitizao, no Captulo 4). CONDICIONAMENTO E CONTIGUIDADE Algo da ateno que historicamente foi de dicada ao condicionamento respondente pode ter dependido do quo facilmente ele podia ser re lacionado ao conceito de associao, um princ pio de aprendizagem com precedentes substan ciais na histria da Filosofia e da Psicologia. A aprendizagem, dizia-se, tem lugar atravs da as sociao de idias, e os reflexos condicionais pareciam representar um exemplo primitivo da formao de tais associaes. Se as idias eram associadas, argumentava-se, ento uma podia conduzir a outra. Em um tipo de qumica men tal, supunha-se que as idias tornavam-se asso ciadas atravs de propriedades tais como o fato

de possurem elementos comuns ou ocorrerem juntas no tempo. Um passo seguinte foi sugerir que as idias podiam ser interpretadas como res postas geradas por eventos ambientais, de tal modo que a lembrana de um evento no passado despertaria outras lembranas com as quais a primeira tivesse ocorrido. No precisamos lidar com os detalhes. Mes mo aqueles segmentos da Psicologia da Apren dizagem contempornea que ainda podem ser denominados associacionistas evoluram consi deravelmente em relao s antigas formulaes. J observamos que o condicionamento respon dente no pode ser interpretado como simples mente tornar um estmulo um substituto para outro. Para o presente, o ponto que o condicio namento respondente foi considerado como o processo que estava na raiz de toda a aprendiza gem, e foi assumido que ele ocorria meramente atravs da contigidade temporal de eventos, ou seja, de sua ocorrncia conjunta no tempo. Deba tes tericos giraram em tomo da primazia do con dicionamento respondente e outros processos, dan do-se ateno particular busca de maneiras de interpretar o comportamento instrumental ou ope rante, como uma instncia de comportamento ge rado por princpios respondentes (para as vrias posies dessa discusso, ver Guthrie, 1935; Hull, 1943; Konorski, 1948; Mowrer, 1960; Schlosberg, 1937; Skinner, 1935b; Smith, 1954). Parte do problema era que as contigidades entre os estmulos no eram adequadamente dis tinguidas das contingncias estmulo-estmulo. A contigidade definida por pareamentos en tre estmulos, ou seja, o nmero de vezes que os estmulos ocorrem juntos. Contudo, mesmo quando o nmero de estmulos permanece cons tante, as relaes de contingncia entre CSs e USs podem variar. Por exemplo, vamos assumir que a campainha (Sl) e a comida (S2) sejam ar ranjadas dentro de tentativas, e que podemos ig norar os estmulos que demarcam as tentativas. As fileiras na Figura 12.3 apresentam amostras de 10 tentativas, de trs diferentes procedimen tos de condicionamento. Em cada uma delas, S 1 pareado com S2 nas tentativas 2, 5 e 7. Na fi leira de cima, somente essas tentativas incluem S2, o qual , portanto, perfeitamente correlacio nado com Sl; a probabilidade de S2 1,0 dado

216

A. C

harles

a t a n ia

2
1

7
~

10

p(S2/S1)
1.0

p<S2/noS1)
O

s i ------------n ---------------------- "

S2 -------- ----- I ~

-----------------

51
52 1.0 1.0

s i---n n_
S2

j~i_ j - i_____n_
.50 .75

FIGURA 12.3 Relaes condicionais entre dois estmulos, SI e S2. A linhas representam as amostras de 10 tentativas de trs procedimentos de condicionamento. Cada um envolve exatamente trs emparelhamentos de SI e S2 (nas tentativas 2, 5 e 7), mas o SI prediz o S2 somente no procedimento superior. Na procedimento do meio, o S2 igualmente provvel dado SI e em ausncia de Sl, e no procedimento embaixo o S2 menos provvel dado SI do que na ausncia de Sl. A probabilidades de S2 dado S l e em ausncia de S l so mostradas direita e so representadas, respectivamente, como A, B e C na Figura 12.4. (Cf. Rescorla, 1967)

Sl, mas zero na ausncia de S l, de modo que Sl prediz perfeitamente a ocorrncia de S2. Na fileira do meio, S2 ocorre em todas as tentativas e, portanto, S 1 irrelevante em relao ocor rncia de S2: a probabilidade de S2 1,0, quer Sl ocorra ou no. Na fileira de baixo, Sl ocorre em 6 tentativas, mas em apenas metade delas seguido por S2, enquanto S2 ocorre em trs quar tos das tentativas, nas quais Sl no apresenta do: a probabilidade de S2 mais baixa quando S1 apresentado (0,5) do que quando no apre sentado (0,75). A Figura 12.4 mostra estas trs condies no interior de um espao de contingncia para rela es estmulo-estmulo. Somente no primeiro procedimento provvel que S 1 torne-se um CS efetivo; no ltimo procedimento, Sl pode at mesmo reduzir a probabilidade de responder condicional eliciado pelos estmulos da tentati va. A base apropriada para classificar os proce dimentos de condicionamento a relao condi cional entre os dois estmulos (contingncia), e no o nmero de pareamentos (contigidade) (Rescorla, 1967, 1988).

FIGURA 12.4 Um espao de contingncia estmuloestmulo. O quadrado unitrio mostra as probabilida des condicionais do estmulo S2 dado o estmulo S l e em ausncia do estmulo S l. Os trs pontos, A, B e C, correspondem aos trs procedimentos da Figura 12.3. (Cf. Figuras 4.2 e 5.9)

COMBINAES DE ESTMULO NO CONDICIONAMENTO O fato de um estmulo tornar-se ou no um CS efetivo depende do contexto de estmulos em que ele aparece (Kamin, 1969); um estmulo nousual ou um estmulo familiar em uma situao

no-usual tem maior probabilidade de tornarem se efetivos do que um estmulo familiar em uma situao familiar. s vezes, o prprio contexto pode tomar-se efetivo como um CS. Por exem plo, um rato pode aprender que um CS segui do por um US quando ele est na cmara experi mental, mas no quando ele est em sua cmara viveiro. A cmara experimental , com efeito, um estmulo em cuja presena a contingncia CSUS opera (como resultado, o rato pode no res ponder ao CS quando este for apresentado em sua cmara viveiro). No contexto do condicio

p r e n d iz a g e m

217

namento respondente, tais estmulos tm sido de nominados estabelecedores de ocasio, no sen tido de que eles estabelecem a ocasio na qual a contingncia estmulo-estmulo operar (p. ex., Rescorla, 1988). Tais estmulos no eliciam o responder; eles modificam os efeitos eliciadores de outros estmulos (o vocabulrio de estabele cimento de ocasio , s vezes, aplicado tam bm a CSs individuais, no sentido de que eles estabelecem a ocasio em que um US poder ser apresentado). O estabelecimento de ocasio uma das muitas possveis funes de estmulo que podem ser produzidas por combinaes de
estm u lo s no c o n d ic io n a m e n to resp o n d en te.

Consideremos, agora, exemplos de algumas ou tras funes.

dicionais sejam observadas, poderemos verifi car que a luz, e no o tom, tomou-se um CS efe tivo, mesmo que o tom tenha precedido o cho que com tanta fidedignidade quanto a luz. Quan do um estmulo deixa de se tornar um CS efeti vo por ser apresentado juntamente com um ou tro estmulo que j efetivo, dizemos que o est mulo com histria anterior bloqueou o condicio namento para o novo estmulo. Esse procedimen to mostrado, esquematicamente, como bloqueio na Figura 12.5. (Fenmenos anlogos podem ocorrer em discriminaes operantes e lembramnos que discriminaes operantes e condiciona mento respondente so, ambos, instncias de controle de estmulo.)

Estmulos Inibitrios em Compostos Sombreamento e Bloqueio Vamos supor a apresentao simultnea de um tom alto e uma luz fraca, seguidos por um US, tal como um choque que elicia uma flexo de pata. Depois que o responder condicional a esse par de estmulos se desenvolve, poderamos apresentar cada estmulo separadamente e veri ficar que o tom tomou-se um CS muito mais efe tivo do que a luz. (O conceito de ateno, como na discriminao operante, relevante para o condicionamento respondente; poderamos dizer que o organismo estava atentando mais para o tom do que para a luz ou que o tom era mais saliente do que a luz; cf. Rescorla & Wagner, 1972). O exemplo do tom mais a luz assume que o organismo no tenha histria de condicionamen to com qualquer dos estmulos do composto. O procedimento mostrado esquematicamente como sombreamento na Figura 12.5. Quando os estmulos de um composto no se tomam igual mente efetivos como CSs, diz-se que o estmulo mais efetivo sombreia o menos efetivo. Mas um tal efeito pode ocorrer tambm quando um dos dois estmulos j tm uma histria de condicio namento. Suponhamos, por exemplo, que a luz fraca j seja ela prpria um CS antes de passar mos a apresent-la juntamente com o tom. Se a apresentao simultnea da luz e do tom vier ago ra a ser seguida pelo choque at que flexes con Os estmulos podem sinalizar tanto omisses quanto apresentaes de outros estmulos (cf. C na Figura 12.4). Os estmulos que sinalizam a omisso de outro estmulo podem adquirir, s vezes, a capacidade de reduzir a efetividade de outros CSs e so descritos como inibitrios. Um exemplo mostrado na Figura 12.6, que ilustra um procedimento de condicionamento envolven do a salivao eliciada pela comida em um co. Prim eiro, uma cam painha torna-se um CS (CSA+). Uma vez que a campainha elicie a sali vao com fidedignidade, um tom passa a ser apresentado, seja sozinho ou juntamente com uma luz, em tentativas que se altemam irregu larmente. Quando o tom (CSB+) apresentado sozinho, ele seguido por comida. Quando ele apresentado juntamente com a luz (CSX-), a co mida omitida. Eventualmente, o tom sozinho vem a eliciar a salivao condicional, mas o pareamento de tom com luz no o faz. Poder-se-ia supor que o co simplesmente discrimina o tom apresentado sozinho de sua apresentao com binada com a luz. Mas o efeito inibitrio da luz pode ser demonstrado quando as apresentaes posteriores da campainha acompanhada da luz eliciam menos salivao condicional do que ape nas as apresentaes da campainha. Em um outro procedimento, poderamos fa zer com que a combinao tom-luz fosse segui da pelo US, sendo este, no entanto, omitido aps

218

A. C

harles

a t a n ia

SOMBREAMENTO Condicionamento (Composto)

Teste

Teste

S1
S2

Tom

S1
Sem CR

US

_phq^_
BLOQUEIO Condicionamento (Composto) Condicionamento

S1 Sombreou S2

S1

51

Luz k Sem CR

US

JChoqu4_

52 US

Tom

Jhq(J_

Choque S1 Bloqueou S2

FIGURA 12.5 Ilustraes equemticas de sombreamento e bloqueio. No sombreamento, nenhum dos dois estmu los de um composto (Sl e S2) tem uma histria prvia de condicionamento, mas somente um deles se torna efetivo como um CS (ou um toma-se mais efetivo do que o outro). No bloqueio, um estmulo estabelecido como um CS efetivo, e essa histria impede que o outro se torne efetivo quanto os dois so apresentados juntos como um composto (ou o primeiro reduz a efetividade do segundo). US = estmulo incondicional; CR = resposta condicio nal.
CSA * 1Sineta I________ CR Sineta US |comida)

CS

_J

Tom

J_

CS

Tom |_

CR ao Tom Sozinho, mas no a Tom + Luz

CS,

J Sineta [_
CR Reduzida Sineta (Luz inibitria)

cs - .

FIGURE 12.6 Ilustrao esquemtica de um procedimeto para demonstrar um componente inibitrio de um com posto de estmulo. Primero, a sucesso de sineta e comida produz a salivao condicional sineta. A seguir, o tom sozinho seguido por comida, mas o tom acompanhado pela luz no ; a salivao condicional ocorre para o tom sozinho, mas no para o tom acompanhado da luz. Finalmente, quando a luz apresetitada com a sineta, a sineta elicia menos salivao do que se fosse apresentada sozinha.

a apresentao isolada do tom ou da luz . Nesse caso, eventualmente verificaramos que a com binao de tom e luz elicia uma CR, enquanto a apresentao isolada desses estmulos no o faz. Em outras palavras, como essa demonstrao revela, os organismos podem responder diferencialmente no apenas a estmulos individuais, mas tambm a relaes entre eles.

Pr-Condicionamento Sensorial e Condicionamento de Segunda Ordem Temos considerado at aqui alguns casos de condicionamento respondente baseados em USs, que servem, em outras situaes, como reforadores (p. ex., comida) ou punidores (p. ex., cho que). Mas o condicionamento pode ocorrer tamA
p r e n d iz a g e m

219

bm quando estmulos relativamente neutros, tais como as luzes ou os sons servem como USs? O problema que difcil verificar o condiciona mento na ausncia de respostas eliciadas. Dois procedimentos que dizem respeito aos efeitos de tais estmulos so ilustrados na Figura 12.7, para flexes condicionais da pata em ces: o pr-condicionamento sensorial e o condicionamento de segunda ordem. Consideremos inicialmente o pr-condicionamento sensorial (Brogden, 1939). Na primei ra fase, de pr-condicionamento, um estmulo sinaliza um segundo estmulo. No exemplo da Figura 12.7, uma campainha consistentemente seguida por um tom. Na segunda fase, um refle xo condicional criado, com o segundo estmu lo tornando-se um CS. Na figura, o tom segui do por um choque. Uma vez que o reflexo con dicional tenha sido criado, de tal maneira que o tom elicie a flexo da pata, os efeitos eliciadores da campainha so testados. A flexo da pata campainha tomada como indicador de que a campainha tomara-se um CS relativo ao tom du rante o pr-condicionamento. (Por convenin cia, foram omitidos grupos de controle usa dos para contrabalanar os estmulos e elim i nar a possibilidade de sensibilizao; cf. Ca ptulo 4.) No condicionamento de segunda ordem, a ordem das fases revertida (cf. Rescorla, 1980). No exemplo da Figura 12.7, primeiro criado um reflexo condicional no qual o tom elicia a flexo da pata, apresentando-se o tom seguido pelo choque. Depois, a campainha seguida pelo

tom. Nesse caso, a questo se o CS criado na primeira fase pode funcionar como um US para um outro estmulo, na segunda fase. A dificul dade que o tom perde sua efetividade como CS medida que apresentado repetidamente, sem ser seguido por choque, na segunda fase, mas justamente durante esse tempo que a campainha deve adquirir suas propriedades condicionais. Um procedimento alternativo, no qual, em todas as tentativas, a campainha seria seguida pelo tom e este pelo choque, seria ambguo; no sabera mos se as flexes de pata eliciadas pela campai nha ocorreriam por causa da relao entre cam painha e tom ou por causa da relao entre a cam painha e o choque. Se o CS for apresentado sozinho depois do pr-condicionamento sensorial, extinguindo o reflexo condicional, o estmulo envolvido no prcondicionamento tambm deixar de eliciar uma CR. Em outras palavras, no exemplo da Figura 12.7, a apresentao, aps a fase do condiciona mento, do tom sozinho, at que este no mais elicie as flexes de pata, tambm far com que a campainha perca sua efetividade como CS. Mas o procedimento comparvel depois do condici onamento de segunda ordem nem sempre extin gue o reflexo condicional de segunda ordem (Rizley & Rescorla, 1972; mas ver tambm Holland&Ross, 1981). No exemplo da Figura 12.7, a apresentao do tom sozinho at que ele no mais elicie as flexes de pata pode no eliminar as flexes condicionais campainha, criadas du rante a fase de condicionamento de segunda or dem.

PR-CONDICIONAMENTO SENSORIAL Pr-condicionamento OS ______J Sineta |_____________ US I Tom 1 Condicionamento I Tom I_____________ ____________ bhoquej Teste ISineta I ______________ CR?

CONDICIONAMENTO DE SEGUNDA ORDEM Primeira Ordem CS I Tom I_____________ Segunda Ordem I Sinetal_____________ _I Tom I Teste [ Sineta 1 _____________ CR?

u s ____________ IChoquej

FIGURA 12.7 Um diagrama esquemtico das fases dos procedimentos de pr-condicionamento sensorial e condi cionamento de segunda ordem, empregando sineta e tom como CSs e flexes da perna eliciadas por choque, em un cachorro, como a UR.

220 A.

C h a r le s C a ta n ia

Esse resultado paradoxal. Consideremos uma histria de caso humana que seja anloga. Um jovem v sangue em circunstncias doloro sas, e a viso de sangue torna-se um CS que eli d a as respostas emocionais que denominamos medo. Posteriormente (de modo anlogo fase de condicionamento de segunda ordem), ele v sangue em um elevador e, desse modo, adquire um medo de elevadores. Ento, ele passa a tra balhar em um hospital e, nesse contexto, gradual mente supera seu medo de ver sangue. De acor do com os resultados de Rizley e Rescorla, essa mudana no reduziria o medo que ele tem de elevadores, apesar desse medo ter sido baseado na viso de sangue. Este um caso hipottico e devemos ser cautelosos ao generalizar situaes experimentais para a vida real. Mas a anlise de tais contingncias respondentes relevante para as terapias comportamentais que se propem a eliminar certos medos ou fobias atravs da ex tino de respostas adquiridas a estmulos aversivos condicionais. Alguns exemplos incluem a terapia implosiva, que envolve a exposio a ver ses intensas do estmulo aversivo, usualmente por uma durao longa, e a de sensibilizao sis temtica, que envolve o esvanecimento gradual do estmulo aversivo (p. ex., Wolpe, 1958,1990). De qualquer modo, tais descobertas demonstram que o condicionamento respondente no ape nas a substituio de um estmulo por outro.

mearam a ocorrer na presena do rato e tam bm de outras estmulos que tinham proprieda des em comum, tais como o algodo. Watson e Rayner chamaram essas respostas de reaes emocionais condicionadas. Contudo, os detalhes do procedimento experimental mostram que as marteladas iniciais sobre a barra de ao no eram independentes do comportamento:
1. Um rato branco foi repentinamente tirado do ces to e apresentado a Albert. Ele comeou a tentar pegar o rato com sua mo esquerda. Assim que a mo dele tocou o animal, a barra foi martelada ime diatamente atrs da cabea dele. O menino pulou violentamente e caiu para a frente, escondendo sua face no colcho. Todavia, ele no chorou. 2. Assim que a mo direita tocou o rato, a barra foi golpeada outra vez. Novamente, a criana pulou violentamente, caiu para a frente e comeou a choramingar. A fim de no perturbar a criana muito seriamente, no foram feitos mais testes durante uma semana. (Watson & Rayner. 1920, p. 4)

CONTIGIDADE E CONSEQNCIAS As instncias de condicionamento, baseadas em estmulos aversivos, tais como o choque el trico, foram denominadas condicionamento de fensivo, na suposio de que as respostas eliciadas por tais estmulos ocorriam, porque elas ti nham alguma funo defensiva natural (cf. Ca ptulo 6 sobre as reaes defensivas especficas de espcie). Um exemplo freqentemente cita do um experimento com um beb chamado Albert (Watson & Rayner, 1920). O estmulo aversivo era um som, atrs do pequeno Albert, de uma martelada sobre uma barra de ao sus pensa. Esse som produzia choro ou respostas de susto e esquiva. Quando o som se seguia a apre sentaes de um rato branco, essas respostas co

Portanto, pelo menos no incio, o experimento de Watson e Rayner usou a punio da resposta de tentar pegar o rato, e no simplesmente as apresentaes de um estmulo independentes do responder. Isso era presumivelmente importante para fazer com que Albert prestasse ateno no rato branco, mas isso tambm significa que no podemos atribuir inequivocamente as respostas do pequeno Albert ao condicionamento. Nem se quer podemos descartar as conseqncias das respostas de Albert aos golpes na barra; afinal, essas respostas levaram os experimentadores a interromper o procedimento por uma semana. O problema, contudo, no se restringe a Wat son e Rayner. Uma vez que estejamos alertas possibilidade de conseqncias para respostas em supostos procedimentos de condicionamen tos, freqentemente as encontraremos. Por exem plo, as demonstraes iniciais de retirada da pata eliciadas por um choque eram indiferentes ao mtodo de ligao dos eletrodos. Contudo, se ambos os eletrodos so fixados pata de um co, uma flexo no pode evitar a aplicao do cho que, enquanto se um ou ambos os eletrodos fo rem ligados ao cho, sobre o qual repousam as patas do co, uma flexo evitar ou terminar o choque, pois interromper o circuito eltrico. De

A p re n d iz a g e m

221

fato, o reflexo defensivo clssico de Bechterev (1933) normalmente tinha ambos os eletrodos sobre uma superfcie que o organismo tocava, de modo que uma resposta evitava ou terminava o choque; portanto, Bechterev estava provavel mente estudando o comportamento de fuga e de esquiva, em vez do condicionamento respondente. O reconhecimento das implicaes de ambos os mtodos de colocao dos eletrodos foi um passo importante na evoluo da distino entre o comportamento operante e respondente (cf. Schlosberg, 1937; Skinner, 1935b; ver tambm Kimmel, 1976). Uma vez que as conseqncias tenham sido implicadas em uns poucos casos de presumvel condicionamento respondente, tornou-se tenta dor busc-las em todos os casos. Por exemplo, ser que as flexes no teriam conseqncias mesmo quando ambos os eletrodos estivessem ligados pata do co, no condicionamento de fensivo? Suponhamos que uma campainha pre ceda o choque com fdedignidade. Como pode remos saber se o choque que passa atravs de uma pata flexionada to aversivo quanto o que passa atravs de uma pata no-flexionada? No condicionamento defensivo, as flexes condici onais so ordinariamente mais lentas do que as flexes incondicionais e tm magnitude diferen te. Talvez, isso acontea porque um co cuja pata j esteja flexionada no precise ajustar tanto sua postura, quando o choque for aplicado, quanto precisaria se o choque fosse apresentado com ele apoiado sobre todas as quatro patas e precisan do deslocar o peso para as trs patas restantes, quando a flexo fosse eliciada (Wagner, Thomas, & Norton, 1967). Claramente, a salivao tam bm tem suas conseqncias; ela afeta o gosto e, no caso de comida seca, a deglutio, alm da diluio, no caso de cido na lngua (p. ex., Hebb, 1956). O lugar do condicionamento respondente na Teoria da Aprendizagem comeou com as tenta tivas de reduzir todas as instncias de aprendi zagem operante a casos especiais de condicio namento respondente, mas esses novos argumen tos reviraram a situao ao contrrio. Argumen tou-se que todas as instncias de condicionamen to respondente podiam ser interpretadas em ter mos de conseqncias que no haviam sido per

cebidas anteriormente. O passo seguinte foi ob servar que respostas autonmicas, tais como a salivao e a constrio ou dilatao de vasos sangneos, eram freqentemente acompanhadas de respostas somticas (p. ex., contraes mus culares que produzem o movimento esquelti co). Era possvel argumentar, portanto, que as respostas autonmicas no condicionamento res pondente eram artefatos, acompanhantes inciden tais do comportamento gerado por processos ins trumentais (Smith, K., 1954; cf. os spandrels do Captulo 3). Portanto, o statiis do condiciona mento respondente veio a depender de demons traes de condicionamento que no pudessem ser interpretadas com base nas conseqncias do responder. Uma abordagem era verificar se o responder condicional podia ser modificado por contingn cias arranjadas explicitamente. Se tais conse qncias fossem inefetivas, ento, o argumento de que novas relaes reflexas dependiam de outras conseqncias no-identificadas deixaria de ser convincente. Assim, Sheffield (1965) adi cionou algumas conseqncias salivao con dicional gerada pela situao pavloviana clssi ca. Especificamente, um tom (CS) precedia a co mida, mas a comida era omitida se o co salivas se em uma dada tentativa. (O procedimento um exemplo de punio negativa, s vezes, referida como treino de omisso.) Em outras palavras, esse arranjo convertia o procedimento pavloviano padro em outro no qual a conseqncia de salivar seria a ausncia de comida, e a con seqncia de no-salivar seria comida. A salivao no foi modificada por suas con seqncias nesse procedimento. Consideremos a performance da cadela Vicki. No incio do trei no, a salivao condicional ainda no havia co meado, de modo que o tom era seguido consistentemente pela comida. Esta contingncia pro duziu uma salivao condicional, mas quando Vicki salivava em uma tentativa, a comida era omitida, de modo que a salivao condicional decrescia. Uma vez que a salivao condicional decrescesse, o tom passava a ser novamente se guido consistentemente por comida, de modo que a salivao condicional reaparecia. Vicki repe tiu esse ciclo de salivao condicional, omisso de comida, decrscimo de salivao, reestabele-

222 A.

C h a r le s C a ta n ia

cimento da comida e retorno salivao condi cional muitas vezes ao longo de 40 dias (800 ten tativas). Embora ela pudesse ter recebido comi da em todas as tentativas, se no salivasse du rante a apresentao do tom, ela no aprendeu a fazer isso e, portanto, recebeu comida em ape nas algumas tentativas a cada dia. Seria prematuro concluir que isso resolveu a questo. Uma conseqncia efetiva como reforador para uma resposta pode no ser efetiva para outra (Captulo 5). A comida elicia a salivao, de modo que no surpreendente que a saliva o seja inefetivamente reforada pela comida. A reduo de salivao pela omisso de um reforador tem sido demonstrada com um reforador como gua, que por si mesmo no elicia a salivao (Miller & Carmona, 1967; cf. Captu lo 7). A salivao, eliciada em algumas circuns tncias, pode ser modificada por suas conseqn cias em outras circunstncias. A questo no mais se coloca como a reduo da aprendizagem operante ao condicionamento respondente ou vice-versa, porque a distino entre ambos ba seada em muitas linhas de evidncia. Por exem plo, as instncias operantes requerem respostas, mas o condicionamento respondente pode ocor rer sem respostas, como ocorre quando as con tingncias estmulo-estmulo so programados durante a paralisia por curare e afetam o com portamento aps a recuperao da paralisia (cf. Solomon & Tumer, 1962). A questo crucial, ao contrrio, ao lidar com casos operantes e respondentes, ser capaz de distinguir qual qual.

AUTOMODELAGEM E AUTOMANUTENO Os casos de condicionamento respondente de que tratamos at o momento incluram tanto as respostas autonmicas (p. ex., salivao) quan to as respostas somticas ou esquelticas (p. ex., flexo de pata). Os Captulos 4 e 7 considera ram o quanto essas duas classes contriburam para as distines tericas entre o comportamento operante e o respondente. A demonstrao de que respostas autonmicas, tais como a salivao, po diam ser modificadas por suas conseqncias teve impacto considervel sobre tais teorias. Um

impacto paralelo ocorreu com a demonstrao de que as respostas somticas ou esquelticas po diam ser afetadas por procedimentos respondentes. Ambas as demonstraes implicaram em que os processos operantes e respondentes no po diam ser distinguidos com base em critrios fi siolgicos de definio de tipos de respostas; a diferena crtica, ao contrrio, residia nas res pectivas contingncias resposta-estmulo e est mulo-estmulo. Discutimos anteriormente a ambigidade de experimentos sobre as flexes da pata condicio nada ao choque. O problema era a impossibili dade de planejar procedimentos em que as fle xes da pata no tivessem conseqncias. Tal vez em parte por essa razo, a demonstrao do condicionamento respondente de uma outra res posta esqueltica, bicar um disco iluminado, por pombos, recebeu ateno especial em um pro cedimento denominado automodelagem (Brown & Jenkins, 1968). Visto que a resposta de bicar um disco iluminado comum em estudos de res ponder conseqencial, era importante determi nar a medida na qual os processos respondentes participavam de tal tipo de desempenho. A automodelagem surgiu como uma alterna tiva conveniente modelagem de respostas de bicar atravs de aproximaes sucessivas (Ca ptulo 7). Ela comea com um pombo que come regularmente em um alimentador, mas ainda no bicou o disco. De tempos em tempos, o disco iluminado e, alguns segundos mais tarde, o ali mentador operado independentemente do com portamento do pombo. Assim, o disco ilumina do torna-se um estmulo que sinaliza a comida. A comida ocasiona o comer, que no pombo in clui o bicar. Podemos, desse modo, dizer que a comida um US e que bicar a comida uma UR. Depois de umas poucas apresentaes de um disco iluminado, seguidas pela operao do alimentador, o pombo comea a virar-se para o disco e a mover-se em direo a ele quando ilu minado. Aps um nmero de tentativas que pode ser menor do que dez e raramente excede 100, o pombo passa a bicar o disco quando ele estiver iluminado. Depois que o bicar gerado por au tomodelagem, a continuao do procedimento denominada automanuteno. Os termos auto modelagem e automanuteno apenas distin-

p r e n d iz a g e m

223

guem entre as mudanas de comportamento que levam primeira bicada e o comportamento mantido aps essa primeira bicada. Na automodelagem e na automanuteno, apresentaes de comida ocorrem independen temente do comportamento. , portanto, difcil atribuir o bicar autom odelado a suas con seqncias. Ainda assim, depois que o bicar se inicia, ele freqentemente seguido por comi da. Desse modo, um argumento baseado apenas na observao de que no h conseqncias b vias para o bicar pode no ser convincente. Por tanto, foram estudadas as bicadas automantidas em procedimentos de omisso anlogos ao ex perimento que Sheffield conduzira com a sali vao: a comida era apresentada depois da ilu minao do disco, mas somente nas tentativas em que o pombo no bicava o disco (Williams & Williams, 1969). Do mesmo modo que havia ocor rido com a salivao, as bicadas freqentemente ocorriam em uma proporo substancial de tenta tivas, mesmo quando elas causavam a omisso de comida. O bicar se estabilizava, presumivelmen te, em um nvel no qual um nmero suficiente de tentativas sem bicadas (e, portanto, com comida) ocorria para manter o bicar em outras tentativas. Quando a comida repetidamente apresen tada para um pombo faminto, o bicar torna-se um componente dominante de seu comportamen to entre as apresentaes de comida (cf. Captu lo 4). As bicadas automodeladas do pombo po dem, portanto, ser interpretadas como compor tamento gerado pelas apresentaes repetidas de comida. Elas ocorrem, principalmente, durante o perodo em que o disco est iluminado e po dem ser dirigidas to fortemente ao disco que acabam por atingi-lo. Uma vez que o bicar auto modelado se inicia, ele pode ser mantido indefi nidamente por repetidas apresentaes do disco iluminado e de comida, mesmo que o bicar no tenha conseqncias bvias (de fato, o pombo pode retardar seu acesso comida ao bicar o dis co mais do que se mantiver sua cabea dentro ou prxima do alimentador). A produo do bicar o disco na automodelagem tem os aspectos crti cos que definem o condicionamento respondente, de modo que o vocabulrio respondente apropriado. A luz do disco um CS. Ela adquire sua capacidade de eliciar uma CR, bicar o disco,

atravs de sua correlao com a comida. A co mida o US e elicia uma UR, o bicar. Como em outros casos, a relao contingente entre a luz do disco e a comida, e no o pareamento entre elas, que determina se o bicar automodelado ocorrer. Um aspecto distintivo da automodelagem a natureza dirigida da CR: bicadas geradas pela luz do disco poderiam ocorrer em qualquer pon to da cmara (no ar, nas paredes, em volta do alimentador); em vez disso, so dirigidas ao dis co. A relao inversa tambm ocorre: os pom bos tendem a se afastar dos estmulos correla cionados com a ausncia de comida (Wasserman, Franklin, & Hearst, 1974). Por exemplo, se um disco verde precede a comida, mas um disco ver melho no, bicadas automodeladas ocorrem quando o disco iluminado com o verde, mas o pombo move-se para o lado oposto da cmara quando o disco iluminado com o vermelho. A natureza dirigida do bicar automodelado tem sido denominada rastreamento de sinal (Hearst & Jenkins, 1974). Uma resposta deve ser emitida antes para que possa ser reforada, e algumas vezes o fato da resposta ter sido eliciada que a faz ser emitida. Talvez, ento, as relaes comportamentais que ocorram na automanuteno sejam prottipos dos processos a partir dos quais o comportamento operante evolui. O Captulo 11 considerou o contraste comportamental, o aumento na taxa de respostas em um componente inalterado de um esquema ml tiplo, quando a taxa de reforo no outro compo nente sofre um decrscimo. Uma explicao do contraste comportamental a de que as bicadas automodeladas, geradas pela correlao diferen cial, com a comida, dos estmulos do esquema mltiplo, sejam adicionadas s bicadas operan tes. Alguns experimentos tm distinguido entre essas duas classes de bicadas ao disco com base na durao e na topografia (p. ex., Keller, 1974; Schwartz & Williams, 1972). A topografia das bicadas automodeladas afetada mais pelo US do que pelas contingncias (Jenkins & Moore, 1973). Por exemplo, a bicada do pombo a gros mais breve e tem forma diferente do que a bi cada para beber. As bicadas automodeladas pro duzidas pela luz do disco e pela comida asseme lham-se a bicadas para comer (quando as bica das automodeladas so baseadas em comida, o

224 A.

C h a r le s C a ta n ia

pombo d a impresso de estar comendo o dis co), enquanto as bicadas produzidas pela luz do disco e pela gua assemelham-se a bicadas para beber (quando as bicadas so baseadas em gua, o pombo d a impresso de estar bebendo o dis co). Por outro lado, a automodelagem pode ocor rer mesmo quando o US elicia comportamentos sem relao com o bicar. Por exemplo, os pom bos podem vir a bicar um disco iluminado se a luz do disco for, sistematicamente, seguida no por comida, mas, ao contrrio, por acesso a uma rea social (Peele & Ferster, 1982). Em nossa viso geral sobre o condicionamen to respondente, cobrimos um amplo territrio. Nosso tratamento dos componentes bsicos, CS e US, e CR e UR, foi seguido por uma breve cobertura dos tipos de condicionamento, incluin do o condicionamento simultneo, de trao, com atraso, temporal e reverso. Tambm distingui mos entre os pareamentos ou as contiguidades, por um lado, e, por outro lado, as contingncias estmulo-estmulo, definidas por probabilidades condicionais. Tambm examinamos as descober tas com vrias combinaes de estmulos no con dicionamento, incluindo o sombreamento e o bloqueio, os estmulos inibitrios em compos tos de estmulos, o pr-condicionamento senso rial e o condicionamento de segunda ordem. Con clumos com um exemplo de condicionamento de uma resposta esqueltica, o bicar do pombo, na automodelagem e automanutenao. Agora estamos prontos para considerar as maneiras pelas quais os processos respondentes podem ser relevantes para o comportamento operante.

foro alimentar. Algumas vezes descrevemos os comportamentos comparveis em humanos com base no medo ou na ansiedade; assim, procedi mentos como esses so freqentemente consi derados como relevantes para a emoo.

CONDICIONAMENTO E EMOO Os estmulos que sinalizam a apresentao de outros estmulos podem ser superpostos so bre linhas de base de comportamento operante. Por exemplo, suponhamos que presses bar ra, por um rato, sejam mantidas por um reforo alimentar; de tempos em tempos um tom apre sentado; o tom termina com a apresentao de um choque. Em tais circunstncias, o tom tipi camente reduz as presses barra, especialmen te, medida que se aproxima o tempo de libera o do choque. Esse fenmeno, originalmente, demonstrado por Estes e Skinner (1941), tem recebido nomes diversos: ansiedade, supresso condicionada e resposta emocional condiciona da ou CER (do ingls, Conditional Emotional Response). O fenmeno ilustrado na Figura 12.8, que mostra o desenvolvimento da supres so e a recuperao subseqente (Geller, 1960). As presses barra pelo rato eram mantidas por um esquema de VI 2 min, com reforo por co mida; um breve choque era apresentado em se guida a apresentaes de um tom, que duravam 3 min. Depois que o tom passou a suprimir o responder, o choque foi descontinuado, e as pres ses barra durante o tom recuperaram os n veis anteriores. O procedimento uma instncia de condi cionamento respondente: um estmulo, o tom, sinaliza um outro estmulo, o choque. (Presumese que o choque seja aversivo, de modo que o tom denominado um estmulo pr-aversivo.) Este um outro caso em que o comportamento produzido pelo CS difere do comportamento pro duzido pelo US. O tom suprime o comportamen to reforado de pressionar a barra, mas o pressi onar recomea assim que o choque tenha sido apresentado. Se olharmos mais de perto para o comporta mento do rato durante o tom, veremos que essas contingncias afetam muitas outras classes de

Seo B

Interaes OperanteRespondente: Emoo

Os processos operantes e respondentes po dem interagir, quando os procedimentos respon dentes so combinados com os procedimentos operantes. Por exemplo, um estmulo que prece da sistematicamente ou sinalize um choque pode no apenas eliciar as flexes de pata; pode tam bm interferir no comportamento que esteja sen do mantido por suas conseqncias como, por exemplo, o pressionar a barra mantido por re

p r e n d iz a g e m

225

Desenvolvimento da Supresso

Recuperaao da Supresso

FIGURA 12.8 Desenvolvimento de uma supresso durante um estmulo pr-aversivo e recuperao da supresso. As respostas de presso barra por um rato, reforadas com comida, eram mantidas por um esquema de V I2 min (os reforadores no so mostrados nos registros acumulados). Os registros da esquerda mostram os efeitos da superposio de um tom, por 3min, seguido por um choque eltrico sobre a linha de base de presso barra. Os deslocamentos para baixo no registro, entre as linhas verticais pontilhadas, sinalizam os perodos com o tom. Na tentativa 27, as respostas de pressionar a barra haviam sido quase que completamente suprimidas pelo tom. Os registros da direita mostram a recuperao da supresso quando o tom deixou de ser seguido pelo choque. (Adap tado de Geller, 1960, Figura 3)

respostas alm do pressionar a barra (p. ex., taxa cardaca, respirao; cf. Blackman, 1977; Rescorla & Solomon, 1967). Ns estamos mais pro pensos a invocar a linguagem da emoo quan do um evento afeta uma faixa ampla de classes de respostas diferentes; por isso, ficamos tenta dos a falar do medo ou da ansiedade, por parte do rato. Se o fizermos, precisaremos reconhe cer que tais termos no explicam o comporta mento do rato. No seria justificvel dizer, de pois, que o rato parou de pressionar durante o tom, porque estava com medo; o efeito do tom sobre o pressionar pelo rato o que em primei ro lugar nos leva a falar em medo no rato. Nossa linguagem de emoes complicada. Falamos de nossas emoes e das dos outros com base tanto em situaes quanto no comportamen to que ocorre nessas situaes (cf. Ortony & Tur ner, 1990). Por exemplo, poderamos falar do comportamento produzido por estmulos praversivos com base no medo ou na ansiedade, mas se tambm observssemos o comportamen to agressivo, estaramos mais inclinados a falar de raiva. De qualquer modo, deve ficar claro que tais nomes para efeitos comportamentais no constituem explicaes desses efeitos. Conside remos, por exemplo, a questo de por que al

gum est agindo de uma dada maneira. Pode mos responder que a pessoa est triste ou depri mida. Se nos perguntarem como sabemos, po deramos responder que podemos saber pela maneira como a pessoa age. Mas, ento, no fi zemos mais do que dizer que a pessoa est agin do de uma dada maneira, porque ela est agindo daquela maneira. Seria mais til saber que a pes soa est agindo daquela maneira por causa de algum evento especfico, tal como a perda do emprego ou o fim de um caso amoroso. Uma aplicao prtica de nossa compreen so dos estmulos pr-aversivos fornecida pelo tratamento de crianas sob cuidados intensivos, como em unidades hospitalares de atendimento a vtimas de queimaduras (Derrickson, Neef, & Cataldo, 1993). Essas crianas so submetidas a eventos aversivos imprevisveis e incontrolveis a qualquer momento do dia ou da noite: inje es, mudanas de curativos, alimentao intra venosa, etc. Um resultado tpico do atendimen to prolongado que elas se tornam letrgicas e ausentes; elas no reagem aos eventos volta delas (cf. Captulo 9 sobre desamparo aprendi do). Para essas crianas, o ambiente hospitalar acabou por tornar-se um enorme estmulo praversivo.

226

A . C harles C

a t a n ia

Podemos ajudar essas crianas, dando a elas, pelo menos, algum controle sobre parte do seu ambiente por algum tempo (p. ex., em interaes sociais com visitantes ou uma equipe hospitalar, em escolhas de refeies quando for possvel, e etc.), mas os requisitos do atendimento hospita lar podem limitar a exeqiiibilidade dessa abor dagem. Uma outra alternativa sugerida pela nossa anlise baseada nos estmulos pr-aversivos. Se acendermos uma luz vermelha sobre o leito da criana pelo menos 10 minutos antes do incio de qualquer procedimento aversivo, a luz vermelha torna-se um estmulo pr-aversivo. O acender da luz toma-se um estmulo aversivo tambm, mas apesar disso, a ausncia da luz tam bm se toma um sinal de segurana, um tempo durante o qual a criana est a salvo de procedi mentos mdicos aversivos. A segurana pode ser relativa, uma vez que a criana pode sentir dor em alguns perodos e podem ocorrer emergnci as que no dem tempo para o uso da luz verme lha, mas uma segurana relativa melhor do que nenhuma. Durante os perodos seguros, enquanto a luz vermelha estiver ausente, haver um rela xamento das reaes fisiolgicas da criana s condies que sinalizam eventos aversivos; ser mais provvel, ento, a manuteno do compor tamento que seguido por eventos reforadores; isso pode acelerar a recuperao da criana, bem como reduzir a letargia e a ausncia por parte dela.

ESTMULOS PR-AVERSIVOS E PR-APETITIVOS Embora a linguagem das emoes seja im portante em nossas interaes com outras pes soas, ela no se tem demonstrado muito til para uma anlise comportamental dos efeitos de est mulos pr-aversivos. Ao contrrio, as interaes entre o condicionamento respondente e o com portamento operante, por exemplo, quando est mulos pr-aversivos ou pr-apetitivos so super postos sobre o responder reforado, tm sido analisadas de modo mais efetivo com base em parmetros experimentais, tais como o esquema de reforo da linha de base, a taxa de respostas na linha de base, etc.

A descoberta de que o responder positivamen te reforado pode ser suprimido por estmulos praversivos foi mais tarde suplementada pela desco berta de que a esquiva, que um responder nega tivamente reforado (cf. Captulo 6), pode ser for talecida por tais estmulos (Sidman, Herrstein, & Conrad, 1957). Em outras palavras, um rato cujas presses barra evitam choque pode aumentar em vez de diminuir suas presses durante um estmu lo que precede um choque inevitvel ou inescapvel. Esse responder fortalecido tem sido denomi nado facilitao condicional ou acelerao con dicional. Uma vez que tal responder fortalecido se desenvolva durante o responder negativamente reforado, ele pode continuar como um responder positivamente reforado. Por exemplo, o pressio nar uma barra por macacos rhesus, mantido por suco de laranja como reforador, foi originalmen te suprimido durante um rudo de cliques que pre cedia um choque; depois que os macacos adquiri ram uma histria de pressionar a barra para evitar o choque e foram retomados ao procedimento ini cial, contudo, as presses barra durante os cli ques no foram mais suprimidas, e sim fortaleci das (Hermstein & Sidman, 1958). As situaes foram ento estendidas de modo a superpor os estmulos pr-apetitivos, em vez dos estmulos pr-aversivos, sobre uma linha de base de comportamento operante. Por exemplo, uma luz de disco que precedia apresentaes de comida independentes de resposta aumentou as bicadas ao disco por um pombo, quando foi su perposta sobre o bicar mantido por reforo em DRL (Hermstein & Morse, 1957). Por analogia ao rtulo de ansiedade, dado supresso duran te estmulos pr-aversivos, era tentador falar de tais efeitos fortalecedores dos estmulos pr-apetitivos baseando-se na alegria. O fortalecimento do res ponder positivamente reforado e a supresso do comportamento negativamente reforado por es tmulos pr-apetitivos parecia paralelo supres so do responder positivamente reforado e forta lecimento do responder negativamente reforado pelos estmulos pr-aversivos (p. ex., Azrin & Hake, 1969; Leitenberg, 1966). Mas as contingn cias so complicadas (p. ex., elas algumas vezes permitem que as bicadas automodeladas se com binem com os efeitos dos estmulos pr-apetitivos), e o estudo continuado dos estmulos pr-aversi-

p r e n d iz a g e m

227

vos e pr-apetitivos mostrou que essa abordagem era supersimplifcada (Blackman, 1977). Como exemplo, a Figura 12.9 mostra que o nvel de choque e a taxa de respostas na linha de base determinam conjuntamente se os estmulos pr-aversivos suprimiro ou fortalecero as res postas de pressionar a barra, por um rato, refor adas com comida (Blackman, 1968). Durante as apresentaes de luz vermelha e rudo, as pres ses barra eram reforadas segundo um esque ma de DRL 15 s, com uma conteno limitada (limited hold) de 5 s (i.e., uma presso era refor ada somente se fosse emitida em um intervalo de 15 a 20 s aps a ltima presso); durante as apresentaes de luz branca, sem rudo, um es quema de FI 20 s operava, com uma conteno limitada de 5 s. Nesse esquema mltiplo DRL FI, os componentes de DRL mantinham as taxas de respostas mais baixas do que as de FI. Pos teriormente, foram acrescentadas apresentaes ocasionais de um tom, com durao de 1 min, que precediam choques breves. O nvel do choque foi variado, para determinar a relao entre a mag nitude do choque e o grau da supresso. A Figu ra 12.9 (esquerda) mostra as taxas de resposta durante o tom (o estmulo pr-aversivo) como uma funo do nvel do choque. No componen

te de FI, a taxa de respostas decresceu consistentemente com aumentos no nvel do choque. No componente de DRL, contudo, a taxa de res postas aumentou com baixos nveis de choque e decresceu somente com nveis maiores de cho que. A Figura 12.9 (direita) mostra os mesmos dados convertidos para uma razo de supresso: a mudana na taxa de respostas expressa em ter mos relativos taxa de respostas na linha de base. Os desempenhos diferentes em FI e DRL mostram como os efeitos comportamentais po dem variar como funo das condies de linha de base. A superposio de estmulos pr-aversivos sobre o responder reforado um procedi mento respondente que tem efeitos opostos de pendendo do desempenho de linha de base sobre o qual ele superposto. Tipos similares de inte rao so crticos para a psicofarmacologia, ou seja, a anlise do efeito das drogas sobre o com portamento; aqui, novamente, o efeito de uma droga pode variar, consideravelmente, dependen do do desempenho de linha de base. Os efeitos de estmulos pr-aversivos so de terminados no apenas pelas propriedades do de sempenho de linha de base, mas tambm pelas propriedades do esquema de apresentao do es tmulo. Por exemplo, a supresso varia em fun

Nvel do Choque (miliamperes)

Nvel do Choque (miliamperes)

FIGURA 12.9 Taxas de respostas (esquerda) e razes de supresso (direita) durante um estmulo que precede o choque. Os efeitos do estmulo pr-aversivo dependeram conjuntamente do nvel do choque e do esquema que mantinha o responder. Os dados so de presses barra, por um rato, mantidas por esquemas mltiplos DRL FI de reforo por comida. O estmulo pr-aversivo suprimiu o responder em todos os nveis de choque, sob o esquema de FI; no esquema DRL, baixos nveis de choque aumentaram a freqncia de respostas e altos nveis suprimiram o responder. (Adaptado de Blackman, 1968, Figura 2)
228 A. C
C

harles

a t a n ia

o da durao de um estmulo pr-aversivo e de sua freqncia de apresentao. O grau de supresso tambm depende em parte do quanto a reduo na taxa de respostas afeta a taxa de reforo: menos supresso ocorre quando a re duo no responder reduz muito o nmero de reforadores obtidos por sesso do que quando a supresso afeta pouco o nmero de reforado res obtidos por sesso (Smith, 1974). Assim como em outros casos respondentes, os efeitos dos estmulos pr-aversivos e pr-apetitivos sobre o comportamento operante de pendem de contingncias estmulo-estmulo, e no de pareamentos estmulo-estmulo. Esse pon to ilustrado na Figura 12.10 (cf. Figura 12.3), que mostra como vrias combinaes de proba bilidades de choque, na presena ou ausncia de um estmulo pr-aversivo, suprimem as presses barra positivamente reforadas, por um rato (Rescorla, 1968). Por exemplo, se 40% dos est mulos pr-aversivos so pareados com um cho que (probabilidade de choque, dado CS = 0,40), uma gama de efeitos, que variam da completa supresso total ausncia de supresso pode ser obtida, dependendo da probabilidade de que ocorra o choque quando o estmulo pr-aversi vo estiver ausente. (Podemos falar das diferen tes contingncias com base em seu v a lo r p re d i-

tiv o : diz-se que o estmulo pr-aversivo tem um

valor preditivo quando a probabilidade de cho que na presena desse estmulo difere da proba bilidade de choque na sua ausncia; diz-se que o estmulo no tem valor preditivo quando essas probabilidades so iguais; cf. Figura 12.4). O responder na presena de um estmulo si nalizador afetado pela sua relao com o est mulo que ele sinaliza. No caso pavloviano cls sico, parecia de incio que um estmulo funcio nava como um substituto do outro, mas com os estmulos pr-aversivos e pr-apetitivos vimos novamente que os fenmenos respondentes no podem ser tratados como uma substituio do es tmulo. Como sempre, apropriado lembrar que os estmulos tm mltiplas funes, e seria prova velmente inevitvel que tivssemos que levar tais funes em conta ao lidar com situaes que com binam os procedimentos operantes e os respon dentes (cf. Hoffman & Fleshler, 1962).

Seo C

Limites Biolgicos da Aprendizagem

O Captulo 3 examinou as origens conjuntas, filogenticas e ontogenticas, do comportamen-

FIGURA 12.10 Supresso das presses barra por um rato durante um estmulo pr-aversivo (CS), como funo de diferentes probabilidades de choque durante sua presena e sua ausncia. Por exemplo, com uma probabilida de de choque de 0,4, ou p(CHOQUE/CS) = 0,4, durante o CS, a supresso dependeu da probabilidade de choque em sua ausncia, ou p( CHOQUE/N AO CS). Os efeitos variaram da supresso completa, quando a ltima probabi lidade era zero, a nenhuma, quando ela era igual a p(CHOQUEZCS). Os mesmos dados so representados nas duas metades da figura: esquerda, o parmetro pf CHOQUE/CS) e direita, o parmetro p(CHOQUE/NO CS). Nessa razo de supresso, a linha de base igual a 0,5. (Adaptada de Rescorla, 1968, Figura 3)
A

p r e n d iz a g e m

229

to e da aprendizagem. Ambas as origens podem impor restries ou limites no apenas sobre os estmulos e as respostas que entram nas contin gncias operantes e respondentes, mas tambm sobre as relaes que podem ser estabelecidas entre os estmulos e as respostas. Esta seo con sidera alguns exemplos.

LIMITES SENSORIAIS Algumas das restries mais bvias sobre a aprendizagem dependem dos sistemas sensoriais do organismo. Por exemplo, um pombo tem maior probabilidade de responder a estmulos visuais do que um morcego, enquanto um mor cego tem maior probabilidade do que um pom bo de responder a estmulos auditivos. Se as ca pacidades sensoriais de um organismo no fo rem levadas em considerao, os experimentos de aprendizagem podem produzir resultados en ganosos. Por exemplo, as freqncias de som nas quais a sensibilidade mxima so muito maio res para os ouvidos de ratos do que para ouvidos humanos. O experimentador que usar estmulos auditivos que sejam facilmente audveis por ra tos poder ser incapaz de saber se os estmulos esto presentes ou no, mas aquele que usar es tmulos auditivos que sejam facilmente audveis por humanos pode estar apresentando ao rato sons que este tenha dificuldade em ouvir e po der concluir incorretamente que o rato aprende lentamente e com dificuldade. Os experimentadores precisam ficar alertas para a possibilidade de que os estmulos aos quais eles prprios sejam insensveis sejam, no obs tante, estmulos discriminativos importantes para o organismo que eles esto estudando. Por exem plo, os resultados de estudos antigos sobre apren dizagem em labirinto devem ser interpretados com cautela, porque os ratos tm uma sensibili dade olfativa aguada. Se um labirinto no for muito bem limpo depois da retirada de um sujei to, o desempenho de outro pode vir a ser basea do em pistas de odor, deixadas por outros ratos, em vez de depender do que cada animal apren deu em suas passagens anteriores pelo labirinto. De modo similar, se o odor de um US alimentar chega a um co durante a apresentao de um

CS em um procedimento pavioviano, a saliva o que se segue pode depender do odor, em vez de depender da contingncia CS-US. Certas restries podem envolver as confi guraes de estmulo, assim como as dimenses simples de estmulo. Por exemplo, no bocejo con tagioso, uma pessoa elicia bocejos nas outras. A efetividade do bocejo como um estmulo eliciador determinada por uma combinao comple xa de aspectos faciais, que incluem os movimen tos dos olhos assim como os da boca (Provine, 1989b). Em humanos, as propriedades das faces que esto envolvidas em bocejos, sorrisos e fran zidos tornaram-se importantes atravs de uma longa histria filogentica de comportamento social (Provine & Fischer, 1989). Se for neces srio que essas propriedades sejam aprendidas, elas o sero mais facilmente do que configura es geomtricas arbitrrias.

LIMITES MOTORES Os limites anatmicos sobre o responder no apresentam problemas. Ns no esperamos que o vo seja similar em pombos, morcegos e abe lhas (e nem sequer consideramos a possibilida de de vo no rato). As diferenas entre espcies em relao s capacidades motoras tm maior probabilidade de suscitar questes quando elas no tm uma base anatmica clara. Em um estudo sobre os movimentos das per nas na primeira infncia, Thelen e Fisher (1983) registraram os intervalos de tempo e a topogra fia com os quais bebs de 3 meses chutavam um mobile. As conseqncias visuais do chutar va riavam: alguns bebs viam o mbile mover-se quando eles chutavam, enquanto outros viam o mbile mover-se quando no o chutavam. Es sas conseqncias afetaram a taxa e o vigor do chutar, mas no as coordenaes temporais en tre as fases de flexo e extenso envolvidas no chutar. Em outras palavras, alguns aspectos da resposta de chutar eram modificveis, enquanto outros aspectos no eram. De modo similar, as contingncias podem afetar a direo na qual uma pessoa anda, mas no as coordenaes de talhadas de seus msculos e juntas quando ela anda.

230

A. C

harles

a t a n ia

A locomoo apresenta componentes tanto filogenticos quanto no ontogenticos, e os de talhes das coordenaes motoras no surgem das contingncias entre as respostas e os estmulos. As coordenaes no andar envolvem as relaes entre os msculos da perna e entre as pernas e outras partes do corpo. (p. ex., o relaxamento de um msculo, medida que um msculo oposto se contrai). Muitos aspectos dessas coordenaes operam independentemente do ambiente (cf. Gallistel, 1980; Gray, 1953); geralmente, eles so denominados programas motores. Um treinador de cavalos no tem que modelar os detalhes do passo ou a ordem dos movimentos das pernas, medida que um cavalo acelera do andar para o trote, e da para a corrida e para o galope. Um cavalo de exibio pode aprender tipos especiais de passadas, tais como o rodopiar, mas, mesmo nesses casos, a nova topografia modula os pa dres j existentes. Um outro exemplo o vo nos pssaros. De que maneira as asas vm a bater em sincronia? necessrio que o pssaro venha a voar para des cobrir que ele no pode permanecer no ar baten do apenas uma asa ou trazendo uma para baixo, enquanto eleva a outra? Pintinhos foram priva dos das experincias de bater as asas e voar, logo aps terem sado do ovo, por restries sobre os movimentos das asas ou por outros meios, e sua coordenao das asas foi testada em vrios est gios posteriores (p. ex., Provine, 1981). O bater as asas mostrou-se sincronizado desde o incio, demonstrando que esse aspecto do voar no de pendia das contingncias ambientais. Muitos as pectos da coordenao do voar constituem um circuito que j vem com as conexes prontas ao nascimento; elas so pr-programadas (pre-wired)\ esses aspectos j vm construdos no com portamento do pssaro. Mesmo assim, o ambien te permanece sendo importante. A evoluo do vo nos pssaros dependeu dos ambientes aero dinmicos de seus ancentrais. E sejam quais fo rem os detalhes da coordenao de movimentos no vo, quando e para onde um pssaro voa so determinados por seu ambiente momentneo. As espcies diferem de vrias maneiras, e as restries sobre a topografia das respostas no devem ser confundidas com certas restries nas funes dessas respostas. Podemos ilustrar este

ponto, comparando um rato caando um camun dongo em um ambiente natural com uma vaca que seja ensinada a caar:
...dada uma presa que esteja relacionada a uma vaca, baseados na velocidade e na estimulao mtua, de modo similar relao de um camundongo para um gato, no deveria ser difcil estabelecer as contin gncias sob as quais uma vaca ir caar, isto , aproximar-se vagarosamente, de modo a no alertar a presa e, quando estiver prxima desta, mover-se rapidamente para captur-la. A presa deveria ser algo como um feixe de milho animado. (Skinner, 1977, p. 1011)

Skinner observa, ento, que esse caar pela vaca, pareceria, em velocidade e outras caracte rsticas, muito diferente do caar por parte do gato. Apesar disso, as propriedades funcionais do comportamento da vaca e do gato seriam si milares, mesmo que tais comportamentos dife rissem consideravelmente em detalhes estrutu rais. LIMITES SOBRE AS CONSEQNCIAS Podemos estender nossos exemplos para abranger a capacidade de vrios estmulos, para reforar ou servir como USs. Assim como as ca pacidades sensoriais e motoras, essas tambm di ferem entre as espcies. Nem precisaramos di zer que a efetividade dos reforadores tem uma base filogentica. Um organismo para o qual nem comida nem gua fossem efetivas como refor adores provavelmente no viveria o suficiente para passar seus gens para a gerao seguinte. Mas as propriedades mais sutis do ambiente tam bm podem ser importantes, tais como as con seqncias sensoriais que mantm o comporta mento exploratrio ou as conseqncias novas que podem tornar um organismo cauteloso ao provar uma comida desconhecida ou uma comi da conhecida em um lugar desconhecido (cf. neofobia\ p. ex., Mitchell, Scott, & Williams, 1973). Antes que a relatividade do reforo fosse re conhecida, era difcil lidar com as descobertas nas quais os reforadores-padro para uma dada espcie deixavam de ter seus efeitos caracters ticos. Breland e Breland (1961) usaram vrios desses casos para argumentar contra a generali

p r e n d iz a g e m

231

dade do reforo como um processo comportamental. Em uma demonstrao com racunos, a co mida era apresentada quando um racum pegava moedas do cho e as depositava em um recipien te. Depois de algumas repeties desse procedi mento, o racum comeava a esfregar persisten temente as moedas umas nas outras, em vez de depoisit-las no recipiente. Os Brelands e ou tros viram esse resultado como invalidando o princpio do reforo. Mas um aspecto relevante do comportamento do racum que os membros dessa espcie normalmente esfregam e lavam sua comida antes de com-la. As moedas aparente mente forneciam uma oportunidade melhor para esse comportamento do que a comida que su postamente funcionava como reforador. Em outras palavras, a comida no era efetiva como reforador, porque esfregar havia se tornado substancialmente mais provvel do que comer. provvel que uma oportunidade para esfregar tivesse sido efetiva como reforador para outras respostas, talvez at mesmo para a resposta de comer. Dado que as relaes de reforo so basea das em probabilidades relativas de respostas, as diferentes hierarquias comportamentais de dife rentes espcies inevitavelmente limitam o que elas podem aprender. Quando um procedimento experimental aplicado, no h garantia de que ele v ser efetivo. Um procedimento que leve aprendizagem com uma resposta ou com um or ganismo pode no ser efetivo com outras res postas ou com outros organismos, e uma respos ta ou um organismo que forem afetados por um procedimento podem no ser afetados por ou tros. Uma parte essencial da anlise da aprendi zagem explorar tais limites.

PREPARAO Certas restries podem envolver tambm as relaes entre os estmulos e as respostas que entram em contingncias operantes e responden tes. Tais relaes estavam implcitas nos exem plos sobre as restries e conseqncias, uma vez que os tratamos em termos das probabilidades relativas de respostas reforadas e das respostas ocasionadas pelos reforadores. Tambm consi

deramos outros exemplos no tratamento das reaes de defesa especficas da espcie, no Captulo 6. Por exemplo, a facilidade com a qual o responder de esquiva era adquirido de pendia das relaes especficas da espcie entre os vrios tipos de respostas de esquiva e os est mulos aversivos. Algumas relaes entre os estmulos discri minativos e as respostas podem ser mais fceis de aprender do que outras. Por exemplo, ser vantajoso para a aprendizagem que os estmulos e as respostas compartilhem de propriedades co muns, tais como responder esquerda a um est mulo situado esquerda e direita para um est mulo situado direita, em vez de responder esquerda para um estmulo verde e direita para um vermelho? No primeiro caso, as posies eram propriedades relevantes tanto dos estmu los como das respostas; no segundo caso, as qua lidades dos estmulos eram correlacionadas com as posies das respostas (p. ex., Miller & Bowe. 1982). Seria uma mudana de posio para qua lidade mais fcil ou mais difcil de dominar do que uma mudana de posies (lembrar da adap tao de Stratton aos prismas invertidos, no Ca ptulo 5; veja tambm a discusso de transfern cia no Captulo 17)? Tais relaes podem ser cru ciais no planejamento de sistemas homem-mquina ou no domnio de habilidades motoras (p. ex., Bauer & Miller, 1982; Glencross, 1977: Mazur, 1986, Captulo 12). Consideramos at aqui os casos envolvendo relaes entre os estmulos discriminativos e as respostas e entre as respostas e os reforadores. As contingncias filogenticas podem ter pre parado os organismos para aprender apenas al gumas das muitas relaes possveis entre os estmulos e as respostas nos procedimentos ope rantes e respondentes. O conceito de prepara o surgiu a partir da observao de que a apren dizagem discriminativa pode ser uma funo do contexto de respostas e reforadores dentro dos quais ela ocorre (Seligman, 1970; Schwartz. 1974). A signifcncia desse conceito foi esta belecida atravs da anlise de um fenmeno de nominado hesitao diante de uma isca ou aprendizagem de averso gustativa ; essa uma variedade de aprendizagem discriminativa, ba seada na punio diferencial (mas ver Rozin & Kalat, 1971).

232

A . C h a r l e s C a ta n ia

Em experimentos sobre averso gustativa, um rato pra de comer uma determinada comida se mais tarde, depois de comer, ele fica doente (Revusky & Garcia, 1970). A nusea ou outras con seqncias sistmicas do comer podem punir o comer, mesmo que essas conseqncias ocorram aps um considervel intervalo de tempo. Em um estudo do papel dos estmulos discriminati vos (Garcia & Koelling, 1966), ratos sedentos beberam gua adoada com sacarina; o beber foi acompanhado por sons de clique e por flashes de luz acionados eletronicamente pelas lambi das do rato agua. Em outras palavras, a gua que os ratos beberam era barulhenta e brilhante, alm de aucarada. Em um grupo, o beber foi seguido por irradiao com raios X, que fazia com que os ratos ficassem doentes mais tarde. Em um segundo grupo, o beber foi acompanha do por choques. Depois, o beber de cada grupo de ratos foi medido quando uma soluo adoci cada era apresentada e quando o beber era acom panhado por rudo e luz. A Figura 12.11 apresenta os resultados. Os ratos que haviam sido irradiados com raios X beberam menos gua adocicada, mas o beber no foi afetado pelo rudo e pela luz; os ratos que levaram choques beberam menos quando o be-

ber era acompanhado por sons e luzes, mas o fato da gua ser adocicada no afetou o beber. Em outras palavras, quando o estmulo aversivo era a conseqncia sistmica da aplicao de raios X, os ratos aprenderam apenas a sua rela o com o gosto da gua anteriormente consu mida, mas quando a estimulao aversiva era o choque, os ratos aprenderam apenas a sua rela o com os sons e as luzes que a precediam. Os efeitos atrasados da irradiao com raios X pu niram o beber gua adocicada, e os efeitos ime diatos do choque puniram o beber gua acom panhada por sons e luzes. No suficiente dizer que os ratos aprenderam alguns estmulos ou al gumas respostas mais facilmente do que outros estmulos ou outras respostas; eles estavam pre dispostos a aprender relaes diferentes entre os estmulos discriminativos e as contingncias nessas diferentes situaes. Revusky e Garcia (1970) discutem essas des cobertas no contexto de um experimento imagi nrio, no qual voc encontra R$ 100,00 que lhe foram deixados
por um insano experimentador bilionrio porque, no almoo, duas horas atrs, voc comeu torta de fram boesas de sobremesa, em vez de sua costumeira tor ta de ma. O experimentador pretendia aumentar a probabilidade futura de que voc comesse torta de frambroesas. muito pouco provvel que esse ex perimento venha a ser bem-sucedido... Centenas de eventos forosamente iro ocorrer durante as duas horas que se passam entre o consumo da torta e o recebimento dos R$ 100,00. Haveria grandes pro babilidades de que voc associasse algum desses eventos intervenientes com os R$ 100,00... Os re sultados de nosso experimento imaginrio so real mente chocantes. Selecionamos uma recompensa arbitrria bastante poderosa e uma resposta da qual voc provavelmente estava bem ciente... [e] chega mos concluso de que a natureza do ambiente im pediu a associao com um atraso de duas horas (Revusky & Garcia, 1970, p. 20).

Raios-X Punidor

Choque

FIGURA 12.11 Porcentagem da ingesto normal de l quidos, em ratos, quando beber gua aucarada era acompanhado por cliques e luzes. Em um grupo, a in gesto de lquido era seguida por irradiao; em um segundo, a ingesto era seguida por choque eltrico. Quais estmulos se tomaram discriminativos efetivos para reduzir o responder, o gosto ou a combinao somluz, dependeu da natureza do punidor. (De Garcia & Koelling, 1966, como apresentado em Revusky & Gar cia, 1970, Figura 9)

Esses investigadores sugeriram, ento, um experimento imaginrio alternativo: em vez de encontrar dinheiro, voc ficava doente.
Uma vez que a torta de framboesas era nova para voc, voc concluiria, provavelmente, que a torta causou a doena. Aqui, a associao com um atraso de duas horas est de acordo com nossa experincia cotidiana... Mas, por que motivo a modificao da conseqncia de R$ 100,00 para uma de ficar doen.
A
p r e n d iz a g e m

233

te mudou a situao?... Parece haver apenas uma resposta razovel.... O fato de que organismos infra-humanos tambm podem associar, ainda que com atrasos longos, sugere fortemente que h uma asso ciao seletiva inata de sabores com ps-efeitos fi siolgicos e, o que mais importante, uma falha seletiva na associao de estmulos irrelevantes com a toxicose. (Revusky & Garcia, 1970, p. 21)

Tais experimentos so, por certo, complica dos por outras diferenas entre os dois tipos de conseqncias. Por exemplo, o choque eltrico tem incio mais abrupto do que os sintomas gs tricos da irradiao com raios X. Alm disso, pode-se argumentar que esses experimentos en volvem relaes respondentes em vez de, ou alm das, relaes operantes. Se as contingncias res pondentes podem ser programadas com o sabor como um CS de trao e a nusea como um US, provvel que o sabor adquira sua aversividade como resultado de sua relao contingente com a nusea, mesmo que essa contingncia opere com atraso. De qualquer modo, esse um outro fenme no com considervel significncia prtica. Quan do a radiao usada em procedimentos mdi cos, como em alguns tratamentos de cncer, as contingncias so anlogas quelas dos grupos com raios X da Figura 12.11. Assim, a prpria situao de tratamento pode comear a eliciar a

nusea, e o apetite do paciente pode decrescer, afetando a palatabilidade dos alimentos ingeri dos nas horas que antecedem o tratamento. Pode ser apropriado planejar os tratamentos de tal modo que esses efeitos permaneam confinados a uma pequena faixa de ambien tes e dietas. Temos considerado, principalmente, as con tribuies flogenticas s restries aprendi zagem. As questes podem ficar ainda mais com plicadas se considerarmos as contribuies ontogenticas, alm das flogenticas. Por exem plo, o comportamento sexual e maternal adulto de macacos depende no apenas das contingn cias evolucionrias que selecionaram os aspec tos de acasalamento e a criao de organismos jovens. Ele depende tambm de contingncias de desenvolvimento precoce que envolvem o contato com a me e a interao com compa nheiros da mesma idade. A privao de contatos maternais nas primeiras semanas de vida de um macaco pode limitar seu comportamento pelo resto de sua vida (p. ex., Harlow & Harlow, 1966). A anlise do comportamento preocupa-se em iden tificar as origens de instncias particulares de com portamento. Tanto com as contingncias operan tes quanto as respondentes, nossas concluses sobre o que aprendido devem levar em conta tanto a filognese quanto a ontognese.

234

A . C h a r le s C a ta n ia

Aprendizagem Social

i ________________

13

A. Tipos de Contingncias Sociais Aprender sobre os Outros Aprender com os Outros Aprendizagem por Observao Imitao As Origens Sociais da Linguagem Aprender sobre Si Prprio Discriminando as Propriedades de Nosso Prprio Comportamento B. Reviso Tipos de Contingncias e Estmulos Contingentes

mune (imune), mutate (mudar), migrate (migrar) e mean (mdia ou meio).

As etimologias para pronomes pessoais prova velmente se estendem, no passado, s primeiras lin guagens humanas. As histrias de eu e de termos relacionados (como ego e ich) podem ser separadas daquelas de mim, meu e minha. Algumas formas do eu tem uma qualidade como a de verbos, e os pro nomes so incorporados em verbos em algumas ln guas (p. ex., como no latim sum e es, para eu sou e voc ). As distines entre estes e outros prono mes pessoais, como voc e ela e eles e ele e ns e vocs, podem ser to fundamentais quanto irredut veis. A palavra self (eu), que relacionada a sibling (parentesco), separate (separar), select (selecionar) e ethnic (etnia), carrega uma implicao de posse (cf. no sentido do termo relacionado, solitary, como algum que est por sua prpria conta). A palavra outro tem o sentido etimolgico de outro entre dois: al-, other (outro) mais ter, two (dois), como em al ternative (alternativa). Community (comunidade), como communicate (comunicar), implica ter em co mum. Comum um derivado de con-, with (com), e do indo-europeu rnei-, to go (ir) ou move (deslocarse) junto com; alguns termos relacionados so im-

Uma variedade de seleo a do tipo que opera sobre as populaes de organismos ao lon go de geraes sucessivas. Esse tipo de seleo foi considerado no Captulo 3, no contexto do tratamento de Darwin sobre a evoluo baseada na seleo natural. Uma outra variedade a do tipo que opera sobre as populaes de respostas, dentro do perodo de vida de um organismo in dividual. Muito de nossa discusso dos efeitos de conseqncias em captulos subseqentes es teve centrada nesta variedade de seleo. Os or ganismos persistem em fazer algumas coisas e param de fazer outras; o procedimento de mode lagem constituiu um exemplo explcito da sele o do comportamento por suas conseqncias. O Captulo 3 tambm mencionou uma ter ceira variedade de seleo. Essa tambm opera va sobre o comportamento, mas envolvia mais do que um organismo. Qualquer que seja o com portamento que um organismo adquira ao longo de sua vida, ele eventualmente perdido, se no for passado para outros organismos. Desde que a aprendizagem social tornou-se possvel, um comportamento que tenha sido aprendido pode sobreviver morte do organismo que o apren deu. Assim, o comportamento sobrevive no que os outros fazem, talvez no apenas no comporta mento dos descendentes, mas mesmo no compor tamento de outros no geneticamente relaciona dos.

Seo A

Tipos de Contingncias Sociais

A aprendizagem com outros especialmente importante no comportamento humano. Uma parcela muito substancial do que qualquer um de ns sabe o que aprendemos com os outros, e muito disso nos tem sido explicitamente ensi nado, seja no contexto informal de interaes en tre membros da famlia e outros, seja no contex to formal das instituies educacionais. Mas os tipos mais remotos de aprendizagem social de vem ter sido muito mais simples. Em que ponto alguns organismos comearam a aprender a fa zer coisas simplesmente observando o que acon tecia, medida que outros organismos faziam essas mesmas coisas? Podemos pensar na aprendizagem por obser vao como banal, j que ela est to freqente mente presente no comportamento humano. Mas no est claro quanto desse tipo de observao ocorre mesmo entre os vertebrados no-humanos de sangue quente (mamferos e pssaros) e dificilmente h evidncia de observao em in vertebrados (p. ex., insetos). Entre os primatas, um exemplo amplamente citado envolve a ali mentao de macacos com batatas doces, em uma reserva japonesa, prxima a uma praia (Kawamura, 1959). As batatas ficam tipicamente reco bertas de areia, mas um macaco jovem eventu almente descobriu a prtica de remover a areia das batatas, lavando-as no oceano. A prtica, ento, alastrou-se entre outros membros jovens da colonia (mas no foi seguida pelos adultos). As culturas humanas oferecem muitos exem plos de seleo social do comportamento, a se leo que ocorre medida que o comportamen to passado de um indivduo para outro (Harris, 1977; Skinner, 1981). Certos modos de criar fi lhos, de obter e preparar os alimentos, de cons truir abrigos e de lidar com membros do grupo e com estranhos sobrevivem ao longo de sucessi vas geraes. Algumas prticas se disseminam para outros grupos que no so parentes genti cos prximos daqueles que deram incio a elas. Na cultura ocidental contempornea, por exem plo, algumas comidas tpicas de certas etnias so preparadas e consumidas por muitos que no so membros dos grupos tnicos que as originaram.

O comportamento que socialmente trans mitido sobrevive por causa de suas conseqn cias. Nos primrdios da histria da humani dade, a pessoa que aprendesse com algum como fazer utenslios de pedra ou fogo, ou vestimentas, provavelmente, teria uma maior chance de sobreviver o bastante para passar o comportamento para outros do que uma pes soa que no pudesse aprender assim (em cada variedade de seleo, procuramos ver como a seleo opera no nvel da sobrevivncia de membros individuais ou unidades, e no no nvel da sobrevivncia do grupo). A sobrevi vncia de outros padres de comportamento pode envolver padres de contingncias mais complexas. Consideremos os padres de criao de crian as. Suponhamos que as crianas criadas de acor do com a maioria dos padres tenham, quando adultos, a mesma probabilidade de criar suas pr prias crianas de acordo com um outro padro qualquer. Mas suponhamos tambm que poucos padres funcionem de modo que, quando as cri anas se tornam adultos, elas tendam a criar suas crianas do mesmo modo como seus pais as cria ram; podemos chamar esses padres de padres auto-replicativos de criao de crianas. Em uma grande populao, sempre que acontece de um padro auto-replicativo ser usado por alguns pais, por quaisquer que sejam as razes, ele ser utili zado novamente na gerao seguinte; os outros padres surgiro e desaparecero. Pouco a pou co, ao longo de muitas geraes, os padres que so auto-reprodutivos substituiro os que no so. Uma vez que os padres tradicionais de cri ao de filhos tenham se originado dessa ma neira, eles provavelmente sobrevivero por perodos muito longos de tempo. Nas discusses iniciais das duas primeiras variedades de seleo, a seleo natural e a sele o operante, notamos que a evoluo e a mode lagem dependiam de populaes variveis sobre as quais a seleo pudesse operar. Restries semelhantes exitem no nvel de seleo cultural. Por exemplo, as prticas culturais que favore cem a diversidade tnica podem ter vantagens sobre outras que no favorecem tal diversidade, simplesmente porque elas permitem tal variabi lidade.

236

A . C h a r l e s C a ta n ia

APRENDER SOBRE OS OUTROS Em muitas situaes, os estmulos discrimi nativos fornecidos por outros organismos so mais importantes do que aqueles fornecidos por objetos inanimados e eventos. Por exemplo, o investimento dos pais nos filhotes pode ser per dido se um pai no pode discriminar entre seus prprios filhos e os filhos de outros; parceiros em potencial devem ser distinguidos de compe tidores em potencial e, entre os parceiros em po tencial, os receptivos devem ser distinguidos dos no-receptivos, e assim por diante. Em muitos organismos, tais propriedades so correlaciona das com as caractersticas anatmicas (p. ex., plu magem colorida em pssaros); mas freqente mente, o comportamento a dimenso crucial. O estudo da comunicao animal est inte ressado nas maneiras pelas quais os organismos produzem os estmulos que afetam o comporta mento de outros organismos. Os exemplos de comunicao so numerosos: canto dos pssa ros, dos sapos e grilos; abanar o rabo e latir em cachorros; o sorriso em chimpanzs; os gestos e a linguagem humanos (Dawkins, 1976, p. 67; ver tambm Dawkins & Krebs, 1978). Seria mais apropriado falar de tais estmulos com base em seus efeitos comportamentais, mais do que na informao que transmitem. Do mesmo modo que pode ser enganoso dizer que os gens carre gam a informao sobre as contingncias filogenticas (Dawkins, 1982), pode ser enganoso falar dos estmulos sociais como carregadores de informao (cf. Captulo 14). Os estmulos liberadores e os padres fixos de ao fornecem muitos exemplos de efeitos de estmulos sociais. Em alguns casos, s vezes, cha mados de facilitao social, o comportamento que serve como um estmulo social e o compor tamento produzido por tal estmulo so topograficamente semelhantes, por exemplo, quando o vo de um pssaro acelera o vo dos outros ps saros em um bando ou quando o galope de uns poucos lderes da manada d origem a uma cor rida desenfreada (o estouro da boiada). Esses casos podem parecer superficialmente com a imitao, mas eles so limitados a uma estrei ta gama de classes de respostas (p. ex., riso e bocejos contagiosos: Provine. 1989a, 1996) e

devem ser distinguidos da imitao (cf. Field e col., 1982). Discriminar o comportamento de outros or ganismos, sejam eles da prpria espcie ou de outras espcies, tem claras vantagens seletivas. Consideremos, por exemplo, a relao entre o predador e a presa. Se um antlope em uma ma nada est um pouco descuidado, o leo que nota o descuido pode ter maior probabilidade de fazer uma captura. O antlope que pode notar a diferen a entre um leo que no come h algum tempo e outro que acabou de comer pode ter maior proba bilidade de se afastar na direo mais segura. Um predador que possa distinguir se foi notado por sua presa tem uma vantagem ntida sobre outro que no possa; uma vantagem tambm pode ser acrescentada para a presa que pode distinguir se foi notada por seu predador. Tais discriminaes supostamente tm uma extensa histria filogentica. A ateno ao comportamento da presa pode ser uma dimenso sobre a qual a seleo natural opera na evoluo de predadores, do mesmo modo que a ateno ao comportamento dos predadores pode ser uma dimenso sobre a qual a seleo na tural opera na evoluo da presa. Em decorrncia de tal seleo, as discriminaes do comportamento social podem se tomar to importantes que sobre pujam outros tipos de discriminaes. As discriminaes do comportamento de ou tros esto no cerne de nosso conceito de intenci onalidade (cf. Dennett, 1987): dizemos que en tendemos as intenes de algum quando nos sas discriminaes das vrias propriedades do comportamento passado e presente daquela pes soa nos permitem agir de modo apropriado com respeito ao que a pessoa far no futuro. De fato, se discriminar o prprio comportamento um caso especial de discriminao do comportamen to de outros (p. ex., Bem, 1967), pode-se argu mentar que este tpico engloba todos os fen menos considerados sob a rubrica da intencio nalidade. Julgamentos das intenes dos outros so, acima de tudo, julgamentos sociais, e no necessria qualquer suposio especial sobre as contingncias seletivas que devem ter operado sobre o comportamento social tanto intra quanto inter espcies, para ver que tais contingncias poderiam modelar capacidades bem-preparadas para as discriminaes sociais.

p r e n d iz a g e m

237

As discriminaes sociais intra-espcies tem muitas funes. Elas podem operar nas hierar quias de dominncia ou na defesa de territrio, ou como mecanismos de isolamento que mante nham a integridade de um grupo contra intru ses de membros de outras espcies, ou na dis tribuio de recursos limitados entre os mem bros do grupo. Em espcies que vivem como grupos sociais, como a maioria dos primatas, os indivduos aprendem que tipos de comportamen to esperar dos outros com os quais eles tm con tato extensivo. O comportamento cooperativo que pode emergir em tais contextos (de Waal, 1989) requer discriminaes sociais que podem ser precursoras do comportamento em relao aos outros que chamado de empatia (Hoffman, 1975).

APRENDER COM OS OUTROS Uma coisa aprender sobre os outros orga nismos, outra coisa aprender algo com eles (Zentall & Galef, 1988). Algumas vezes o com portamento de um organismo possibilita que um outro organismo aja com base nos estmulos dis ponveis somente para o primeiro, como quando o chamado vocal de um macaco favorece que um outro macaco fuja de um predador que ele no havia visto. Chamados ou pios de aviso so bem documentados no comportamento dos ps saros (p. ex., Kroodsma & Miller, 1982). Em ma cacos, os avisos sobre predadores podem variar com os tipos de predadores, e a resposta ao avi so pode depender de quem que emite o aviso e quem que ouve (p. ex., Gouzoules, Gouzoules, & Marler, 1984; Seyfarth, Cheney, & Mar ler, 1980).

Aprendizagem por Observao A aprendizagem baseada na observao do comportamento de outro organismo denomi nada aprendizagem por observao (p. ex., Zen tall & Levine, 1972; outro termo ocasional aprendizagem vicariante : Bandura, 1986). s vezes, o que parece ser aprendizagem por ob servao envolve processos mais simples. Por

exemplo, as preferncias alimentares em ratos so aprendidas em contextos sociais; difcil eli minar os ratos por envenenamento, porque ratos que no ingerem o veneno podem evit-lo de pois de interagir com outros ratos que o ingeri ram e ficaram doentes ou morreram. Quando os ratos ficam juntos, eles cheiram e lambem uns aos outros; assim, pelo cheiro e pelo gosto, um rato pode ficar familiarizado com as proprieda des da comida que o outro comeu recentemente (Galef & Stein, 1985). Se a comida nova, e o outro rato est saudvel, o primeiro rato, mais tarde, ir preferir aquela comida nova a outras comidas novas, mas se o outro rato est doente, o primeiro rato evitar aquela comida nova (em outras palavras, esta uma averso gustativa me diada socialmente: cf. Captulo 12). A aprendi zagem no ocorrer sem algum contato entre os dois ratos (p. ex., boca na boca ou boca no pelo). Um rato ter aprendido sobre as novas comidas com um outro, mas somente no sentido de que a combinao dos estmulos alimentares com a dos estmulos sociais torna algumas comidas mais ou menos efetivas como reforadores ou como estmulos aversivos, e no no sentido de que um rato tenha aprendido alguma coisa com base na observao do que acontece a um outro rato. A aprendizagem por observao foi convin centemente demonstrada com macacos rhesus (Mineka e col., 1984). Na natureza, os macacos mostram medo de cobras atravs de gritos e ou tros comportamentos agitados e pela esquiva da cobra. Mesmo que os pais demonstrem medo de cobras, os macacos criados no laboratrio, que no tenham tido experincia com cobras, no de monstram medo; por exemplo, se a comida est do outro lado de uma gaiola em que h uma co bra, eles alcanaro a comida por cima da gaio la. Mas se os animais criados no laboratrio ob servam um de seus pais se comportar de modo amedrontado em relao a cobras, eles tambm se tornam medrosos. Esse medo intenso e per sistente; se for testado trs meses depois, ele no ter diminudo. O que eles aprenderam sobre cobras baseia-se apenas na observao do com portamento do pai em relao cobra. No en tanto, deve haver um componente filogentico, porque esse tipo de aprendizagem por observa o tem maior probabilidade de ocorrer com co

238 A.

C h a r l e s C a ta n ia

bras e com objetos semelhantes a cobras do que com outros tipos de estmulos. A aprendizagem por observao, s vezes, tratada como se fosse, ela prpria, um tipo fun damental de aprendizagem (p. ex., Bandura, 1986), mas provavelmente ela seria melhor tra tada como uma variedade de comportamento de ordem superior. Muitas habilidades diferentes tm que ser conjugadas de modo apropriado para que a aprendizagem por observao funcione e, no caso da aprendizagem observacional huma na, provvel que tambm esteja envolvido um extenso componente verbal (Catania, 1995; cf. Captulos 14 e 15). No mnimo, a aprendizagem por observao deve incluir discriminaes su tis das aes de um outro organismo e de seus resultados, e al