Vous êtes sur la page 1sur 17

Laboratrio de Psicologia, 6(1): 75-91 (2008)

2008, I.S.P.A.

Sensibilidade e bom senso: Princpios fundamentais


da teoria de deteco de sinal na investigao em Psicologia
David Van der Kellen
Ludmila Duarte Nunes
Leonel Garcia-Marques
Faculdade de Psicologia e de Cincias da Educao da Universidade de Lisboa

Resumo
Com vrias aplicaes, a Teoria de Deteco de Sinal (TDS) proporciona um mtodo eficaz de anlise
do desempenho em identificao de sinal na presena de rudo. Uma das aplicaes mais conhecidas
da TDS na rea da memria, especificamente nos testes de reconhecimento. Ao permitir calcular a
sensibilidade existncia de determinados atributos associados ao sinal e o grau de especificidade da
deteco do mesmo, a TDS facilita a compreenso dos padres de resposta obtidos em testes de
memria. Este artigo faz uma reviso detalhada da TDS e dos seus pressupostos e medidas associadas,
permitindo uma utilizao adequada da teoria em paradigmas de reconhecimento do tipo sim/no e
em paradigmas de escolha forada.
Palavras-chave: Anlise de desempenho, Curvas ROC, Deteco de sinal, Memria, Reconhecimento.

Abstract
Providing numerous applications, the Signal Detection Theory (SDT) offers an effective performance
analysis in tasks of signal identification in the presence of noise. One of the most known applications
of the SDT is in the field of memory, especially in recognitions tests, making possible to understand the
response patterns identified. In this sense, this paper presents a detailed revision of the SDT, its
assumptions and associated measures, allowing a correct use of the theory in yes-no and forced choice
paradigms.
Key words: Memory, Performance analysis Recognition, ROC curves, Signal detection.
A correspondncia relativa a este artigo dever ser enviada para: David Van der Kellen, Faculdade de Psicologia e de Cincias
da Educao, Alameda da Universidade, 1649-013 Lisboa; E-mail: davekellen@gmail.com

76

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Introduo
Imaginemos uma situao experimental em que participantes lem uma lista de palavras, sendo-lhes
em seguida pedido que reconheam essas mesmas palavras numa lista de teste, na qual esto
igualmente includas palavras no apresentadas, ou distractores. Nesta situao, os participantes tm
de discriminar as palavras apresentadas dos distractores, o que implica que utilizem a informao
armazenada em memria. Num teste de reconhecimento, habitualmente, os participantes baseiam as
suas respostas no sentimento de familiaridade que a informao armazenada em memria produz e que
aumenta aps um episdio recente em que essa informao esteja presente. Da que, em mdia, os itens
produzam um sentimento de familiaridade superior ao dos distractores. Mas a tarefa dos participantes
menos simples do que parece porque quer os itens quer os distractores variam no sentimento de
familiaridade que produziam antes dos participantes lerem a lista dos itens. Da que, apesar de, em
mdia, os itens produzirem nos participantes um sentimento de familiaridade maior do que os
distractores, muitas vezes, os distractores mais familiares a priori podem transmitir, durante o teste de
reconhecimento, um sentimento de familiaridade maior do que os itens menos familiares a priori. Por
isso, os participantes no podem cingir as suas respostas ao componente mnsico (o sentimento de
familiaridade), tm tambm que escolher um critrio de resposta acima do qual decidem reconhecer
como itens e abaixo do qual decidem rejeitar como distractores os estmulos apresentados. O
estabelecimento desse critrio chamado componente decisrio subjacente ao desempenho dos
participantes num teste de reconhecimento. Note-se que qualquer critrio que seja o critrio escolhido,
o participante cometer sempre erros desde que os distractores mais familiares sejam mais familiares
do que os itens menos familiares. Esta situao leva a que os indivduos regulem o seu desempenho,
estabelecendo um compromisso entre memrias verdicas e falsas sob a forma de um critrio de
resposta que pode ser mais liberal ou conservador consoante o contexto e os objectivos.
Assim, numa investigao que contemple reconhecimento de informao, torna-se necessrio ter
em conta tanto os processos mnsicos como os processos decisrios. A negligncia desta distino
pode levar a interpretaes distorcidas dos dados e, consequentemente, a concluses erradas. Uma
ferramenta que permite no apenas distinguir estes processos mas tambm medi-los de forma
independente a Teoria de Deteco de Sinal (TDS), cuja importncia na investigao psicolgica tem
crescido ao longo dos anos.
Esta teoria parte do princpio de que a maioria dos processos de deciso ocorre na presena de
alguma incerteza. Assim, procura proporcionar uma linguagem precisa em termos estatsticos,
matemticos e grficos, que descreva e analise a tomada de deciso na presena de incerteza (Green &
Swets, 1966). A TDS tem sido utilizada em diferentes domnios, da electrnica s telecomunicaes,
passando mesmo pelo diagnstico mdico e pela deciso estatstica. A sua introduo na Psicologia
fez-se atravs de investigaes em Psicofsica, alargando-se a outras reas como a memria
(Macmillan & Creelman, 2005), na qual tem tido uma enorme preponderncia nos ltimos 40 anos.
A TDS tem sido principalmente utilizada na anlise do desempenho de participantes na
identificao do sinal, quando na presena de rudo. No caso especfico dos testes de reconhecimento,
nos quais se pede aos participantes para decidirem se o estmulo apresentado j havia sido
anteriormente estudado, o sinal corresponde ao sentimento de familiaridade gerado por um estmulo
memorizado, e o rudo ao sentimento de familiaridade gerado por um novo estmulo. Neste caso, os
principais objectivos da TDS so estimar a fora do sinal relativamente do rudo e identificar a
estratgia de resposta utilizada pelos participantes.

Princpios da aplicao da teoria de deteco de sinal

77

Origem e pressupostos da teoria de deteco de sinal


Tendo sido desenvolvida no campo da engenharia electrotcnica e tendo por base a teoria estatstica da
deciso, a TDS surge inicialmente durante 2 Guerra Mundial, com o intuito de analisar a capacidade dos
radares para detectar os avies inimigos. nesta altura que os investigadores, preocupados com os erros
cometidos pelos humanos e pelas mquinas, como os radares, em tarefas de deteco de sinal, concluram
que, em qualquer sistema onde exista rudo, no possvel maximizar as respostas positivas correctas e
minimizar as respostas positivas falsas, ao mesmo tempo. ento no campo das redes de comunicaes
que a TDS conhece os seus desenvolvimentos, quando os engenheiros electrotcnicos tentam encontrar
uma forma de determinar a sensibilidade dos sinais das redes de comunicao, na presena de rudo, mas
sem que o enviesamento de resposta contamine os resultados (Green & Swets, 1966).
Em 1966, a TDS adaptada de uma forma sistematizada Psicofsica, por John Swets e David
Green. A Psicofsica, fundada por Fechner, baseava-se no relato subjectivo das sensaes. Ora, este
relato subjectivo trazia, entre outros, o problema de os participantes poderem dar as suas respostas
baseadas numa certa adivinhao (guessing) fundamentada pela taxa de deteco de sinal e no na
sensao per se. Deste modo, a TDS torna-se til, ao esclarecer o comportamento do indivduo na
identificao de limiares, ou seja, numa tarefa de deciso. Mais tarde, a TDS deixa de ser aplicada
apenas percepo e s sensaes, passando a ser utilizada tambm em reas relacionadas com a
aprendizagem e a reteno humanas, como a reteno verbal (Egan citado por Banks, 1970). Logo,
reas como a memria humana beneficiaram tambm da utilizao da TDS.
Assim, aplicada Psicofsica e, mais tarde, Psicologia Cognitiva, a TDS toma como principal
intuito a explicao da forma como os humanos discriminam os sinais do rudo e procura tornar
possvel a utilizao de medidas para uma correcta quantificao desta capacidade discriminatria.
Segundo a TDS, a deteco de um determinado alvo depende da capacidade de distingui-lo do rudo
envolvente. Esta deteco feita atravs da sensibilidade (por vezes designada por discriminabilidade
na literatura) existncia de determinados atributos associados ao alvo a detectar, cuja presena evidencia
este ltimo. No entanto, podem existir configuraes semelhantes de atributos, com uma origem
diferente da dos alvos a detectar, podendo levar a uma falsa deteco destes. Devido a esta situao,
torna-se necessrio considerar a capacidade de extraco das caractersticas especficas do alvo que
permitem discrimin-lo em relao ao rudo, ou seja, o nvel de especificidade na deteco (alguns
autores designam por critrio ou enviesamento). A adopo de nveis de especificidade conduz ento
a um enviesamento das respostas e subsequente reduo das falsas identificaes de alvos mas, por
outro, possvel no-deteco de alvos. Assim, existem custos associados ao estabelecimento de um
critrio de especificidade, variando proporcionalmente em relao ao nvel de discriminao adoptado.
Tendo em conta estes constrangimentos na relao entre sensibilidade e especificidade, possvel
identificar quatro tipos de resultados em funo do tipo de estmulo e da resposta dada, representada
sob a forma de uma matriz na Figura 1.
RESPOSTA

ALVO
RUDO

ESTMULO

SIM

Figura 1. Matriz de estmulo-resposta

ACERTOS
(HITS)

NO
OMISSES

FALSOS

REJEIES

ALARMES

CORRECTAS

78

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Quando o alvo se encontra presente, e este identificado, estamos na presena de um acerto (hit); no
caso em que apenas existe rudo e h uma resposta no sentido da presena do alvo, ocorre um falso
alarme. Podemos ainda considerar resultados em que h uma omisso, quando o alvo est presente e,
contudo, no detectado; e, por ltimo, quando ocorre uma rejeio correcta, dada a ausncia do alvo
e a sua no deteco.
Tendo em conta estes possveis resultados, e a forma como os nveis de sensibilidade e
especificidade influenciam a deteco, torna-se ento pertinente considerar o modo como a variao
destes nveis determina a frequncia dos quatro tipos de resultados da matriz.
Consideremos ento estes pressupostos da TDS no contexto de uma tarefa de reconhecimento.
Num teste de reconhecimento, o experimentador fornece o item alvo e a funo do participante
recuperar o contexto de apresentao (ou no) deste. O objectivo da TDS neste tipo de tarefas o de
distinguir os processos mnsicos dos decisrios, e a prevalncia destes no desempenho dos
participantes experimentais.
Um dos tipos de teste de reconhecimento mais comuns o chamado teste de reconhecimento do
tipo sim/no (yes-no recognition test), no qual os participantes estudam uma lista de itens e,
posteriormente, na fase de teste, so-lhes apresentados vrios itens (estudados e no-estudados) sendolhes ento pedido que decidam se cada um desses itens pertencia lista estudada, respondendo sim
ou no. Este tipo de teste de reconhecimento especialmente til na compreenso dos pressupostos
TDS, j que permite um conjunto de manipulaes, tanto ao nvel da sensibilidade como da
especificidade, explicitados mais adiante.
Consideremos ento uma investigao hipottica, em que se procurou avaliar o desempenho de
uma amostra de participantes no reconhecimento de uma categoria de estmulos K. No teste de
reconhecimento, era perguntado aos sujeitos se cada um dos estmulos da fase de teste tinha sido
previamente estudado ou no. Deste teste resulta uma tabela semelhante matriz da Figura 1.
Imaginemos ento que, neste teste, foram obtidos os dados apresentados na Tabela 1.

Tabela 1
Frequncia mdia de respostas, no hipottico teste de reconhecimento de estmulos da categoria K
RESPOSTA-AMOSTRA RECONHECIMENTO K
ESTMULO

SIM

NO

TOTAL

ANTIGO
NOVO

50
15

50
85

100
100

Na Tabela 1, apenas dois resultados so relevantes para a anlise dos nveis de sensibilidade e
especificidade dos participantes experimentais, nomeadamente os acertos (hits) e os falsos alarmes, a
partir de agora designados por H e F, respectivamente. Os outros dois resultados no so necessrios para
que se efectue a anlise, j que podem ser obtidos atravs dos valores de H e F, dada a sua
complementaridade em relao a estes, quando representados sob a forma de propores, como se
verifica na Tabela 2. Estas propores podem ser encaradas como estimativas de probabilidade dada a
possibilidade de representar tanto H como F atravs de probabilidades condicionais, designadamente
H=P (SIM/ANTIGO) e F=(SIM/NOVO). Atravs destas propores ento possvel encontrar medidas
que avaliem a sensibilidade e especificidade destes resultados no teste de reconhecimento. As medidas de
sensibilidade podem basear-se em pressupostos e tipos de dados distintos, tendo por isso vantagens e

Princpios da aplicao da teoria de deteco de sinal

79

limitaes caractersticas. O conhecimento destas caractersticas permite escolher a medida mais


adequada para cada estudo, e analisar criticamente os resultados apresentados na literatura.

Tabela 2
Proporo de respostas no hipottico teste de reconhecimento de estmulos da categoria K
RESPOSTA-AMOSTRA RECONHECIMENTO K
ESTMULO
ANTIGO
NOVO

SIM

NO

TOTAL

.50
.15

.50
.85

1.00
1.00

Medio da sensibilidade
Um mtodo utilizado antes da introduo da TDS consistia na correco dos resultados obtidos atravs
da diferena entre a proporo de acertos (hits) e a proporo de falsos alarmes, ou seja, H F. Apesar
de se encontrar ultrapassado, este mtodo permite perceber o principio subjacente s medidas de
sensibilidade, nomeadamente a necessidade de considerar os acertos e falsos alarmes conjuntamente.
Consideremos ento a amostra representada na Tabela 2, cujos resultados representam um desempenho
de H=.50 e F=.15, correspondendo a sensibilidade a um valor de .35. Quanto maior for a proporo de
acertos, maior ser a sensibilidade; no entanto, quanto mais falsos alarmes se verificarem, menor deve
ser a sensibilidade. Qualquer medida de sensibilidade tem de considerar esta relao entre acertos e
falsos alarmes, aumentando com o aumento do primeiro, e diminuindo com o aumento do segundo.
Porm, a mera diferena H F no permite caracterizar a verdadeira competncia do observador em
distinguir os alvos dos distractores, na medida em que a verdadeira competncia corresponde
tendncia central de uma populao de potenciais desempenhos e no possvel caracterizar uma
populao a partir de uma nica observao. Para que seja possvel essa caracterizao, torna-se
necessrio inferir pressupostos sobre os parmetros dessa distribuio. Quer dizer, necessitamos de
inferir a forma como a informao sobre os estmulos se encontra disponvel para o observador (neste
caso, informao disponvel em memria). Segundo a TDS, a informao disponvel representada
por uma nica dimenso que quantifica as evidncias (normalmente definida como dimenso de
familiaridade), atravs da qual os estmulos se encontram distribudos. Um pressuposto assumido
tradicionalmente pela TDS que esta distribuio normal (Green & Swets, 1966). com base nestes
dois pressupostos que surge a medida de sensibilidade mais popular, o d (l-se d prime ou d
linha), Esta medida parte do pressuposto que a quantidade de evidncias produzidas tanto pelos alvos
como pelo rudo, se distribuem sob a forma de duas curvas normais, representadas atravs de um eixo
X de familiaridade e um eixo Y de densidade de probabilidade, como se pode observar na Figura 2.

Figura 2. Distribuio normal dos alvos e do rudo, adaptado de Macmillan e Creelman (2005)

80

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

O clculo de d bastante simples, j que apenas a diferena entre o valor mdio da distribuio dos
alvos (Ps) e da distribuio do rudo (Pn) dividida pelo desvio padro da distribuio do ruido (Vn).
Deste modo podemos expressar d da seguinte forma:
d=(PsPn)/Vn
O valor de dpermite ento avaliar o nvel de sensibilidade apresentado; enquanto o nvel de acertos (hits)
for superior ao de falsos alarmes, d>0; se d for igual a 0, estamos perante uma sobreposio completa
das duas distribuies, no existindo qualquer discriminao entre o alvo e o rudo e verificando-se um
padro de respostas aleatrio. Quanto mais elevado for o valor de d, maior ser a sensibilidade.
No entanto este valor no pode ser calculado directamente, dado que apesar de se assumir a
normalidade das distribuies, os seus parmetros so desconhecidos, as distribuies apresentadas na
Figura 2 so puramente tericas. Porm, o facto de se assumir que as distribuies de sinal e rudo so
normais, permite a utilizao da distribuio normal reduzida (de mdia 0 e desvio padro de 1) para
a estimao de d. Assim:
d=zF-zH
O valor d pode assim ser estimado manualmente, procurando-se nas tabelas da distribuio normal
reduzida os valores z cujas probabilidades so equivalentes s propores de acertos (hits) e de falsos
alarmes; ou ento atravs de solues informticas mais rpidas e cmodas, como as frmulas de
Excel, apresentadas no apndice. Calculemos ento o d dos resultados do teste de reconhecimento:
H=.5 e F=.15
d=z(.5)-z(.15)=1.036
Consideremos ento que foi igualmente estudado o desempenho no reconhecimento de outras duas
categorias de estmulos, a categoria M e N (apresentado na Tabela 3), e que queremos saber qual dos trs
mtodos de estudo produz uma maior sensibilidade no reconhecimento de estmulos previamente
estudados.

Tabela 3
Propores das respostas num teste de reconhecimento das categorias M e N
RESPOSTA AMOSTRA RECONHECIMENTO M
ESTMULO
ANTIGO
NOVO

SIM

NO

TOTAL

.85
.50

.15
.50

1.00
1.00

RESPOSTA AMOSTRA RECONHECIMENTO N


ESTMULO
ANTIGO
NOVO

SIM

NO

TOTAL

.85
.20

.15
.80

1.00
1.00

Se considerarmos apenas os acertos (hits) das amostras, iramos concluir que tanto os mtodos M e N
so equivalentes, superiores aos do mtodo K. No entanto, como j referimos, necessrio ter em conta
no apenas os acertos (hits) mas tambm os falsos alarmes para que possamos avaliar a sensibilidade
manifestada. No caso do mtodo M, o aumento de acertos (hits) acompanhado por um aumento de

Princpios da aplicao da teoria de deteco de sinal

81

falsos alarmes, o que levanta duvidas em relao a uma sensibilidade superior do mtodo K.
Calculemos ento o d desses resultados:
H=.85 e F=.50
d=z(.85)-z(.50)=1.036
Podemos ento verificar que apesar do reconhecimento das categorias K e M levarem a valores
diferentes ao nvel dos falsos alarmes e dos acertos (hits), estas tm d iguais, o que indica nveis de
sensibilidade semelhantes. Comparemos ento com o d obitdo com a categoria de estmulos N:
H=.85 e F=.20
d=z(.85)-z(.20)=1.87
Verificamos que o valor de d obtido com a categoria N superior ao encontrado na categoria M,
indicando uma sensibilidade bastante elevada, apesar de ambas apresentarem uma proporo de
acertos (hits) equivalente.
Se no tivesse sido utilizada a TDS na avaliao dos dados obtidos com estas trs categorias,
podia ter-se concludo erroneamente que tanto a categoria M como a N levam a performances
semelhantes, superiores aos da categoria K. Na verdade, apenas com a categoria de estmulos N
apresenta uma sensibilidade superior (d=1.87), em comparao com as outras duas categorias que
apresentam nveis de sensibilidade semelhantes (d=1.036).
A medida de sensibilidade d permite assim evitar erros de anlise, possibilitando uma avaliao
que vai alm da superficialidade proporcionada pelos dados em bruto. O d possui ainda a qualidade
de no ser afectado pelos enviesamentos de respostas causados pelos critrios de especificidade,
permitindo no apenas diferenciar os vrios nveis de sensibilidade, mas tambm perceber os diferentes
modos como o mesmo nvel de sensibilidade pode ocorrer; o valor d permite assim uma medida pura
dos processos da resposta. Uma limitao importante no d o facto de no poder utilizada quando se
verificam efeitos de tecto, isto porque quando o sujeito reconhece correctamente todos os estmulos
antigos, o valor de d igual a ? (infinito). Este problema pode ser ultrapassado com a utilizao de
medidas de sensibilidade alternativas, como a alternativa no-paramtrica A, ou ento Az, que tem
como base a utilizao de uma escala de avaliao. Ambas as medidas tm pressupostos e limitaes
especificas, pelo que sero descritas detalhadamente mais adiante.
Medidas de especificidade
Como ficou demonstrado anteriormente com as duas amostras, diferentes propores de acertos (hits) e
de falsos alarmes podem apresentar o mesmo nvel de sensibilidade. As diferenas devem-se ento a
outro factor distinto, nomeadamente aos diferentes critrios de especificidade manifestados pelas
amostras. A especificidade diz respeito ao limite de evidncias utilizado para discriminar os vrios
estmulos. Este limite define assim um critrio de reconhecimento, abaixo do qual os estmulos so
rejeitados, e acima do qual so reconhecidos. Tal como se pode observar na Figura 3, o estabelecimento
de um critrio define no apenas a proporo de acertos (hits), mas tambm a prevalncia de
determinados tipos de erro. Quando o critrio mais conservador, como no caso de C1, h uma reduo
dos falsos alarmes, no entanto h um aumento de outro tipo de erro, a omisso. Pelo contrrio, quando se
estabelece um critrio mais liberal como C2, h um aumento dos falsos alarmes acompanhado por uma
diminuio das omisses. Dada a possibilidade deste tipo de enviesamentos, a medio da especificidade
torna-se fundamental na compreenso dos padres de resposta.

82

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Figura 3. Diferentes estabelecimentos do critrio de especificidade, adaptado de Macmillan &


Creelman (2005)
Uma das maneiras de calcular o critrio de especificidade atravs da medida C, que utiliza a relao
entre a interseco das duas distribuies e as propores de resposta manifestadas de forma a avaliar
a natureza e magnitude do enviesamento. Quando no h qualquer enviesamento, C=0; no caso de um
enviesamento causado por um critrio mais liberal, C<0, ou ento se estivermos perante um critrio
mais conservador, C>0:
C=.5 (zF+zH)
Como vimos anteriormente, as propores de acertos (hits) no so indicativas da sensibilidade; as
propores de acertos (hits) nas amostras relativas s categorias K e M eram diferentes, no entanto
traduziam o mesmo nvel de sensibilidade. Esta situao leva a que a que se considere o
estabelecimento de critrios de especificidade distintos para cada amostra, como pode ser demonstrado
pelo clculo de C:
Categoria K
C=.5[z(.50)+z(.15)]
C=.518

Categoria M
C=.5[z(.85)+z(.50)]
C=-.518

Categoria N
C=.5[z(.85)+z(.20)]
C=-.097

Verifica-se ento que as duas amostras apresentam enviesamentos de resposta tendencialmente


opostos, resultantes do estabelecimento de critrios distintos. Na primeira amostra encontramos um
critrio ligeiramente conservador, enquanto que na segunda amostra verificamos exactamente o
contrrio, um critrio de resposta mais liberal.
Uma derivao da medida C, o C, que pondera a especificidade em relao ao nvel de
sensibilidade manifestado. Esta medida decorre da necessidade de ter em conta d, j que quanto maior
este for, menor ser o enviesamento provocado por um determinado valor C. Esta medida corrigida
calculada atravs da seguinte frmula:
C=C/d
Outra das medidas utilizadas na avaliao dos critrios de especificidade o E, ou coeficiente de
verosimilhana, que se baseia na estimao a partir das densidades de probabilidade, tanto na
distribuio de sinal (S), como na de rudo (N). O valor E calculado da seguinte forma:
E=f(zH)/f(zF)
O critrio neutro assume o valor 1; os enviesamentos liberais apresentam valores E menores que 1,
enquanto que critrios mais conservadores tem valores E maiores do que 1. O clculo de E pode no
entanto ser representado de outro modo, utilizando-se logaritmos:
ln(E)=ln[z(H)z(F)]

Princpios da aplicao da teoria de deteco de sinal

83

No caso de ln (E), o critrio neutro para o valor 0, verificando-se um enviesamento liberal para
valores negativos e um enviesamento mais conservador para valores positivos. Um enviesamento
liberal significa que no ponto estabelecido, a probabilidade do sinal inferior probabilidade do rudo;
pelo contrrio, quando o critrio estabelecido conservador, a probabilidade do sinal superior do
rudo. No caso em que o critrio neutro, as probabilidades de sinal e de rudo so equivalentes.
Tendo sido descritas trs medidas de especificidade, C, C e E, qual pode ser considerada a melhor
ou mais adequada? Apesar de no existirem verdadeiras concluses empricas, vrios autores (Lockhart
& Murdock, 1970; Snodgrass & Corwin, 1988), consideram C a medida mais indicada, j que aquela
que verdadeiramente independente da sensibilidade, permitindo uma avaliao pura dos processos
decisrios e uma verdadeira distino entre sensibilidade e enviesamento. Apesar da independncia de C
e da sua utilizao em diversos modelos de memria como o SAM (Gillund & Shiffrin, 1984), o TODAM
(Murdock, 1982) ou o MINERVA2 (Hintzman, 1988), modelos mais recentes como o ALT (Glanzer et
al., 1993), o SLT (McClelland & Chappel, 1998) ou REM (Shiffrin & Steyvers, 1997) tm adoptado o E
como medida de critrio, dado que este permite explicar de uma forma mais simples alguns fenmenos
mnsicos como [e.g., o efeito de espelho (Glanzer & Adams, 1985)].
A questo das diferentes medidas de critrio reside no facto de que estas tm subjacentes
processos decisrios completamente distintos, enquanto que C considera que apenas est em causa um
processo baseado na familiaridade, E postula que os indivduos calculam um coeficiente de
verosimilhana de forma a aceitar ou rejeitar estmulos alvo (para uma discusso aprofundada deste
tpico ver Morrel, Gaitan, e Wixted, 2002).
Curvas ROC
Como foi visto anteriormente, o mesmo nvel de sensibilidade pode ser acompanhado por diferentes
critrios de resposta, que alteram as propores de acertos (hits) e falsos reconhecimentos dos
participantes experimentais. Estas diferentes manifestaes da mesma sensibilidade podem ser
observadas nas curvas de isosensibilidade, normalmente designadas por curvas ROC (Response
Operating Characteristics) que denotam as diferentes propores de acertos (hits) e falsos alarmes
contempladas num determinado valor d, sendo a proporo de acertos (hits) representada pelo eixo X
e a proporo de falsos alarmes pelo eixo Y, como se pode verificar na Figura 4. Estas curvas permitem
assim compreender o modo como a variao do critrio de especificidade afecta as respostas dadas e
os erros contedos, dado um valor de sensibilidade constante.

Proporo
Acertos

Proporo Falsos
Alarmes

Figura 4. Exemplos de curvas de isosensibilidade, adaptado de Macmillan e Creelman (2005)

84

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Outra vantagem das curvas ROC a possibilidade de se mapear as respostas de participantes


experimentais ao longo de diferentes nveis de especificidade, ou seja construir aquilo que se designa
de curvas ROC observadas. A obteno destes pontos necessita que os sujeitos alterem o seu critrio
de resposta, o que pode ser obtido directamente de duas formas (Macmillan & Creelman, 2005). A
primeira forma atravs da manipulao da proporo de palavras antigas e novas; quanto maior for
a proporo de palavras antigas, mais liberal vai ser o critrio, e vice-versa. A outra forma, alternativa
utilizao das propores, consiste na atribuio de uma pontuao ao desempenho dos sujeitos.
Partindo do princpio que os participantes procuram maximizar os seus resultados, uma penalizao
nos falsos alarmes superior bonificao obtida nos acertos, leva a que os sujeitos adoptem um critrio
mais conservador. Quando a bonificao superior aos acertos, o critrio deve ser mais liberal.
O problema destes dois mtodos de manipulao do critrio de resposta reside no facto de
necessitarem que os sujeitos respondam a uma grande quantidade de estmulos em diversas condies
de proporo ou pontuao. Esta limitao leva a que se opte por uma terceira alternativa a utilizao
de nveis de confiana, que apesar de mais prtica j que limita o nmero de condies, e
consequentemente de respostas, implica a aceitao de um pressuposto adicional, nomeadamente que
os nveis de confiana so equivalentes ao posicionamento do critrio (ver Figura 5). A aceitao deste
pressuposto permite inferir as propores de acertos e falsos alarmes que os participantes
manifestariam se estivessem a utilizar diferentes critrios de resposta.
Assim, a obteno de curva ROC feita atravs da utilizao de um paradigma de avaliao, no
qual se pede aos participantes experimentais que reconheam estmulos, indicando numa escala o grau
de confiana que tm das suas escolhas. Estas grelhas tm normalmente entre 6 a 10 graus de
confiana, tendo como plos um critrio muito conservador (ex: claramente antigo) e um critrio muito
liberal (ex: claramente novo) (Murdock, 1965).

Figura 5. Segmentao das distribuies atravs de uma escala de avaliao, adaptado de Macmillan
& Creelman (2005)

Os resultados obtidos so mapeados de forma cumulativa, iniciando-se pelo critrio mais conservador
at ao mais liberal. Os pontos encontrados permitem ento estimar a curva correspondente a um
determinado participante experimental ou amostra, e assim determinar d.
Esta estimao feita atravs da proporo de acertos (hits) e falsos alarmes encontrada no ponto
de interseco entre a diagonal menor (definida pela funo Y=1-X) e a curva ROC observada, como
se pode ver na Figura 6. Aps a obteno deste ponto na curva, o valor d calculado utilizando a
frmula j anteriormente utilizada. A utilizao do ponto de interseco deve-se ao facto deste denotar
as propores obtidas quando o critrio de especificidade nulo. Este mtodo apresenta algumas
limitaes, no entanto permite obter uma estimativa de sensibilidade que no influenciada pelos
enviesamentos de resposta (Murdock, 1965).

Princpios da aplicao da teoria de deteco de sinal

85

Figura 6. Exemplo de uma curva ROC observada, adaptado de Macmillan e Creelman (2005)

As curvas ROC trazem grandes vantagens ao estudo da memria de reconhecimento ao possibilitarem


a anlise de processos mnsicos distintos. Um desses casos a distino entre recordao explcita e a
familiaridade dos estmulos, atravs da assimetria da curva e dos pontos de interseco com os eixos
(Rotello, Macmillan, & Van Tassel, 2000; Yonelinas, 1994).
Dado o pressuposto de normalidade das distribuies, possvel ainda transformar as propores
de acertos (hits) e falsos alarmes em coordenadas-z, obtendo-se desse modo uma zROC, definida pelas
seguintes equaes:
z(H)=-(CPs)/Vs
z(F)=(C-Pn)/Vn
Ao resolvermos estas equaes em funo do critrio de especificidade (C), ficamos com:
z(H)=(Vn/Vs)z(F)+(PsPn)/Vs
Se considerarmos ainda que os desvios padro das duas distribuies so equivalentes, a equao
simplifica-se:
z(H)=z(F)+d
A transformao da curva ROC leva a uma representao grfica como a da Figura 7.

Proporo
Acertos

Z (Acertos)

Z (Falsos Alarmes)

Figura 7. zROC para diferentes nveis de sensibilidade (d), adaptado de Macmillan e Creelman (2005).

86

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Apesar das ROC serem acessveis na visualizao dos pontos de interseco, a sua transformao em
zROC permite um melhor acesso a informao relativa s diferenas entre a distribuio de sinal e rudo,
permitindo aferir a normalidade das distribuies atravs da linearidade da zROC (Green & Swets, 1966;
no entanto esta mtodo tem limitaes, dado que existem distribuies no-normais que resultam numa
linearidade zROC; ver Lockhart & Murdock, 1970), e determinar a diferena das mdias das distribuies
(d) atravs da distncia vertical entre a linha z-ROC e a diagonal do acaso (d=0).
Uma outra vantagem das zROC o facto desta permitir a anlise das varincias de ambas as
distribuies de uma forma mais precisa do que a que anlise da simetria da curva ROC permite; sendo
o declive da zROC a razo entre o desvio padro do rudo e o desvio padro do sinal medida pelo
declive da linha zROC. Este ltimo aspecto de especial importncia, j que importantes modelos de
memria como o MINERVA2 (Hintzman, 1988), o modelo TODAM (Murdock, 1982) ou os modelos
dualistas (Yonelinas, 1994) fazem previses especficas relativamente varincia das distribuies, a
sua igualdade e modificao consoante a fora do sinal.
A medio da sensibilidade dos participantes baseada nas ROC apresenta vantagens considerveis,
no entanto a sua utilizao implica que os participantes respondam com escalas de avaliao, o que pode
comprometer a medio de outras variveis como os tempos de resposta, j que no so equivalentes s
verificadas com respostas dicotmicas sim/no. Em suma, a sua utilizao deve ser ponderada, tendo
em conta as vantagens e desvantagens.
Sensibilidade e comparao: Paradigmas de escolha forada
A implementao da TDS em tarefas de reconhecimento foi at este momento abordada no contexto do
paradigma de reconhecimento do tipo sim/no. Existem no entanto outras formas de avaliar a capacidade
dos participantes experimentais reconhecerem informao previamente apresentada, como no caso do
teste two-alternative-forced-choice, no qual em cada ensaio so apresentados simultaneamente dois
estmulos. Ao contrrio do paradigma de reconhecimento do tipo sim/no, que no distingue entre
familiaridade inerente ao estmulo e a familiaridade causada pela sua apresentao prvia, o paradigma
de escolha forada possibilita a distino destes atravs da apresentao simultnea de estmulos,
manipulando-se a frequncia tanto dos estmulos-sinal como dos estmulos-rudo. Neste caso, o
participante experimental tem que escolher o sinal em cima ou em baixo. Esta uma tarefa mais fcil que
o reconhecimento do tipo sim/no j que os participantes experimentais no tm expectativas relativamente apresentao do sinal em cima ou em baixo, pelo que esta uma tarefa normalmente executada
com o mnimo de enviesamento.
A TDS parte do pressuposto que os participantes experimentais estimam a familiaridade de cada
um dos estmulos de forma independente, o que permite mapear os estmulos no espao de deciso
ortogonalmente, como se pode verificar na Figura 8.
Como se assume que o participante estima a familiaridade de cada item independentemente,
obtm-se as duas representaes das distribuies de familiaridade presentes na Figura 8. Aplicando-se o
teorema de Pitgoras a esta representao geomtrica, mais precisamente ao tringulo formado pelas
duas mdias e pela origem, verifica-se que a duas mdias das distribuies distam entre si 2d, o que
significa que o nvel de sensibilidade dos indivduos neste tipo de tarefa superior em 2, em relao
tarefa de reconhecimento sim/no. Transpondo esta representao para o espao unidimesional,
obtm-se uma distncia semelhante, o que implica que a frmula para calcular o d seja compensada
de modo a reflectir esta diferena na distncia entre as mdias das duas distribuies. Logo, a
sensibilidade neste tipo de tarefa calcula-se ento do seguinte modo:
d=1/2[z(H)-z(F)]

Princpios da aplicao da teoria de deteco de sinal

87

Quanto medida de especificidade, C, a sua frmula de clculo no se altera, j que no se costuma


verificar grandes diferenas quanto ao enviesamento de resposta, entre esse tipo de tarefa e a tarefa de
reconhecimento sim/no.

Figura 8. Representao bidimensional da tarefa de escolha forada, adaptado de Macmillan e Creelman


(2005)
Medidas alternativas: A proposta no paramtrica
Apesar da robustez das medidas paramtricas, alguns autores propem a utilizao de medidas que no
tenham qualquer tipo de distribuio como pressuposto. Pollack e Norman (1964), Hodos (1970), Grier
(1971) e Donaldson (1992) desenvolveram um conjunto de medidas no paramtricas, A e B, e
correspondentes frmulas de computao, aproximadas de d e C, respectivamente.
O princpio subjacente a estas medidas consiste na constatao de que a rea debaixo da curva
ROC numa tarefa de reconhecimento sim/no corresponde proporo de acertos (hits) obtidos de
forma no enviesada numa tarefa de escolha forada. Tendo em conta que a anlise do desempenho
numa tarefa de escolha forada no implica qualquer tipo de pressupostos, a medio da sensibilidade
dos indivduos atravs do clculo da rea debaixo da curva tambm no implicar qualquer tipo de
pressupostos. Dentro desta lgica, e tendo em conta as propriedades da curva ROC, foi ento proposto
um processo de estimao que permitisse obter uma medida no-paramtrica da sensibilidade dos
indivduos, sendo apenas necessria uma nica avaliao do desempenho, como o ponto (H,F) da
Figura 9. Uma das caractersticas das ROC o facto de terem um crescimento montono acompanhado
por um decrscimo do declive. Isto permite prever as reas pelas quais a curva ROC pode passar ou
no. Ao possuirmos o ponto (H,F), podemos delimitar duas reas, A1 e A2, pelas quais a ROC tem
obrigatoriamente que passar, e uma rea I, e uma rea S, que no so interceptadas pela curva ROC.
Esta noo permitiu a Pollack e Norman (1964) criar uma frmula que permite a estimao de A:
A=I+.5(A1+A2)
A estimao do critrio de especificidade (Hodos, 1970) foi igualmente desenvolvida:
B=(A1-A2)/(A1+A2+2S)

88

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

Proporo
Acertos

Proporo Falsos Alarmes

Figura 9. reas da curva ROC, adaptado de Macmillan e Creelman (2005)

As frmulas de computao de A e B foram igualmente definidas (Grier, 1971; Hodos, 1970):


Quando HdF,
A=.5+[(H-F)(1+H-F)]/[4H(1-F)]
B=[H(1-H)-F(1-F)]/[H(1-H)+F(1-F)]
Quando H<F,
A=.5+[(F-H)(1+F-H)]/[4F(1-H)]
B=[F(1-F)-H(1-H)]/[F(1-F)+H(1-H)]
A medida A varia entre 0 e 1, sendo o valor .5 indicativo de reconhecimento aleatrio; por outro lado,
B varia entre -1 e 1, com 0 a denotar a ausncia de enviesamento e valores positivos e negativos a indicar
critrios liberais e conservadores, respectivamente. Estas medidas apresentam algumas vantagens, como
a possibilidade de medir a sensibilidade de participantes experimentais com propores de falsos
alarmes ou de acertos (hits) de 0, algo que no possvel com d; para alm disto apresentam poucas
diferenas, estando altamente correlacionadas com as suas homlogas paramtricas. Contudo, existem
autores que pem em causa a sua natureza no-paramtrica (Macmillan & Creelman, 2005). Diversos
estudos tm demonstrado que de facto, A assume muitos pressupostos acerca da distribuio
subjacente ao desempenho dos participantes experimentais, assumindo diferentes tipos de distribuio
consoante o nvel de sensibilidade (Macmillan & Creelman, 1996).

Concluso
Como vimos ao longo do artigo, a teoria de deteco de sinal no apenas uma ferramenta til na anlise
de dados, uma ferramenta essencial para uma compreenso dos padres de respostas dos participantes
experimentais. A dissociao entre processos mnsicos e decisrios permite avaliar desempenhos e
comparar diferentes teorias acerca da recuperao de informao em memria, possibilitando um debate
aprofundado relativamente aos efeitos de diversas variveis, como a comparao de diferentes propostas
permite o desenvolvimento de novas teorias e modelos. Apesar de apenas ter sido abordada no contexto
da literatura sobre memria de reconhecimento, a TDS pode ser aplicada a praticamente todos os

Princpios da aplicao da teoria de deteco de sinal

89

paradigmas que envolvam uma deciso dicotmica, sendo utilizado em investigaes sobre memria
implcita, e aplicado em tarefas como identificao perceptiva ou deciso lexical. Num estudo sobre
memria implcita (Zeelenberg, Wagenmakers, & Raaijmakers, 2002), a TDS permitiu clarificar um
debate nesta literatura, nomeadamente se a apresentao prvia de um estmulo aumentava a
sensibilidade dos sujeitos em relao a estes em tarefas subsequentes, ou se estvamos perante um
mero efeito de enviesamento de resposta. A TDS permitiu a estes autores afirmar que, para alm de um
enviesamento de resposta, existe um aumento da sensibilidade, ou seja, esto presentes dois efeitos. A
utilizao da TDS permite no apenas entender os contributos dos dois componentes no desempenho
dos sujeitos, mas tambm rejeitar ideias antigas sobre os processos subjacentes a estes.
Para uma aprendizagem mais aprofundada da TDS em geral, recomendamos a consulta o livro de
Macmillan e Creelman (2005). Em termos de artigos, Snodgrass e Corwin (1988) uma referncia
clssica que faz uma introduo das diferentes medidas e apresenta uma aplicao da TDS num
contexto clnico; o artigo de Verde, Macmillan e Rotello (2006) faz uma anlise bastante interessante
sobre a robustez das medidas; e a reviso de literatura feita por Wixted (2007) apresenta as vantagens
da TDS enquanto modelo de memria.
Para finalizar, apresentamos uma lista que descreve os pontos principais sobre a TDS que devem
ser extrados do texto:
a) A mera comparao dos acertos obtidos pelos sujeitos no informativa, sendo necessrio ter
em conta os falsos alarmes.
b) O desempenho dos sujeitos pode ser separado em duas componentes, uma componente mnsica
que define a discriminabilidade entre os estmulos e o rudo, e uma componente de especificidade que estabelece um limite de evidncias que define o critrio de resposta.
c) As representaes grficas ROC e zROC permitem no apenas a utilizao de formas de
medio alternativas mais robustas tendo em conta que assumem menos pressupostos do que as
frmulas, como o pressuposto de igualdade de varincias, mas tambm permitem observar
diferentes aspectos do desempenho como a interseco dos eixos. Uma desvantagem das ROC
que implicam a utilizao de escalas de avaliao, o que pode comprometer outros aspectos a
ser estudados, como os tempos de resposta.
d) Existem duas medidas de especificidade principais, C e E. Estas medidas assumem pressupostos
fundamentalmente distintos, pelo que a sua utilizao implica a aceitao dos mesmos.

Apndice
Frmulas de computao das medidas para folha de clculo EXCEL
1)
2)
3)

Introduzir as designaes na primeira linha, uma designao por clula.


Introduzir as frmulas correspondentes a cada designao nas clulas da linha dois.
Introduzir os valores nas clulas A-E, e o clculo automtico

Designaes (cada uma corresponde a uma clula da linha 1)


A. Participante
B. #acertos (hits)
C. # omisses
D. #falsos alarmes
E. #rejeies correctas
F. H
(cont. o

90

D. Van der Kellen, L. Duarte Nunes, & L. Garcia-Marques

(m cont.)

G.
H.
I.
J.
K.
L.
M.
N.
O.
P.
Q.
R.

F
z(H)
z(F)
d
c
c

ln
A
B
Pr
Br

Frmulas (correspondem s clulas da linha 2. substituir os nmeros pela linha correspondente)


SE[C2>0;B2/(B2+C2);(B2-0,5)/(B2+C2)]
SE[D2>0;D2/(D2+E2);0,5/(D2+E2)]
INV.NORMP(F2)
INV.NORMP(G2)
H2-I2
0,5*(H2+I2)
L2/K2
EXP(K2*L2)
LN(N2)
SE[G2>F2;(0,5-(G2-F2)*(1+G2-F2)/(4*G2*(1-F2)));(0,5+(F2-G2)*(1+F2-G2)/(4*F2*(1-G2)))]
SE[G2>F2;((F2*(1-F2))-(G2*(1-G2)))/((F2*(1-F2))+(G2*(1-G2)));((G2*(1-G2))-(F2*(1-F2)))/((G2*(1-G2))+(F2*(1-F2)))]
F2-G2
G2/[1-(F2-G2)]

Referncias
Banks, W. P. (1970). Signal detection theory and human memory. Psychological Bulletin, 74, 81-99.
Donaldson, W. (1992). Measuring recognition memory. Journal of Experimental Psychology: General,
121, 275-277.
Gillund, G., & Shiffrin, R. M. (1984). A retrieval model for both recognition and recall. Psychological
Review, 91, 1-67.
Glanzer, M., & Adams, J. K. (1985). The mirror effect in recognition memory. Memory & Cognition,
16, 5-16.
Glanzer, M., Adams, J. K., Iverson, G. J., & Kim, K. (1993). The regularities of recognition memory.
Psychological Review, 100, 546-567.
Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. New York: Wiley.
Grier, J. B. (1971). Nonparametric indexes for sensitivity and bias: Computing formulas. Psychological
Bulletin, 75, 424-429.
Hintzman, D. L. (1988). Judgments of frequency and recognition memory in a multiple-trace memory
model. Psychological Review, 95, 528-551.
Hodos, W. (1970). Nonparametric index of response bias for use in detection and recognition
experiments. Psychological Bulletin, 74, 351-354.

Princpios da aplicao da teoria de deteco de sinal

91

Lockhart, R. S., & Murdock, B. B., Jr. (1970). Memory and the theory of signal detection. Psychological
Bulletin, 74, 100-109.
Macmillan, N. A., & Creelman, C. D. (1996). Triangles in ROC space: History and theory of nonparametric measures of sensitivity and response bias. Psychonomic Bulletin & Review, 3, 164-170.
Macmillan, N. A., & Creelman, C. D. (2005). Detection theory: A users guide (2nd ed.). Mahwah, NJ,
US: Lawrence Erlbaum Associates Publishers.
McClelland, J. L., & Chappell, M. (1998). Familiarity breeds differentiation: A subjective-likelihood
approach to the effects of experience in recognition memory. Psychological Review, 105, 724-760.
Morrell, H. E. R., Gaitan, C., & Wixted, J. T. (2002). On the nature of the decision axis in signaldetection-based models of recognition memory. Journal of Experimental Psychology: Learning,
Memory & Cognition, 28, 1095-1110.
Murdock, B. B. (1965). Signal detection theory and short-term memory. Journal of Experimental
Psychology, 70, 443-447.
Murdock, B. B. (1982). A theory for the storage and retrieval of item and associative information.
Psychological Review, 89, 609-626.
Pollack, I., & Norman, D.A. (1964). A non-parametric analysis of recognition experiments. Psychonomic
Science, 1, 125-126.
Rotello, C. M., Macmillan, N. A., & Van Tassel, G. (2000). Recall-to reject in recognition: Evidence
from ROC curves. Journal of Memory and Language, 43, 67-88.
Shiffrin, R. M., & Steyvers, M. (1997). A model for recognition memory: REM-retrieving effectively
from memory. Psychonomic Bulletin & Review, 4, 145-166.
Snodgrass, J. C., & Corwin, J. (1988). Pragmatics of measuring recognition memory: Applications to
dementia and amnesia. Journal of Experimental Psychology: General, 117, 34-50.
Verde, M. F., Macmillan, N. A., & Rotello, C. M. (2006). Measures of sensitivity based on a single hit
rate and false-alarm rate: The accuracy, precision, and robustness of d, Az, and A. Perception &
Psychophysics, 68, 643-654.
Wixted, J. (2007) Dual-process theory and signal-detection theory of recognition memory.
Psychological Review, 114, 152-176.
Yonelinas, A. P. (1994). Receiver-operating characteristics in recognition memory: Evidence for a
dual-process model. Journal of Experimental Psychology: Learning, Memory, & Cognition, 20,
1341-1354.
Zeelenberg, R., Wagenmakers, E.-J., & Raaijmakers, J. G. W. (2002). Repetition priming in implicit
memory tasks: Prior study causes enhanced discriminability, not only bias. Journal of Experimental
Psychology: General, 131, 38-47.

Submisso: 10/10/2007

Aceitao: 06/05/2008

Vous aimerez peut-être aussi