Vous êtes sur la page 1sur 12

Avaliao Psicolgica, 2003, (2)2, pp.

99-110 99

Fundamentos da Teoria da Resposta ao Item TRI


Basic Theory of Item Response Theory IRT

Luiz Pasquali
Universidade de Braslia
Ricardo Primi
Universidade de So Francisco

Resumo
O artigo apresenta o histrico e a lgica bsica da nova teoria em psicometria, a teoria de resposta ao item,
abreviadamente a TRI. A teoria tem suas origens nos anos 1930, mas foi axiomatizada nos anos 1960, tomando
conta de grande parte da psicometria nos anos 1980. A TRI constitui uma teoria dentro das teorias da modelagem
latente que surgiram nos anos 1930. Estas teorias postulam que o comportamento humano conseqncia de
processos hipotticos chamados de traos latentes. A TRI assume este modelo e expressa a relao entre os
comportamentos (chamadas variveis observveis) e os traos latentes (as variveis hipotticas) atravs uma
equao matemtica chamada de equao logstica. Esta produz uma curva ou ogiva conhecida como a curva
caracterstica do item, a CCI. A CCI define os parmetros dos comportamentos, ditos itens (dificuldade, discrimi-
nao) em funo do tamanho do trao latente, expresso como teta (q). Discutem-se tambm as vantagens que a TRI
apresenta frente teoria tradicional em psicometria, a Teoria Clssica dos Testes (TCT).
Palavras chave: Teoria de resposta ao item, TRI, psicometria.

Abstract
The paper offers a historical view and the basic rationale of the modern theory in psychometrics: item response
theory (IRT). This theory has its roots in the 1930, but it was fully developed only in the 1950s, and became the
standard theory in psychometrics in the 1980s. The IRT is one of the latent trait modeling theories that appeared
in the 1930s. Latent trait modeling theories assume that the human behavior, called observable variables, is
dependent and caused by latent traits, the hypothetical variables. The IRT assume this modeling and expresses the
relationship between these two types of variables through a mathematical equation called the logistic equation.
This equation produces a curve called the item characteristic curve (ICC). This curve defines the items parameters
(difficulty, discrimination) in terms of the level of the latent trait, symbolized as theta (q). The paper also
discusses the advantages that IRT offers over the traditional theory in psychometrics, that is, the classical
theory of tests (CTT).
Key words: Item response theory, IRT, psychometrics.

Fundamentos da ves problemas da medida em Psicologia. Um dos


problemas a que nos referimos j vinha sendo frus-
Teoria da Resposta ao Item TRI
trantemente assinalado por Thurstone antes mesmo
No contexto terico da Psicometria, era inevi- dos anos 30. Dizia Thurstone (1928/1959, p. 547):
tvel que alguma teoria alternativa teoria clssica Um instrumento de medida, na sua funo de
dos testes (TCT) surgisse para resolver alguns gra- medir, no pode ser seriamente afetado pelo ob-
jeto de medida. Na extenso em que sua fun-
o de medir for assim afetada, a validade do
instrumento prejudicada ou limitada. Se um
Correspondncia deve ser encaminhada aos autores atravs dos
e-mails: labpam@unb.br ou rprimi@mpc.com.br
metro mede diferentemente pelo fato de estar
100 Luiz Pasquali & Ricardo Primi

medindo um tapete, uma pintura ou um pedao resposta est no fato de que a soluo dada ao pro-
de papel, ento nesta mesma extenso a confi- blema da independncia do instrumento de medida
ana neste metro como instrumento de medida em relao ao objeto de medida que a Teoria da
prejudicada. Dentro dos limites de objetos para Resposta ao Item props apresentava algoritmos
os quais o instrumento de medida foi produzido, matemticos de tal complexidade que a tecnologia
sua funo deve ser independente da medida computacional da poca era incapaz de resolver de
do objeto. uma maneira til e prtica. Com o avano da
A Psicometria, hoje em dia chamada de clssi- tecnologia da informtica (microcomputadores) e da
ca (Teoria Clssica dos Testes TCT), estava bas- disponibilidade de softwares apropriados, este pro-
tante bem axiomatizada j nos anos 50, sobretudo blema foi solucionado e a TRI entrou em moda. Ali-
com os trabalhos de Guilford (1936/1954) e Gulliksen s, o primeiro software para as anlises da TRI sur-
(1950). Ela, contudo, continha o grave problema que giu somente em 1979 com o BICAL de Wright, Mead
Thurstone menciona acima, isto , o instrumento e Bell, seguidos depois pelo LOGIST (Wingersky,
construdo dependia intrinsecamente do objeto me- Barton, & Lord, 1982) e pelo BILOG (Mislevy &
dido. De fato, os testes psicolgicos elaborados den- Bock, 1984).
tro da Psicometria Clssica so dependentes dos itens
que os compem (test-dependent). Assim, por exem- Problemas da Psicometria Clssica
plo, ao se querer medir a inteligncia de um sujeito, o Alm do grave problema mencionado na intro-
resultado vai depender muito do instrumento utiliza- duo deste captulo, outros problemas so salienta-
do, obviamente um instrumento que mede intelign- dos contra a Psicometria Clssica. Um deles afirma
cia. Se utilizar, digamos, as Matrizes Progressivas que os parmetros dos itens de um teste dependem
de Raven (SPM), obtenho um resultado; se utilizar o da amostra de sujeitos em que eles foram calcula-
Wechsler Adult Intelligence Scales (WAIS), obte- dos. Assim, um item qualquer se torna mais difcil ou
nho outro. Qual dos dois resultados o correto? A mais fcil dependendo da amostra ser composta de
resposta fica ligada ao instrumento utilizado, de tal sujeitos mais inteligentes ou menos inteligentes. Desta
forma que o objeto medido, a inteligncia no caso, forma, o parmetro de dificuldade do item vai vari-
afeta diretamente o instrumento utilizado; alis, ela ar de pesquisa para pesquisa em funo da amostra
definida pelo instrumento utilizado. Voc talvez se de sujeitos; isto , este parmetro dependente dos
lembra como Binet (Binet & Simon,1908) definiu a sujeitos utilizados na pesquisa (subject-dependent).
inteligncia: Inteligncia o que o meu teste mede! Esta crtica vlida, mas ela se refere mais a um
Seria como dizer em Fsica que o comprimento do problema de amostragem e no tanto da anlise que
objeto o que o metro mede ou a massa o que a se faz da dificuldade do item em termos de nmero
balana mede. de acertos. Se a mostra for aleatria e representati-
Embora Thurstone tenha percebido agua- va, este problema no existe na Psicometria Clssi-
damente este problema da medida em Psicologia, ele ca. No entanto, uma grande vantagem da TRI que
no conseguiu encontrar uma soluo para o mes- mesmo em amostras no representativas os
mo. Foi somente aps os anos 50 que os psicometristas parmetros podero ser estimados corretamente
comearam a descobrir a soluo para o problema, (Embretson & Reise, 2000).
baseados na teoria do trao latente de Lazersfeld Um problema mais grave ocorre com o clculo
(1959) e nos trabalhos de Lord (1952) e do dinamar- do parmetro de discriminao do item. Esta an-
qus Rasch (1960), os quais se tornaram as bases lise, dentro da Psicometria Clssica, feita baseada
da moderna Teoria da Resposta ao Item - TRI (Item no escore total de um teste, seja utilizando grupos-
Response Theory - IRT), inclusive conhecida como critrio ou coeficientes de correlao (Pasquali,
a Teoria do Trao Latente, esboada por Lord em 1996). Tal procedimento incorre numa incongrun-
1952 e finalmente axiomatizada por Birnbaum em cia lgica, pois a discriminao de cada item testa-
1968 e por Lord em 1980. da contra o escore total que constitudo por todos
O que pode parecer estranho nesta histria o os itens do teste, inclusive o item que se est anali-
fato de que o problema levantado por Thurstone te- sando. Isto supe que os outros itens, pelo menos,
nha sido detectado j nos anos 30 e que a resposta j sejam adequados. Mas se o so, ento por que se
tinha sido dada nos anos 60. Por que ento a nova fazer a anlise? E se no o so, ento a anlise est
teoria somente veio a ser utilizada nos anos 80? A simplesmente falha, errada.

Avaliao Psicolgica, 2(2), 2003, pp. 99-110


A Teoria da Resposta ao Item 101

Outro problema grave na Psicometria Clssica A Teoria da Resposta ao Item


se situa no clculo da fidedignidade de um teste.
Esta definida comumente em termos de formas Um pouco de histria
paralelas de um teste. Estas formas precisam ser Como j assinalamos, a TRI foi sendo elaborada
estritamente paralelas, isto , elas precisam produzir aos poucos desde os anos 50 por vrios autores, em-
um escore verdadeiro idntico e varincias tambm bora suas razes remontem h mais de uma dcada
iguais. Obviamente, a obteno de formas assim anterior. Entre estes precursores se encontram os tra-
paralelas de um mesmo teste algo difcil de ser balhos de Richardson (1936), comparando os
conseguido. Ademais, os sujeitos, ao tomar uma for- parmetros dos itens obtidos pela teoria clssica da
ma paralela, nunca sero exatamente os mesmos, Psicometria com os moldes que hoje usa a TRI; os
pois h os problemas de maturao que Campbell e trabalhos de Lawley (1943, 1944), indicando alguns
Stanley (1973) discutem no contexto do delineamen- mtodos para estimar os parmetros dos itens, os quais
to de pesquisa, tais como a aprendizagem, o cansa- se afastavam da teoria clssica e os trabalhos de
o, a motivao, etc. que muda da aplicao de uma Tucker (1946), que parece ter sido o primeiro a utili-
forma para outra, inclusive diferencialmente para zar a expresso curva caracterstica do item - Item
diferentes sujeitos, tornando a comparao entre as Characteristic Curve, ICC - que constitui um con-
duas formas no mais paralela. ceito chave na TRI. Tambm deve ser mencionada a
Um outro problema presente na teoria tradicio- contribuio de Lazersfeld (1950), que introduziu o
nal em Psicometria consiste na suposio que nela conceito de trao latente, ainda que no contexto da
se faz de que a varincia dos erros de medida a medida das atitudes, conceito novamente que se
mesma para todos os testandos, suposio de difcil constituiu num parmetro chave da nova TRI.
sustentao, pois parece bvio que alguns testandos Entretanto, o responsvel mais direto que deu
realizam a tarefa mais consistentemente que outros origem TRI moderna, Frederic Lord (1952, 1953)
e que a consistncia varia em funo da habilidade por ter elaborado, no somente um modelo terico,
dos sujeitos (Hambleton & Swaminathan, 1985). Por mas ainda mtodos para estimar os parmetros dos
exemplo um teste com itens medianamente fceis itens dentro da nova teoria, utilizando o modelo da
poder diferenciar mais os sujeitos com habilidade ogiva normal. Os modelos elaborados por Lord se
mdia mas no ir diferenciar da mesma maneira os aplicam a testes onde as respostas so dicotmicas,
sujeitos com habilidade superior que provavelmente isto , certo e errado, ou seja, testes de aptido. Mais
obtero escores perto dos mais altos. Conseqente- tarde, Samejima (1969, 1972) elaborou modelos para
mente, o erro de medida neste segundo grupo ser tratar respostas politmicas e mesmo para dados
maior que no primeiro (Embretson & Reise, 2000; contnuos, como caso em testes de personalidade.
Hambleton & Swaminathan, 1985). Outro passo importante na histria da TRI foi dado
H, alm disso, a condio tpica dos testes de por Birnbaum (1957) ao substituir as curvas de ogiva
aptido construdos dentro dos moldes da teoria cls- por curvas logsticas, isto , baseadas nos logaritmos,
sica da Psicometria. Os testes so elaborados para tornando o tratamento matemtico dos dados bem
avaliar maximamente os sujeitos de habilidades me- mais fcil.
dianas, sendo, por isso, bem menos apropriados e Um dos fatores que concretamente mais con-
vlidos para avaliar sujeitos com habilidades superi- triburam para o uso generalizado da TRI hoje em
ores ou de pouca habilidade. De fato, a validade de dia foi o avano da informtica. Como a complexi-
um teste se maximiza na medida em que o nvel de dade matemtica no campo da TRI enorme, o pro-
dificuldade do mesmo se aproxima do nvel de habi- gresso vertiginoso nas mquinas de processamento
lidade do sujeito (Lord, 1980; Weiss, 1983). De sorte (microcomputadores) possibilitou a viabilizao dos
que aplicando testes de dificuldade mdia diferente clculos que o modelo TRI exige em Psicometria.
a sujeitos de diferentes nveis de aptido ir produzir Com este progresso das mquinas, foi possvel tam-
resultados nem sempre comparveis, pois bvio bm, nos anos 80, o desenvolvimento de softwares
que obter 50 num teste fcil no a mesma que apropriados para os tais clculos.
coisa obter 50 num teste mais difcil que mea a
mesma aptido. A tarefa de comparar os sujeitos A Teoria Bsica da Resposta ao Item
em tais situaes de difcil manejo dentro dos mo- A Teoria da Resposta ao Item uma teoria do
delos tradicionais de anlise. trao latente aplicada primariamente a testes de ha-

Avaliao Psicolgica, 2(2), 2003, pp. 99-110


102 Luiz Pasquali & Ricardo Primi

bilidade ou de desempenho. O termo teoria do tra- latentes pode ser descrita por uma equao
o latente se refere a uma famlia de modelos mate- matemtica monotnica crescente, chama-
mticos que relaciona variveis observveis (itens da de Curva Caracterstica do Item CCI
de um teste, por exemplo) e traos hipotticos no- (veja Figura 1).
observveis ou aptides, estes responsveis pelo
aparecimento das variveis observveis ou, melhor,
das respostas ou comportamentos emitidos pelo su-
jeito que so as variveis observveis. Assim, temos
um estmulo (item) que apresentado ao sujeito e
este responde a ele. A resposta que o sujeito d ao
item depende do nvel que o sujeito possui no trao
latente ou aptido. Desta forma, o trao latente a
causa e a resposta do sujeito o efeito. Agora, para
se poder estimar, a partir da resposta dada pelo su-
jeito, o seu nvel no trao latente, preciso que se Figura 1 ICC para item 1
hipotetizem relaes entre as respostas observadas
do sujeito e o seu nvel neste mesmo trao latente. A Figura 1 mostra que, medida que aumenta
Quando estas relaes so expressas numa equa- o teta, aumenta tambm a probabilidade de acertar o
o matemtica, constando de variveis e de cons- item (relao monotnica crescente entre aptido e
tantes, temos um modelo ou teoria do trao latente. probabilidade de acerto)1.
Como tanto as variveis e constantes que entram
numa tal equao, quanto as formas matemticas Vantagens da TRI
que as curvas, que expressam a relao hipotetizada, As restries que a TRI faz sobre os dados,
podem ser as mais variadas, segue que, em princ- como veremos, so muito fortes. Segundo o princ-
pio, existe um nmero sem fim de tais equaes pos- pio geral da parcimnia em cincia, isto , de que se
sveis. A TRI se decidiu por algumas destas equa- deve privilegiar a explicao e o modelo mais sim-
es que achou mais adequadas ou produtivas, como ples, a TRI seria um modelo bem mais complexo do
veremos mais adiante. que o modelo da Psicometria Clssica e, conse-
De qualquer forma, o fundamental da teoria do quentemente, deveria ser preterido em favor desta.
trao latente consiste em expressar numa frmula Isto seria vlido se o modelo mais complexo no ex-
matemtica a relao existente entre variveis ob- plicasse mais coisas do que o mais simples. Ento,
servadas e variveis hipotticas, chamadas estas de pergunta-se: a TRI oferece vantagens importantes
traos latentes. Assim, se conhecemos as caracte- em relao ao modelo tradicional da Psicometria ou
rsticas das variveis observadas (como os itens de no? Quais so estas vantagens que torna a TRI
um teste), estas se tornam constantes na equao e prefervel?
esta se torna solucionvel, permitindo que se estime Primeiramente, preciso alertar que a TRI no
ento o nvel do trao latente ou a aptido do sujeito veio para substituir toda a Psicometria Clssica, mas
e vice-versa, isto , se for conhecido o nvel do trao apenas partes dela, particularmente na anlise dos
latente possvel serem estimadas as caractersti- itens e no tema da fidedignidade da medida; mas
cas dos itens respondidos por este sujeito. sua contribuio na temtica da validade dos ins-
Assim, a TRI faz dois postulados bsicos, a trumentos psicolgicos, ainda que importante, no
saber: parece revolucionria e esta temtica a mais re-
1) o desempenho do sujeito numa tarefa (item levante em Psicometria. Evidentemente, de se
de um teste) pode ser predito a partir de um esperar que logo se consiga desenvolver a
conjunto de fatores ou variveis hipotticas, Psicometria pura e simplesmente em Psicologia, sem
ditos aptides ou traos latentes (identifica- distino entre Clssica e Moderna, mas utilizando
dos na TRI com a letra grega teta: q); o teta os avanos definitivos de ambas. Dito isto, ento
sendo a causa e o desempenho o efeito. Tra-
ta-se de modelagem latente (latent trait
modeling). Ou seja, comportamento = fun- 1
Os modelos atuais da TRI completos incluem outros parmetros
o (trao latente) na equao, como veremos ao falarmos dos mesmos; contudo, a
lgica fundamental da teoria do trao latente consiste em expressar
2) a relao entre o desempenho e os traos
o comportamento em termos de traos latentes.
Avaliao Psicolgica, 2(2), 2003, pp. 99-110
A Teoria da Resposta ao Item 103

quais so os avanos que a TRI trouxe no campo provveis, tais como os erros de medida se-
da Psicometria? Hambleton, Swaminathan e Rogers rem iguais para todos os testandos;
(1991) apresentam cinco grandes avanos que a e) a TRI no necessita trabalhar com testes
TRI trouxe, sendo os trs primeiros particularmen- estritamente paralelos como exige a
te importantes. Vejamos: psicometria clssica.
a) o clculo do nvel de aptido do sujeito Pode parecer que as duas primeiras vantagens
independe da amostra de itens utilizados: diz- so fictcias pois se utilizssemos amostras repre-
se que a habilidade do sujeito independen- sentativas, tanto na construo quanto na padroniza-
te do teste (not test-dependent). Na o dos testes, teramos medidas independentes do
Psicometria Clssica, o escore do sujeito teste utilizado e parmetros dos itens independentes
dependia e variava segundo o teste aplicado da amostra de sujeitos. Considere, por exemplo, dois
fosse mais fcil ou mais difcil, ou produzis- testes, um mais fcil e um mais difcil, padronizados
se maiores ou menores erros. Assim, tais com amostras representativas de sujeitos. Neste caso
escores no eram comparveis e, mesmo poder-se-ia supor que, resultados semelhantes na
aplicando ajustes, os escores ainda continu- escala padronizada, obtidos por meio do teste fcil
avam no comparveis sobretudo porque os ou pelo teste difcil, significariam a mesma coisa. Mas
testes produziam diferenas nas varincias isso no verdade pois as distncias entre os sujei-
de erros de medida. No caso da TRI, no tos com habilidade superior mdia, obtidas caso
importa que itens ou conjunto de itens que aplicssemos o teste difcil, seriam maiores do que
voc utilize, obviamente que estejam medindo se aplicssemos o teste mais fcil uma vez que estes
o mesmo trao latente, iro produzir o mes- sujeitos, com alta habilidade, teriam notas muito pr-
mo nvel de aptido do sujeito, dentro, b- ximas das mais altas e, portanto, mais prximas no
vio, dos sempre presentes erros de medida segundo teste. Portanto a medida afetada pelo ins-
em qualquer ramo da cincia; trumento utilizado. Na TRI isto no ocorre porque
b) o clculo dos parmetros dos itens (difi- ela trabalha com o escore teta. Como mostra a Figu-
culdade e discriminao) independe da ra 1 o escore teta tem uma relao no linear com a
amostra de sujeitos utilizada: diz-se que os probabilidade de acerto associada ao escore total e,
parmetros so independentes dos sujei- por isso, corrige as distores do escore total. Nos
tos (not group-dependent). Na clssica, extremos, uma diferena de pequena magnitude na
os parmetros dependiam muito dos sujei- probabilidade de acerto corresponde a uma diferen-
tos amostrados possurem maior ou me- a de magnitude muito dos escores teta, ainda que,
nor aptido; com preciso muito mais reduzida.
c) a TRI permite emparelhar itens com a ap-
tido do sujeito. Isto quer dizer que se ava- Suposies da TRI
lia a aptido de um sujeito, utilizando itens Entre as caractersticas ou pr-requisitos da TRI,
com dificuldade tal que se situam em torna duas so de especial relevncia: a unidimensionalidade
to tamanho da aptido do sujeito, sendo, as- e a independncia local, que representam suposies
sim, possvel utilizar itens mais fceis para bsicas dos modelos mais correntes desta teoria
sujeitos com habilidades inferiores e itens psicomtrica. A histria das suposies frustrante
mais difceis para sujeitos mais aptos, pro- para muita gente, porque elas no podem ser
duzindo escores comparveis em ambos os empiricamente demonstradas e nem possuem bases
casos. Na psicometria clssica sempre era lgicas; elas so simplesmente aceitas ou no aceitas,
aplicado o mesmo teste, hermeticamente isto , elas so gratuitas, elas so hipteses. Mas, ob-
fechado, para todos os sujeitos, de sorte que, serve o seguinte: (1) qualquer modelo matemtico,
se o teste fosse fcil, avaliaria bem sujeitos para poder funcionar e ser til, precisa fazer algumas
de aptido menor e mal sujeitos de aptido suposies entre o modelo e os dados empricos, in-
superior e, se o teste fosse difcil, faria o clusive especificando as relaes que existem entre
contrrio. Esta histria ficar mais clara ao as variveis hipotticas do modelo e as variveis
falarmos de testes adaptativos e montagem observveis ou empricas; (2) embora as suposies
de testes otimizados; no possam ser provadas diretamente, elas podem s-
d) a TRI constitui um modelo que no precisa lo indiretamente (em suas conseqncias), isto , ve-
fazer suposies que aparentam serem im- rificando se a sua violao produz resultados incon-
Avaliao Psicolgica, 2(2), 2003, pp. 99-110
104 Luiz Pasquali & Ricardo Primi

gruentes no estudo da realidade emprica; quer dizer ractersticas do mesmo (dificuldade, discriminao)
que os resultados prticos iro determinar se as supo- e do tamanho do teta do sujeito respondente, como
sies foram ou no teis ou adequadas. veremos mais adiante. Acompanhe o seguinte raci-
ocnio, para entender o que seja independncia local:
A Unidimensionalidade Seja
As teorias do trao latente (que vm dos anos q a aptido dominante que afeta um conjunto
30) afirmam que existe um conjunto de traos laten- de itens,
tes que esto por detrs de um desempenho Ui a resposta de um sujeito ao item i (i = 1, 2,
comportamental qualquer. Assim, um sujeito qual- ....., n); o Ui = 1 se o sujeito acerta o item e Ui
quer se situa num espao de n dimenses (agora = 0 se ele erra;
chamadas de teta q) e seu desempenho depende P(Uiq) a probabilidade de resposta do su-
do tamanho que ele possui em cada um desses tetas, jeito j com aptido q ao item i. P(Ui=1q) sig-
de sorte que o seu comportamento pode ser expres- nifica a probabilidade de uma resposta correta
so como um vetor de escores ou pesos nos vrios dada ao item i, levando em conta o teta do su-
tetas, isto , jeito e P(Ui=0q) a probabilidade de uma res-
Desempenho = f(q1, q2, q3, ..., qn). posta errada. Estas duas instncias so
Entretanto, em sua maioria, os modelos da TRI abreviadamente expressas como Pi e Qi (sen-
postulam que h apenas uma aptido (teta) respon- do Qi = 1 Pi).
svel pela realizao de um conjunto de tarefas (itens Com tais informaes, a independncia local
de um teste). Parece pacfico que qualquer desem- pode ser matematicamente afirmada como
penho humano sempre multideterminado ou
multimotivado, dado que mais de um trao latente Prob(U1, U2, ... , Unq) = P(U 1q)
entra na execuo de qualquer tarefa, como o mo- P(U2q)n ..... P(Unq)
delo geral do trao latente afirma. Contudo, para
satisfazer o postulado da unidimensionalidade sufi- = P( U i )
i =1
ciente admitir que haja uma aptido dominante (um onde a ltima expresso significa o produtrio
fator ou trao dominante) responsvel pelo desem- das probabilidades dos n itens do teste.
penho num conjunto de itens de um teste. Este fator A independncia local significa que, para exa-
o que se supe estar sendo medido pelo teste. O minandos com uma aptido dada, a probabilidade de
postulado da unidimensionalidade continua importante resposta a um conjunto de itens igual aos produtos
dado que a TRI ainda no possui solues adequa- das probabilidades das respostas do examinando a
das para modelos multidimensionais, embora estes cada item individual. Assim, se um sujeito acertou
estejam sendo pesquisados j de longa data (Mulaik, os itens 1 e 2 e errou o 3, a configurao ou padro
1972; Samejima, 1974; Bock & Aitkin, 1981; de suas respostas, isto , o padro de resposta U1
Reckase, 1985). Isso tambm no quer dizer que os =1, U2 =1, U3 =0, ou seja, 1 1 0 e a independncia
autores se entendem completamente sobre o que seja local implica que
unidimensionalidade e como ela deve ser estimada.
A Independncia Local P(U1=1, U2=1, U3=0q) = P(U 1 =1q)
P(U2=1q) P(U3=0q)
Este postulado afirma que, mantidas constan-
= P 1P 2 Q 3.
tes as aptides que afetam o teste, menos o teta do-
minante, as respostas dos sujeitos a quaisquer dois Embora parea improvvel que os comportamen-
itens so estatisticamente independentes. Isto impli- tos (respostas) de um mesmo sujeito no estejam
ca em que o desempenho do sujeito num item no
afeta o desempenho em outro item: cada item res-
pondido exclusivamente em funo do tamanho do 2
Os matemticos complicam esta histria dizendo que P(Xi = 1|Xj
seu teta dominante2. Esta suposio importante e = 1, x k, q s = P(X i = 1| x k, q s), isto , a probabilidade de que o item
i seja acertado (X
til, porque, sendo ela verdadeira, ento a seqncia i = 1), dependendo ou condicionado ao fato de que o item
de respostas do sujeito a uma srie de itens ser o j seja acertado (X j = 1) e dos parmetros dos itens (dificuldade,
produto das probabilidades de cada item individual. discriminao, etc.: x k ) e do teta do sujeito respondente (
q s) a mesma que resolvendo o item i sozinho. Em outras palavras,
As probabilidades de cada item dependem das ca- o que acontece com o item j irrelevante com respeito histria
do item i.
Avaliao Psicolgica, 2(2), 2003, pp. 99-110
A Teoria da Resposta ao Item 105

correlacionados, a independncia local afirma que, se Supe-se que os processos psquicos se distri-
houver correlao, esta se deve influncia de fatores buem normalmente entre a populao. Isto quer di-
outros que no o fator dominante. Se estes outros fato-
res forem controlados (mantidos constantes), o fator
dominante ser a nica fonte de variao e as respos-
tas se tornam independentes, porque o sujeito responde
exclusivamente em funo do tamanho do seu teta.
Assim, a independncia local implica tambm a
unidimensionalidade, j que a nica causa da resposta
do sujeito este suposto teta dominante (Lord, 1980;
Lord & Novick, 1968).
Tambm preciso anotar que a independncia
local afirma a independncia das respostas do sujei-
to, o que no significa que os itens do teste no pos- zer que um processo psquico se distribui dentro da
sam estar correlacionados. Como assim? A correla- populao como uma curva normal, implicando que
o entre os itens, se existe, definida sobre um alguns sujeitos da populao possuem um nvel bai-
grupo de sujeitos, que responderam do mesmo jeito, xo de tal processo, outros um nvel alto, e a maioria
enquanto a independncia local diz que cada sujeito um nvel mdio, como mostra a Figura 2.
individualmente deu respostas independentes para Figura 2 Distribuio normal dos processos psquicos
cada item do teste. Alis, se os itens esto medindo
o mesmo trao latente, de se esperar que estejam
correlacionados. Para expressar a distribuio da totalidade dos
Quando um sujeito responde a uma srie de elementos de uma populao utiliza-se a mtrica do
itens, ele produz o que se chama de um padro de escore padro, que ancorada na mdia (valor 0) e
respostas, composto de acertos (valor 1) e erros (va- que vai de - a +, mas que na prtica vai de -3 a +3,

Tabela 1 Padres de resposta em 4 itens para 10 sujeitos


Padro de resposta para item
Sujeitos 1 2 3 4 Probabilidade do padro
1 0 0 0 0 Q1 Q2 Q3 Q4 = 0,8 x 0,6 x 0,5 x 0,2 = 0,048
2 0 0 0 1 Q1 Q2 Q3 P4 = 0,8 x 0,6 x 0,5 x 0,8 = 0,192
3 0 0 1 0 Q1 Q2 P3 Q4 = 0,8 x 0,6 x 0,5 x 0,2 = 0,048
4 0 0 1 1 Q1 Q2 P3 P4 = 0,8 x 0,6 x 0,5 x 0,8 = 0,192
5 0 1 0 0 Q1 P2 Q3 Q4 = 0,8 x 0,4 x 0,5 x 0,2 = 0,032
6 0 1 0 1 Q1 P2 Q3 P4 = 0,8 x 0,4 x 0,5 x 0,8 = 0,128
7 0 1 1 1 Q1 P2 P3 P4 = 0,8 x 0,4 x 0,5 x 0,8 = 0,128
8 1 0 0 0 P1 Q2 Q3 Q4 = 0,2 x 0,6 x 0,5 x 0,2 = 0,012
9 1 0 1 1 P1 Q2 P3 P4 = 0,2 x 0,6 x 0,5 x 0,8 = 0,048
10 1 1 1 1 P1 P2 P3 P4 = 0,2 x 0,4 x 0,5 x 0,8 = 0,032

lor 0). Veja os exemplos de padres de resposta e porque entre estes dois pontos cai 99,97% de todos
sua probabilidade de ocorrncia na Tabela 1 para 10 os sujeitos de uma populao. A TRI faz uso desta
sujeitos em 4 itens, cuja probabilidade individual de mtrica. O processo psquico chamado de teta (q).
acerto [Pi(qj)] destes ltimos de, respectivamente, Supe-se, assim, que cada sujeito da populao pos-
0.2, 0.4, 0.5, 0.8. sui um tamanho ou nvel de teta que o posiciona nes-
ta escala de -3 a +3. Como que se vai descobrir o
A Curva Caracterstica do Item CCI tamanho do teta de cada sujeito? Resposta: Atravs
Na viso da teoria do trao latente, os itens de um do seu comportamento. Como assim? A forma usu-
teste constituem a expresso comportamental ou com- al para medir um processo latente (teta) consiste em
portamentos, que o sujeito expressa como resposta a desenvolver um teste com uma srie de questes ou
um ou mais traos latentes. Assim, qualquer comporta- itens, os quais expressam algum aspecto do trao
mento seria a expresso fsica ou comportamental de latente. Em se tratando de um teste de aptido, en-
um processo psquico, sendo este a causa daquele. to o tamanho de teta do sujeito expresso pelo n-
Avaliao Psicolgica, 2(2), 2003, pp. 99-110
106 Luiz Pasquali & Ricardo Primi

mero de itens que ele acertou. Isto na Teoria Clssi- Esta curva expressa tudo que a TRI pode des-
ca dos Testes (TCT). No caso da Teoria de Respos- cobrir sobre o item. Ela chamada de curva logstica
ta ao Item (TRI), entretanto, no se pergunta quantos e caracterizada por duas caractersticas, a saber, a
itens o sujeito acertou e, sim, por que ele acertou ou dificuldade e a discriminao. Vamos examinar um
errou cada item individual. Desta forma, a TRI est pouco a histria da curva logstica e as duas carac-
interessada em descobrir qual o tamanho de teta tersticas.
que o sujeito deve ter para poder acertar o item, cada
item individualmente. Voc j pode adivinhar, ento, A funo logstica
que em teoria basta at um nico item para se poder A funo logstica se expressa numa ogiva, que
descobrir o tamanho do teta do sujeito. O problema j era utilizada desde o sculo 19 em biologia para
que fica para resolver consiste em se saber como o expressar o crescimento dos seres vivos e ela en-
item sinaliza o tamanho do teta do sujeito. A respos-
trou em voga na Psicometria com Birnbaum nos anos
ta ficar clara no decorrer desta exposio, mas a
1950. Os pioneiros da TRI no trabalhavam com a
resposta sucinta a seguinte: atravs da CCI. Ento
funo da ogiva logstica e sim com a da ogiva nor-
vamos ver o que Teesta CCI.
mal (veja Lord, 1952; Lord & Novick, 1968). A ex-
Parece razovel se supor que um sujeito que
presso da funo em termos logsticos evita traba-
tem maior aptido, isto , que possui um nvel mais
elevado do processo latente que um dado item mede, lhar com integrais, o que permite tratamento mate-
ter uma probabilidade maior de acertar este item mtico mais simples, segundo os estatsticos. Essa
do que um sujeito com nvel inferior de aptido. Se o histria do modelo da ogiva normal e do modelo
processo latente expresso como q, ento esta pro- logstico um pouco complicada para estudiosos que
babilidade de acerto definida como pi(q), que se l no so estatsticos. Vamos ver brevemente esta his-
como: a probabilidade (p) de acertar o item (i) dado tria: o modelo da ogiva normal se baseia na chama-
um tamanho tal de teta (q). Assim, o sujeito com da funo phi-gamma que trabalha com os mnimos
menor habilidade ter uma pi(q) pequena, enquanto quadrados. Phi-gamma vem das letras gregas que
um de aptido superior ter tal probabilidade bem compem a frmula: p = f(g), onde o gama (g) o
maior. Desta forma, a pi(q) de acertar um dado item desvio em relao mdia, mais ou menos como o
vai de 0 a 1, onde ela ser 0 para o sujeito que no caso dos desvios-padro z. A Equao que trabalha
tiver nenhuma aptido que o item mede e 1 para o a ogiva z2
z 1normal
complexa e a seguinte:
sujeito que tem uma aptido teta tima. Esta situa- p = e 2 dz . Os estatsticos preferem traba-
o faz com que, medida que cresce o tamanho do 2
lhar com outra funo, que produz uma curva bem
teta, vai crescendo tambm a pi(q), provocando vi- parecida com a ogiva normal e que tipicamente se
sualmente uma curva de tipo S na escala de aptido, ajusta melhor aos dados. Esta funo a funo
como mostra a Figura 3. logstica, a qual trabalha com o mtodo da mxima
verossimilhana em lugar dos mnimos quadrados e
matematicamente mais fcil de processar. A fun-
1
o logstica a seguinte: Q = (veja Guilford,
1 + e x
1954). O expoente do denominador chamado de
logit, ou seja, o desvio logstico. Aplicado ao caso da
TRI, esta funo a seguinte:
1
p ( ) = a ( b )
1+ e
onde, e = constante que equivale a 2,7182818...
(geralmente expresso como 2,72)
b = dificuldade do item
a = discriminao do item
= aptido ou trao latente
Figura 3 A CCI de um item em funo do a( - b) = logit.
Avaliao Psicolgica, 2(2), 2003, pp. 99-110
A Teoria da Resposta ao Item 107

A conceituao e a mtrica do q foi explicada tido tendem a errar o item enquanto sujeitos de
acima (veja figura 2). A conceituao e a mtrica menor habilidade tendem a acertar. Na prtica, a
dos parmetros de dificuldade e de discriminao mtrica deste parmetro vai de 0 a 3, onde 0 sig-
sero explicados a seguir. Quando se fala de mtri- nifica nenhuma discriminao e 3, discriminao
ca, quer-se referir ao tipo de escala utilizada para praticamente perfeita. Veja estes dois parmetros
medir um dado fenmeno. Assim, quando se diz que expressos na Figura 4.
algum obteve 9 numa prova de desempenho, sendo Na figura 4, o parmetro bi do item corresponde
um desempenho excelente, est-se supondo que a ao ponto na escala de aptido q onde a probabilidade
mtrica utilizada uma escala que vai de 0 a 10. Se de resposta 0,5. Quanto maior for o bi, maior deve
a escala utilizada fosse de 0 a 100, ento a nota 9 ser o nvel de aptido exigido para que o examinando
representaria pssimo desempenho. Desta forma, tenha a chance de 50% de acertar o item. Transfor-
voc v que de fundamental importncia, quando mando a escala da aptido em escores padres, com
se do valores numricos aos fenmenos, se saber mdia = 0 e desvio padro = 1, os valores de bi tipi-
qual a mtrica (o metro) utilizada e, assim, se po- camente se situam entre -3 (itens fceis) e +3 (itens
der entender o significado do valor atribudo. difceis); assim, conforme figura 4, o item 1 exige
aptido de mais ou menos 1,6 e o item 2 aptido de
As caractersticas do item 0,60, sendo este ltimo mais difcil que o item 1.
O parmetro de dificuldade, chamado de bi, o O parmetro de discriminao do item (isto , o
ponto na escala de aptido no qual a probabilidade ai) representado pela inclinao da curva no ponto
de uma resposta correta de 50% (ou seja, 0,5). A de inflexo, onde a probabilidade de resposta corre-
mtrica terica deste parmetro vai de - a +, mas ta 0,5. Na ilustrao da figura 1-4, o item 2 mais
na prtica vai de -3 a +3. difcil (parmetro b2) que o item 1 (bi), mas menos
O parmetro da discriminao, chamado de discriminativo, pois a inclinao da curva dele me-
ai, expresso pela inclinao da CCI no momento nor que a do item 1 (parmetro a2 menos ngreme
da inflexo, isto , quando a curva CCI corta a que a1, isto , seu ngulo de incidncia no ponto de
linha que corresponde probabilidade de 0,5 de inflexo mais agudo que do item 1). Veja na Figura
resposta correta., o que acontece sempre quando 5 por que o ngulo de inclinao da curva caracte-
q = b. A mtrica terica deste parmetro tambm rstica expressa a discriminao do item.
vai de - a +, mas valores negativos ficam estra- De fato, para distinguir um sujeito que tem a
nhos porque eles diriam que sujeitos de maior ap- chance de 70% de acertar o item com relao a um

Figura 4 Parmetros de dificuldades (b) e discriminao (a) de dois itens


Avaliao Psicolgica, 2(2), 2003, pp. 99-110
108 Luiz Pasquali & Ricardo Primi

Figura 5 Parmetros de discriminao de trs itens

que tem a chance de 50%, o item 1 precisa apenas diferentes. Assim, se um item apresenta uma discri-
de uma diferena de 0,40 desvios padres de teta, minao perfeita, ento o ngulo de incidncia da
enquanto o item 3 j precisa uma diferena de 2 des- curva seria de 90 graus, ou seja, uma perpendicular.
vios padres de teta. Isto , um sujeito, para aumen- Neste caso, o item capaz de discriminar diferen-
tar suas chances de 50% para 70% de acertar o as infinitesimamente mnimas de nveis de teta. Veja
item, basta aumentar a sua aptido (o teta) em 0,4 isto na Figura 6.
no caso do item 1 e em 2,0 no caso do item 3. Assim, Neste caso da Figura 6, os sujeitos esquerda
o item 1 diferencia tamanhos de teta bem mais pr- da perpendicular teriam chance 0 de acertar o item,
ximos do que o item 3 ou o item 2, isto , reage a enquanto os da direita teriam probabilidade 1 de acer-
pequenas diferenas de teta e, conseqentemente, tar. Observe-se que em ingls estes dois parmetros
ele mais discriminativo de diferenas de nveis do dos itens vm indicados com diferentes nomes, como
teta do que estes dois ltimos. Note tambm que to- segue:
dos os trs itens tm a mesma dificuldade, ou seja, b Dificuldade: b, location, threshold, position;
= 0, mas seus ndices de discriminao so muito Discriminao: a, slope, inclination, dispersion.

Figura 6 Item com discriminao perfeita em = 0

Avaliao Psicolgica, 2(2), 2003, pp. 99-110


A Teoria da Resposta ao Item 109

Referncias Lord, F.M. (1980). Applications of item response theory


to practical testing problems. Hillsdale, NJ:
Lawrence Erlbaum.
Baker, F.B. (2001). The basics of item response theory.
Washington, DC: ERIC. Lord, F.M. & Novick, M.R. (1968). Statistical theories of
mental test scores. Reading, MA: Addison-Wesley.
Binet, A. & Simon, Th. (1908). Le dveloppement de
lintelligence chez les enfants. Anne Psycho- Lord, F.M. (1952). A theory of test scores (Psychometric
logique, 14, 1-94. Monograph No. 7). Iowa City, IA: Psychometric
Society.
Birnbaum, (1957). Efficient design and use of test of a
mental ability for various decision-making problems. Lord, F.M. (1952). The relation of the reliability of multiple-
(Series Report No. 58-16). Washington, DC: USAF choice tests to the distribution or item difficulties.
School of Aviation Medicine. Psychometrika, 17, 181-194.
Birnbaum, A. (1968). Some latent trait models and their Lord, F.M. (1953). The relation of test score to the trait
use in inferring and examinees ability. In F.M. Lord underlying the test. Educational and Psychological
& M.R. Novick, Statistical theories of mental test Measurement, 13, 517-549.
scores. Reading, MA: Addison -Wesley, ch. 17-20.
Mislevy, R.J. & Bock, R.D. (1984). BILOG: Maximum
Bock, R.D. & Aitkin, M. (1981). Marginal maximum likelihood item analysis and test scoring logistic
likelihood estimation of item parameters: Application models. Mooresville, IN: Scientific Software.
of an EM algorithm. Psychometrika, 46, 443-459.
Mulaik, S.A. (1972). The Foundations of factor analysis.
Campbell, D.T. & Stanley, J. (1973). Experimental and New York: McGraw-Hill.
quasi-experimental designs for research. Skokie,
IL: Rand McNally. Pasquali, L. (1996). Teoria da resposta ao item - IRT: uma
introduo. In L. Pasquali (Org.), Teoria e mtodos
Embretson, S. E. & Reise, S. P. (2000). Item response theory de medida em cincias do comportamento. Braslia:
for psychologists. New Jersey: Lawrence Erlbaum. INEP, 173-195.
Guilford, J.P. (1936, 1954). Psychometric methods. New Rasch, G. (1960, 1980). Probabilistic models for some
York: McGraw-Hill. intelligence and attainment tests. Chicago, IL:
MESA Press.
Gulliksen, H. (1950). Theory of mental tests. New York:
Wiley. Reckcase, M.D. (1985). The difficulty of test items that
measure more than one ability. Applied Psy-
Hambleton, R.K. & Swaminathan, H. (1985). Item Response chological Measurement, 9(4), 401-412.
Theory. Principles and applications. Boston, MA:
Kluwer Nijhoff Publishing. Richardson, M.W. (1936). Notes on the rationale of item
analysis. Psychometrika, 1, 69-76.
Hambleton, R.K., Swaminathan, H., & Rogers, H.J. (1991).
Fundamentals of item response theory. Newbury Richardson, M.W. (1936). The relation between the
Park, CA: SAGE Publications. difficulty and the differential validity of a test.
Psychometrika, 1, 33-49.
Lawley, D.N. (1943). Richardson, M.W. (1936). On problems
connected with item selection and test construction. Samejima, F. (1972). A general model for tree-response
Proceedings of the Royal Society of Edinburgh, data (Psychometric Monograph, No. 18). Psy-
Series A, 61, 273-287. chometric Society.
Lawley, D.N. (1944). The factorial analysis of multiple item Samejima, F. (1974). Normal ogive model on the continuous
tests. Proceedings of the Royal Society of Edin- response level in the multi-dimensional latent space.
burgh, 62-A, 74-82. Psychometrika, 39, 111-121.
Lazarsfeld, P.F. (1950). The logical and mathematical Samejima, R. (1969). Estimation of latent ability using a
foundation of latent structure analysis. In S.A. response pattern of graded scores (Psychometric
Stauffer, L. Guttman, E.A. Suchman, P.F. Lazarsfeld, Monograph No. 17). Psychometric Society.
S.A. Star, & J.A. Clausen (Eds.), Measurement and
prediction. Princeton, NJ: Princeton University Samejima, R. (1973). Homogeneous case of the continuous
Press, 1950.
response model. Psychometrika, 38, 202-219.
Lazersfeld, P.F. (1959). Latent structure analysis. In S.Koch,
Psychology: A study of science. New York: McGraw- Thurstone, L.L. (1959). The measurement of values. Chi-
Hill, 476-543. cago, IL: Chicago University Press.

Avaliao Psicolgica, 2(2), 2003, pp. 99-110


110 Luiz Pasquali & Ricardo Primi

Thurstone, L.L (1928). Attitudes can be measured. Weiss, D.J. (Ed. - 1983), New horizons in testing: Latent
American Journal of Sociology, 33, 529-554. trait test theory and computerized adaptive testing.
New York: Academic Press.
Tucker, L.R. (1946). Maximum validity of a test with
equivalent items. Psychometrika, 11, 1-13. Wingersky, M.S., Barton, M.A., & Lord, F.M. (1982).
LOGIST users guide. Princeton, NJ: Educational
Weiss, D.J. (1983). Introduction. In David J. Weiss (Ed.), Testing Service.
New horizons in testing: Latent trait test theory
and computerized adaptive testing. New York:
Academic Press, 1-8. Recebido em 17/12/2002
Aceito em 03/04/2003

Avaliao Psicolgica, 2(2), 2003

Vous aimerez peut-être aussi