Vous êtes sur la page 1sur 6

Article mthodologique

Rev Neuropsychol
2011 ; 3 (4) : 284-9

Le TOP 12 : comment interprter les


rponses comme des mesures de la
capacit de la mmoire collective ?
TOP 12: how to interpret the responses
as a measure of collective memory?

milie Lacot1 , Emmanuel J. Barbeau2 ,


Catherine Thomas-Anterion3, Sandrine
Basaglia-Pappas3 , Jrmie Pariente4 ,
Michle Puel4 , Stphane Vautier1
1
Unit de recherche OCTOGONE/CERPP,
Pavillon de la Recherche,
5 alles Antonio Machado,
31058 Toulouse Cedex 9
<emilie@lacot.net>
2
Unit de recherche CERCO,
Toulouse III
3
Unit de neuropsychologie,
CM2R,
CHU de Saint-tienne,
Saint-tienne
4
Unit de neuropsychologie,
CM2R-CHU Purpan,
Toulouse

Pour citer cet article : Lacot , Barbeau


EJ, Thomas-Anterion C, Basaglia-Pappas S,
Pariente J, Puel M, Vautier S. Le TOP 12 :
comment interprter les rponses comme
des mesures de la capacit de la mmoire
collective ?. Rev Neuropsychol 2011 ;
3 (4) : 284-9 doi:10.1684/nrp.2011.0189

Introduction. Le TOP 12 value la mmoire collective au


travers dune srie de huit types de questions portant sur le
souvenir de la vie de 12 clbrits nommment dsignes. La validation de tels tests est souvent envisage dans le seul but de prdire un critre externe au test (validation externe) ; la
validation interne nest quant elle que trs rarement tudie. Objectifs. Montrer comment
les rponses obtenues peuvent mesurer une seule grandeur hypothtique (appele aussi
construit) : la capacit de la mmoire collective. Mthodes. Lchantillon est compos de
145 sujets (91 tmoins, 32 patients prsentant une maladie dAlzheimer, 21 patients ayant
un trouble cognitif lger de type amnsique, 1 patient ayant une dmence smantique). Deux
tapes sont ncessaires : modliser les rponses aux items laide dun modle de rponse
litem trois paramtres et tester lunidimensionnalit des scores estims. Rsultats. Les huit
modles sajustent troitement aux donnes. Lanalyse factorielle conrmatoire ne permet
pas de rejeter lide selon laquelle les huit types de questions mesurent bien une seule et
unique grandeur hypothtique. Conclusion. La modlisation psychomtrique des donnes
observes avec le TOP 12 indique quelles mesurent la capacit de la mmoire collective.

Rsum

Mots cls : mmoire collective TOP 12 validation interne modlisation psychomtrique grandeur
hypothtique

Abstract

Key words: collective memory TOP 12 internal validation data processing hypothetical variable

Correspondance :
. Lacot

284

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

doi:10.1684/nrp.2011.0189

Introduction. The TOP 12 is a test designed to assess collective (semantic) memory quickly and easily. It relies on
eight questions about the life of 12 celebrities that are named (verbal presentation). Test
validation is often based on the denition of a criterion external to the test (i.e. a pathological threshold, external validation); internal validation is itself rarely studied. In the present
study, our aim is to assess the internal validation of the TOP 12. Aims. To show how the
responses provided by the subjects measure a single hypothetical dimension (also called a
construct): collective memory ability. Methods. The sample was made of 145 subjects (91
control subjects, 32 patients with Alzheimers disease, 21 with amnestic mild cognitive
impairment (aMCI) and 1 with semantic dementia). Two stages of analysis were required:
modelling the responses for each item using a dedicated model with three parameters
and testing for the unidimensionnality of the estimated scores. Results. The eight models
t tightly to the data. A combinatorial factorial analysis does not allow rejecting the idea
that the eight questions assess one and only one hypothetical dimension. Conclusion.
Psychometric modelling of the TOP 12 data shows that they assess collective (semantic)
memory.

Article mthodologique
Introduction
Le problme gnral : comment relier le rfrentiel
des rponses au test la notion de capacit de la
mmoire collective ?
Dans larticle prcdent : Le TOP 12 : comment
sen servir pour reprer une pathologie du vieillissement
cognitif ? , il ntait pas ncessaire de disposer dune
interprtation de ce que pourraient mesurer les rponses
observes an de rpondre la question pose. Lorsquon
utilise un test an de reprer si la personne examine prsente ou non des troubles du vieillissement cognitif, on
cherche optimiser la capacit diagnostique du score de
manire empirique, ou indpendamment dune signication neuropsychologique pralablement tablie ; la limite,
nimporte quel bricolage psychotechnique convient
condition de fournir une caractrisation ordinale (i.e., une
position sur chelle ordonne) qui optimise la valeur diagnostique du test. La question laquelle cet article a pour
objectif de rpondre est de nature interprtative : il sagit
de montrer comment les rponses observables peuvent tre
concues comme des mesures dune grandeur hypothtique
(appele aussi construit). Lobjectif est donc de montrer
comment les rponses obtenues au TOP 12 (GRECO, 2008)
peuvent mesurer la capacit de la mmoire collective.
Le TOP 12 permet dobserver 96 rponses, leur cotation dichotomique (0 ou 1) les situant dans un rfrentiel
de description (Vautier, 2011)1 constitu de 296 96-uplets
possibles [1]. Le problme qui se pose est donc de
savoir comment on peut relier logiquement le rfrentiel empirique qualitatif au rfrentiel neuropsychologique
quantitatif et rciproquement. Autrement dit, il sagit de
savoir en quel sens un 96-uplet quelconque peut mesurer
la capacit de la mmoire collective, cest--dire une grandeur variant par hypothse dans lensemble des nombres
rels. Cette question na rien voir avec les proprits diagnostiques de la somme des 1 qui gurent dans les 96-uplets
(cf. article prcdent, Le TOP 12 : comment sen servir
pour reprer une pathologie du vieillissement cognitif ? ).
Sil nexistait pas de solution ce problme, il serait
alors logiquement absurde dafrmer que le TOP 12 puisse
mesurer la capacit de la mmoire collective en tant que
grandeur continue. En effet, le test noprationnalise pas
le principe de continuit impliqu par la notion de capacit de la mmoire collective. Cest en ce sens que Cliff et
Keats (2003) soulignent la ncessit dutiliser un modle
1

Un rfrentiel de description est un ensemble dtats possibles. Ces


tats caractrisent le mode de manifestation des objets tudis selon
un certain parti pris thorique. Dans le cas du TOP 12, une personne
un moment donn est caractrise par la donne de 96 valeurs descriptives. Ces 96 donnes constituent un 96-uplet de rponses. Ainsi,
le TOP 12 permet de caractriser une personne un moment donn
dans un espace qualitatif et multivari. Formellement, un rfrentiel de
description est un produit cartsien de modalits descriptives qualitatives.

de mesure : Lide fondamentale lorsquon assigne de


manire intelligible des nombres des vnements, en
particulier des scores des rponses un test, est quil
doit exister un modle quantitatif ou une mini-thorie qui
les articule. Le modle peut tre simple ou complexe, testable empiriquement ou non, mais ce modle doit exister
(p. 16) [2].

Spcication du problme : comment plusieurs


items dichotomiques peuvent-ils mesurer une
grandeur hypothtique ?
Le problme est rsolu laide dun modle de rponse
litem (MRI). On suppose quun individu u considr
une date t occupe une position (thta) sur la grandeur
hypothtique. On suppose encore quil existe une probabilit p que, occupant cette position, il russisse litem
(par exemple, obtienne le score 1). On suppose enn que
cette probabilit est une fonction numrique de litem et
de lunit dobservation : = (u,t). Cette fonction est telle
que pour un item donn, si on compare la probabilit de
russite de 1 = (u1 ,t1 ) celle de 2 = (u2 ,t2 ), alors 1 > 2
implique p(1 ) > p(2 ) autrement dit, la fonction est strictement croissante. On notera pi (), la probabilit de russir
litem i lorsque la grandeur vaut . La solution est gnralise tout item j laide de la notion de difcult de litem.
Ainsi, si litem i est plus difcile que litem j, on pose que
pi () < pj (). On introduit enn le postulat dindpendance
des vnements qui se ralisent lors de la rponse aux items
(postulat dit dindpendance locale), de telle sorte que la
probabilit dun k-uplet de rponses sobtient par le produit
de la probabilit de chaque rponse [3-6].

Application du problme au TOP 12


Les items du test ne sont pas homognes . En effet, les
rponses obtenues dpendent de huit types de questions
(familiarit, mort/vivant, nationalit, profession, question
morphologique, question spcique 1, question spcique
2, datation) propos de 12 personnalits voques par leur
nom (dith Piaf, Simone Veil, Coluche, Marilyn Monroe,
Alfred Hitchcock, Ronald Reagan, Amlie Mauresmo, Martine Aubry, Tony Blair, Jos Bov, Georges W. Bush, Vladimir
Poutine). Chaque type de question dnit un champ smantique spcique. Par exemple, la question profession
renvoie lactivit professionnelle des 12 personnalits
tandis que la question mort/vivant renvoie lide de
leur dcs possible. Par consquent, on ne peut pas afrmer lavance que la capacit de la mmoire collective
telle quelle est mesure avec des questions lies la
profession soit identique la capacit de la mmoire collective telle quelle est mesure avec lindicateur de dcs.
A priori, on peut supposer que chaque champ smantique est associ une facette spcique de la mmoire
collective, reprsente par une grandeur spcique. Cest
pourquoi il faudra dans un deuxime temps se demander
si les huit grandeurs respectives peuvent tre considres
comme unidimensionnelles. Ce problme est abord plus

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

285

Article mthodologique
loin (Lunidimensionnalit des huit grandeurs modlises
par le TOP 12).
La question qui se pose est donc la spcication dun
modle psychomtrique. Considrons les 12 items dun
type de question donn. Chaque type de question dnit un rfrentiel spcique constitu de 212 12-uplets de
rponses. La solution la plus simple est de faire appel au
modle de Rasch. Dans ce modle, la probabilit de russir
litem i tant donne la position est dnie comme suit :
pi ( ) =

exp( i)

(1)

1+ exp( i)

Lquation 1 spcie la probabilit pi () comme une


fonction logistique des paramtres (capacit mnsique)
et i (paramtre de difcult de litem i). Lorsque tend
vers , la probabilit pi () tend vers 0. Or, le TOP 12
met les personnes examines dans la situation de rpondre
chaque question en choisissant obligatoirement parmi
un nombre limit de rponses possibles (rponse choix
forc). En supposant que la personne ait une capacit
de mmoire inniment petite, sa rponse seffectuant au
hasard, la probabilit pi () nest pas nulle : elle est gale
1/n, n tant le nombre de rponses possibles pour un
item donn (par exemple, pour un item trois modalits de
rponses, pi () = 1/3). Ainsi, la modlisation logistique doit
prendre en compte la probabilit de russir litem i lorsque
tend vers . Lquation 1 doit donc tre corrige, ce qui
conduit lquation 2 :
pi ( ) = i + (1 i )

exp( i)

(2)

1+ exp( i)

O i (paramtre de pseudo-chance) xe la valeur


asymptotique en . Ainsi, la modlisation permet
dinterprter un 12-uplet de rponses comme le rsultat
dune exprience alatoire dans des conditions thoriques
spciques xes par la valeur que prennent les paramtres
, i et i . La modlisation permet destimer ces conditions thoriques, cest--dire de dterminer la valeur des
paramtres du modle laide dune technique itrative
de minimisation dune fonction dajustement du modle
aux donnes [4, 5]. Lorsque cette estimation est effectue,
il est possible dvaluer a posteriori la qualit avec laquelle
le modle sajuste aux donnes en utilisant, par exemple,
un Chi-carr dajustement (i 2 ) [7-9]. Le i 2 est donn par
lquation Soit : lquation 3 qui suit, o Oi (k) est la frquence observe de la rponse k (k = 0, 1), et Ei (k) est la
frquence thorique de la rponse k obtenue litem i :
[Oi (k) Ei (k)] 2
Ei (k)
k=1
2

i2 =

(3)

Lunidimensionnalit des huit grandeurs


modlises par le TOP 12
Lanalyse factorielle conrmatoire (AFC) fournit un
cadre analytique adapt la question de savoir si on peut
considrer que les huit grandeurs invoques pour interprter
les rponses aux huit types de questions sont unidimension-

286

nelles [10, 11]. Deux variables sont unidimensionnelles sil


est possible de les considrer comme dpendantes dun
seul facteur commun. Cette ide est formalise laide
dun modle unifactoriel, quon appelle aussi un modle
congnrique [12].
Dans le modle congnrique, les variables indicatrices
ne sont pas dichotomiques mais continues et non bornes. Elles sont ici approches laide des estimations
des paramtres associes chacun des huit modles
de rponse litem. La fonction qui les relie au facteur
commun est linaire et lerreur de mesure est concue
comme une variable alatoire centre. On introduit la
notion dindpendance locale en spciant que les huit
variables derreur ne sont pas corrles.
Comme son nom lindique, lAFC permet de tester
lhypothse nulle. Dans lAFC, lhypothse nulle stipule
que les moments (esprances, variances, covariances)
dun ensemble de variables indicatrices dpendent dun
ensemble de paramtres dits structurels [10]. Comme dans
la modlisation des rponses litem, la modlisation des
moments estims repose sur lestimation des paramtres
selon une mthode itrative dajustement du modle aux
donnes. Si lhypothse nulle doit tre rejete, cela signie
que le modle congnrique, compatible avec lide que
les huit grandeurs estimes mesurent la mme capacit, ne
permet pas dinterprter les donnes. La consquence thorique du rejet de lhypothse nulle est la remise en question
de lide selon laquelle le TOP 12 mesurerait une seule
capacit mnsique.

Mthode
chantillon et matriel
Lchantillon de ltude se compose des 145 sujets
dcrits dans larticle prcdent ( Le TOP 12 : comment
sen servir pour reprer une pathologie du vieillissement
cognitif ? ). Le matriel, lui aussi dcrit dans ce premier
article, est le TOP 12 (GRECO, 2008).

Analyses
Les analyses sont effectues en deux tapes. La premire
consiste modliser les rponses aux items, la seconde
tester lunidimensionnalit des scores estims lors de la premire tape. La modlisation des donnes selon un MRI
trois paramtres (quation 2) a t effectue laide du
logiciel Multilog [13]. Le modle est spci avec deux
contraintes structurelles : la pente de chaque fonction logistique est invariante an que la difcult relative des items
ne varie pas en fonction des capacits de chaque sujet. Le
paramtre de pseudo-chance est x en fonction du nombre
de modalits de rponses de litem. La qualit dajustement
des modles aux donnes a t mesure laide du 2
dajustement (quation 3) [14]. LAFC a t effectue
laide du logiciel Mplus (Muthn et al., 1998).

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

Article mthodologique
Rsultats

Discussion

Modles de rponse litem


Les huit modles sajustent troitement aux donnes.
Les 96 2 dajustement sont compris entre 0 et 0,09. Par
consquent, les paramtres ui estims sont utilisables pour
lAFC.

Modle congnrique
La matrice de variances, de covariances et de corrlations est prsente dans le tableau 1. Le modle
congnrique sajuste troitement aux donnes 2 (N = 145,
dL = 20) = 26,05, p = 0,16, ce qui permet de ne pas rejeter lide selon laquelle les huit facettes de la mmoire
collective indiquent une seule et mme grandeur hypothtique. La puissance statistique du test peut tre estime
laide du root means square error of approximation (RMSEA)
si on spcie sa valeur dans la population (ici 0,08) et
sa valeur pour lhypothse nulle (ici 0). La puissance statistique estime pour une erreur de type I de 0,05 est
0,73 [15].
Les estimations des paramtres du modle congnrique sont indiques dans la gure 1. Pour chaque variable
indicatrice (note Yi = i F + i , o i est le coefcient
de rgression linaire de cet item i et i sa valeur
rsiduelle), il est possible destimer la dlit dnie par
lquation 4 [16] :
(Yi ) =

i2.Var(F )
2
i .Var(F ) + Var(i )

(4)

o Var(F) est la variance du facteur commun appel ici


mmoire collective.
Les estimations de la dlit varient de 0,28 (variable
datation) 0,46 (variables questions spciques 1 et 2).

Tableau 1. Variance des huit variables estimes avec les


modles de rponse litem. Les covariances et les corrlations sont indiques respectivement au-dessous et au-dessus
de la diagonale.
1

1 0,31 0,50 0,51 0,58 0,50 0,50 0,56 0,36


2 0,19 0,50 0,49 0,56 0,56 0,63 0,53 0,39
3 0,20 0,24 0,48 0,56 0,53 0,60 0,60 0,34
4 0,20 0,25 0,24 0,39 0,52 0,54 0,63 0,34
5 0,21 0,30 0,28 0,25 0,57 0,64 0,66 0,48
6 0,21 0,33 0,37 0,25 0,36 0,56 0,71 0,50
7 0,23 0,27 0,37 0,29 0,37 0,39 0,54 0,40
8 0,15 0,21 0,18 0,16 0,28 0,29 0,23 0,60

Lobjectif de larticle tait de montrer que la


modlisation psychomtrique des donnes permet
doprationnaliser lide selon laquelle les performances
observes avec le TOP 12 dpendent de manire probabiliste dune ou de plusieurs capacits reprsentes
quantitativement. Ainsi, les items de chaque sous-test
du TOP 12 peuvent tre interprts comme indicateurs
dune grandeur latente. De plus, les huit grandeurs latentes
construites avec les modles de rponse litem peuvent
tre interprtes de facon unidimensionnelle : lAFC
des estimations issues de la MRI montre quil nest pas
ncessaire de postuler un espace multidimensionnel pour
interprter les scores estims.
Les estimations structurelles du modle congnrique
suggrent que la variable indicatrice datation a une
dlit particulirement faible par rapport celle des
autres variables indicatrices. Autrement dit, les diffrences interindividuelles relatives au facteur commun
expliquent peu les diffrences interindividuelles mesures.
La variabilit rsiduelle peut tre interprte de diffrentes
manires :
en termes derreur de mesure ;
en termes de validit discriminante si lon suppose que
la variance rsiduelle de la variable datation sexplique par
lexistence dun autre facteur.
Pour dpartager ces deux interprtations, il serait ncessaire de dvelopper le TOP 12 en ajoutant des items
spciquement ddis la mesure de ce second facteur.

Conclusion gnrale
La validation dun test dsigne une multitude
dapproches critiques destines prciser la signication des scores attribus aux personnes en fonction de
leurs rponses aux items [17]. Larticle prcdent, Le
TOP 12 : comment sen servir pour reprer une pathologie
du vieillissement cognitif ? , se centrait sur la signication
diagnostique des scores du TOP 12. La contribution
principale de cet article consiste fonder la signication
diagnostique des scores sur lutilisation dun critre de
pathologie tabli indpendamment des scores. Dun point
de vue pratique, un seul seuil de dcision est par hypothse valide pour toute personne satisfaisant les critres
dinclusion utiliss dans cette tude.
Le prsent article a abord un autre aspect de la validation du TOP 12 : il ne sagissait non pas de prdire un
critre externe au test (validation externe), mais de fonder lintuition selon laquelle les performances observes
avec le TOP 12 indiquent une capacit mnsique (mmoire
collective) reprsente de facon quantitative et univarie. Ainsi, la modlisation psychomtrique (validation
interne) a une nalit non pas pratique mais interprtative. Les analyses effectues ne montrent pas la ncessit

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

287

Article mthodologique
2(N = 145, dl = 20) = 26,05, p = 0,16
Familiarit

1
0,17

1,00
Mort/Vivant

2
0,24

1,34
Var(F) = 0,141

Nationalit

1,33
1,21

Profession

1,55

Morphologie

0,23

4
0,18

Mmoire collective
5

0,23
1,66

Spcificit 1

6
0,18

1,63
Spcificit 2

7
0,17

1,01
Datation

8
0,43

Figure 1. Estimations des paramtres du modle congnrique.

dinvoquer plus quune variable latente pour interprter les observations. Il parat cependant intressant que
la variable indicatrice datation ait une dlit faible
par rapport aux autres variables, ce qui pourrait indiquer
quune autre variable latente entre en jeu, par exemple la
mmoire pisodique (item situ dans le temps), par oppo-

sition la mmoire smantique pour les autres variables


indicatrices.
Conits dintrts
Aucun.

Rfrences
1. Vautier S. The operationalization of general hypotheses versus the
discovery of empirical laws in psychology. Philosophia Scientiae 2011 ;
15 : 105-22.
2. Cliff N, Keats JA. Ordinal measurement in the behavioral sciences.
Mahwah : Lawrence Erlbaum Associates ed., 2003.
3. Bertrand R, Blais JG. Modles de mesure : lapport de la thorie
des rponses aux items. Montral, Qubec : Presses de lUniversit du
Qubec, 2004.
4. Embretson SE, Reise SP. Item Response Theory for Psychologists.
London : Lawrence Erlbaum Associates, 2000.
5. Hambleton RK, Swaminathan H, Rogers HJ. Fundamentals of item
response theory. Newbury Park : Sage Publications ed., 1991.
6. Rasch C. Probabilistic models for some intelligence and attainment
tests. Copenhagen : Danish Institute for Educational Research ed.,
1960.
7. Bolt DM, Hare RD, Vitale JE, et al. A multigroup item response
theory analysis of the psychopathy checklist-revised. Psychological
Assessment 2004 ; 16 : 155-68.

288

8. Stark S, Chernyshenko OS, Drasgow F. Detecting differential item functioning with conrmatory factor analysis and
item response theory. Journal of Applied Psychology 2006 ; 91 :
1292-306.
9. Zickar MJ, Russell SS, Smith CS, et al. Evaluating two morningness
scales with item response theory. Personality and Individual Differences
2002 ; 33 : 11-24.
10. Bollen KA. Structural equations with latent variables. New
York : Wiley Series in Probability and Mathematical Statistics (Wiley
ed.), 1989.
11. Dickes P, Tournois J, Fieller A, et al. La psychomtrie. Thories et
mthodes de la mesure en psychologie. Paris : Presses Universitaires de
France ed., 1994.
12. Jreskog KG. Statistical analysis of a set of congeneric tests. Psychometrica 1971 ; 36 : 109-33.
13. Thissen D. Multilog users guide: multiples, categorical item analysis and test scoring using item response theory. Chicago : IL: Scientic
Software ed., 1991.

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

Article mthodologique
14. Drasgow F, Levine MV, Tsien S, et al. Fitting polytomous item
response theory models to multiple-choice tests. Applied Psychological
Measurement 1995 ; 19 : 143-65.
15. MacCallum RC, Browne MW, Sugawara HM. Power analysis and
determination of sample size for covariance structure analysis. Psychological Methods 1996 ; 1 : 130-49.

16. Vautier S, Gaudron JP, Jmel S. Modles factoriels pour lanalyse


de la dlit des variables composites. Revue Epidmiologie Sant
Publique 2004 ; 52 : 441-53.
17. Messick S. Validity of psychological assessment: validation of inferences from persons responses and performances as scientic inquiry
into score meaning. American Psychologist 1995 ; 50 : 741-9.

REVUE DE NEUROPSYCHOLOGIE
NEUROSCIENCES COGNITIVES ET CLINIQUES

289