Vous êtes sur la page 1sur 36

Partie 1 - La

mthode des tests


en psychologie
clinique et en
psychopathologie

UDP6CLIA - LICENCE 3ime


ANNE de PSYCHOLOGIE

Novembre 2013

Catherine Marion - Psychologue


clinicienne - Docteur en
Psychopathologie et en Psychologie
Clinique

Lgende

Entre du glossaire

Rfrence Bibliographique

Rfrence gnrale

Table des
matires

Objectifs

I - Historique des tests en psychologie

A. Cration des tests.........................................................................................7


B. Principaux moments de l'volution historique des tests et des chelles................8

II - Principes psychomtriques gnraux : dfinition de la


mthode des tests, standardisation et talonnage

11

A. Standardisation et talonnage......................................................................11
B. Dfinitions de la mthode des tests, de la standardisation et de l'talonnage......12

III - Les qualits mtrologiques d'un test : construction d'un


test
13
A. La fidlit...................................................................................................13
B. La sensibilit..............................................................................................13
C. La validit..................................................................................................14
D. La gnralisation........................................................................................14
E. Dfinitions des qualits mtrologiques d'un test et d'une chelle.......................14

IV - Utilisation des tests

17

A. Evaluation, dpistage et recherche................................................................17


B. valuation, Dpistage et Recherche cliniques..................................................18
C. Les critres de choix des outils d'valuation....................................................18
D. Classification..............................................................................................18
E. Les trois niveaux de mesures en psychopathologie..........................................19

V - Les limites de l'valuation standardise

21

A. Le psychologue clinicien "valuateur".............................................................21


B. Les aspects culturels...................................................................................21
C. Exercice : Les limites culturelles de l'valuation psychologique..........................22
D. Le choix des sujets......................................................................................23
E. Les limites individuelles de l'valuation psychologique......................................23

Conclusion

25

Ressources annexes

27

Solution des exercices

29

Glossaire

35

Rfrences

37

Bibliographie

39

Objectifs

Apprendre les principales notions historiques de la mthode des


tests en psychologie clinique
Apprendre les dfinitions des principes psychomtriques de
construction des tests (standardisation et talonnage), et de
leur validation scientifique (qualits mtrologiques)
Apprendre et comprendre : l'utilisation, la classification et les
limites de la mthode des tests et des chelles

Historique des
tests en
psychologie
I -

Cration des tests

Principaux moments de l'volution historique des tests et des chelles

A. Cration des tests


Selon Derogatis et Dellapietra (1994) [Derogatis et Dellapietra], la cration des
premiers instruments du dpistage en psychologie remontent la fin du 19ime
sicle. En 1884, Sir Francis GaltonSir Francis Galton (cousin de Charles Darwin), en
Angleterre, construisit le prototype du questionnaire psychologique l'occasion de
l'Exposition Universelle de Londres : il prconisait la mesure des caractristiques
physiques et mentales de chaque individu, et l'tude de leur transmission hrditaire.
Ses travaux ont prfigur les tests psychologiques standardiss, mais aussi les
thories de l'eugnisme.
Il faut distinguer les premiers tests d'valuation des grandes fonctions en psychologie
(intelligence, mmoire, perception, attention, etc.), des premiers inventaires des
symptmes des troubles psychopathologiques et des premiers tests projectifs.
Ces premiers tests psychologiques, au sens d'preuves standardises destines
un groupe d'individus , remontent aux travaux allemands de psychologie
exprimentale de Weber, Fechner, Wundt. Ces preuves tudiaient des
caractristiques psychosensorielles (par exemple la vitesse de raction). L'volution
va consister, pour les chercheurs, dvelopper ces mesures priphriques des
mesures plus gnrales. Par exemple, H. Ebbinghaus (1850-1909) utilise, lors de ses
recherches sur la mmoire, les prcurseurs des tests d'intelligence. Puis James Mc
Keen Cattell (1860-1944) labore un ensemble de 10 preuves valuant la mmoire
et l'attention. Mais les tests factoriels dcoulent vritablement des mthodes
statistiques dveloppes par Spearman (1863-1945) et Thurstone (1887-1955) qui
concernent, d'une part l'analyse des corrlations, et d'autre part l'analyse factorielle.
Ces mthodes ont jou un rle dterminant pour valider l'hypothse de recherche
principale concernant l'intelligence : elle serait compose (selon Olron, 1957,
Reuchlin, 1964 [Reuchlin Maurice]), d'une composante gnrale et de composantes
spcifiques.
En France, on doit la cration du premier test d'valuation de l'intelligence Binet et
Simon en 1905, en raison d'une part des proccupations du Ministre franais de

Historique des tests en psychologie

l'Instruction Publique au sujet de l'enseignement procurer aux enfants en


difficults, et d'autre part, de l'intrt d'Alfred Binet (1887-1911) (cf. Alfred Binet,
Biographie et Bibliographie) pour le fonctionnement intellectuel des enfants dit
normaux et anormaux . Rejetant le courant de la phrnologie l'tude du
caractre des facults dominantes d'un individu d'aprs la forme de son crne et
celui de la psychologie exprimentale allemande, Alfred Binet et Thodore Simon
laborent un test ayant pour objectif de mesurer les processus mentaux
suprieurs chez les enfants partir de 3 ans (et jusqu' l'ge adulte), l'aide
d'un indice de niveau intellectuel , qui deviendra ensuite ce qu'on appelle l'ge
Mental (A.M.). On dveloppera plus en dtails dans la partie 2 l'volution des
tests d'intelligence et leurs consquences.
A peu prs la mme poque, aux tats-Unis, en 1914, le psychiatre d'origine suisse
Adolphe Meyer (1866-1950), construisait la premire chelle d'valuation
psychiatrique le Classement des Comportements de Philips (The Philipps
Behavior Chart [Kemps]). En 1918, la fin de la 1ire Guerre Mondiale, le premier
inventaire des symptmes sous la forme d'un auto-questionnaire la Personal
Data Sheet ft dvelopp par Robert Woodworth, afin de dpister les troubles
psychopathologiques des soldats amricains qui partaient la guerre. Puis Moor
(1930), en construisant une chelle d'observation psychiatrique, voulut dterminer
empiriquement la structure de la symptomatologie des psychoses Moor . La partie 4
du cours dveloppe diffrents outils d'valuation des troubles psychopathologiques.
Paralllement, en Suisse, en 1921, le psychiatre Hermann RorschachHermann Rorschach,
pourvu d'une sensibilit artistique constante tout au long de sa vie, publie son
ouvrage Le Psychodiagnostic, dans lequel il dveloppe un test de tches d'encre
plus communment connu sous le nom test de RorschachHermann Rorschach qui
permet, selon lui, non plus d'tudier les grandes fonctions psychologiques mais le
fonctionnement de la personnalit de l'enfant, de l'adolescent et de l'adulte.
Rorschach travaillait sur l'imagination, la projection et la cration artistique, et
orientait alors ses recherches sur l'approche thrapeutique de la schizophrnie, et
l'interprtation psychanalytique des peintures des patients schizophrnes. Il utilisa
des tches d'encre comme moyen d'investigation avec les patients et observa que les
patients diagnostiqus schizophrnes rpondaient diffremment au jeu des
tches d'encre que les autres patients. Cette observation clinique fondamentale lui fit
poursuivre ses recherches pour dvelopper son test et le valider empiriquement. A
partir de la fabrication d'une centaine de planches, il en slectionna les 15 meilleures
et les appliqua 340 patients et sujets dits normaux . Le Psychodiagnostic :
Test diagnostique bas sur la perception (1921) est issu de cette validation
empirique, et comprend actuellement 10 tches d'encre sur des planches cartonnes.
Nous dvelopperons plus longuement ce test dans la partie 3.
Quinze ans plus tard, en 1935 aux Etats-Unis, Mugan et Murray publient la premire
version du TAT dans leur ouvrage commun Thematic Apperception Test. Puis en
1938, Henry Murray en utilise les rsultats pour asseoir sa thorie de la personnalit
dans son ouvrage Exploration de la personnalit, et en 1943, il publie la version
dfinitive de son test dans son Manuel d'application. Le TAT se compose de 31
planches, des reproductions d'aquarelles ou de dessins, destines stimuler la
production imaginaire. Les annes 70 voient apparatre de nombreuses critiques
concernant les tests projectifs, critiques dues l'absence de mthodologie efficace et
objective. En France, Vica Shentoub (1970-1971) [Vica Shentoub] s'intresse la
situation projective du TAT, et essaye d'en dgager une mthodologie. C'est grce
ses travaux et ceux de ses nombreux collgues L'Ecole Franaise du TAT de
1955 1974, que la codification de la mthodologie de cotation du TAT a t
construite. Vica Shentoub et Rosine Debray laborent une mthode de cotation,
d'analyse et d'interprtation du matriel recueilli, fonde sur des postulats thoriques
psychanalytiques, en particulier sur la mtapsychologie freudienne. Les auteurs
franais retiennent 16 planches sur les 31 (values comme les plus valides et les
plus significatives cliniquement). Ces travaux s'inscrivent dans une approche

Historique des tests en psychologie

psychanalytique

du

fonctionnement

psychique

de

la

personnalit

Paralllement, Nina Rausch de Traubenberg (1970) (cf. Nina Rausch de Traubenberg,


biographie et bibliographie) s'engage sur la mme voie, en dveloppant ses propres
recherches mthodologiques et en prcisant les fondements thoriques du test de
Rorschach, dont les travaux seront poursuivis ultrieurement, notamment par
Catherine Chabert (cf. C. Chabert Biographie et Bibliographie). Nous dvelopperons
plus longuement ces tests dans le chapitre 3.

B. Principaux moments de l'volution historique des


tests et des chelles
Apprendre rdiger une synthse
Mthode rdactionnelle :
Vous devez tre capable de rendre compte synthtiquement des grands
moments et des grands auteurs qui ont contribu au dveloppement des tests
et des chelles en psychologie clinique.
L'introduction, par dfinition, introduit la rponse attendue la question
pose. Elle doit faire quelques lignes, tre prcise dans les termes employs,
et proposer, de manire synthtique, les diffrentes parties de la rponse qui
seront dveloppes dans la partie principale. Ce n'est pas une reformulation
de la question pose, mais un rsum de votre rponse.
Le dveloppement, lui aussi par dfinition, est la partie la plus importante de
votre rponse. Il doit tre structur en plusieurs paragraphes qui se suivent
dans un ordre logique (en fonction de la question pose et des rponses
attendues).
La conclusion est un paragraphe relativement court, comme l'introduction, qui
conclut les rponses attendues la question pose, soit en rsumant en
quelques termes le dveloppement, et/ou en introduisant une nouvelle
question.
A chaque fois que la question demandera de rdiger une introduction, un
dveloppement et une conclusion, vous devrez utiliser cette mthode de rdaction.
Question
[Solution n1 p 31]

Restituez les principaux moments de l'volution historique des tests en


psychologie clinique et en psychopathologie depuis la fin du 19ime sicle
jusqu' notre poque. Vous citerez les auteurs de rfrence pour chacune
des priodes, identifies historiquement, et vous rdigerez une introduction,
un dveloppement et une conclusion. (10 points)

Historique des tests en psychologie

* *
*

Il faut donc retenir que le dveloppement des tests d'valuation en psychologie


clinique et en psychopathologie a pris deux grandes directions de recherches en
fonction des mthodes utilises : d'une part, les mthodes statistiques (en
rfrence au bhaviorisme, par comparaisons de comportements) qui fondent les
tests psychomtriques, et d'autre part, les mthodes analytiques qui fondent les
tests projectifs (en rfrence au fonctionnement psychique thoris par la
psychanalyse).
De plus, le dveloppement continu, l'amlioration progressive et la diffusion aux
communauts scientifiques europennes et nord-amricaines de toutes ces mthodes
d'valuation, tant de l'intelligence que de la personnalit normale ou pathologique et
des troubles psychopathologiques se concentrent entre la fin du 19ime et les 3
premires dcennies du 20ime sicle. C'est la priode fondatrice principale du
dveloppement des recherches en psychologie clinique (sur environ 50 ans),
paralllement et le plus souvent de manire oppose, la diffusion des thories
psychanalytiques de Freud (1880-1938) et de ses successeurs. Les 50 annes
suivantes, aprs-guerre, verront le dveloppement exponentiel des recherches
concernant la standardisation et l'talonnage de multiples tests et chelles.
Il nous faut donc prciser maintenant, aprs ces quelques rappels historiques, ce que
nombre d'auteurs dfinissent comme tant la mthode des tests en psychologie, et
comment se construisent les tests.

10

Principes
psychomtriques
gnraux :
dfinition de la
mthode des
tests,
standardisation et
talonnage
II -

Standardisation et talonnage

II

11

Dfinitions de la mthode des tests, de la standardisation et de


l'talonnage
12

A. Standardisation et talonnage
Nous retiendrons ici l'une des dfinitions les plus gnrales et les plus
consensuelles. Selon Delay et Pichot (1965, p. 23), On appelle mthode
psychomtrique l'ensemble des procds aboutissant une description quantitative
des lois psychologiques . La mthode psychomtrique est d'un emploi trs gnral
en psychologie exprimentale, et la mthode des tests n'en n'est qu'une partie, bien
que les deux expressions mthode psychomtrique et mthode des tests
soient, par abus de langage, souvent confondues.
Les auteurs prcisent que le test psychomtrique est une situation exprimentale
standardise, qui va servir de stimulus un comportement. Ce comportement est
valu par comparaison statistique, avec celui d'autres sujets placs dans la mme
situation. Cette valuation permet donc de classer le sujet, soit quantitativement,
soit typologiquement.
Cette dfinition souligne le fait que, pour qu'un stimulus quelconque (une srie de

11

Principes psychomtriques gnraux : dfinition de la mthode des tests, standardisation et


talonnage

questions, de tches d'encre, d'images, une consigne de tche, etc.) devienne


rellement un test, il devra tre obligatoirement standardis, c'est--dire
rigoureusement identique lui-mme pour tous les sujets auxquels on le prsentera,
cette passation se faisant elle-mme dans des conditions invariables. La
standardisation est donc l'un des deux critres ncessaires de transformation d'un
stimulus ordinaire en item de test ou d'chelle.
L'autre point important souligner dans la mthode des tests est qu'il est ncessaire
que deux observateurs diffrents, observant la mme rponse, la notent de manire
univoque. En psychologie, la mesure dans les tests est en ralit un talonnage,
c'est--dire, un reprage sur une chelle. Cette chelle est elle-mme constitue par
l'analyse des rsultats d'un groupe de sujets de rfrence. Le rsultat d'un test
permettra, de cette faon, de reprer la position du sujet examin par rapport aux
autres sujets du groupe d'talonnage. Les preuves qui ne sont pas construites en
rfrence un talonnage explicite ne constituent pas un test. L'talonnage est donc
le second critre indispensable la transformation d'un stimulus ordinaire en
item de test ou d'chelle.
Delay et Pichot (1965) prcisent que, mme si les mthodes psychomtriques
pouvaient permettre de dcouvrir les lois de la vie psychologique , en ralit,
leurs fondements thoriques sont aussi divers que les mthodes elles-mmes (il
existe l'heure actuelle plus de 2000 instruments, crs, produits, valids et
publis).
Un test a donc une valeur prdictive de comportements d'un sujet dans diverses
situations de la vie. Il fournit galement des informations prcises sur le psychisme
d'un sujet et apporte des rsultats quantitatifs permettant une finesse de
discrimination entre les comportements.
Pour tre un instrument de mesure scientifique, un test doit possder les qualits
mtrologiques d'un bon instrument de mesure. Pour pouvoir tre utilis
scientifiquement, un test doit donc tre fidle, sensible, valide et gnralisable.
Mais les principes thoriques qui sous-tendent l'valuation psychologique sont
diffrents de ceux qui prsident aux autres formes de mesures scientifiques. En effet,
en psychologie clinique, l'objet des mesures est toujours une construction
hypothtique (par exemple, l'anxit, la dpression, le stress, etc.), l'oppos des
mesures en sciences physiques, par exemple, qui concernent des entits tangibles (le
poids, la distance, etc.). En quantifiant ces constructions hypothtiques, les
mesures se font sur des chelles dont les marges d'erreurs sont plus
grandes. Les mesures en psychologie clinique sont donc simplement moins
prcises, sans tre pour autant moins scientifiques.

B. Dfinitions de la mthode des tests, de la


standardisation et de l'talonnage
Identifier les dfinitions de concepts et savoir les restituer prcisment
Mthode rdactionnelle :
Il est essentiel que vous appreniez dfinir les concepts qui sont dans
l'nonc des questions d'examen (et de devoirs), ainsi que ceux que vous
employez quand vous rpondez une question de cours.
Il faut expliquer ce que vous avez compris, en reformulant les phrases de
votre cours, mais sans changer les termes des dfinitions.
Vous devez donc, pour cette question, dfinir d'abord la mthode des tests
(faites une synthse des diffrentes dfinitions donnes dans votre cours),
puis les deux principes psychomtriques gnraux que sont la standardisation

12

Principes psychomtriques gnraux : dfinition de la mthode des tests,


standardisation et talonnage

et l'talonnage.
Question
[Solution n2 p 33]

Comment construit-on un test en psychologie clinique ? Pour rpondre la


question, vous dfinirez d'abord la mthode des tests, puis les deux
principes psychomtriques gnraux qui prsident la cration d'un test.

* *
*

La standardisation et l'talonnage sont donc les deux grands principes


psychomtriques qui permettent, d'une part de transformer un stimulus quelconque
en un item de test, et d'autre part, de construire un test ou une chelle. On vrifiera
ensuite les qualits mtrologiques, qualits intrinsques du test ou de l'chelle, dans
le cadre de recherches en psychologie clinique, avant de pouvoir l'utiliser dans le
cadre des pratiques cliniques professionnelles.
Nous allons donc dfinir les quatre qualits mtrologiques ncessaires la validation
scientifique d'un test.

13

Les qualits
mtrologiques
d'un test :
construction d'un
test
III -

III

La fidlit

13

La sensibilit

13

La validit

14

La gnralisation

14

Dfinitions des qualits mtrologiques d'un test et d'une chelle

14

A. La fidlit
Toute mesure scientifique est fonde sur la cohrence et la reproductibilit de
l'exprience. La fidlit dsigne le degr de reproductibilit inhrent au fait de
mesurer : c'est la stabilit du rsultat au cours de mesures rptes. La fidlit peut
tre conceptualise comme le rapport entre la vraie variation de la cotation, et la
variation totale des mesures. Elle reprsente la prcision des mesures et impose
donc, de fait, la limite thorique de la validit des mesures.
Un test en psychologie doit tre fidle, c'est--dire qu'appliqu deux reprises, dans
les mmes conditions au mme sujet, le mme rsultat doit tre obtenu. La fidlit
inter-juges (ou intercotateurs) est dfinie comme tant l'examen d'un mme sujet
par les mmes valuateurs avec le mme test. Deux observateurs effectuent une
valuation indpendamment, au mme moment et dans les mmes conditions.
Quand il s'agit de mesures loignes dans le temps, on parle de stabilit temporelle
des rsultats (test-retest).

15

Les qualits mtrologiques d'un test : construction d'un test

B. La sensibilit
La sensibilit, encore appele le taux de vrais positifs est la proportion de
sujets obtenant un score suprieur au seuil parmi un groupe de sujets malades. Elle
correspond la finesse de discrimination permise et obtenue par l'outil d'valuation,
entre les degrs de la caractristique psychologique mesure. Elle est lie au nombre
d'items constituant l'chelle, et leur nombre de degr de cotation. Plus il y aura
d'items, plus l'chelle sera sensible, mais difficile appliquer en pratique. Un test doit
donc tre sensible, c'est--dire qu'il doit permettre un classement suffisamment fin
des sujets. Certains auteurs (Fombonne E. et Fuhrer R., 1991 [Fombonne E. et
Fuhrer R., 1991]) rajoutent comme condition mtrologique la spcificit, c'est--dire
le taux de vrais ngatifs de l'chelle, ou encore, la proportion de personnes
non malades ayant un score infrieur au seuil. Sensibilit et spcificit sont
importantes pour connatre la prvalence d'une caractristique psychopathologique
d'une population.

C. La validit
La validit des mesures reflte le degr jusqu'o un instrument peut aller pour
mesurer ce pourquoi il est conu. Dire qu'un test est valide ne signifie rien sur le plan
scientifique : les tests ne sont valides que pour les objectifs qu'on leur donne.
La validit la plus explicite et la plus applicable est la validit prdictive, par
exemple dans les processus de dpistage des troubles psychopathologiques. La
valid prdictive d'une chelle par exemple, dpend essentiellement de son degr de
corrlation avec l'talon. La validit de construction est relative la formulation
d'hypothses thoriques ensuite testes avec des mthodes statistiques : le test doit
tre fidle aux hypothses qui sont l'origine de sa construction. La validit
externe ( l'instrument lui-mme) repose sur la comparaison des rponses de sujets
prsentant certaines caractristiques particulires avec celles de sujets ne les
prsentant pas. Quant la validit interne (ou structurale), elle repose sur
l'homognit des diffrents items qui la constituent. L'homognit est la qualit qui
fait que les items du test mesurent tous la mme qualit. Elle est ncessaire dans
une preuve qui mesure une seule dimension, comme par exemple, l'intelligence, ou
l'intensit de l'anxit. Elle se vrifie l'aide de l'analyse factorielle.
Pour qu'un test soit valide, il doit donc prdire effectivement ce qu'il est cens
prdire. Un test qui ne mesure qu'une dimension (par exemple, une chelle de
dpression) doit tre valid comme sa capacit prdire avec prcision les
dpressions cliniques : il ne doit pas servir rechercher d'autres troubles
psychopathologiques.

D. La gnralisation
De nombreuses conditions et de manifestations cliniques changent en fonction de
paramtres tels que l'ge, le genre, l'origine culturelle, la prsence ou l'absence de
maladies. Quand les coefficients de validit (sensibilit et spcificit) sont utiliss en
fonction d'une condition diagnostique spcifique, ils peuvent varier considrablement
si les paramtres de sant et de dmographie de la population pour lesquels ils ont
t tablis ont chang de manire importante. Par exemple, la dpression chez les

16

Les qualits mtrologiques d'un test : construction d'un test

jeunes adultes se manifeste sur le plan affectif de manire moins ostentatoire que
chez les personnes ges, o elle se caractrise par des dysfonctionnements cognitifs
ou moteurs qui s'apparentent la dmence. La gnralisation doit tre tablie
de manire empirique, et ne peut pas reposer sur des hypothses de
recherche faites sur des populations diffrentes du groupe tudi. La
gnralisation
est
donc
une
qualit
mtrologique
obtenue
par
exprimentation dans une population homogne.
Nous allons donc voir maintenant comment s'utilisent ces outils d'valuation et en
fonction de quels critres on peut les rpertorier.

E. Dfinitions des qualits mtrologiques d'un test et


d'une chelle
Identifier les dfinitions des quatre concepts mtrologiques de votre
cours
Mthode rdactionnelle :
Faites une introduction qui cite les quatre qualits mtrologiques auxquelles
doit rpondre un test ou une chelle, et justifiez-en la ncessit.
Le dveloppement, en quatre points, reprend les diffrents termes de votre
introduction. Vous devez successivement dfinir la fidlit (fidlit inter-juges
et stabilit temporelle), la sensibilit, la validit (prdictive, de construction,
externe et interne) et la gnralisation.
Rdigez une conclusion qui ouvre un ou plusieurs autres questionnement
concernant les mesures en sciences humaines (par exemple).
Question
[Solution n3 p 34]

Dfinissez prcisment les quatre qualits mtrologiques d'un test qui


permettent de le valider scientifiquement. Vous rdigerez une introduction
pertinente, un dveloppement et une conclusion.

* *
*

Les dfinitions de ces quatre qualits mtrologiques sont indispensables retenir. Ce


sont elles qui fondent le caractre scientifique des chelles et des tests en
psychologie clinique et en psychopathologie, et non pas la prcision des mesures
(comme par exemple dans les sciences physiques ou mathmatiques).

17

Utilisation des
tests
IV -

IV

Evaluation, dpistage et recherche

17

valuation, Dpistage et Recherche cliniques

18

Les critres de choix des outils d'valuation

18

Classification

18

Les trois niveaux de mesures en psychopathologie

19

A. Evaluation, dpistage et recherche


L'utilisation de ces outils (chelles d'valuation, questionnaires ou tests projectifs)
concerne essentiellement les pratiques cliniques des psychologues cliniciens d'une
part, et d'autre part, les recherches cliniques ou pidmiologiques dans le
champ clinique. La mthode des tests est utilise des fins d'valuation et de
dpistage de troubles intellectuels, affectifs et/ou psychopathologiques. Le choix d'un
outil intervient donc dans deux situations : celle du psychologue clinicien confront
des besoins d'valuation et/ou de dpistage de difficults ou de troubles, et donc la
vrification de ses hypothses cliniques (le plus souvent dans le cadre d'un bilan
psychologique), et celle du psychologue clinicien chercheur confront la
vrification de ses hypothses de recherche (le plus souvent dans le cadre d'une
recherche doctorale). Le choix des outils dcoule donc de plusieurs questionnements.
L'chelle ou le questionnaire pourra tre utilis comme critre principal ou
secondaire dans l'tude de la psychopathologie.
L'chelle ou le questionnaire pourra tre utilis seul ou en complment
d'autres outils d'valuation.
Le psychologue devra s'assurer de la capacit d'adhsion et de comprhension
du patient, en particulier lors des auto-valuations (sous forme d'chelles ou
de questionnaires).
Il faudra choisir le niveau de troubles valuer, une symptomatologie trs
gnrale (par exemple celle de la dpression) ou bien un symptme plus
spcifique (par exemple, l'tude du ralentissement dpressif). Les chelles
seront alors diffrentes.
Il faudra dcider s'il s'agit d'une valuation ponctuelle ou longitudinale. Dans
le cas des valuations longitudinales, il faudra choisir le nombre de cotations
et l'cart dans le temps entre les valuations.
Afin de choisir l'outil le plus adapt la question pose (clinique ou de
recherche), le psychologue devra se documenter sur les ouvrages regroupant

19

Utilisation des tests

des outils cliniques traduits et valids en langue franaise, ou bien de traduire


et de valider soi-mme des outils de langue trangre, ce qui se fait
gnralement dans le cadre de recherches cliniques.

B. valuation, Dpistage et Recherche cliniques


Rendre compte synthtiquement des deux objectifs principaux des
tests
Mthode de rdaction
Vous devez, dans cet exercice, citer les deux principaux objectifs de l'utilisation des
tests et des chelles en psychologie clinique, et synthtiser, en la reformulant, une
explication pour chacun de deux : l'valuation et le dpistage des troubles,
intellectuels, affectifs et relationnels et psychopathologique d'une part, et d'autre
part, la contribution la recherche et aux thorisations en psychologie clinique.
Question
[Solution n4 p 35]

A quelles fins utilise-t-on les tests et les chelles en psychologie clinique ?


(5 points)

C. Les critres de choix des outils d'valuation


Rendre compte des principaux critres de choix des outils d'valuation
et de dpistage
Mthode de rdaction :
Vous devez, dans cet exercice, citer les principaux critres de choix des tests et des
chelles en psychologie clinique, et synthtiser, en la reformulant, une brve
explication pour chacun d'eux, en l'illustrant d'exemples.
Question
[Solution n5 p 35]

En fonction de quels critres choisit-on les outils d'valuation ? (5 points)

D. Classification
Les chelles et les questionnaires d'valuation des troubles peuvent tre classs
selon plusieurs critres :
Leur contenu : il permet de relever les caractristiques de l'tat civil d'un
patient, ses antcdents personnels et/ou familiaux, sa symptomatologie
actuelle (bio-psycho-sociale), son comportement actuel ou pass.
Leur utilisateur : une chelle ou un questionnaire peuvent tre construits
pour tre remplie par un patient (en auto-valuation), ou un psychologue
clinicien, un psychiatre, un mdecin gnraliste, un infirmier, un membre de
la famille (en htro-valuation).
Leur systme de cotation : on distingue les instruments cotation

20

Utilisation des tests

dichotomique (oui/non, prsent/absent, etc.) des chelles ou questionnaires


cotation gradue. Le procd de graduation peut tre labor pour choisir,
soit entre une srie de formulations dcrivant des symptmes d'intensit ou
de frquence croissante, soit entre une gamme d'adverbes de quantit ou de
frquence qui aident au reprage des comportements ou de symptmes, soit
entre des procds graphiques (exemple, l'Echelle Visuelle Analogique, EVA).
La nature de la psychopathologie explore : il existe des chelles
d'apprciation globale d'une psychopathologie, des inventaires gnraux qui
explorent l'ensemble de la psychopathologie du patient, des chelles
restreintes l'exploration de syndromes fonctionnels, des chelles spcifiques
explorant un symptme.
Par ailleurs, on distingue trois principaux niveaux de mesure en psychopathologie, le
niveau syndromique, le niveau comportemental, et le niveau tiologique.
Le niveau syndromique Le niveau syndromique fait rfrence l'valuation d'entits
psychopathologiques consensuelles et rpertories. Chez l'adulte, la pratique clinique
des psychologues met en vidence que le consensus est homogne pour des troubles
tels que la dpression et l'anxit. Chez l'enfant, le consensus est moins vident,
comme par exemple pour des entits comme l'hyper-activit, l'hyper-anxit ou
l'autisme infantile. Chez le sujet g, l'tude de la dpression rfrence aux
classifications de l'adulte prsente des limites, du fait des caractristiques spcifiques
lies au vieillissement. L'valuation syndromique est toujours source de difficults
lorsque le patient (quel que soit son ge) prsente des atteintes neurobiologiques
conjointement un trouble psychopathologique.
Le niveau comportemental correspond ce qui est observable et repose sur l'tude
des conduites, des comportements et des attitudes du sujet. Il permet de distinguer
des comportements externaliss (agitation ou ralentissement moteur) et internaliss
(attitude de repli). Bouvard (2005)

[Bouvard (2005)] (cf. Manuel Bouvard et

Cottraux p 29)prcise que le niveau comportemental n'est pas superposable au


niveau syndromique. En effet, s'il est cens tre plus objectif , il manque de
spcificits. Par exemple, un mme type de comportements peut correspondre des
entits syndromiques diffrentes. Pour cette raison, les outils cliniques qui
privilgient l'tude du niveau comportemental ne peuvent pas tre utiliss comme
critres diagnostiques, mais seulement comme aide au diagnostic psychiatrique.
Quant au niveau tiologique, il est essentiellement reprsent par un seul
rfrentiel thorique, la psychanalyse, et permet d'infrer, partir du seul
discours du patient, des hypothses cliniques sur un fonctionnement mental ,
interne, qu'on appelle fonctionnement psychique et qui a t labor par Freud et
ses successeurs. La thorie psychanalytique est une thorie tiologique des troubles
psychopathologiques, et a donn lieu un classement spcifique psychose,
nvrose, tats-limites reprsent essentiellement par les cliniciens europens,
opposs la description comportementale des troubles, d'origine nord-amricaine et
anglo-saxonne.
Ces dernires remarques nous amnent aborder maintenant les limites de
l'valuation standardise.

21

Utilisation des tests

E. Les trois niveaux de mesures en psychopathologie


Restituer les trois niveaux de mesures en psychologie clinique et en
psychopathologie
Mthode de rdaction :
Vous devez citer les trois niveaux de l'valuation psychologique - syndromique,
comportementale et tiologique, et identifier, en expliquant les raisons pour chacun
d'entre eux, le rfrentiel thorique auquel il se rfre. Vous devrez rdiger une
introduction, un dveloppement et une conclusion.
Question
[Solution n6 p 36]
Restituez les principaux niveaux de mesure en psychologie clinique et en
psychopathologie, en les illustrant. Qu'en concluez-vous ? Vous ferez une
introduction, un dveloppement et une conclusion. (10 points)

22

Les limites de
l'valuation
standardise
V -

Le psychologue clinicien "valuateur"

21

Les aspects culturels

21

Exercice : Les limites culturelles de l'valuation psychologique

22

Le choix des sujets

23

Les limites individuelles de l'valuation psychologique

23

A. Le psychologue clinicien "valuateur"


Certaines sources de variabilit des rsultats proviennent de l'observateur lui-mme.
Les facteurs qui peuvent modifier des rsultats de l'valuation sont l'ge, le
sexe, la situation socio-conomique, le mode et les capacits de communication avec
le patient, l'tat motionnel, la personnalit et la motivation de l'observateur, et,
critre fondamental, les choix thoriques implicites (ou explicites) du
psychologue clinicien. En effet, la formation thorique et la pratique initiale du
psychologue influent sur les relations entre, d'une part le choix des concepts et
l'exprience pratique des examinateurs et d'autre part, l'observation et l'identification
des symptmes. L'valuation clinique standardise permet donc d'identifier ces biais,
qu'on retrouve bien videmment dans le travail clinique qualitatif du psychologue.
L'existence de tels biais a pour consquences ncessaires de savoir les reconnatre,
de mettre en place des tudes de fidlit des chelles d'valuation, et de se former
l'valuation standardise.
D'autre part, les aspects culturels et le choix des sujets sont galement sources de
biais de l'valuation en psychologie clinique, ce que nous allons dtailler ci-dessous.

B. Les aspects culturels


Selon Fombonne et Fuhrer (1991, op. cit.), les instruments d'valuation crs dans
un pays ou une culture spcifique sont dvelopps avec des performances associes
un certain seuil. Lorsque l'outil est transpos dans un contexte linguistique, culturel

23

Les limites de l'valuation standardise

et social diffrent, les utilisateurs ne doivent pas utiliser les seuils d'utilisation
prdfinis ; en effet, cela reviendrait faire l'hypothse que la sensibilit et la
spcificit de l'outil sont gales d'un pays l'autre. Or les recherches de S. Ionescu
(1991)S. Ionescu (1991) ont montr que l'appartenance culturelle influait sur les rsultats
aux tests, chelles et questionnaires utiliss en psychologie clinique. Cet auteur
recommande, pour utiliser un outil clinique dans un nouveau contexte culturel,
d'tudier l'quivalence de cinq dimensions majeures : les contenus, la dimension
smantique, la dimension technique, la dimension conceptuelle, et les critres de
choix.
L'quivalence des contenus signifie que chaque item d'un outil clinique doit tre
pertinent dans la culture o son utilisation est envisage. Les items doivent
exister et recouvrir la mme signification. Dans le cas contraire, il faudra transformer
ou liminer certains items de l'chelle, et donc vrifier les qualits mtrologiques de
l'outil ainsi modifi.
L'quivalence smantique s'tudie partir de la signification de chaque item,
qui doit tre quivalente d'une langue l'autre, aprs traduction, en rfrence
l'outil d'origine. La traduction peut poser des risques de contresens. Il est essentiel
galement de connatre la thorie psychopathologique des concepteurs de l'outil. On
pratique ainsi une retro-traduction, une traduction de la premire traduction pour
retourner vers la langue originale. Le processus est donc complexe voir parfois
impossible, puisque certaines langues culturelles sont minoritaires ou inadaptes
lorsqu'il n'y a pas de langue crite.
L'quivalence technique signifie que les experts interculturels doivent s'assurer
que les rsultats obtenus d'une culture l'autre ne sont pas affects par des
variables lies aux mthodes. Certaines techniques adaptes la culture
occidentale (questions, directivit, notation crite, et.), peuvent tre inadaptes dans
des cultures dites orales et o l'accs la scolarisation est faible ; elles peuvent
tre aussi perues comme coercitives ou inconvenantes (en particulier pour le sexe
des examinateurs). On appelle cette dimension la dsirabilit sociale ou
besoin d'approbation sociale , ncessaire prendre en compte dans le choix
des outils, des modes de recueil des donnes et de l'appartenance culturelle et
sociale de l'valuateur.
L'quivalence conceptuelle signifie que l'outil doit valuer la mme
construction thorique d'une culture l'autre. Il est important de connatre le
rfrentiel thorique l'origine de la construction de l'outil clinique, afin d'valuer si,
transpos dans une culture diffrente, il reste pertinent. On procde gnralement
l'tude des corrlations entre l'outil clinique considr, transpos de la culture A la
culture B, et des variables communes aux deux cultures.
L'quivalence quant aux critres de choix correspond l'interprtation des
rsultats par rapport une norme, dont il est ncessaire d'tudier l'quivalence
d'une culture l'autre. En effet, il est ncessaire de rflchir la notion de culture,
qui ne peut pas tre rduite au degr de dveloppement technologique et
conomique, mais qui doit prendre en compte le fait que les normes sociales et
culturelles varient d'une culture l'autre, y compris dans les pays de mme niveau
de dveloppement technologique et conomique.

C. Exercice : Les limites culturelles de l'valuation


psychologique
Compltez le texte ci-dessous. Les "trous" doivent tre compris et appris.
signifie que chaque item d'un outil clinique doit
o
son utilisation est envisage. Les items doivent
. Dans le cas contraire, il

24

Les limites de l'valuation standardise

faudra transformer ou liminer certains items de l'chelle, et donc vrifier les qualits
mtrologiques de l'outil ainsi modifi.
s'tudie partir de l
, aprs
. La traduction peut poser
des risques de contresens. Il est essentiel galement de
de l'outil. On
pratique ainsi une retro-traduction, une traduction de la premire traduction pour
retourner vers la langue originale. Le processus est donc complexe voir parfois
impossible, puisque certaines langues culturelles sont minoritaires ou inadaptes
lorsqu'il n'y a pas de langue crite.
signifie que les experts interculturels doivent s'assurer
que
Certaines techniques adaptes la culture occidentale (questions,
directivit, notation crite, et.), peuvent tre inadaptes dans des cultures dites
orales et o l'accs la scolarisation est faible ; elles peuvent tre aussi perues
comme coercitives ou inconvenantes (en particulier pour le sexe des examinateurs).
On appelle cette dimension la
ou
, ncessaire
prendre en compte dans le choix des outils, des modes de recueil des donnes et de
l'appartenance culturelle et sociale de l'valuateur.
signifie que l'outil doit
. Il est important de
de l'outil
clinique, afin d'valuer si, transpos dans une culture diffrente, il reste pertinent. On
procde gnralement l'tude des corrlations entre l'outil clinique considr,
transpos de la culture A la culture B, et des variables communes aux deux
cultures.
correspond
, dont il est ncessaire
. En
effet, il est ncessaire de rflchir la notion de culture, qui ne peut pas tre rduite
au degr de dveloppement technologique et conomique, mais qui doit prendre en
compte le fait que les normes sociales et culturelles varient d'une culture l'autre, y
compris dans les pays de mme niveau de dveloppement technologique et
conomique.

D. Le choix des sujets


Une rflexion sur l'utilisation des concepts et le choix des outils cliniques
semble galement ncessaire pour valuer des comportements et des
fonctionnements dans des groupes de population divers. En effet, lorsqu'un outil est
utilis dans un chantillon de population spcifique, par exemple une chelle de
dpression dans un service de psychiatrie, il a une valeur prdictive satisfaisante car
cet chantillon a une prvalence leve pour cette psychopathologie tudie. En
revanche, si l'outil est utilis avec un chantillon de population moins slectionn,
pour lequel la prvalence des troubles psychopathologiques est moins leve que
dans un groupe spcifique (par exemple une population psychiatrique ), la valeur
prdictive de l'outil chute avec le taux de prvalence du trouble psychopathologique.
Les rsultats peuvent galement varier chez un mme patient en fonction de
l'heure de passation, ce qui est li aux variations nycthmrales. De mme, lors de
passations successives, on peut observer des erreurs de contraste, lorsqu'un sujet
peu souffrant est valu immdiatement aprs un sujet trs souffrant. De plus,

25

Les limites de l'valuation standardise

certains examinateurs ont tendance sur-estimer ou sous-estimer les symptmes,


ou attribuer l'ensemble des items une note moyenne (tendance centrale) ou
similaire (effet de halo), ou encore donner des notes voisines plusieurs items
(effet de proximit). La formation des psychologues cliniciens la passation et la
cotation de ces outils permet de diminuer ces variations d'valuation.
Enfin, le mode d'utilisation de ces outils peut influer sur la smiologie des
troubles psychopathologiques elle-mme. Ainsi, par exemple, on joint
systmatiquement la passation d'une chelle brve lors d'un entretien semi-directif
la passation d'une chelle longue lors d'un entretien non-directif, modalits de
passation susceptibles de modifier la qualit de la relation clinique et donc
l'apparition des diffrents symptmes.

E. Les limites individuelles de l'valuation


psychologique
Psychologue clinicien, Sujet et Outils : les biais individuels
Mthode de rdaction :
Vous devez, dans cet exercice rdactionnel, restituez les limites et les biais relatifs
aux acteurs de l'valuation psychologique, qui dpendent tant du psychologue
clinicien (son rfrentiel thorique) que du sujet valu et de la pertinence du choix
des outils.
Question
[Solution n7 p 37]

Quelles sont les limites mthodologiques individuelles de l'valuation


standardise ? Vous ferez une introduction, un dveloppement et une
conclusion. 7 points

26

Conclusion

Les tests sont des situations d'valuation standardises qui ont pour but d'objectiver les
dimensions de la personnalit en vitant des biais de la subjectivit. Nanmoins, on l'a vu,
ces biais sont inhrents toute situation d'valuation, et dus essentiellement l'existence
mme de la situation d'valuation. On ne peut donc pas prtendre qu'une situation
d'valuation standardise est toujours plus objective qu'une situation d'valuation non
standardise (comme par exemple en entretien clinique non directif).
Il semblerait plutt que ce soit le rfrentiel thorique mis en uvre dans une situation
clinique qui demande au psychologue clinicien de faire le choix de standardiser ou
non son valuation des faits cliniques observables dans le discours, dans le
comportement et dans la dimension relationnelle. L'oprationnalisation des thories de
la personnalit en psychologie clinique pose la question de l'articulation entre les diffrents
rfrentiels thoriques et les multiples pratiques professionnelles. L'utilisation de la mthode
des tests par les psychologues cliniciens n'est vritablement performante que si et seulement
si ceux-ci y intgrent les connaissances issues de la recherche en psychologie clinique et en
psychopathologie, ainsi qu'une rflexion thorique sur la dimension relationnelle inhrente
toute interaction clinique.

27

Ressources
annexes

- Manuel Bouvard et Cottraux

29

Solution des
exercices

> Solution n1 (exercice p. 9)


Exemple de corrig
Introduction
La cration des premiers instruments du dpistage en psychologie remontent la fin
du 19ime sicle (Derogatis et Dellapietra, 1994). On distinguera les premiers tests
d'valuation des grandes fonctions en psychologie (intelligence, mmoire, perception,
attention, etc.), des premiers inventaires des symptmes des troubles
psychopathologiques et des premiers tests projectifs. (1 point pour la distinction
des trois grands domaines de l'valuation en psychologie, sa cration fin
19ime sicle).
Dveloppement
Les premiers tests psychologiques des preuves standardises destines un
groupe de personnes, remontent aux travaux allemands de psychologie
exprimentale de Weber, Fechner ou Wundt, tudiant les caractristiques
psychosensorielles. L'volution consistera dvelopper ces mesures priphriques
des mesures plus gnrales. Par exemple, H. Ebbinghaus (1850-1909) utilise, lors de
recherches sur la mmoire, les prcurseurs des tests d'intelligence. Puis James Mc
Keen Cattell (1860-1944) labore un ensemble de 10 preuves valuant la mmoire
et l'attention. Les premiers tests factoriels dcoulent vritablement des mthodes
statistiques dveloppes par Spearman (1863-1945) et Thurstone (1887-1955)
concernant l'analyse des corrlations l'analyse factorielle. Ces mthodes ont jou un
rle dterminant pour valider l'hypothse de recherche principale concernant
l'intelligence : elle serait compose (selon Olron, 1957, Reuchlin, 1964), d'une
composante gnrale et de composantes spcifiques. (2 points pour la restitution
des principaux auteurs (et les dates) des tests psychologiques concernant
les caractristiques psychosensorielles, l'attention et la mmoire.)
En France, on doit la cration du premier test d'valuation de l'intelligence Binet et
Simon en 1905, sous l'influence du Ministre franais de l'Instruction Publique au
sujet de l'enseignement procurer aux enfants "en difficults", et de l'intrt d'Alfred
Binet (187-1911) pour le fonctionnement intellectuel des enfants dit normaux et
anormaux . Binet et Simon laborent un test ayant pour objectif de mesurer les
processus mentaux suprieurs chez les enfants partir de 3 ans (et jusqu' l'ge
adulte), l'aide d'un indice de niveau intellectuel , qui deviendra ensuite ce qu'on
appelle l'ge Mental (A.M.). (1 point pour avoir citer la cration du test de
Binet et Simon en 1905).
A peu prs la mme poque, aux Etats-Unis, en 1914, le psychiatre Adolphe Meyer
(1866-1950) construit la premire chelle d'valuation psychiatrique le
Classement des Comportements de Philips (The "Philipps Behavior Chart"). En
1918, le premier inventaire des symptmes sous la forme d'un auto-questionnaire

31

Solution des exercices

la "Personnal Data Sheet" est dvelopp par R. Woodworth, afin de dpister les
troubles psychopathologiques des soldats amricains qui revenaient de la guerre.
Puis Moor (1930) labore une chelle d'observation psychiatrique, pour identifier
exprimentalement la structure de la symptomatologie des psychoses. (1 point
pour avoir citer la cration des premiers inventaires de psychopathologie
aux USA, entre 1914 et 1930.)
Paralllement, en Suisse, en 1921, Hermann Rorschach, psychiatre, publie son
ouvrage "Le Psychodiagnostic", dans lequel il dveloppe un test de tches d'encre
le test de Rorschach qui permet, selon lui, non plus d'tudier les grandes fonctions
psychologiques mais le fonctionnement de la personnalit de l'enfant, de l'adolescent
et de l'adulte. Rorschach travaillait sur l'imagination, la projection et la cration
artistique, et orientait alors ses recherches sur l'approche thrapeutique de la
schizophrnie, et l'interprtation psychanalytique des peintures des patients
schizophrnes. Il utilisa des tches d'encre comme moyen d'investigation avec les
patients et observa que les patients diagnostiqus schizophrnes rpondaient
diffremment au jeu des tches d'encre que les autres patients. Cette observation
clinique fondamentale lui fit poursuivre ses recherches pour dvelopper son test et le
valider empiriquement. Le Psychodiagnostic : Test diagnostique bas sur la
perception (1921), est issu de cette validation empirique. (2 points pour avoir
citer la cration du test de Rorschach (1921) et ses conditions empiriques.)
Quinze ans plus tard, en 1935 aux Etats-Unis, Mugan et Murray publient la premire
version du TAT dans leur ouvrage commun Thematic Apperception Test. Puis en
1938, Henry Murray en utilise les rsultats pour asseoir sa thorie de la personnalit
dans son ouvrage "Exploration de la personnalit", et en 1943, il publie la version
dfinitive de son test dans son Manuel d'application. Le TAT se compose de 31
planches, des reproductions d'aquarelles ou de dessins, destines stimuler la
production imaginaire. Les annes 70 voient apparatre de nombreuses critiques
concernant les tests projectifs, critiques dues l'absence de mthodologie efficace et
objective. En France, Vica Shentoub (1970-1971) s'intresse la situation
projective du TAT, et essaye de dgager une mthodologie spcifique. C'est grce
ses travaux et ceux de ses collgues L'Ecole Franaise du TAT de 1955 1974,
que la codification de la mthodologie de cotation du TAT a t construite. Shentoub
et Debray laborent une mthode de cotation, d'analyse et d'interprtation du
matriel recueilli, fonde sur des postulats thoriques de la mtapsychologie
freudienne. Les auteurs franais retiennent 16 planches sur les 31 (values comme
les plus pertinentes et les significatives cliniquement). Ces travaux s'inscrivent dans
une approche psychanalytique du fonctionnement et du dveloppement de la
personnalit. Paralllement, Nina Rausch de Traubenberg (1970) s'engage sur la
mme voie, en dveloppant les recherches mthodologiques et en prcisant les
fondements thoriques du test de Rorschach, dont les travaux seront poursuivis
ultrieurement, notamment par Catherine Chabert. (2 points pour avoir citer les
principaux auteurs et les conditions de cration de l'valuation
psychologique par les tests projectifs, en France, entre les annes 1950 et
1970).
Conclusion
Le dveloppement des tests d'valuation en psychologie clinique et en
psychopathologie a donc pris deux grandes directions de recherches, en fonction des
mthodes utilises : d'une part, les mthodes statistiques (en rfrence au
bhaviorisme, par comparaisons de comportements) qui fondent les tests
psychomtriques, et d'autre part, les mthodes analytiques qui fondent les tests
projectifs (en rfrence au fonctionnement psychique thoris par la psychanalyse).
(1 point pour expliquer, par exemple, les deux grands courants
mthodologiques de recherches des tests et des chelles en psychologie
clinique).

32

Solution des exercices

> Solution n2 (exercice p. 13)


Exemple de corrig
Introduction
La dfinition la plus consensuelle de la mthode des tests est due Delay et Pichot
(1965) pour lesquels la mthode psychomtrique est l'ensemble des procds
aboutissant une description quantitative des lois psychologiques , la mthode des
tests n'tant qu'une partie de la mthode psychomtrique. Delay et Pichot (1965)
prcisent que, mme si les mthodes psychomtriques pouvaient permettre de
dcouvrir les lois de la vie psychologique , en ralit, ces lois seraient aussi
diverses que les bases thoriques qui fondent la multitude des mthodes
psychomtriques. Pour qu'un stimulus devienne un test ou une chelle, il est
ncessaire de le standardiser et de l'talonner. C'est ce que nous allons dfinir. (2
points)
Dveloppement
Un test a une valeur prdictive de comportements d'un sujet dans diverses situations
de la vie. Il fournit galement des informations prcises sur le psychisme d'un sujet
et apporte des rsultats quantitatifs permettant une finesse de discrimination entre
les comportements.
Delay et Pichot prcisent que le test psychomtrique est une situation exprimentale
standardise qui va servir de stimulus un comportement, verbal ou non verbal. Ce
comportement est valu par comparaison statistique avec celui d'autres sujets
placs dans la mme situation. Cette valuation permettra ensuite de classer le
sujet, soit quantitativement (dans quel groupe de mmes caractristiques, par
ge, par groupe de population, etc.), soit typologiquement ( partir d'une dimension
psychologique spcifique). (3 points)
La dfinition gnrale des tests montre que pour qu'un stimulus quelconque (par
exemple une srie de questions, des tches d'encre, des images, la consigne d'un
dessin, etc.), devienne un test ou une chelle en psychologie clinique, il devra tre
standardis, c'est--dire rigoureusement identique lui-mme pour tous les sujets,
dans de conditions invariables. C'est la standardisation des tests, condition
ncessaire la validation de la mthode des tests. La standardisation est donc l'un
des deux critres ncessaires la transformation d'un stimulus en item de test
psychologique. (2 points)
De plus, il est ncessaire que deux observateurs diffrents, observant la mme
rponse, la notent de manire univoque identique. Cette notion de mesure en
psychologie clinique est un reprage sur une chelle et se nomme l'talonnage. Un
test, pour tre valide, doit tre talonn, et donc permettre de reprer la position du
sujet sur une chelle en fonction des autres sujets du groupe d'talonnage. Cette
chelle est elle-mme constitue partir de l'analyse des rsultats d'un groupe de
sujets de rfrence. Tous les tests, projectifs et psychomtriques, sont valids ainsi.
L'talonnage est donc le deuxime critre de transformation d'un stimulus en item de
test psychologique. (2 points)
Conclusion
Les principes qui sous-tendent l'valuation psychologique sont diffrents de ceux qui
prsident aux autres formes de mesures scientifiques. En effet, en psychologie,
l'objet des mesures est toujours une construction hypothtique (par exemple,
l'anxit, la dpression, le stress, l'estime de soi , etc.), l'oppos des mesures en
sciences physiques, par exemple, qui concernent des entits plus tangibles (le poids,
la distance, etc.). En quantifiant ces constructions hypothtiques, les mesures se font
sur des chelles dont les marges d'erreurs sont plus grandes. Les mesures en
psychologie sont donc simplement moins prcises, mais tout autant scientifiques

33

Solution des exercices

lorsque les critres de standardisation et d'talonnage ont t valids. (1 point)

> Solution n3 (exercice p. 17)


Exemple de corrig
Introduction
Le test psychomtrique est une situation exprimentale standardise qui va servir de
stimulus un comportement, verbal ou non verbal. Ce comportement est valu, par
comparaison statistique, avec celui d'autres sujets placs dans la mme situation.
Pour tre un instrument de mesure fiable, un test doit donc possder les qualits de
tout instrument de mesure scientifique, c'est--dire qu'il doit tre fidle, sensible,
valide et gnralisable. Nous allons donc dfinir ces quatre notions, qu'on appelle des
qualits mtrologiques . (1 point)
Dveloppement
La fidlit dsigne le degr de reproductibilit inhrent au fait de mesurer. C'est la
stabilit du rsultat au cours de mesures rptes. Pour tre fidle, un test, appliqu
deux reprises dans les mmes conditions et au mme sujet, doit pouvoir donner le
mme rsultat. On parlera de fidlit inter-juges si le mme test est appliqu au
mme sujet par les mmes cotateurs, et de stabilit temporelle lorsque le test donne
les mmes rsultats lorsque les mesures sont loignes dans le temps. On dit
galement que c'est le rapport entre la vraie variation de la cotation, et la variation
totale des mesures. Elle reprsente la prcision des mesures et impose la limite
thorique de la validit des mesures. (2 points)
La sensibilit est la proportion de sujets obtenant un score suprieur au seuil parmi
un groupe de sujets malades. C'est la finesse de discrimination permise par l'outil
d'valuation. Elle est lie au nombre d'items et leur nombre de degr de cotation.
Plus il y a d'items, plus l'outil est sensible, mais plus il est difficile appliquer.
Certains auteurs (Fombonne E. et Fuhrer R., 1991) rajoutent la sensibilit d'un test
la spcificit, c'est--dire le taux de vrais ngatifs de l'chelle, ou la proportion de
personnes non malades ayant un score infrieur au seuil. (2 points)
La validit reflte le degr jusqu'o un outil d'valuation peut aller pour mesurer ce
pour quoi il est conu. Pour qu'un test soit valide, il doit donc prdire effectivement
ce qu'il est cens prdire. Les auteurs parlent gnralement de trois sortes de
validit. La validit prdictive dpend de son degr de corrlation avec la validit
du groupe d'talonnage. La validation de construction est relative la formulation
d'hypothses, testes ensuite avec des mthodes statistiques. Les validits, externe
et interne, sont relatives au test lui-mme. La validit externe et interne repose,
pour la premire sur la comparaison des rponses de sujets prsentant des
caractristiques avec celles de sujets ne les prsentant pas ; et pour la seconde, sur
l'homognit des items (le fait que les items mesurent tous la mme dimension). (3
points)
La gnralisation est une qualit mtrologique tablie empiriquement, et ne peut
pas reposer sur des hypothses de recherche faites sur des groupes de populations
diffrentes du groupe tudi. En effet, de nombreuses conditions et manifestations
cliniques changent en fonction de paramtres tels que l'ge, le genre, l'origine
culturelle ou la prsence ou l'absence de maladies somatiques. Les coefficients de
validit (validit et spcificit) d'un test peuvent varier de manire considrable si les
paramtres pour lesquels ils ont t tablis ont chang. (1 point)
Conclusion
En psychologie, contrairement aux mesures des objets physiques, l'objet des
mesures est toujours une construction hypothtique (par exemple, la dpression,
l'anxit, le stress...). En quantifiant ces hypothses, les mesures se font sur des
chelles dont les marges d'erreurs sont plus grandes, ce qui ne signifie pas plus
fausses . Les mesures en psychologie clinique sont donc simplement moins

34

Solution des exercices

prcises, ce qui ne prjuge en rien de leur caractre scientifique, qui se vrifie avec
leurs qualits mtrologiques. (1 point)

> Solution n4 (exercice p. 20)


Objectifs de l'valuation, du dpistage et de la recherche
Les objectifs de l'valuation en psychologie clinique sont doubles : ils peuvent
rpondre des questions cliniques que se pose le psychologue clinicien praticien pour
un patient ; ils peuvent rpondre des questions de recherche que se pose le
psychologue clinicien chercheur pour un groupe de patients. (1 point)
L'utilisation des chelles d'valuation, des questionnaires ou des tests projectifs
concerne donc d'une part, les pratiques cliniques professionnelles. La mthode des
tests est utilise des fins d'valuation et de dpistage de troubles intellectuels,
affectifs et/ou psychopathologiques. Le choix d'un (ou plusieurs) outil intervient donc
dans la situation du psychologue clinicien confront la confirmation ou
l'infirmation des hypothses cliniques qui ont t formules au cours du recueil des
faits cliniques (et ce, quelque soit la mthode de recueil).
D'autre part, l'utilisation des chelles et des tests est pertinente dans le domaine des
recherches cliniques ou pidmiologiques dans le champ de la psychologie clinique.
Le choix d'un ou plusieurs outils d'valuation est intervient dans la pratique du
psychologue clinicien chercheur, confront des besoins de prcisions thoriques
et/ou mthodologiques, et donc la confirmation ou l'infirmation de ses
hypothses thorico-cliniques. (2 points)
Le choix des outils dcoulera donc de ces deux types de questionnements. Dans le
premier cas de confirmation ou d'infirmation des hypothses cliniques du
psychologue clinicien, le bnficiaire direct est le patient, en termes de spcificit de
la prise en charge, de finesse du diagnostic, de pertinence des traitements
mdicamenteux, psychothrapeutiques. Dans le second cas de confirmation ou
d'infirmation des hypothses thorico-cliniques de recherche, les bnficiaires directs
en sont les psychologues cliniciens chercheurs, en termes de publication de rsultats
de recherche, d'adaptation de dispositifs thrapeutiques, de prcisions quant la
dfinition de concepts ou de notions de psychopathologie, et les bnficiaires
indirects, les patients, une fois les rsultats de recherche valids pour leur application
en pratiques cliniques. (2 points)

> Solution n5 (exercice p. 20)


Quelque soit le questionnement, valuatif ou de recherche, le choix des outils se fait
en fonction de plusieurs spcificits de construction des outils.
1. Le dpistage, le diagnostic et l'tude de la psychopathologie peuvent
ncessiter un ou plusieurs outils, soit en critre principal (comme pour le
diagnostic, par exemple), soit comme critre secondaire (pour la description
fine d'un trouble, par exemple). Il s'agira donc d'oprer un choix, en fonction
des faits cliniques recueillis antrieurement.
2. L'chelle ou le questionnaire peuvent tre utiliss seul ou en complment
d'autres outils d'valuation, comme par exemple, des mthodes de recueil de
faits cliniques moins standardises, telles que l'observation clinique,
l'entretien clinique, l'anamnse clinique.
3. Le psychologue clinicien devra s'assurer de la capacit d'adhsion et de
comprhension du patient, en particulier lors de la passation d'chelles ou de
questionnaires sous forme d'auto-valuations. Par exemple, les outils
d'valuation utilisant uniquement la mthode verbale doivent tre pertinent

35

Solution des exercices

eu gard au niveau de comprhension dans la langue du patient.


4. Le niveau des troubles valuer est galement un choix faire, une
symptomatologie trs gnrale (par exemple celle de l'anxit) ou bien un
symptme plus spcifique (par exemple, l'tude de l'agitation ou du
ralentissement psycho-moteur) ; dans ce cas, les chelles seront diffrentes.
5. Il faut dcider s'il s'agit d'une valuation ponctuelle (en pratique clinique) le
plus souvent) ou longitudinale (dans des protocoles de recherche par
exemple). Dans le cas des valuations longitudinales, il faudra choisir le
nombre de cotations et l'cart dans le temps entre les valuations. En
gnral, les manuels des chelles et des tests indiquent ces carts dans le
temps.
6. A partir de la formulation de l'hypothse (clinique ou de recherche), le
psychologue clinicien devra se documenter sur les ouvrages regroupant des
outils cliniques talonns et valids en langue franaise ; dans le cas
contraire, il devra traduire et valider lui-mme des outils de langue trangre,
ce qui se fait gnralement dans le cadre de recherches cliniques en
psychologie clinique.
(5 points)

> Solution n6 (exercice p. 22)


Introduction
L'valuation standardise en psychologie clinique et en psychopathologie, comme
toute mthode d'valuation, mesure trois niveaux diffrents, calqus sur les
mthodes de classifications des troubles psychopathologiques. Il s'agit du niveau
syndromique (on value la prsence et l'intensit des symptmes pour les regrouper
en syndromes), du niveau comportemental (on value la prsence et l'intensit des
conduites et des comportements observables) et du niveau tiologique (on value la
prsence et l'intensit des mcanismes psychiques en fonction des trois organisations
psychiques, psychose, nvrose et tats-limites). Nous allons donc prciser ce que
recouvrent ces trois niveaux de mesure. (1,5 point)
Dveloppement
Le
niveau
syndromique
est
reprsent
par
le
classement
d'entits
psychopathologiques consensuelles et rpertories par la communaut scientifique,
telles que les grandes classification internationales comme le DSM (Diagnostic
Statistical Manuel) ou la CIM ("Classification Internationale des Maladies") dans leurs
diffrentes versions ractualises. Le consensus entre psychologues est homogne
pour des troubles tels que la dpression et l'anxit dcrits chez l'adulte, partir de
l'une ou l'autre des deux classifications. Le consensus entre professionnels est moins
vident pour des populations d'enfants, par exemple pour des entits
psychopathologiques telles que l'hyperactivit, l'hyper-anxit, l'autisme infantile et
les TDHA. Du fait des caractristiques spcifiques lies au vieillissement normal, les
classifications de l'adulte prsente prsentent des limites mthodologiques,
puisqu'elles n'ont pas t valides spcifiquement pour ces populations. De plus,
l'valuation syndromique est toujours source de difficults lorsque le patient (quelque
soit son ge) prsente des atteintes neurobiologiques conjointement un trouble
psychopathologique. Ce niveau relverait d'une approche dite athorique, selon,
certains auteurs. (2,5 points)
Le niveau comportemental correspond, par dfinition, ce qui est directement
observable. Il est fond sur l'tude et l'observation des conduites, des
comportements et des attitudes du sujet. Il distingue les comportements externaliss
(par exemple, agitation ou ralentissement moteur) des comportements internaliss
(par exemple, attitude de repli). Bouvard (1996) met une rserve quant
l'utilisation de ce niveau de mesure : selon l'auteur, le niveau comportemental n'est
pas superposable au niveau syndromique dcrit plus haut. En effet, s'il est cens tre

36

Solution des exercices

plus objectif (ce qui reste encore dmontrer), il manque de spcificit : en


effet, un mme type de comportements peut correspondre des entits
syndromiques diffrentes. Il prconise donc que les outils cliniques privilgiant
l'tude du niveau comportemental ne doivent pas tre utiliss comme critres
diagnostiques. Ce ne peut tre que des aides au diagnostic psychiatrique et/ou
psychopathologique. (2,5 points)
Le niveau tiologique est reprsent, l'heure actuelle, par un seul rfrentiel
thorique, la psychanalyse. Il permet de formuler, seulement partir du discours
explicite et implicite du patient, des hypothses cliniques sur son fonctionnement
mental , interne, c'est--dire son fonctionnement psychique. Il a t labor par
Freud et ses successeurs. La thorie psychanalytique est une thorie tiologique des
troubles psychopathologiques. Elle a donn lieu un classement spcifique des
troubles en trois grandes catgories : la psychose, la nvrose (dcrites comme des
structures psychiques) et les tats-limites (dcrits comme des organisations
psychiques). Ce classement est reprsent essentiellement par les psychologues
cliniciens europens, opposs la description comportementale des troubles, plutt
d'origine nord-amricaine. (2,5 points)
Conclusion
Ces trois niveaux de mesure dcrivent et recensent les outils les plus communment
utiliss par les psychologues cliniciens en Occident. On peut remarquer que les
fondements thoriques de chacun des trois niveaux de mesure sont diffrents, le
niveau syndromique affichant une volont d'exhaustivit en tentant de dcrire la
totalit des troubles (y compris les troubles culturellement dpendants). C'est
galement le cas pour le niveau tiologique reprsent par la psychanalyse, qui
propose d'tendre sa classification tous les ges de la vie (y compris les ges de
dveloppement extrme que sont l'enfance et la vieillesse). Ces deux dernires
propositions posent des problmes de mthode de construction et de validation des
outils de mesure en psychologie clinique, encore non rsolus. (1 point)

> Solution n7 (exercice p. 26)


Introduction
L'valuation standardise en psychologie clinique, comme toute mthode
d'valuation, a ses biais et ses limites. Les deux sources de biais de l'valuation
standardise, hormis les limites culturelles, sont le choix du rfrentiel thorique du
psychologue et le choix des sujets. Nous allons dvelopper ces deux points (1 point)
Dveloppement
La plus importante, au del des diffrences individuelles dues la personne mme du
psychologue, est la formation thorique et pratique du psychologue valuateur, qui
influence d'une part le choix et l'exprience des outils d'valuation, donc le choix des
concepts thoriques et d'autre part, l'observation et l'identification des symptmes.
Ces constatations auront pour consquences de modifier la description des troubles
psychopathologiques faite par le psychologue.
Le choix des sujets est galement source de biais au cours de l'valuation des
troubles. L'talonnage des groupes de sujets est l'une des variables importantes
prendre en compte. La validit des rsultats peut tre modifie en fonction du choix
des groupes de sujets. Si le groupe n'a pas t talonn pour le fonctionnement du
sujet valu, l'outil ne sera pas pertinent.
Par ailleurs, les rsultats peuvent galement varier chez un mme patient en fonction
des variations nycthmrales. On observe galement des erreurs de contraste
(notamment lors de passation et cotation entre deux patients), des surestimations ou
des sous-estimations de la gravit des symptmes, des effets de halo (note

37

Solution des exercices

similaire), de proximit (note voisine) ou des tendances centrales (note moyenne


donne l'ensemble des symptmes).
Enfin, la mthode d'valuation elle-mme peut influencer la smiologie des troubles,
puisqu'on sait que chaque mthode produit des catgories spcifiques de symptmes
ou de syndromes : c'est une sorte de point aveugle de chaque mthode
d'valuation. (4 points)
Conclusion
La formation technique et thorique des psychologues cliniciens la pratique des
outils d'valuation, l'attention porte aux biais mthodologiques en termes
d'quivalence culturelle ou non, la rflexion en amont sur les ventuels bnfices
pour un patient d'une valuation standardise sont des pralables indispensables
l'utilisation des mthodes (ou des outils, des techniques) d'valuation en psychologie
clinique.
D'autre part, c'est la situation d'valuation elle-mme qui produit ces biais : une
situation d'valuation standardise ne serait donc pas plus objective qu'une situation
d'valuation non standardise. Cette dernire est simplement moins reproductible
l'identique. C'est donc bien le rfrentiel thorique du psychologue qui lui impose de
standardiser, ou non, la situation d'valuation clinique d'un patient, la relation
clinique tant le paramtre le moins sujet une standardisation quelconque. (2
points)

38

Glossaire

"Age Mental" de Binet


La notion "d'Age Mental" de Binet (1911, "Les ides modernes sur les enfants", Paris,
Flammarion, rdit en 1973, p.16) : L'ide directrice de cette mesure a t la
suivante : imaginer un grand nombre d'preuves, la fois rapides et prcises et
prsentant une difficult croissante ; essayer ces preuves sur un grand nombre
d'enfants d'ge diffrent ; noter les rsultats ; chercher quelles sont les preuves qui
russissent pour un ge donn et que les enfants plus jeunes, ne serait-ce que d'un
an, sont incapables en moyenne de russir ; constituer aussi une chelle mtrique de
l'intelligence qui permet de dterminer si un sujet donn a l'intelligence de son ge,
ou bien est en retard ou en avance, et combien de mois ou d'annes se monte ce
retard ou cette avance .
Adolphe Meyer (1866-1950)
Adolphe Meyer (1866-1950), neurologue et neuropathologiste suisse ayant migr
aux USA, a conu les troubles mentaux comme des modes de raction diverses
situations. Il est l'inventeur du modle thorique psycho-biologique des troubles
psychopathologiques.
Mthode psychomtrique et mthode des tests
Nous nous efforcerons, dans la suite du cours, de distinguer l'une ou l'autre de ces
expressions, la premire dsignant le plus souvent les outils psychomtriques, et la
seconde, les outils projectifs.
Validit concourante
Guelfi, Gaillac et Dardennes (1995, Psychopathologie quantitative, Paris, Masson)
voquent galement la validit concourante : les rsultats permettent, ou non, une
estimation d'un comportement actuel et la validit de contenu : les rsultats
l'preuve sont, ou non, expliqus, interprtables psychologiquement.
Validit des mesures
Voir ci-dessous la dfinition de la validit d'un test.

39

Rfrences

[Hermann Rorschach]

Son pre tait peintre et professeur de dessin. Hermann Rorschach


est mort en 1922 d'une pritonite tardivement diagnostique.

[Hermann Rorschach]

Rorschach fit imprimer, parmi 15 tches, les 10 tches qu'il utilisait


le plus souvent. En rduisant la taille des planches, l'imprimeur
modifia les couleurs, en rduisant les diffrences d'intensit.
Rorschach conserva cette modification du test et thorisa ce nouvel
apport pour crer un nouveau critre de cotation, l'estompage. Pour
plus de prcisions sur la mthodologie de construction du test de
Rorschach, se reporter au chapitre 3.

[Le niveau
syndromique]

Par exemple, dans les classifications internationales telles que le


DSM Diagnostic Statistical Manuel ou la CIM Classification
Internationale des Maladies.

[Moor]

Cit par Delay et Pichot, 1965, Psychologie, Paris, Masson, p.24.

[S. Ionescu (1991)]

Ionescu S., 1991, Quatorze approches de la psychothrapie, Paris,


Armand Colin, 3ime d. 2005 : l'auteur rapporte des rsultats
d'valuation au MMPI Inventaire Multiphasique de Personnalit du
Minesota chez des sujets appartenant diffrentes groupes
ethniques minoritaires vivant aux USA. L'chelle de schizophrnie
montre des rsultats constants lgrement plus levs que le seuil
dfini pour la population majoritaire.

[Sir Francis Galton]

Pour plus de prcisions, voir l'article d'Olivier Martin, 2008, Francis


Galton (1822-1911), l'obsession de la mesure, http://le-cerclepsy.scienceshumaines.com

[Validit prdictive]

Guelfi, Gaillac et Dardennes (1995, Psychopathologie quantitative,


Paris, Masson) voquent galement la validit concourante : les
rsultats permettent, ou non, une estimation d'un comportement
actuel et la validit de contenu : les rsultats l'preuve sont, ou
non, expliqus, interprtables psychologiquement.

41

Bibliographie

[Bouvard (2005)] BOUVARD M., COTTRAUX J., 2005, Protocoles et chelles d'valuation en psychiatrie
et en psychologie, Paris, Masson.
[Derogatis et Dellapietra] DEROGATIS, L.R. & DELLAPIETRA, L., 1994, "Psychological tests in
screening for psychiatric disorder",.In M. Maruish (Ed.), Psychological Testing in Treatment Planning and
Outcomes Assessment. New York, Lawrence Earlbaum Associates.
[Fombonne E. et Fuhrer R., 1991] FOMBONNE E. ET FURER R., 1991, Sensibilit, spcificit et valeurs
prdictives des moyens d'valuation en psychiatrie , in Revue L'encphale, XVII : 73-7.
[Kemps] KEMPS E.J., 1914, The behavior chart in mental diseases , in American Journal of Insanity,
7, 761-772.
[Reuchlin Maurice] REUCHLIN M., Psychologie, Paris, PUF, 1977.
[Vica Shentoub] SCHENTOUB VICA
psychanalytique, Paris, Dunod, 1990.

ET

COLL.,

1957, Manuel d'utilisation du TAT. Approche

43