Vous êtes sur la page 1sur 17

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/324603474

La psychométrie : la recherche et l’évaluation des compétences qui


caractérisent l’’intelligence.

Chapter · April 2005

CITATIONS READS

2 7,506

1 author:

Jacques Juhel
Université de Rennes 2
88 PUBLICATIONS 963 CITATIONS

SEE PROFILE

All content following this page was uploaded by Jacques Juhel on 19 April 2018.

The user has requested enhancement of the downloaded file.


L’intelligence 1/16

Chapitre 1

La psychométrie : la recherche et l’évaluation


des compétences qui caractérisent
l’intelligence∗

L’intérêt porté par les psychologues à l’intelligence humaine est aussi vieux que
la psychologie elle-même, les points de vue sur l’intelligence, ses formes et l’origine
des différences entre individus aussi contrastés que les polémiques féroces. Dans des
sociétés où l’égalité des opportunités offertes à l’être humain est encouragée, la
question des différences individuelles dans le domaine de l’intelligence est
évidemment très sensible. L’intelligence est d’abord une notion commune saturée de
pré-supposés idéologiques, porteuse de valeurs et de préjugés sociaux avant d’être
l’objet d’étude que le psychologue choisit de caractériser par un ensemble de
comportements. Sans doute n’est-il pas inutile de rappeler que le projet
d’objectivation des différences entre individus dans le domaine de l’intelligence,
projet né en Angleterre à la fin du 19ème siècle, reposait à l’origine sur une
conception héréditariste de l’intelligence et s’inscrivait plus largement dans le
mouvement eugéniste. Il faut aussi savoir que les tests d’intelligence tels que nous
les connaissons aujourd’hui ont été élaborés en réponse à des demandes sociales
d’évaluation, initialement en France pour juger du niveau d’adaptation scolaire
d’élèves en difficulté, quelques années plus tard aux Etats-Unis pour sélectionner les
recrues lors de la première guerre mondiale ou à des fins d’orientation
professionnelle. L’esprit dans lequel ces tests ont été construits, leurs fondements


Chapitre rédigé par Jacques JUHEL [Juhel, J. (2005). La psychométrie : la recherche et
l’évaluation des compétences qui caractérisent l’intelligence. In J. Lautrey et J.-F. Richard
(Eds.), L’intelligence (pp. 23-39). Traité des sciences cognitives. Paris : Hermès Science.]
L’intelligence - 2/16

conceptuels validés et leur valeur pronostique éprouvée, a donc nécessairement subi


l’influence du contexte intellectuel et social de l’époque. L’histoire sociale et
politique du mouvement de testing de l’intelligence en Grande-Bretagne et aux
Etats-Unis notamment est ainsi pleine d’exemples qui témoignent de l’exploitation
contestable, parfois inacceptable, qui a pu être faite de l’objectivation à l’aide de
tests des différences entre individus dans le domaine de l’intelligence. Enfin, le
succès considérable remporté par les tests d’intelligence et la notion de quotient
intellectuel (QI) a très largement contribué à la diffusion dans le grand public d’une
vision relativement monolithique, figée et déterministe de l’intelligence. Il n’est
donc pas étonnant que les débats sur la mesure de l’intelligence et ses implications
sociales, sur la modifiabilité de l’intelligence mesurée par les tests ou sur les facteurs
génétiques à l’origine des différences d’efficience intellectuelle aient pris des
proportions considérables au sein et à l’extérieur de la communauté scientifique1.

Ces quelques éléments brièvement évoqués aideront à mieux comprendre


pourquoi l’approche psychométrique de l’intelligence, le domaine de la psychologie
qui a trait à la mesure et l’organisation des comportements qui caractérisent
l’intelligence, a occupé jusqu’aux années 60 une position à la fois prééminente et
très contestée en psychologie appliquée. Bien que les points de vue sur la question
de l’intelligence aient largement évolué depuis, la place qui est encore celle des tests
d’efficience intellectuelle dans les procédures d’évaluation montre que le constat
explicite et systématisé qu’ils permettent d’effectuer présente toujours un intérêt
pratique (Grégoire, 2000, 2004 ). Nous rappellerons à ce sujet que l’approche
psychométrique de l’intelligence a d’abord légué à la psychologie une procédure
originale de construction d’instruments permettant de mesurer certains aspects de
l’efficience intellectuelle. Nous verrons aussi qu’elle est à l’origine du
développement de méthodes corrélationnelles permettant de résumer les différences
de performance observées aux tests sous forme de variables non observables
directement, de décrire l’organisation de ces « sources de variation » hypothétiques
et, plus récemment, d’identifier parmi les différents schémas d’organisation mis à
l’épreuve, la représentation la plus compatible avec l’organisation des données
recueillies. Nous préciserons alors quelles hypothèses ont été faites sur la base de
ces descriptions psychologiques pour rendre compte des différences de performance
observées dans les tests avant d’évoquer quelques propositions théoriques qui
encouragent à dépasser le cadre trop restrictif de l’approche psychométrique de
l’intelligence.
1
Un célèbre exemple de controverse est celle qui a suivi la publication en 1969 d’un article de Jensen
concluant que : a) les tests d’intelligence montrent que les Noirs ont un QI moyen inférieur à celui des
Blancs, b) les races existent et sont génétiquement distinctes ; c) les différences d’intelligence sont
génétiques à 80% et sont donc peu modifiables par l’éducation ou l’élévation du niveau social. Bien que
de nombreux arguments scientifiques conduisent à réfuter cette thèse (par ex., Gould, 1983 ; Kamin,
1974 ; Montagu, 1975, 1999), la querelle renaît périodiquement. La parution en 1996 du livre de
Hernnstein et Murray, des épigones de Jensen dont le point de vue n’a guère évolué (Jensen, 1998), a une
nouvelle fois suscité de très vives réactions de la communauté scientifique.
L’intelligence 3/16

1.1. La question de la mesure des différences individuelles dans le domaine de


l’intelligence

1.1.1. La dépendance entre conception et opérationnalisation de l’intelligence

La notion d’intelligence est une abstraction qui trouve son origine dans des
croyances qui sont à la base de notre compréhension du monde. L’emploi du terme
dans l’usage courant suggère que certains individus semblent se comporter de façon
plus « intelligente » que d’autres dans un large ensemble de situations de la vie
quotidienne, scolaire ou professionnelle. L’idée, parfois contestée par certains
auteurs2, que des aspects caractéristiques de l’activité intellectuelle puissent être
mesurés en découle donc. Là s’arrête le consensus car les tentatives effectuées pour
aboutir à une caractérisation plus précise de ce qu’est l’intelligence n’ont jamais
rencontré beaucoup de succès. L’exemple le plus récent nous est fourni par le
rapport d’experts réunis il y a une dizaine d’années à l’initiative de l’Association
Américaine de Psychologie. On y lit en effet que « les concepts d’"intelligence" sont
des tentatives faites pour clarifier et organiser un ensemble complexe de
phénomènes et qu’aucune conceptualisation ne recueille un assentiment général3 »
(Neisser et al., 1996, p. 77). Par quels moyens est-on alors parvenu à mesurer un tel
complexe de comportements intelligents?

Les efforts accomplis par les psychométriciens pour mesurer les différences
comportementales dans le domaine de l’intelligence ont très tôt été guidés par l’idée
que l’intelligence était une propriété individuelle dont certains aspects pouvaient être
quantifiés. La relation entre les comportements –plus ou moins- intelligents et une
propriété possédée à des degrés divers par les individus n’a cependant pas le
caractère de celle qui existe, par exemple, entre le mouvement de l’aiguille de la
balance et la masse de l’objet pesé. Le concept d’intelligence, comme l’explique
Reuchlin (1962), ne peut en effet être connu qu’au travers de l’instrument de mesure
dont les caractéristiques dépendent de la représentation initialement invoquée de la
notion. Le psychologue ajoute-t-il doit donc d’abord se servir de ses méthodes pour
les fonder et en justifier les étapes « primitives ». Les premières tentatives de mesure
de l’intelligence autour des années 1900 illustrent bien cette dépendance mutuelle.

2
Ceux qui pensent notamment que les sciences empiriques ne peuvent pas répondre à toutes les questions
intelligibles comme par exemple Rose (1998), un neurobiologiste qui conteste qu’on puisse quantifier
correctement un caractère global ou Best (2000), un philosophe qui estime que la notion d’intelligence,
comme celle d’amour ou de vanité, est au-delà de toute exploration scientifique.
3
La définition retenue est la suivante : « Les individus diffèrent les uns des autres dans leur capacité à
comprendre des idées complexes, à s’adapter effectivement à leur environnement, à apprendre de leurs
expériences, à mettre en œuvre des formes variées de raisonnement, à franchir certains obstacles à l’aide
d’outils de pensée. »
L’intelligence - 4/16

L’Anglais Galton pense que l’intelligence est une propriété physiologique


fonction de l’efficience neurale, que les variations dans ce domaine sont héréditaires
et que le statut social est un bon critère externe de l’intelligence. Il fait donc appel à
des mesures anthropométriques, chronométriques et sensorielles pour mesurer
l’intelligence. L’observation par Wissler4 en 1901 de corrélations5 peu cohérentes
(de –0,29 à 0,39) entre les mesures de seuils sensoriels et le niveau académique
d’étudiants d’une vingtaine d’années montrera très tôt les limites de ce programme
de recherches.

Binet va réussir quelques années plus tard là où l'approche sensorielle a


démontré son inefficacité. Binet s’intéresse en effet à l’intelligence en voie de
développement, une intelligence qu’il définit en termes de « compréhension,
invention, direction et censure » (1911, p. 109) et dont il défend l’éducabilité et
l’extensibilité. L'originalité de Binet tient à sa proposition de situer sur une même
échelle différents niveaux d'intelligence qu’il propose de déterminer à l'aide
d'épreuves dont le niveau de difficulté varie avec l'âge. Le dispositif qu’il élabore en
1905 avec Simon, l’Echelle Métrique de l’Intelligence (EMI), vise ainsi à évaluer
l’efficience de processus supérieurs et le niveau d’assimilation des connaissances
culturelles de l’enfant. Le principe fondateur de cette opération de mesure est que le
niveau de complexité des problèmes que les enfants peuvent résoudre est - en
moyenne - fonction de leur âge. Le niveau des problèmes qu’un enfant peut résoudre
peut ainsi être situé du point de vue de l’âge moyen auquel ces problèmes sont
d’habitude résolus. Ceci permet de définir l’âge mental auquel correspond le
comportement de l’enfant, de comparer son âge chronologique à cet âge mental, et
de diagnostiquer ainsi d’éventuels retards ou avances du développement intellectuel.

On distingue clairement ici deux grandes opérationnalisations l’une et l’autre


étroitement dépendantes d’une certaine conception de l’intelligence. Galton cherche
à mesurer par l’efficience de processus très élémentaires une intelligence-trait qu’il
pense être à l’origine des variations qu’il observe dans les comportements
complexes, sans se préoccuper d’en décrire les mécanismes ni d’en élaborer la
signification. Binet veut apprécier l’intelligence en activité et évaluer globalement
l’efficacité des processus supérieurs, déplore qu’on puisse réduire celle-ci à une

4
Wissler était un doctorant de James McKeen Cattell, fervent Galtonnien. Les résultats « décevants » de
sa thèse firent un tel tapage qu’il préféra s’orienter vers l’anthropologie…
5
La corrélation linéaire entre deux variables qui permettent de différencier un même ensemble
d’individus (de les ordonner les uns par rapport aux autres) est une estimation du degré de ressemblance
des différenciations observées. La corrélation linéaire varie entre -1 et 1. Elle est de 1 lorsque les deux
différenciations sont identiques ou parallèles (par ex., 1,2,3 et 1,2,3 ; 1,2,3 et 2,4,6) et de –1 lorsqu’elles
sont inversement parallèles (par ex., 1,2,3 et 3,2,1). Elle est de 0 lorsque les deux différenciations sont
sans relation ou « orthogonales ».
L’intelligence 5/16

simple mesure quantitative et ne cherche qu’une méthode simple et pratique de


classement hiérarchique des individus le long d’une échelle développementale.

1.1.2. Le concept d’intelligence est façonné par l’opération de mesure

Les méthodes statistiques utilisées pour situer des comportements intelligents sur
une échelle numérique imposent un certain type de relation mathématique entre le
nombre et l’intelligence, le trait latent non observable directement dont on pré-
suppose l’existence. Ces méthodes ne sont donc pas neutres et entretiennent par le
fait même une certaine relation avec la théorie psychologique qui rend compte de
l’organisation des données empiriques. Elles peuvent même être employées de
manière absolue et servir de théorie par défaut. La conception « structurale » de
l’intelligence qui prédominera jusqu’aux années 70 a été ainsi façonnée par un
modèle de mesure inventé par Spearman en 1904.

Spearman est à la recherche d’un grand principe organisateur des différences


individuelles dans le domaine de l’intelligence, principe dont il n’a qu’une assez
vague idée mais qu’il souhaite « mesurer objectivement ». Il s’agit écrit-il de
déterminer « les tendances psychiques produites par la communauté de l’organisme
qui connectent les "tests mentaux" [les tâches de laboratoire] aux activités
psychiques plus générales et d’un plus grand intérêt » (1904, p. 205). Spearman
effectue pour cela des mesures de seuils différentiels dans diverses modalités
sensorielles sur plusieurs groupes d’écoliers chez qui il recueille toute une série
d’observations (notes scolaires, différence absolue entre rang scolaire et classement
en fonction de l’âge, jugement porté par les maîtres sur les compétences scolaires ou
par l’élève le plus âgé sur le bon sens hors domaine scolaire de ses camarades).
Spearman note d’abord une tendance à l’homogénéité des performances des
écoliers ; les meilleurs en latin, en français ou en anglais tendent aussi à être les
meilleurs dans les autres matières (the positive manifold). Il remarque également
qu’en rangeant les coefficients de corrélation entre tests en fonction de leur
amplitude, ces coefficients s’organisent hiérarchiquement c’est-à-dire décroissent
horizontalement et verticalement à partir de la diagonale, du sommet gauche (la
corrélation la plus élevée) au coin droit (la plus faible) de la matrice de corrélations
(the monotonicity check). Spearman met alors au point une méthode d’analyse,
l’analyse factorielle, qui permet d’estimer la fonction psychologique recherchée.
L’amplitude des corrélations désatténuées6 entre les indicateurs sensoriels d’une
part, les diverses estimations de l’intelligence d’autre part, le conduit d’abord à
distinguer une fonction sensorielle générale d’une fonction intellectuelle générale
(General Intelligence). Ses calculs montrant que la valeur estimée de la corrélation

6
Spearman a développé une formule de correction des corrélations observées afin de tenir compte des
erreurs de mesure.
L’intelligence - 6/16

entre ces deux fonctions est très proche de 1, Spearman conclut à l’existence d’une
« fonction fondamentale commune (ou d’un groupe de fonctions) saturant à des
degrés différents toutes les branches de l’activité intellectuelle » (p. 272).
L’invention d’une méthode statistique d’estimation de variables psychologiques non
directement mesurables permet ici à Spearman d’affirmer que les diverses formes
d’activité mentale sont sous la dépendance d’une fonction centrale ou facteur
d’intelligence générale. Mais ce facteur g, quelle qu’en soit la portée opératoire ou
prédictive, est aussi une propriété fonctionnelle des contraintes de mesure de
l’analyse quantitative particulière mise en œuvre par son concepteur.

1.1.3. Le processus d’instrumentalisation tend à figer le concept d’intelligence

Les psychologues américains ont été les premiers à traduire l’Echelle Métrique
de Binet-Simon pour l’adapter à leur usage7 et quantifier la performance en
remplaçant la notion de niveau mental par celle de Quotient Intellectuel8. Le
Stanford-Binet Test, rapidement très employé chez l’enfant, devint un standard qui
influença profondément les constructeurs des tests collectifs et individuels élaborés
ensuite. Les tests furent ainsi standardisés selon des principes d’uniformité des
conditions d’observation et d’interprétation des résultats en référence à des
observations faites sur une population donnée (l’« étalonnage » du test). Diverses
techniques furent mises au point pour parvenir à estimer la fidélité, la sensibilité, la
stabilité et la validité des mesures effectuées. Mais les tests furent développés avant
tout dans une perspective pragmatique, du seul point de vue de leur validité de
mesure (par ex., en veillant à ce qu’ils différencient correctement les individus ou en
faisant évoluer leur contenu interne en fonction de leur capacité à prédire un critère
externe) plutôt qu’en fonction de considérations théoriques. Le QI devint ainsi par
construction un indicateur global d’efficience intellectuelle (par ex., de moyenne
100 pour un écart-type de 15 dans les échelles de Wechsler publiées en 1958) et un
des meilleurs prédicteurs des apprentissages scolaires et des performances
professionnelles.

Le succès de ce processus d’instrumentalisation n’a cependant pas été sans


conséquences. La conception de l’intelligence ayant présidé à la construction de
l’Echelle Métrique a été remplacée par une vision naturaliste et statique de
l’intelligence. L’intelligence mesurée s’est ainsi trouvée enfermée dans une
tautologie dans laquelle les variations de performance aux tests sont devenues ce par
quoi était désormais définie conventionnellement l’intelligence humaine.

7
Les items de l’Echelle Métrique ont été traduits par l’Américain Goddard en 1911, l’Echelle Métrique a
ensuite été adaptée par Terman en 1916 (Stanford-Binet Test).
8 âge mental
QI = ×100 .
âge chronologi que
L’intelligence 7/16

1.2. L’identification des dimensions de l’intelligence et la description de leur


organisation

1.2.1. L’analyse factorielle comme instrument de recherche

Dès son invention, l’analyse factorielle a été considérée par les psychométriciens
comme l’instrument permettant d’identifier les dimensions de l’intelligence à partir
des relations observées entre tests. Celle-ci va beaucoup évoluer au plan technique
(Reuchlin, 2003) sous l’influence notamment de Thurstone (1938). Celui-ci doute en
effet de l’existence d’un facteur général. Il fait au contraire l'hypothèse d'une
diversité de types d’intelligence et cherche à identifier des facteurs indépendants les
uns des autres (les « vecteurs de l’esprit ») à l’aide d’une méthode qui généralise le
modèle de Spearman à un modèle à plusieurs facteurs. Cette méthode d’analyse
multifactorielle repose sur la recherche d’une « structure simple » c’est-à-dire d’une
structure dans laquelle les saturations9 des facteurs sur les tests sont toutes positives.
La solution factorielle est obtenue par « rotation » des axes c’est-à-dire en faisant
pivoter les facteurs afin de mieux représenter les groupes de tests ; elle est le résultat
de l’application d’un critère objectif de redistribution de l’information analysée par
rapport à des facteurs posés indépendants les uns des autres (le critère varimax).
L’émergence d’un facteur dans une telle représentation traduit ainsi l’existence
d’une propriété commune à plusieurs tests –une même façon de différencier les
individus- que d’autres tests ne partagent pas. Plusieurs tests, par exemple de
raisonnement logique, peuvent partager une même et unique façon de différencier
les individus (facteur raisonnement) ; des tests de compréhension verbale peuvent
réfléchir une autre dimension commune de variation humaine (facteur verbal).
Thurstone sera cependant amené à relâcher la contrainte d’orthogonalité entre
facteurs de 1er ordre, à faire l’hypothèse de facteurs « obliques » (c’est-à-dire
corrélés entre eux), pour rendre son modèle plus compatible avec l’organisation des
données.

CT V RF PV A D
Compréhension de Texte 1,000
Vocabulaire 0,614 1,000
Reproduction de Figures 0,156 0,217 1,000
Perception Visuelle 0,084 0,203 0,435 1,000
Addition 0,145 0,132 0,174 0,168 1,000
Dénombrement 0,198 0,200 0,087 0,156 0,670 1,000

Tableau 1.1. Corrélations observées entre 6 tests.

Voici par exemple les corrélations observées entre 6 tests mesurant l’activité
mentale dans les domaines verbal (CT : Compréhension de Texte ; V : Vocabulaire),
9
Les saturations sont les corrélations désatténuées entre facteurs et tests.
L’intelligence - 8/16

numérique (A : Addition ; D : Dénombrement) et visuo-spatial (RF : Reproduction


de Figures ; PV : Perception Visuelle).

a) g

0,50 0,
0,5 60
4

0,37
0,5

0,3
8

CT V RF PV A D

uCT = 0,75 uV = 0,71 uRF = 0, 86 uPV = 0,87 uA = 0,66 uD = 0,64

b)

V V-S N
0,77

0,7

0,64

0,80

0,8
0,6
7

1
4

CT V RF PV A D

u’CT = 0,41 u’ V = 0,41 u’ RF = 0,59 u’ PV = 0,59 u' A = 0,36 u'D = 0,34

c)
V V-S N
V 1,00
V-S 0,26 1,00
N 0,27 0,32 1,00

Figure 1.1. Solutions factorielles à 1 facteur général (a) et 3 facteurs orthogonaux (b). Les
tests sont représentés dans des carrés, les facteurs dans des cercles. Les estimations sont les
saturations des facteurs sur les tests et les variances uniques (u, u’) (les saturations
inférieures à 0,30 ne sont pas présentées). En c), les corrélations entre facteurs de 1er ordre
dans le modèle à 3 facteurs obliques.

La figure 1.1 présente deux solutions factorielles obtenues en appliquant le


modèle d’analyse en facteurs communs à la matrice de corrélations. La première
solution correspond au modèle de Spearman. On impose l’existence de 3 facteurs de
1er ordre orthogonaux dans la solution b). Le principe de l’analyse est de chercher à
décomposer l’information liée à chaque test (la variance du test) en deux
composantes. La première composante est la communauté du test ou degré de
ressemblance entre la différenciation produite par le test et celle que réfléchit le
facteur commun (la variance commune). La seconde composante est la variance
unique du test, sa part de variance sans relation avec celle d’autres tests. Les
L’intelligence 9/16

estimations fournies par chacun des modèles hypothétiques peuvent être comprises
de la manière suivante. Un test possède d’autant plus de variance en commun avec
l’ensemble des tests dont le facteur réfléchit la différenciation -il mesure d’autant
mieux le facteur-, que la saturation du facteur sur le test est proche de 1 ou que
l’unicité du test est proche de 0. Dans le premier modèle et sur cet échantillon, D, A
et V sont les tests qui mesurent le mieux le facteur général (saturations de 0,60,
0,58 et 0,54 ; unicités de 64, 66 et 71%). Les estimations sont évidemment
différentes dans le modèle à 3 facteurs orthogonaux : D est un bon indicateur d’un
facteur de 1er ordre « numérique» (saturation de 0,81) quand V est une bonne mesure
d’un facteur « verbal » (saturation de 0,77). Les unicités sont en outre nettement plus
faibles que dans le modèle unifactoriel. Enfin, l’observation de corrélations entre
facteurs de 1er ordre (c) suggère l’existence d’un facteur d’ordre supérieur. En
comparaison à la solution unifactorielle, la solution multifactorielle laisse donc un
plus faible pourcentage de variance « inexpliqué » par les facteurs. Elle semble
mieux reconstituer les corrélations entre tests.

La généralisation de l’analyse factorielle de second ordre et le développement


des méthodes de modélisation structurale marqueront une autre étape importante de
l’évolution de l’analyse factorielle. Les progrès effectués au plan méthodologique
offriront en particulier la possibilité de comparer différents modèles spécifiés a
priori10 dans une démarche « restrictive », d’évaluer le gain d’ajustement apporté par
le relâchement d’une contrainte donnée grâce aux indices fournis par les
programmes de modélisation structurale. En permettant de trancher en faveur d’une
représentation plutôt que d’une autre, ils contribueront donc à éclairer la question de
l’organisation des dimensions de l’intelligence.

Que penser alors des critiques de ceux qui comme Gould (1983) estiment que la
faiblesse conceptuelle de l’analyse factorielle réside dans la tendance à réifier
l’intelligence et les aptitudes intellectuelles, à en faire des entités possédant une
existence propre ? Réifier les facteurs est effectivement une erreur et aucune
hypothèse expliquant les variations comportementales observées ne peut être mise à
l’épreuve avec l’analyse factorielle. Les réponses apportées n’ont également aucun
caractère absolu. Elles permettent néanmoins de conjecturer l’existence de
propriétés non observées directement à partir des relations entre tests et inspirent à
ce titre des pistes de recherche et des hypothèses que le psychologue peut tester. On
a aussi souvent reproché à l’analyse factorielle de pouvoir générer plusieurs
structures capables de rendre compte de l’organisation des corrélations entre tests.
Bien que les différences entre solutions factorielles soient parfois minimes, cette
critique est aujourd’hui sans fondement grâce aux techniques de modélisation
structurale dont on dispose désormais. Mais il va de soi que de simples critères

10
Des modèles faisant par exemple l’hypothèse d’un nombre plus important de facteurs, de facteurs
corrélés, de plusieurs facteurs d’ordre supérieur, etc.
L’intelligence - 10/16

d’ajustement ne suffisent pas en eux-mêmes et qu’ils ne remplacent pas les


hypothèses théoriques du chercheur. Le problème est donc moins de discuter l’utilité
de l’analyse factorielle que les conditions qui en font l’utilité dans l’identification
des dimensions de l’intelligence et l’étude de leur organisation.

1.2.2. Comment s’organisent les différences dans le domaine de l’intelligence ?

Le niveau de performance de chaque individu est-il à peu près équivalent d’un


test d’intelligence à un autre ou existe-t-il des domaines d’efficience relativement
indépendants les uns des autres ? Autrement dit, peut-on parler de l’intelligence au
singulier ou celle-ci est-elle plurielle ? Ces deux points de vue situés à des pôles
extrêmes explicitement associés à des opinions sociales se sont longtemps opposés
avant qu’on ne démontre qu’ils sont l’un et l’autre compatibles avec une même
conception hiérarchique des facteurs de l’intelligence (Vernon, 1950).

La réponse à cette question dépend en effet entièrement du niveau d’observation


et d’analyse choisi. L’objectif peut être de décrire la performance d’individus à un
niveau primaire correspondant par exemple à des tests de vitesse perceptive,
d’aptitude verbale ou d’aptitude numérique. Il peut tout aussi bien être d’obtenir une
approximation satisfaisante du niveau général de performance en utilisant des tests
de raisonnement abstrait (matrices de Raven11, complétion de séries, analogies). Le
choix des tests administrés à un échantillon donné d’individus détermine donc
l’organisation des variations observées et la structure de facteurs qui en rend
compte. La « carte des tests » de la figure 1.2 (un cône vu de dessus) illustre ce
point. Quelques tests parmi les plus fréquemment utilisés pour mesurer l’intelligence
et les aptitudes intellectuelles chez l’adolescent ou l’adulte sont ici localisés en
fonction de leur similitude à différencier les individus. Ces tests se répartissent selon
le domaine de réalité qu’ils indexent, dans cet exemple les domaines verbal, spatial
et numérique. De plus, leur position dans la hiérarchie dépend de leur niveau de
complexité. Les tests faciles pour lesquels seule compte la vitesse de réalisation sont
donc situés à la base du cône. Les tests plus complexes pour lesquels prime la
puissance de raisonnement sont localisés au contraire vers le sommet.
L’organisation des relations entre tests explorant des contenus différents, situés
plutôt vers la base et à la périphérie du cône, risque ainsi d’être mieux résumée par
plusieurs groupes de tests (en gris clair) que par un seul. A l’opposé, si les tests
utilisés se situent plutôt vers le sommet et donc vers le centre de la représentation,
l’organisation sous-jacente risque d’être mieux décrite par un seul groupe de tests
(en gris foncé) plutôt que par plusieurs.

11
On présente dans ce test « non-verbal » des tableaux composés de dessins organisés en lignes et en
colonnes. Ces dessins varient d’une ligne et d’une colonne à une autre selon des lois qu’il faut identifier.
L’intelligence 11/16

Addition
Multiplication
Soustraction
Division
Jugement numérique

Empans Comparaison
de chiffres, Raisonnement numérique de chiffres
de lettres Série de nombres de symboles
de figures identiques

Analogies de nombres

Voc. Voc. Série de Matrices Développement Reconstruction Rotation


Anagrammes
reconn. déf. lettres de Raven de surfaces de formes mentale

Analogies
Formation verbales Analogies
de concepts géométriques
Compréhension Assemblage
à l’écoute mécanique
d’un texte Cubes de Kohs

Rappel de Assemblage
paragraphe d’objets
Complétion
Compréhension d’images
de lecture

Figure 1.2. Représentation « en cône » d’un ensemble fini de tests d’intelligence (d’après
Snow et Lohman, 1989).

Les modèles hiérarchiques contemporains de l’intelligence psychométrique


formalisent les idées précédentes. Gustafsson (1984) emploie l’analyse factorielle
restrictive pour décrire les relations observées entre une vingtaine de tests mesurant
dix facteurs de 1er ordre. Il démontre que l’hypothèse de 3 facteurs de niveau
intermédiaire permet de rendre correctement compte des corrélations observées
entre les facteurs de 1er ordre. Ces facteurs de 2nd ordre, déjà identifiés
antérieurement par Raymond Cattell (Horn et Cattell, 1966) sont : a) l'intelligence
« fluide » (gf) qui regroupe des facteurs primaires de raisonnement inductif et
déductif, de mémoire et de capacité à effectuer des inférences logiques ; b)
l’intelligence « cristallisée » (gc) associée aux aptitudes verbale, numérique, de
raisonnement et connaissances mécaniques ; c) le facteur de « visualisation
générale » (gv) qui recouvre les facteurs primaires de visualisation, de
souplesse/rapidité de structuration et d’orientation spatiale. Le modèle hiérarchique
final fait enfin l’hypothèse d’un facteur général de 3ème ordre, assez semblable à gf,
qui renvoie à ce qu’ont en commun les trois facteurs de 2nd ordre. C’est à une
structure comparable qu’aboutit quelques années plus tard Carroll (1993) qui
identifie toutefois plusieurs autres facteurs de 2nd ordre (perception auditive, vitesse
de traitement, vitesse de réaction, capacité de rappel, mémoire générale et
apprentissage). La capacité du modèle hiérarchique à reconstituer les corrélations
entre tests issus de catégories différentes montre donc qu’il est raisonnable de
L’intelligence - 12/16

décrire celles-ci à l’un ou l’autre niveau d’une structure hiérarchique de facteurs


selon le point de vue adopté et les objectifs poursuivis. Un facteur général identifié à
partir des corrélations entre tests renvoie ainsi à un niveau d’analyse distinct mais
conciliable avec celui auquel certains de ces tests permettent d’appréhender des
aspects moins généraux ou plus spécifiques de l’activité intellectuelle.

1.2.3. Comment interpréter le facteur général ?

Il est aujourd’hui admis que l’identification d’un facteur général est possible dès
lors qu’une batterie de tests suffisamment bien construite pour cela est administrée à
des sujets moyennement efficients. Carroll qui fait autorité en la matière conclut
ainsi en faveur de l’existence d’un facteur commun de 3ème ordre opérationnellement
identifiable. Mais comment interpréter ce facteur général qui semble réfléchir une
dimension essentielle de la performance à de nombreux tests d’intelligence ?

Les psychologues Spearmaniens défendent la prééminence du facteur g capable à


leurs yeux de rendre compte d'une part de variance bien plus importante que tous les
facteurs d’ordre inférieur réunis. La fonction psychologique unique qui « explique »
les corrélations observées entre les tests d’intelligence est pour eux largement
d’origine biologique et génétique (la vitesse de traitement, l’efficience ou la
plasticité neurale, etc.). Jensen (1998) par exemple présente de multiples données
corrélationnelles (biochimie, électrophysiologie, chronométrie mentale, imagerie
cérébrale, etc.) en faveur de cette conception. Cette thèse, quelle que soit la validité
quantitative des corrélats relevés, est contestable sur de nombreux aspects. En
particulier et comme le reconnaît Jensen lui-même (p. 257), aucune théorie
neurophysiologique cohérente de g n’est fournie qui permette de prédire les
corrélations observées et rien n’est dit sur les mécanismes sous-jacents. Il s’agit en
définitive d’une défense acharnée du facteur g, irréfutable dans sa circularité, à
laquelle se risquent parfois à souscrire quelques-uns de ceux qui tentent d’intégrer
les résultats des neurosciences et des sciences cognitives en un même modèle
mécaniste de l’intelligence générale12.

La position des psychologues qui considèrent que les corrélations entre tests
d’intelligence peuvent être résumées au plus haut niveau de la hiérarchie des
facteurs par un facteur général conceptuellement conforme à une définition en
termes de capacité mentale générale (Neisser et al., 1996) n’est pas de même nature.
L’existence d’un facteur général n’impose d’abord pas celle d’une fonction
psychologique unique. Thomson par exemple a proposé dès 1916 une théorie
associationniste expliquant la corrélation entre tests à partir de l’idée que chacun
d’entre eux pouvait impliquer un très grand nombre d’éléments (de liaisons, de

12
Par exemple le modèle neurobiologique de l’intelligence de Gray et Thompson (2004).
L’intelligence 13/16

processus) échantillonnés à des degrés divers selon les tests. L’observation d’une
corrélation entre tests n’entraîne pas non plus que ceux-ci mesurent nécessairement
un même processus psychologique. Des mécanismes mentaux distincts mais
interdépendants peuvent tout aussi bien sous-tendre les performances observées.

Prenons l’exemple de la distinction entre les composantes fluide et cristallisée de


l’intelligence mesurée par les tests. La première est classiquement définie comme la
capacité de raisonnement inductif (percevoir et inférer des similitudes ou des
relations entre stimulus), la capacité d'adaptation et de flexibilité de raisonnement en
situation nouvelle. La seconde, l'intelligence « cristallisée par la culture », s'exprime
dans les produits de l'activité mentale (connaissances liées à l'apprentissage et aux
expériences dans les domaines verbal, numérique, spatial, compréhension du
système culturel et de ses conventions, etc.). Bien que ces deux facteurs de 2nd ordre
soient significativement corrélés (0,60 environ) et puissent être projetés sur un
facteur général de 3ème ordre, plusieurs résultats suggèrent que la liaison statistique
entre ces facteurs de différent niveau n’est pas causale. On sait par exemple que la
relation entre gf et gc est plus importante chez les individus de faible niveau
d’aptitude que chez ceux d’un niveau élevé. On dispose aussi de résultats qui
montrent que la performance aux tests d’intelligence fluide décline au cours du
vieillissement normal alors que celle aux tests d’intelligence cristallisée reste stable
voire même s’améliore. L’augmentation depuis la fin de la 2nde guerre mondiale du
niveau moyen de performance aux tests d’intelligence dans les sociétés occidentales
(l’«effet Flynn») est également nettement plus marquée pour la composante fluide
qu’elle ne l’est pour la composante cristallisée. Ces variations de performance à des
groupes différents de tests d’intelligence renforcent l’utilité pratique et la portée
diagnostique de la distinction gf-gc. Elles rendent surtout nécessaire une meilleure
compréhension de la signification fonctionnelle des dimensions révélées par
l’analyse factorielle. L’étude expérimentale des processus cognitifs qui sous-tendent
les différenciations observées peut à cet égard se montrer très productive. On
trouvera dans le chapitre suivant (Lautrey, cet ouvrage) plusieurs exemples de
travaux qui éclairent ainsi le rôle de la capacité de la mémoire de travail ou celui du
système de contrôle attentionnel dans la performance aux tests d’intelligence
générale (voir aussi Huteau et Lautrey, 1999). Des résultats complémentaires d’un
niveau d’observation différent sont également à espérer des recherches de
modélisation neuro-computationnelle et de neuroimagerie fonctionnelle (Houdé, cet
ouvrage).

1.3. L’élargissement d’une conception tacite de l’intelligence mesurée

Le modèle hiérarchique des facteurs de l’intelligence est d’autant plus attractif


qu’il apparaît compatible avec la conception communément partagée que
l’intelligence réfléchit ce que nous sommes capables de faire aussi bien que ce dont
L’intelligence - 14/16

nous disposons qui nous en rend capables. Mais d’autres orientations rompant plus
ou moins nettement avec cette conception ont été suggérées. Nous n’en évoquerons
brièvement ici que deux: la première en raison des applications qu’elle permet
d’envisager ; la seconde parce qu’elle met l’accent sur les facteurs non-cognitifs de
la performance aux tests traditionnels et invite à resituer dans un contexte
psychologique plus complexe les demandes liées à ce type de situation.

L’analyse de ce que mesurent les tests met en lumière des aspects de


l’intelligence qu’ils ne mesurent pas. Une façon de dépasser la conception
psychométrique jugée alors trop réductrice est d’englober celle-ci dans une vision
plus large incluant d’autres formes d’intelligence que la seule forme analytique (par
ex., pratique, créative ; Lubart, cet ouvrage ; Sternberg, 1999). Gardner (1983)
accorde peu d’intérêt à un facteur général qui ne représenterait selon lui qu’un très
faible pourcentage de variance si les tests étaient moins décontextualisés et
échantillonnaient d’autres domaines que ceux habituellement explorés. Il reprend
donc l’ancienne idée de formes d’intelligence relativement distinctes, indépendantes
et modulaires13. Il conseille aussi d’abandonner l’évaluation traditionnelle de
l’intelligence au profit d’une évaluation ayant plus de sens pour le sujet, plus en lien
avec ses activités quotidiennes et plus à même de répondre à ses besoins. Cette
théorie des intelligences multiples – pourtant peu fondée scientifiquement- a
fortement séduit les pédagogues et éducateurs soucieux de permettre à chacun de
développer le répertoire de ses compétences. Elle remet en effet en question une
vision stéréotypée des compétences qui caractérisent l’intelligence et offre des
formes alternatives d’évaluation dont la validité hypothético-déductive reste
néanmoins à préciser.

La performance aux tests d’intelligence semble aussi réfléchir d’autres aspects


que ceux identifiés par la description de l’organisation des corrélations qu’ils
présentent ou par l’analyse cognitive de leur contenu. L’« état de préparation » de
l’individu aux demandes cognitives et sociales du test est très certainement une
source importante de variation à ces tests (Richardson, 2002). Les tests étant
socialement et culturellement conditionnés, des individus issus d’environnements
différents sont nécessairement plus ou moins préparés à y faire face. Tout porte
même à croire que les tests dits « indépendants de la culture », ceux qui saturent le
plus le facteur d’intelligence générale (par ex., les matrices de Raven), sont d’abord
des problèmes de reconnaissance de symboles et de règles –plus ou moins
culturellement enracinés- avant d’être des problèmes de raisonnement. L’évolution
culturelle des classes moyennes dans les pays occidentaux, leur plus grande
exposition aux outils symboliques et technologiques est d’ailleurs une hypothèse
souvent évoquée pour expliquer l’effet Flynn. Les sujets à qui on administre un test

13
Gardner définit plusieurs formes –non hiérarchisées- d’intelligence ou capacités verbale, logico-
mathématique, spatiale, musicale, kinesthésique, interpersonnelle, intrapersonnelle et naturaliste.
L’intelligence 15/16

d’intelligence peuvent aussi être plus ou moins anxieux, avoir une plus ou moins
bonne image de soi, adopter certaines attitudes plutôt que d’autres, être plus ou
moins motivés à y répondre… Tous ces facteurs « conatifs » ne sont évidemment
pas sans incidence sur le degré d’engagement des sujets dans la tâche ni sur leur
performance en situation de test. Le point de vue défendu par Richardson, selon qui
un « complexe de facteurs affectifs et socio-cognitifs » intervient dans la
performance aux tests d’intelligence est donc tout à fait vraisemblable. Il serait
même tout à fait dommage comme le faisait remarquer Reuchlin il y a maintenant
plus de quinze ans, que la psychologie « méconnaisse l’importance de l’évolution
qui conduit à examiner le rôle des facteurs conatifs dans le fonctionnement même
des processus cognitifs » (Reuchlin, 1990).

1.4. Conclusion

Que retenir aujourd’hui de l’approche psychométrique de l’intelligence ? On lui


doit en premier lieu d’avoir conçu des techniques d’observation rigoureusement
standardisées permettant de mesurer l’intelligence, d’apporter une information sur
les performances dont chacun peut se montrer capable face à des items
échantillonnant différents aspects, définis au préalable, de l’activité intellectuelle.
Ces tests d’intelligence, individuels ou collectifs, ont été construits à l’origine dans
une perspective pronostique, en vue d’applications à des problèmes éducatifs ou
professionnels. Leur validité pratique doit donc beaucoup à ce souci pragmatique et
à une mise au point soigneuse. Les tests individuels d’intelligence globale (par
exemple les échelles de Wechsler) ou plus analytiques sont désormais de plus en
plus utilisés à des fins diagnostiques.

Cette contribution technique n’est pas la seule. L’approche psychométrique de


l’intelligence nous a également offert une méthode, l’analyse factorielle, qui permet
de décrire les relations entre tests d’intelligence, de « découvrir » comment ceux-ci
se structurent. Les résultats de ces recherches convergent aujourd’hui vers une
représentation hiérarchique qui réfléchit un modèle général de l’efficience
intellectuelle mesurée par les tests. L’apport théorique peut paraître ici bien modeste
au regard des efforts déployés et les tests d’intelligence manquent toujours d’une
théorie consensuelle capable de servir à tous les usages qu’est susceptible d’en faire
le psychologue. Il n’est pas pour autant mineur. Les comportements intelligents
décrits dans un tel modèle hiérarchique de l’efficience n’apparaissent en effet ni
isolément, ni dans une globalité scientifiquement impénétrable. Ils apparaissent au
contraire comme un système de fonctions interdépendantes, aucune fonction n’étant
à elle seule la cause ultime des comportements observés. Il ne s’agit là sans doute
que d’une ébauche de système mais l’enseignement est là.
L’intelligence - 16/16

1.5. Bibliographie
Binet, A. (1911, 1973). Les idées modernes sur les enfants. Paris: Flammarion.
Carroll, J.B. (1993). Human cognitive abilities: A survey of factor analytic studies.
Cambridge: Cambridge University Press.
Gardner, H. (1983). Frames of mind: The theory of multiple intelligences. New York: Basic
books.
Gould, S.J. (1983). La mal-mesure de l’homme. Paris: Ramsay.
Grégoire, J. (2000). L’évaluation clinique de l’intelligence de l’enfant. Sprimont : Mardaga.
Grégoire, J. (2004). L’examen clinique de l’intelligence de l’adulte. Sprimont : Mardaga.
Gustafsson, J.E. (1984). A unifying model for the structure of intellectual abilities.
Intelligence, 8, 179-203.
Herrnstein, R., & Murray, C. (1996). The Bell curve : Intelligence and class structure in
American Life. New York : Free Press.
Horn, J.L., & Cattell, R.B. (1966). Refinement and test of the theory of fluid and crystallized
intelligence. Journal of Educational Psychology, 57, 253-270.
Huteau, M. & Lautrey, J. (1999). Evaluer l’intelligence : Psychométrie cognitive. Paris : PUF.
Jensen, A. (1998). The g factor : The science of mental ability. Westport, CT : Praeger.
Kamin, L.J. (1974). The science and politics of IQ. Potomac MD : Erlbaum.
Montagu, A. (Ed.) (1975, 1999). Race and IQ. New York : Oxford University Press.
Neisser, U., Boodoo, G., Bouchard, T.J.Jr., Boykin, A.W., Brody, N., Ceci, S.J., Halpern,
Loehlin, J., Perloff, R., Sternberg, R.J., & Urbina, S. (1996). Intelligence : Knowns and
unknowns. American Psychologist, 51, 77-101.
Reuchlin, M. (1962). Les méthodes quantitatives en psychologie. Paris : PUF.
Reuchlin, M. (1990). Facteurs conatifs des différences cognitives. In Actes des 8èmes
Journées de psychologie différentielle (pp. 461-471). Lyon : PUL.
Reuchlin, M. (2003). Contributions à l’histoire des méthodes statistiques employées en
psychologie : De la régression aux modèles structuraux. Psychologie et Histoire, 4, 3-30.
Richardson, K. (2002). What IQ tests test ? Theory and Psychology, 12, 283-314.
Spearman, C. (1904). “General intelligence” objectively determined and measured. American
Journal of Psychology, 15, 201-293.
Sternberg, R.J. (1999). Successful intelligence: Finding a balance. Trends in Cognitive
Science, 3, 436-442.
Thurstone, L.L. (1938). Primary Mental Abilities. Psychometric Monographs, 1.
Vernon, P.E. (1950). Structure of human abilities. London: Methuen.

View publication stats

Vous aimerez peut-être aussi