Vous êtes sur la page 1sur 3

que la notation scolaire, alors liée à des enjeux de discipline et de

hiérarchisation des élèves, véhicule une représentation négative par rapport à


des enjeux pédagogiques et éducatifs qui seront, dès la deuxième moitié du
20e siècle, revendiqués par l’évaluation des apprentissages. C’est
certainement une des raisons qui a incité un ensemble d’auteurs à distinguer
les notions de contrôle et d’évaluation en éducation et formation. Ainsi,
Ardoino et Berger argumentent-ils dans leur texte de 1989 qu’évaluer n’est
pas contrôler. Le besoin se fait sentir d’établir une différence conceptuelle
entre ce que pourrait être une évaluation au service des apprentissages des
élèves et de l’enseignement, et ces pratiques de notation et d’examens dont
l’origine historique et les finalités s’apparentent à du contrôle normatif et
social. Des avis plus nuancés sont aujourd’hui avancés par rapport à cette
distinction entre évaluation et contrôle, souvent difficiles à dissocier
complètement dans les pratiques.

2. La docimologie, première partie


du 20e siècle
Dès la fin du 19e siècle, puis tout au long de la première partie du 20e siècle,
des travaux scientifiques ont pris pour objets d’études les examens, leurs
contenus, les méthodes de correction des épreuves et le comportement des
examinateurs et examinés. Dans les années 1920, Piéron introduit le terme
« docimologie », à partir de deux mots grecs, dokimé, épreuve, et logos,
science. Il définit la docimologie comme étant « l’étude systématique des
examens (modes de notation, variabilité interindividuelle et intra-individuelle
des examinateurs, facteurs subjectifs, etc.) » (Parisot, 1988, cité par Bonniol
& Vial, 1997, p. 57). Avec d’autres chercheurs, dont Laugier qui a publié
avec des collaborateurs des études qui ont marqué le domaine entre les
années 1927 et 1938, l’ambition est de créer une nouvelle « discipline », une
« science des examens ». Elle est à l’origine de l’émergence du domaine
scientifique qui, aujourd’hui, porte plus largement sur l’évaluation des
apprentissages des élèves.
Il n’est pas inutile de rappeler quelques fondements de la docimologie.
Dans la revue Histoire de l’éducation, Martin (2002) retrace les origines de
cette science des examens associées à deux mouvements majeurs en France,
la psychologie expérimentale qui « s’autonomise comme discipline
scientifique à part entière sur le modèle des sciences expérimentales » et le
développement de nouveaux courants pédagogiques « qui s’appuient en
grande partie sur les applications éducatives de la psychologie » (pp. 2-3). De
la docimologie, on a surtout retenu les différents facteurs d’influence (ou
« effets ») qui font varier les jugements évaluatifs des examinateurs. Ils
dénoncent la subjectivité des jugements évaluatifs qui mettent à mal la
validité des examens. Des études fameuses ont marqué les esprits, donnant à
voir d’importantes variations de notation entre plusieurs examinateurs, mais
également pour un même correcteur à plusieurs mois d’intervalle. L’encart 1
résume les principaux effets dégagés par ces recherches. D’autres facteurs
d’influence ont été mis en évidence depuis, dont « la constante macabre »
(Antibi, 2003) qui désigne le phénomène consistant à attribuer toujours un
certain pourcentage de mauvaises notes quelle que soit la qualité des réponses
à l’examen.

Encart 1 : Les divergences de notations


dépendent d’effets systématiques
« La docimologie repose sur les présupposés suivants : les copies d’élèves, à l’instar d’objets
physiques sont mesurables et quantifiables ; les divergences de notation entre examinateurs
résultent d’erreurs de mesure, elles sont donc réductibles ; il est donc possible d’améliorer la
validité des examens et la fidélité des évaluations… La perspective docimologique a tenté de
rendre compte des sources responsables de ces variations et d’expliquer les comportements
des examinateurs. Quels sont les facteurs ou les situations responsables des écarts entre
notateurs ?… Les notes attribuées dépendraient d’effets systématiques auxquels seraient
sensibles tous les correcteurs » (Amigues & Zerbato-Poudou, 1996, pp. 135-136).

Principaux effets dégagés par les études docimologiques


Effet de fatigue ou d’ennui : cet effet peut engendrer laxisme ou sur-sévérité.
Effet de halo : le professeur, influencé par des caractéristiques de présentation de la
copie (soin, écriture, orthographe) ou de l’élève, surestime ou sous-estime la note.
Effet d’assimilation : l’évaluation est influencée par les informations que le professeur
possède de l’élève (statut scolaire de l’élève, origine socioéconomique, origine
ethnique).
Effet de contamination : les notes/ points attribués successivement aux différents
aspects d’un même travail s’influencent mutuellement.
Effet de tendance centrale : par crainte de sur-évaluer ou de sous-évaluer le travail
d’un élève, le professeur groupe ses appréciations vers le centre de l’échelle.
Effet de l’ordre de correction et effet de contraste : l’évaluateur se laisse influencer
par l’ordre des copies (les premières sont sur-évaluées) et par la qualité de la copie
précédente. Un travail moyen paraîtra bon s’il suit un travail médiocre.
Effet de trop grande indulgence/ de trop grande sévérité : certains évaluateurs sont
systématiquement trop indulgents ou trop sévères dans toutes leurs évaluations
(personnalité des évaluateurs).

(Voir notamment les études citées par Amigues & Zerbato-Poudou, 1996)

L’analyse historique de Martin a pour intérêt de souligner les


préoccupations sociales attachées aux travaux scientifiques des docimologues
et des enjeux socio-éducatifs visés. L’auteur distingue trois grandes
directions aux études docimologiques des années 1920-1940 : (1) une critique
du caractère arbitraire de l’examen traditionnel. Par le recours aux méthodes
statistiques, les chercheurs mettent en évidence des défauts structurels et les
variations de correction intra et inter-examinateurs (voir encart 1) ; (2) l’étude
des rendements scolaires qui visent à déterminer les caractéristiques
psychophysiologiques des élèves examinés. Ici, le projet des chercheurs était
de définir des groupes d’aptitudes en fonction des différents métiers
(l’orientation professionnelle était une de leurs préoccupations), tout en
croyant à « l’éducabilité ou la perfectibilité des aptitudes » ; (3) la fonction
sociale de la sélection et la finalité de l’examen. Les chercheurs critiquent la

Vous aimerez peut-être aussi