que la notation scolaire, alors liée à des enjeux de discipline et de
hiérarchisation des élèves, véhicule une représentation négative par rapport à
des enjeux pédagogiques et éducatifs qui seront, dès la deuxième moitié du 20e siècle, revendiqués par l’évaluation des apprentissages. C’est certainement une des raisons qui a incité un ensemble d’auteurs à distinguer les notions de contrôle et d’évaluation en éducation et formation. Ainsi, Ardoino et Berger argumentent-ils dans leur texte de 1989 qu’évaluer n’est pas contrôler. Le besoin se fait sentir d’établir une différence conceptuelle entre ce que pourrait être une évaluation au service des apprentissages des élèves et de l’enseignement, et ces pratiques de notation et d’examens dont l’origine historique et les finalités s’apparentent à du contrôle normatif et social. Des avis plus nuancés sont aujourd’hui avancés par rapport à cette distinction entre évaluation et contrôle, souvent difficiles à dissocier complètement dans les pratiques.
2. La docimologie, première partie
du 20e siècle Dès la fin du 19e siècle, puis tout au long de la première partie du 20e siècle, des travaux scientifiques ont pris pour objets d’études les examens, leurs contenus, les méthodes de correction des épreuves et le comportement des examinateurs et examinés. Dans les années 1920, Piéron introduit le terme « docimologie », à partir de deux mots grecs, dokimé, épreuve, et logos, science. Il définit la docimologie comme étant « l’étude systématique des examens (modes de notation, variabilité interindividuelle et intra-individuelle des examinateurs, facteurs subjectifs, etc.) » (Parisot, 1988, cité par Bonniol & Vial, 1997, p. 57). Avec d’autres chercheurs, dont Laugier qui a publié avec des collaborateurs des études qui ont marqué le domaine entre les années 1927 et 1938, l’ambition est de créer une nouvelle « discipline », une « science des examens ». Elle est à l’origine de l’émergence du domaine scientifique qui, aujourd’hui, porte plus largement sur l’évaluation des apprentissages des élèves. Il n’est pas inutile de rappeler quelques fondements de la docimologie. Dans la revue Histoire de l’éducation, Martin (2002) retrace les origines de cette science des examens associées à deux mouvements majeurs en France, la psychologie expérimentale qui « s’autonomise comme discipline scientifique à part entière sur le modèle des sciences expérimentales » et le développement de nouveaux courants pédagogiques « qui s’appuient en grande partie sur les applications éducatives de la psychologie » (pp. 2-3). De la docimologie, on a surtout retenu les différents facteurs d’influence (ou « effets ») qui font varier les jugements évaluatifs des examinateurs. Ils dénoncent la subjectivité des jugements évaluatifs qui mettent à mal la validité des examens. Des études fameuses ont marqué les esprits, donnant à voir d’importantes variations de notation entre plusieurs examinateurs, mais également pour un même correcteur à plusieurs mois d’intervalle. L’encart 1 résume les principaux effets dégagés par ces recherches. D’autres facteurs d’influence ont été mis en évidence depuis, dont « la constante macabre » (Antibi, 2003) qui désigne le phénomène consistant à attribuer toujours un certain pourcentage de mauvaises notes quelle que soit la qualité des réponses à l’examen.
Encart 1 : Les divergences de notations
dépendent d’effets systématiques « La docimologie repose sur les présupposés suivants : les copies d’élèves, à l’instar d’objets physiques sont mesurables et quantifiables ; les divergences de notation entre examinateurs résultent d’erreurs de mesure, elles sont donc réductibles ; il est donc possible d’améliorer la validité des examens et la fidélité des évaluations… La perspective docimologique a tenté de rendre compte des sources responsables de ces variations et d’expliquer les comportements des examinateurs. Quels sont les facteurs ou les situations responsables des écarts entre notateurs ?… Les notes attribuées dépendraient d’effets systématiques auxquels seraient sensibles tous les correcteurs » (Amigues & Zerbato-Poudou, 1996, pp. 135-136).
Principaux effets dégagés par les études docimologiques
Effet de fatigue ou d’ennui : cet effet peut engendrer laxisme ou sur-sévérité. Effet de halo : le professeur, influencé par des caractéristiques de présentation de la copie (soin, écriture, orthographe) ou de l’élève, surestime ou sous-estime la note. Effet d’assimilation : l’évaluation est influencée par les informations que le professeur possède de l’élève (statut scolaire de l’élève, origine socioéconomique, origine ethnique). Effet de contamination : les notes/ points attribués successivement aux différents aspects d’un même travail s’influencent mutuellement. Effet de tendance centrale : par crainte de sur-évaluer ou de sous-évaluer le travail d’un élève, le professeur groupe ses appréciations vers le centre de l’échelle. Effet de l’ordre de correction et effet de contraste : l’évaluateur se laisse influencer par l’ordre des copies (les premières sont sur-évaluées) et par la qualité de la copie précédente. Un travail moyen paraîtra bon s’il suit un travail médiocre. Effet de trop grande indulgence/ de trop grande sévérité : certains évaluateurs sont systématiquement trop indulgents ou trop sévères dans toutes leurs évaluations (personnalité des évaluateurs).
(Voir notamment les études citées par Amigues & Zerbato-Poudou, 1996)
L’analyse historique de Martin a pour intérêt de souligner les
préoccupations sociales attachées aux travaux scientifiques des docimologues et des enjeux socio-éducatifs visés. L’auteur distingue trois grandes directions aux études docimologiques des années 1920-1940 : (1) une critique du caractère arbitraire de l’examen traditionnel. Par le recours aux méthodes statistiques, les chercheurs mettent en évidence des défauts structurels et les variations de correction intra et inter-examinateurs (voir encart 1) ; (2) l’étude des rendements scolaires qui visent à déterminer les caractéristiques psychophysiologiques des élèves examinés. Ici, le projet des chercheurs était de définir des groupes d’aptitudes en fonction des différents métiers (l’orientation professionnelle était une de leurs préoccupations), tout en croyant à « l’éducabilité ou la perfectibilité des aptitudes » ; (3) la fonction sociale de la sélection et la finalité de l’examen. Les chercheurs critiquent la
L'univers est intelligent. L'âme existe. Mystères quantiques, multivers, intrication, synchronicité. Au-delà de la matérialité, pour une vision spirituelle du cosmos.