Académique Documents
Professionnel Documents
Culture Documents
net/publication/349780093
CITATION READS
1 444
2 authors, including:
Vantourout Marc
Paris Descartes, CPSC
13 PUBLICATIONS 48 CITATIONS
SEE PROFILE
All content following this page was uploaded by Vantourout Marc on 07 April 2021.
Pascal Detroz,
Marcel Crahay
et Annick Fagnant
(sous la direction de)
Imprimé XXXXX
Dépôt légal :
Bibliothèque nationale, Paris : XXXXX 2016 ISSN 0777-5245
Bibliothèque Royale de Belgique, Bruxelles : 2016/13647/XXX ISBN 978-2-807-30715-5
CHAPITRE 1
Évaluations à large échelle : prendre la juste mesure
des effets de contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Par Dominique LAFONTAINE
AXE 1 :
ÉVALUATIONS ET CONTEXTES DIDACTIQUES
Introduction à l’axe 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Par Annick FAGNANT
CHAPITRE 2
Évaluer en mathématiques :
une approche didactique et épistémologique . . . . . . . 63
Par Brigitte GRUGEON-ALLYS
CHAPITRE 3
L’évaluation, un paramètre prépondérant
en didactique du français langue étrangère
et seconde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Par Fatima CHNANE-DAVIN et Jean-Pierre CUQ
CHAPITRE 4
Évaluation formative de l’apprentissage
par la lecture : relation complexe et dynamique
« individu-contexte » . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Par Sylvie C. CARTIER, Thaïs GUERTIN-BARIL, Julie ARSENEAULT
et Manal RAOUI
AXE 2 :
ÉVALUATION ET MODÈLES COGNITIFS
CHAPITRE 5
Évaluations scolaires et étude du jugement
des enseignants : pour une docimologie cognitive . . 141
Par Rémi GOASDOUÉ et Marc VANTOUROUT
CHAPITRE 6
Une modélisation pour appréhender
la référentialisation dans l’évaluation
des apprentissages des élèves . . . . . . . . . . . . . . . . . . . . 169
Par Lucie MOTTIER LOPEZ
CHAPITRE 7
Le redoublement des élèves :
des décisions prises dans l’incertitude . . . . . . . . . . . . . 193
Par Géry MARCOUX et Marcel CRAHAY
AXE 3 :
ÉVALUATION DANS L’ENSEIGNEMENT SUPÉRIEUR,
ORIENTATIONS DISCIPLINAIRES
ET APPROCHES PÉDAGOGIQUES
CHAPITRE 8
Viser le développement des pratiques
d’Assessment for Learning (AfL) dans le contexte
de la 1re année à l’université : cadre théorique,
dispositif et initiatives pédagogiques
résultant du projet « Feedbacks 1er bac ». . . . . . . . . . . 221
Par Laurent LEDUC, Audrey MOHR, Eléonore MARICHAL, Mélanie DEUM
et Pascal DETROZ
CHAPITRE 9
Comment former à une vision élargie
de l’évaluation formative en vue de réguler
efficacement les apprentissages mathématiques
des élèves ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
Par Annick FAGNANT et Isabelle DEMONTY
CHAPITRE 10
Regards croisés sur deux dispositifs de formation
technopédagogique, leur outillage conceptuel
et l’évaluation de leurs bénéfices . . . . . . . . . . . . . . . . . 277
Par Catherine LOISY, Jeff VAN DE POËL et Dominique VERPOORTEN
Julie Arseneault
Université de Montréal
Sylvie C. Cartier
Université de Montréal
Fatima Chnane-Davin
Aix-Marseille Université
Marcel Crahay
Professeur honoraire
Universités de Genève et de Liège
Jean-Pierre Cuq
Université Nice Sophia Antipolis
Isabelle Demonty
Université de Liège
Pascal Detroz
Université de Liège
Mélanie Deum
Université de Liège
Annick Fagnant
Université de Liège
Rémi Goasdoué
Université Paris Descartes
Brigitte Grugeon-Allys
Laboratoire de Didactique André Revuz
Université Paris-Diderot, Université de Cergy Pontoise,
Université Paris-Est Créteil, Université d’Artois, Université de Rouen
Thaïs Guertin-Baril
Université de Montréal
Dominique Lafontaine
Département éducation et formation, Université de Liège
Laurent Leduc
Université de Liège
Catherine Loisy
École normale supérieure de Lyon
Géry Marcoux
Université de Genève
Eléonore Marichal
Université de Liège
Audrey Mohr
Université de Liège
Lucie Mottier Lopez
Université de Genève
Manal Raoui
Université de Montréal
Jeff Van de Poël
Université de Liège
Marc Vantourout
Université Paris Descartes
Dominique Verpoorten
Université de Liège
Nathalie Younes
Université Blaise Pascal de Clermont-Ferrand
1. Le présent ouvrage fait suite au 27e colloque de l’ADMEE Europe qui a été organisé à
l’Université de Liège du 17 au 20 janvier 2015. La thématique de ce colloque est donc
forcément identique à celle du présent ouvrage, à savoir « L’évaluation à la lumière
des contextes et des disciplines ». En conséquence, la présente introduction s’inspire
en partie de la description de la thématique telle qu’elle a été présentée dans l’appel à
communication de l’ADMEE.
2. Car on pourrait également évoquer l’évaluation dans les entreprises, l’évaluation des
services et des produits par les clients, etc. Bref, l’évaluation est partout.
4. STRUCTURE DE L’OUVRAGE
Cet ouvrage débute par un texte introductif, correspondant à la
conférence inaugurale de ce colloque et traduisant sa problématique cen-
trale : l’importance de la prise en compte des contextes lors des évaluations.
Dans les lignes qui suivent, nous présentons brièvement ce texte
introductif, ainsi que les raisons ayant présidé aux choix des trois axes
thématiques. En vue de donner une vue d’ensemble de l’ouvrage, le contenu
de chacun des axes est également très brièvement évoqué.
Notons toutefois qu’une description plus complète des thématiques
traitées par chacun des axes sera présentée en introduction de ceux-ci. Un
court résumé de chacun des chapitres constitutifs y sera également présent.
Nous renvoyons donc le lecteur intéressé à ces présentations liminaires.
RÉFÉRENCES BIBLIOGRAPHIQUES
Introduction à l’axe 2 :
De la docimologie à la psychologie de l’évaluation
Chapitre 5 Évaluations scolaires et étude du jugement
des enseignants : pour une docimologie
cognitive
Chapitre 6 Une modélisation pour appréhender
la référentialisation dans l’évaluation
des apprentissages des élèves
Chapitre 7 Le redoublement des élèves :
des décisions prises dans l’incertitude
46. Le lecteur trouvera un développement des idées présentées dans cette première section
dans Crahay, M. (2006). L’évaluation des élèves : entre mesure et jugement.
Crahay, mais dans une moindre mesure. Ceci prouve son actualité. Pour
être précis, ce modèle pose que toute évaluation repose sur la construction
par l’évaluateur « d’un référent, système d’attentes jugées légitimes, ou d’un
ensemble de critères au nom desquels on va se prononcer, et d’un référé,
“modèle réduit” de l’objet évalué, c’est-à-dire ce à partir de quoi on pourra
porter le jugement de valeur » (cf. Hadji, 1997, pp. 42-45 ; 1992, pp. 31-36,
cité par Goasdoué et Vantourout, ci-dessous). Bien plus, le modèle de réfé-
rence se construit avant l’évaluation. Comme le mentionnent Goasdoué et
Vantourout, le modèle « comparaison référent/référé » fait consensus tant
dans le domaine de l’enseignement (cf. Hadji, 1997) que dans celui de la
formation (cf. Barbier, 1985). Il semble donc que les chercheurs en évalua-
tion considèrent ce modèle comme universel.
L’intérêt des trois contributions rassemblées dans la présente section
de l’ouvrage réside dans le fait qu’elles discutent à des degrés divers, sur la
base de données empirique, la validité et l’universalité de ce modèle. Bien
plus, les données engrangées par les uns et les autres tendent précisément
à en contester l’universalité.
Étudiant notamment l’activité de professeurs confrontés à des
situations aménagées en mathématiques, Rémi Goasdoué et Marc Vantou-
rout distinguent trois groupes ou profils d’enseignants. Le premier profil
conforte le modèle référent/référé puisqu’il correspond à des enseignants
qui résolvent immédiatement l’intégralité du problème, avant de s’intéresser
aux réponses des élèves. Disposant de l’ensemble des réponses attendues,
ces professeurs disposent d’un référent lorsqu’ils évaluent les productions
des élèves. Ces enseignants se caractérisent également par la maîtrise des
enjeux disciplinaires du problème, ce qui indique l’importance des connais-
sances disciplinaires dans l’activité évaluative des enseignants. Cependant,
d’autres profils ont également été identifiés, pour lesquels il est difficile, voire
impossible de les décrire à l’aide du modèle comparaison référent/référé.
Ainsi, on repère des professeurs qui ne résolvent pas le problème, car, ne
maîtrisant pas les connaissances disciplinaires nécessaires, ils rencontrent
des difficultés importantes pour le comprendre. Il convient de se demander
quelle portée il convient de donner à cette dernière observation. Celle-ci
est réalisée dans le cadre d’une étude quasi expérimentale dans laquelle les
enseignants n’ont pas conçu l’épreuve ; celle-ci leur est en quelque sorte
imposée. Or, on peut penser que, dans le quotidien de leurs classes, les
enseignants évitent de présenter à leurs élèves des problèmes qu’eux-mêmes
ne peuvent résoudre. Quoi qu’il en soit l’observation interpelle et mériterait
d’être vérifiée par des recherches complémentaires en conditions naturelles.
Plus généralement, ces chercheurs ambitionnent de comprendre
les logiques internes aux pratiques d’évaluation en articulant les apports
théoriques de la psychologie et des didactiques disciplinaires, ce qui les
Notre point de vue est qu’il faudrait commencer par mieux connaître
et comprendre les pratiques évaluatives des enseignants, c’est-à-dire telles
qu’elles se développent dans leur contexte écologique, notamment quand elles
débouchent sur des décisions à forts enjeux sur les parcours de formation
des élèves, comme c’est le cas dans des évaluations certificatives.
RÉFÉRENCES BIBLIOGRAPHIQUES
1. PRÉAMBULE
1.1. Quel psychologique en évaluation ?
Ce chapitre appartient à la section de l’ouvrage consacrée aux
« modèles psychologiques en évaluation » ou encore à la « psychologie des
enseignants-évaluateurs ». Mise en perspective avec le titre du colloque,
« L’évaluation à la lumière des disciplines et des contextes », cette apparte-
nance signifie que, en tant que contributeurs, nous estimons pouvoir accéder
à une meilleure connaissance et compréhension de l’évaluation, notamment
en milieux scolaires, en portant un regard psychologique sur celle-ci. Les
références au « psychologique » en évaluation sont historiquement et actuel-
lement diverses48. C’est pourquoi nous souhaitons clarifier en préambule
notre façon de l ‘appréhender49. Pour nous, le psychologique en évaluation :
48. Comme le montrerait, à notre avis, une confrontation des chapitres regroupés dans
cette section.
49. Certains pourront juger, à juste titre, ces clarifications rapides. Effectivement, nous
n’entrons dans aucune des réflexions relatives au pluralisme théorique de la psychologie
(cf. Crahay, 2013) et n’abordons pas l’épineuse question des rapports des didactiques,
en particulier celle des mathématiques, à la psychologie (cf. Maury, 2001).
50. La notion de contenus « désigne tout ce qui est objet d’enseignement et d’apprentissage
et qui constitue les savoirs qui sont enseignés et les connaissances que construisent les
élèves au fil du temps » (Delcambre, 2007, p. 45).
51. Dans ce chapitre, nous nous centrons sur la facette « correction » de l’activité des éva-
luateurs. Pour la facette « conception d’épreuves », voir Vantourout & Goasdoué, 2014.
être rabattue, pour les épreuves, sur leur pouvoir de discrimination, pour
les jugements des enseignants, sur la convergence des notations. Ainsi,
nous nous intéressons davantage à ce qui dans l’activité des enseignants,
notamment à partir de leurs verbalisations, nous permet de décrire les
processus cognitifs qui conduisent aux jugements, plutôt qu’aux jugements
qu’expriment les enseignants, et marginalement à leurs notes. Contraire-
ment à la docimologie « critique », initialement construite pour promouvoir
l’emploi d’épreuves inspirées des tests psychologiques alors en plein essor,
l’approche que nous défendons rejette l’idée d’une faillibilité généralisée des
jugements des évaluateurs, considérant que celle-ci ne peut se fonder sur
les constats répétés de divergences de notation. En tentant de comprendre
les ressorts de l’activité des évaluateurs, nous avons en effet maintes fois
constaté que des jugements pouvaient être divergents sans être aberrants,
tout comme des convergences de notations pouvaient masquer des diver-
gences de jugements. Bref, sans verser dans un relativisme généralisé, nous
considérons que des jugements peuvent être également « légitimes » sans
être convergents. L’analyse minutieuse de l’activité d’évaluation nous conduit
tout autant à remarquer que certaines épreuves ne permettent pas porter
de jugement fiable sur les acquis des élèves, tout comme certains évalua-
teurs éprouvent des difficultés pour corriger et ne cernent pas toujours
clairement les enjeux conceptuels et cognitifs des épreuves. Au-delà de
ces deux écueils, un angélisme compréhensif et une suspicion a priori,
nous défendons que l’analyse de l’activité permet, pour un domaine précis,
mais aussi pour un type d’épreuve donné, de porter un regard nouveau
sur les questions de validité. Il ne s’agit pas d’évaluer l’évaluation ou les
évaluateurs, mais de cerner à quelles conditions les jugements peuvent
être « valides »52. Enfin, accoler « cognitive » à docimologie se justifie, de
notre point de vue, pour trois raisons principales. D’abord, parce que nous
convoquons des concepts issus de la psychologie cognitive pour analyser
l’activité. Ensuite, en référence à l’étymologie de ce terme, parce que nous
accordons aux connaissances et à leurs spécificités une place centrale dans
l’évaluation scolaire. Enfin, parce nous considérons l’évaluation comme une
démarche de production de connaissance (cognitive), une forme d’enquête53
structurée par des modes de « raisonnements évaluatifs » spécifiques aux
contenus de savoirs évalués et aux types d’épreuves impliquées (cf. infra
dernière partie).
Ce chapitre comprend quatre parties. Nous porterons d’abord un
regard critique sur deux résultats majeurs des travaux docimologiques.
52. Jugements « valides » ou « légitimes » ? Notre préférence porte sur le second terme,
nous nous en expliquerons (cf. infra).
53. Bien qu’ayant des finalités variables, les évaluations produisent des connaissances sur
les acquis des élèves, leurs démarches, voire sur l’effet de pratiques d’enseignement ou
d’organisations curriculaires.
Puis dans les deux parties suivantes, nous montrerons à travers deux
recherches, que tout ne se passe pas toujours de manière conforme au(x)
modèle(s) proposé(s) par les docimologues expérimentaux. Conjointement,
ces recherches serviront à illustrer les principaux renouvellements apportés
par la docimologie cognitive pour étudier les divergences entre évaluateurs,
notamment sur les plans méthodologiques et théoriques. Dans la dernière
partie, nous présenterons et discuterons quelques-unes des bases de la
docimologie cognitive et reviendrons sur la notion de validité, en lien avec
ce que nous nommons « raisonnement évaluatif ».
54. Voir Vantourout & Goasdoué, 2010, notamment pour une illustration empirique.
55. De Ketele (2012) parle de l’existence d’éléments unificateurs mais ne cite que ces deux-là.
un avatar du modèle explicatif56. Bien qu’il existe des différences entre ces
deux modèles57, il semble que l’on s’accorde désormais pour considérer
le modèle « comparaison référent/référé » comme un modèle « universel »
(cf. ci-dessus De Ketele, 2012).
Nous constatons en effet que ce modèle bénéficie d’un large consen-
sus, tant dans le domaine de l’enseignement (cf. Hadji, 1997) que dans celui
de la formation (cf. Barbier, 1985). Pour preuve, il est convoqué fréquem-
ment dans une variété de travaux indépendamment des formes et objets
d’évaluation, sans qu’aucune réserve soit véritablement émise à son égard, à
l’exception de rares restrictions qui ne sont que des déclarations formelles,
celles-ci se situant à un niveau de généralité très élevé (cf. ci-dessus la
citation de De Ketele, 2012 ; cf. également Bonniol, note 13). Or, à notre
connaissance, le modèle explicatif, dont il dérive directement, n’a été établi
que sur la base de situations expérimentales de notations et de classements
de copies et renfermait une dimension heuristique (Amigues, communica-
tion personnelle). Il devait permettre de poser des perspectives ultérieures
d’investigations, ses concepteurs ayant d’ailleurs encouragé à en étudier la
validité en le testant selon différentes modalités (ce qui à notre connais-
sance n’a pas été fait). Dans la suite de ce qui vient d’être mentionné,
notons que les docimologues expérimentaux décelaient des limites dans
leur modèle explicatif. En particulier, ils avaient conscience que l’étude des
processus impliqués par la tâche d’évaluation était la seule voie de progrès
et d’amélioration du modèle58 (Noizet & Caverni, 1978, p. 116). Notre cri-
tique principale vis-à-vis de ce modèle porte sur sa généralisation à d’autres
domaines d’application, alors qu’il n’a jamais été, à notre connaissance,
véritablement « testé », notamment à travers des situations d’évaluation
en milieux scolaires.
À présent, nous voudrions revenir sur le niveau de généralité des
modèles et sur l’importance de la spécificité des contenus évalués. Dans
les modèles qui viennent d’être présentés, le cognitif ne se manifeste qu’à
56. À notre connaissance, Barbier (1985) est le premier auteur qui présente le modèle
« comparaison référent/référé ». Il le fait pour décrire le procès d’évaluation en forma-
tion et se réfère alors largement au modèle explicatif des docimologues expérimentaux,
présenté notamment par Noizet et Caverni en 1978 dans leur ouvrage de référence.
57. Par exemple, le référent est appelé « modèle de référence » dans le modèle explicatif
des docimologues expérimentaux. Le modèle de référence est finement décrit et com-
porte plusieurs éléments dont le « produit norme » et les « produits attendus ». Un texte
de dictée sans faute est un exemple de produit norme.
58. L’étude des processus devait leur permettre d’accéder à un modèle formel (au lieu du
modèle analogique explicatif) et d’envisager, comme souvent dans les années 1970-1980,
une simulation informatique (c’est nous qui inférons) en vue « d’énoncer des prédic-
tions quantifiées [de la note la plus probable] » (Noizet & Caverni, 1978, p. 116). Les
objectifs visés ici par l’étude des processus divergent fortement des nôtres.
61. Lors des expérimentations, les situations aménagées sont présentées aux évaluateurs
via un CD-Rom. Phase 1, ils travaillent seuls face à un ordinateur (un dispositif permet
de savoir sur quoi porte leur activité, notamment à quelle traces de l’activité des élèves
ils s’intéressent) et doivent répondre à la consigne suivante : « En quoi les productions
et réponses de ces élèves sont-elles satisfaisantes et/ou non satisfaisantes ? » Phase 2,
en binôme, ils doivent discuter et s’accorder sur une évaluation commune. Phase 3, ils
participent individuellement à un débriefing.
62. Les professeurs évaluent des travaux attribués à des élèves absents et qu’ils ne
connaissent pas. Ces travaux ont été élaborés, pour les besoins de l’expérimentation,
à la suite d’observations de binômes d’élèves « réels » qui avaient résolu le même pro-
blème.
car en lien avec la tâche et qui seront mobilisées ou non selon les
sujets – constituent cependant un des déterminants internes de l’activité
d’évaluation, c’est-à-dire propres à l’évaluateur. L’intérêt que nous leur
portons a pour finalité de mieux comprendre leur rôle dans les processus
d’évaluation63.
En étudiant l’activité de professeurs64 confrontés aux situations amé-
nagées en mathématiques, trois grands pôles de connaissances ont pu être
identifiés : « disciplinaires », « évaluation » et « socio-psycho-pédagogiques »
(Vantourout & Maury, 2006). Au sein du pôle disciplinaire, nous distin-
guons les connaissances liées aux mathématiques et aux représentations
graphiques et les connaissances liées à la didactique des mathématiques.
Toutes ces connaissances peuvent se manifester, entre autres, quand les
enseignants se concentrent sur l’identification et l’étude des procédures
mises en œuvre par les élèves. Si la majorité des enseignants observés
marque de l’intérêt pour les procédures et reconnaît les situations où leur
analyse est pertinente, ce n’est qu’exceptionnellement qu’un professeur
parvient à conduire une analyse didactique, c’est-à-dire à mener une analyse
explicative de l’activité de l’élève en mobilisant des connaissances valides
liées à la didactique des mathématiques. Ces dernières représentent moins
de 0,25 % des occurrences de connaissances que nous avons relevées, bien
que ces professeurs, anciens étudiants et stagiaires en IUFM, aient reçu une
formation en didactique des mathématiques65.
De fait, mener une véritable analyse didactique requiert également
la mobilisation de connaissances dites de « niveau conceptuel supérieur »
(Vantourout & Maury, 2006). Au sein des connaissances disciplinaires liées
aux mathématiques et aux représentations graphiques, nous distinguons les
63. D’après le modèle explicatif des docimologues expérimentaux (cf. Annexe 1), tout se
passe comme si ces derniers créditaient les correcteurs d’une maitrise des objectifs
pédagogiques et des connaissances impliqués dans l’épreuve qu’ils corrigent. Les doci-
mologues expérimentaux postulent en quelque sorte que les correcteurs disposent d’un
niveau de compétence (notamment disciplinaire) requis pour accomplir leur tâche, ce
qui est d’autant plus intéressant, et peut même sembler paradoxal, puisqu’ils défendent
l’existence d’une faillibilité générale des correcteurs, leurs divergences en étant le
symptôme. Il en résulte que ces divergences ne peuvent pas reposer sur un déficit de
connaissances mais uniquement sur des biais universels. Attention toutefois, mobili-
ser pour évaluer la (ou les) connaissance(s) adéquate(s) ne garantit absolument pas
l’absence de divergences entre évaluateurs (cf. infra).
64. Il s’agit de 18 enseignants en fin de formation initiale en IUFM (Institut Universitaire de
Formation des Maîtres), 12 professeurs des écoles (PE) et 6 professeurs de mathéma-
tiques (PLC – Professeur exerçant en Collège ou en Lycée ). Selon que les professeurs
sont des PE ou PLC, les élèves sont respectivement déclarés comme étant en CM2 en
fin d’année scolaire ou en 6e en début d’année scolaire.
65. Ce résultat renvoie à la question de la pragmatisation des savoirs en connaissances opé-
rationnelles, telle qu’abordée en didactique professionnelle (cf. Pastré, 2011).
66. Ceux-ci s’opposent aux professeurs de formation « scientifique ». Parmi ces derniers
figurent tous les PLC et les professeurs des écoles qui possèdent au minimum un bac-
calauréat scientifique.
élèves d’un binôme ne font pas débuter leur tracé au point (0, 250), mais
à l’origine du repère, puis placent le point67 (1, 260). Sur le plan des
jugements évaluatifs, dix-sept des dix-huit professeurs s’accordent pour
reprocher aux élèves de faire débuter leur graphique à l’origine. Seul l’un
des professeurs (F) hésite vraiment à émettre une critique sur la réponse
proposée et la juge finalement acceptable : il défend l’idée selon laquelle
faire débuter le graphique à l’origine dénote d’une logique concrète, que
cela renvoie à la dimension « réaliste » du problème. Nous présentons
ci-après quelques courts extraits d’échanges entre des enseignants qui
doivent s’accorder sur une évaluation commune68. À travers les justifica-
tions, et en comparant les différentes interventions (par exemple A2 et
C3), il apparaît nettement que les connaissances à l’origine d’un même
jugement peuvent être différentes. Quant à elles, les interventions C3 et
F3 permettent d’inférer que les deux évaluateurs maîtrisent les enjeux
disciplinaires et qu’ils mobilisent, bien qu’ils s’expriment différemment (ce
qui n’est peut-être pas anodin ici), une connaissance analogue relative aux
fonctions affines. Pourtant, certainement parce qu’ils ne donnent pas la
même importance à la l’aspect « réaliste » évoqué par le problème, leurs
jugements sont opposés.
Le jugement des enseignants A et B laisse apparaître une divergence,
avec aucune véritable argumentation. Finalement B suivra l’avis de A. Ce qui
emporte la décision est la référence aux autres tracés (A2). L’intervention
A2 donne aussi une indication sur la manière dont est construit le référent
et sur sa solidité (cf. infra)
67. Dans un premier temps, comme cela se voit sur le graphique, ils oublient de prendre en
compte l’abonnement et placent les points (0, 0), (1, 10), (5, 50), etc., dont les abscisses
correspondent aux valeurs figurant dans le tableau qu’ils doivent d’abord compléter.
68. Pour accéder à la catégorisation et à l’analyse détaillée des connaissances mobilisées
par les différents professeurs, se reporter à Vantourout, (2004).
69. Pour une présentation détaillée des quatre profils, voir Vantourout (2007).
70. On retrouve un produit-norme « vague et flou », tel qu’avancé par Bonniol (cf. note 13).
Mais avait-il envisagé que cela puisse arriver dans une situation analogue aux nôtres,
avec des qui problèmes mathématiques « classiques » ?
71. On pourrait aussi considérer que ce référent s’apparente à une « image opérative »
(cf. Pastré, 2011).
72. Il est question dans l’énoncé d’un cycliste qui roule régulièrement (phase 1), s’arrête
(phase 2), puis roule à nouveau régulièrement (phase 3). La phase 3 ne peut pas être
modélisée comme une situation de proportionnalité. Pour trouver la distance parcou-
rue au bout de 90 minutes (phase 3), alors que l’un des élèves, David, ne parvient
pas à se dégager de la situation de proportionnalité, l’autre, Alexis, utilise implicite-
ment et judicieusement la propriété des fonctions affines dite « propriété des écarts
proportionnels ».
qui donne lieu à une lecture uniquement orientée par le référé, ce qui
rend difficile, voire impossible, une description à l’aide de ces modèles et
de cette comparaison73.
C’est un fait, certains professeurs élaborent donc leur référent
alors qu’ils évaluent (Vantourout, 2004 et 2007). Il est possible de faire
un rapprochement entre ce phénomène évaluatif et l’évaluation « appré-
ciative sans modèle prédéterminé » postulée par Ardoino et Berger (1986,
cf. Hadji, 1989 et 1992) et dont il sera plus amplement question ci-après.
Cette recherche a permis de donner une consistance empirique à cette
proposition et d’attester l’existence de tels phénomènes évaluatifs. Mais, il
a également été constaté que, parmi les évaluateurs qui ne disposent pas
de référent a priori, certains maîtrisent mal, voire pas du tout, les aspects
disciplinaires du problème servant à évaluer.
4. LA CORRECTION DE DISSERTATION
EN SCIENCES ÉCONOMIQUES ET SOCIALES
Une autre illustration des options méthodologiques et théoriques
que nous défendons pour l’étude de l’activité des évaluateurs vient d’une
recherche menée sur la correction de dissertations en Sciences économiques
et sociales (SES) (Goasdoué, Vantourout & Bedoin, 2016 ; Vantourout
& Goasdoué, 2011). Bien qu’attaché à une autre discipline, ce travail s’ins-
crit dans le prolongement des travaux menés en mathématiques tout en
explorant des questions sur les jugements des enseignants, moins sail-
lantes dans la recherche précédente. Nous avons en effet choisi d’aller vers
une épreuve encore plus ouverte, au sens où l’ensemble des productions
également valables ou acceptables est plus important et que ces produc-
tions, qui sont d’une grande richesse74, ne relèvent certainement pas du
régime du « juste » ou du « faux ». Ces caractéristiques permettent par
ailleurs de réinterroger la pertinence de la comparaison référent/référé,
puisqu’évidemment aucun enseignant ne s’engage dans la correction avec
une « dissertation modèle » en tête. L’absence d’un référent identifiable ne
73. On pourrait rétorquer que ce profil est avant tout un artefact de la situation aména-
gée, qu’un professeur en exercice ne donne pas à ses élèves un problème qu’il ne saura
pas résoudre, une tâche pour laquelle il ne dispose pas finalement de la réponse atten-
due. Nous pensons qu’il n’en est rien et qu’en raison de contraintes diverses, l’emploi
d’outil d’évaluation par certains enseignants repose parfois sur un choix très global, un
choix par thématique, sans que soient pesés les enjeux de la tâche d’évaluation qu’ils
ne conçoivent qu’assez rarement.
74. Une copie peut-être « riche » pour son contenu, relativement à ce qui est évalué et
attendu, mais elle peut l’être aussi pour les « problèmes » qu’elle suscite du point de
vue de son évaluation, des ambiguïtés qu’elle renferme.
signifie pas pour autant l’absence d’attentes très précises, mais nous les
qualifierions alors plutôt de réseaux d’attentes que de référent.
L’enquête s’appuie sur une analyse détaillée des verbalisations d’en-
seignants au cours de leur correction de copies. Il s’agit à nouveau d’une
situation aménagée, car ce travail d’explicitation de l’activité de correction
est, dans une certaine mesure, artificiel tout en étant bien un témoignage du
fonctionnement cognitif du correcteur. Après un temps de « préparation »
du sujet de la dissertation, nous demandons aux enseignants de verbaliser
tous les commentaires qu’ils jugent nécessaires pour que l’on comprenne
leur activité de correction. Toujours dans l’idée de prolonger dans une autre
perspective les travaux en docimologie, nous avons sélectionné trois copies75
dont une moins bonne et deux moyennes, car elles sont identifiées de
longue date (cf. Laugier, Weinberg 1936, cités par Piéron 1963) comme
suscitant un maximum de divergences. Tous ces choix – une tâche ouverte,
des réponses ne pouvant pas nécessairement faire l’objet d’une évaluation
tranchée, des copies moyennes – offrent une sorte de cas « extrême » pour
mettre à l’épreuve les principaux résultats et hypothèses de la docimologie :
les divergences entre évaluateurs et leurs déterminants, le modèle com-
paraison référent/référé. Enfin pour évacuer l’effet possible du niveau de
formation et de maîtrise des contenus évalués, nous nous sommes adressés
à des enseignants expérimentés et presque tous agrégés en SES.
Le premier constat quantitatif des divergences de notation est
conforme à tout ce qui a été écrit à ce sujet depuis les travaux pionniers
des docimologues des années 1930, la même copie à reçu la note de 8/20
ou 16/20 selon le correcteur. L’intérêt majeur de ce travail ne réside évi-
demment pas dans la répétition de ce constat, mais dans l’analyse du lien
que l’enquête permet de faire entre notation et jugement. Si on compare
les correcteurs par paires, on peut par exemple remarquer que des écarts
plus faibles en nombre de points ne s’accompagnent pas nécessairement
d’une convergence accrue de jugements simplement caractérisés par leur
valence positive ou négative (Vantourout & Goasdoué, 2010). Inversement,
des enseignants produisant davantage de jugements communs à propos des
mêmes éléments mettent des notes plus divergentes. Ce premier constat
conduit évidemment à différencier divergences de jugement et de nota-
tion. La nature de l’épreuve et les techniques de correction pourraient
être invoquées pour expliquer ces décalages entre jugements et notation.
L’adoption d’un barème commun pourrait être vue comme une solution à
ces divergences ; or il n’en est rien (idem). En effet, parmi les enseignants
interrogés, plusieurs corrigeaient à l’aide d’une grille commune et très détail-
lée à laquelle ils confient en quelque sorte le choix de la note qui n’est plus
75. Ces trois copies proviennent d’un lot, que nous nous étions procuré, constitué de
l’ensemble des copies de bac blanc d’une classe de terminale.
qu’une somme de l’ensemble des points accordés pour chaque item (en fait,
les compétences constitutives de la maîtrise de la dissertation) de la grille.
Les divergences de notation entre ces correcteurs ne sont pas inférieures
à celles relevées avec d’autres correcteurs qui corrigeaient sans grille76.
Une analyse plus approfondie a permis de constater que si de nombreux
enseignants s’intéressaient aux mêmes passages de la dissertation (80 %
des verbalisations sont concentrées sur les mêmes phrases), ils n’en tirent
pas toujours les mêmes conséquences. On retrouve ici les constats faits
lors de la recherche précédente, la convocation d’une même connaissance
ne conduit pas nécessairement au même jugement évaluatif, comme en
témoignent les extraits suivants :
À la lecture de ces deux phrases d’une copie : Les syndicats
sont devenus des institutions, c’est pourquoi les salariés ne se
reconnaissent plus dans les syndicats et n’y adhèrent donc plus. Les
représentants des syndicats ne sont plus des salariés c’est pourquoi
on peut se demander si les syndicats défendent leurs propres intérêts
ou ceux des adhérents.
76. Attention toutefois, la grille, qui contraint et organise l’activité des évaluateurs, a des
effets positifs, notamment sur la qualité des retours adressés aux élèves (Vantourout
& Goasdoué, 2010).
77. Pour une présentation détaillée de la catégorisation des inférences, voir Goasdoué et al.
(2016).
79. Pathologie moderne caractérisée par l’abus de statistiques, déjà dénoncé par Pitirim
Sorokin en 1956 à propos de l’usage des statistiques en sociologie.
RÉFÉRENCES BIBLIOGRAPHIQUES
Amigues R., Bonniol J.-J., Caverni J.-P., Fabre J.-M. & Noizet G. (1975). Le compor-
tement d’évaluation de productions scolaires : à la recherche d’un modèle explicatif.
Bulletin de psychologie, 28, 793-799.
Amigues R., & Zerbato-Poudou, M.-T. (1996). Les pratiques scolaires d’apprentis-
sage et d’évaluation. Paris : Dunod.
Barbier J.-M. (1985). L’évaluation en formation. Paris : PUF.
Blanc N. & Brouillet N. (2003). Mémoire et compréhension. Paris : In Press.
Bodin A. (2006). Les mathématiques face aux évaluations nationales et inter-
nationales. Repères IREM, no 65, 55-89. www.univirem.fr/commissions/reperes/
consulter/65bodin.pdf
Bonniol J.-J. & Vial M. (1997). Les modèles de l’évaluation – Textes fondateurs
avec commentaires. Bruxelles : De Boeck.
Cardinet J. (1973/1988). L’adaptation des tests aux finalités de l’évaluation. In J.
Cardinet, Évaluation scolaire et mesure (pp. 24-59). Bruxelles : De Boeck.
Caverni J.-P. & Gonzales M. (1986). Vers une modélisation des processus de jugement
dans l’évaluation. Bulletin de psychologie, 39 (375), 301-304.
Chen S. & Chaiken S. (1999). The Heuristic-Systematic Model in ITS Broader
Context. In S. Chaiken & Y. Tropes (Eds), Dual Process Theory in Social and
Cognitive Psychology, 73-96. New York : Guilford.
Crahay M. (2013). Nécessité et insuffisance d’une psychologie de l’apprentissage pour
enseigner les mathématiques. Éducation & Formation – e-298-01, 11-21.
Delcambre I. (2007). Contenus d’enseignement et d’apprentissage. In Y. REUTER,
Dictionnaire des concepts fondamentaux des didactiques (pp. 45-51). Bruxelles :
De Boeck.
De Ketele J.-M. (2012). À la recherche de paradigmes intégrateurs ou de paradigmes
unificateurs. In L. Mottier Lopez & G. Figari, Modélisation de l’évaluation en édu-
cation – Questionnements épistémologiques (pp. 195-210). Bruxelles : De Boeck.
Eco U. (1985). Lector in fabula. Paris : Le Livre de poche.
Fiske, S. (2008). Psychologie sociale. Bruxelles : De Boeck.
Goasdoué R., Vantourout M. & Bedoin D. (2016). La correction de dissertations : nouveau
regard sur la construction des jugements des évaluateurs. In L. Mottier Lopez & W. Tes-
saro, Le jugement professionnel des enseignants (pp. 73-93). Berne : Peter Lang.
Hadji C. (2012). Faut-il avoir peur de l’évaluation ? Bruxelles : De Boeck.
Hadji C. (1997). L’évaluation démystifiée. Paris : ESF.
Hadji C. (1992). L’évaluation des actions éducatives. Paris : PUF.
Hadji C. (1989). L’évaluation, règle du jeu. Paris : ESF.
Kahneman D. (2012). Système 1/Système 2 – Les deux vitesses de la pensée. Paris :
Flammarion.
Laugier H. & Weinberg D. (1927). I. Le Facteur subjectif dans les notes d’examen.
L’année psychologique, 28 (1), 236-244.
Leplat J. (1997). Regards sur l’activité en situation de travail. Paris : PUF.
Maury S. (2001). Didactique des mathématiques et psychologie cognitive : un regard
comparatif sur trois approches psychologiques. Revue française de pédagogie,
no 137, 85-93.
Nabbout M. (2006). Enseignement des probabilités en terminale au Liban :
études des représentations et des pratiques dans des situations aménagées.
Thèse non publiée. Université René Descartes – Paris 5 Sorbonne.
Noizet G. & Caverni J.-P. (1978). Psychologie de l’évaluation scolaire. Paris : PUF.
Passeron J.-C. (1992/2006). Le Raisonnement sociologique : Un espace non pop-
périen de l’argumentation. Paris : Albin Michel.
Pastré P. (2011). La didactique professionnelle. Paris : PUF.
Sperber D. & Wilson D. (1989). La pertinence – communication et cognition.
Paris : Les Éditions de Minuit.
Vantourout M. (2007). Étude de l’activité évaluative de professeurs stagiaires
confrontés à des productions d’élèves en mathématiques : quel référent pour l’éva-
luateur ? Mesure et évaluation en éducation, vol. 30, no 3, 29-58.
Vantourout M. (2004). Étude de l’activité et des compétences de professeurs des
écoles et de professeurs de mathématiques dans des situations « simulées »
d’évaluation à visée formative en mathématiques. Thèse non publiée. Université
René Descartes – Paris 5 Sorbonne.
Vantourout M. & Goasdoué R. (2014). Approches et validité psychodidactiques des
évaluations. Éducation & Formation – e-302, 139-155.
Vantourout M. & Goasdoué R. (2011). Correction de dissertations en SES. Idées,
163, 71-77.
Vantourout M. & Goasdoué, R. (2010). Correction de dissertations : analyse de
l’activité de professeurs engagés dans une approche pas compétences. In Actes du
congrès de l’Actualité de la recherche en éducation et en formation (AREF),
Université de Genève, 13-16 septembre. 12 pages (en ligne).
Vantourout M., Goasdoué R., Maury S. & Nabbout M. (2012). À la frontière entre
l’écologique et l’expérimental : des situations aménagées pour l’étude de l’activité
évaluative en mathématiques. In M. Altet, M. Bru, C. Blanchard-Laville (Eds), Obser-
ver les pratiques enseignantes (pp. 191-204). Paris : L’Harmattan.
Vantourout M. & Maury S. (2006). Quelques résultats relatifs aux connaissances
disciplinaires de professeurs stagiaires dans des situations simulées d’évaluation de
productions d’élèves en mathématiques. Revue des sciences de l’éducation, vol. 32,
no 3, 759-782.
ANNEXE 1
SORTIE
PRODUCTEUR MÉMOIRE ÉVALUATION (évaluations)
INFORMATIONS SÉQUENTIELLES
INFORMATIONS « A PRIORI »
COMPARATEUR
CONDITIONS DE
PRODUCTION
MODÈLE
DE
RÉFÉRENCE PRODUIT
RÉÉL
ENTRÉE
REPÈRES (productions)
PRODUITS PRODUITS
POSSIBLES SÉLECTEUR ATTENDUS SUR UNE
ÉCHELLE
OBJECTIFS CORPS DE
PÉDAGOGIQUES CONNAISSANCES
ANNEXE 2
ANNEXE 3