Académique Documents
Professionnel Documents
Culture Documents
La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les
limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la
licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie,
sous quelque forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de
l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage
dans une base de données est également interdit.
Résumé
Cet article donne à voir le rapport entretenu entre l’évaluation et la mesure dans le champ éduca-
tif. Les questions qui sont posées sont susceptibles d’alimenter le débat sur l’évaluation dans le
champ de l’administration au‑delà du seul champ éducatif. Dans un premier temps, l’article rap-
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)
Mots‑clefs
Mesure, jugement professionnel en évaluation, évaluation située, collaboration
Abstract
— Questioning the Measurement Model: Evaluation from the Perspective of Professional
Judgement and Collaboration Within the Field of Educational Science — This article high‑
lights the link between evaluation and measurement within the field of education. The ques‑
tions that are raised contribute to the ongoing debate on evaluation, also present within the
field of administration. Initially, the article recalls the origins of measurement when it comes
to education by mentioning the studies on grading practices which demonstrated the impor‑
tance of possessing the skill‑set required for “aptly evaluating” student learning. Therefore, in
this case measurement serves as a reference model. Next, the article presents some arguments
questioning this idea, namely by highlighting the necessary distinction to be made between
evaluation and measurement. By doing so, the article briefly outlines some of the major guide‑
lines for broadening the theoretical framework of evaluation, in which measurement becomes
merely just another means to an end. So as to illustrate this broadening process, the article
concludes by presenting a model which brings evaluation to the forefront, as a social and
epistemic practice, based on professional judgement and the collaborative dimensions of the
evaluation process. It aims to integrate the characteristics associated with an evaluation that
is both of service to the individual and to social intervention, yet encompassing measurement.
Keywords
Measurement, professional judgement in evaluation, contextualised evaluation, collaboration
Comme le rappellent Demeuse et al. (2004), c’est à partir du XVIIe siècle, avec
Descartes, que la mesure est devenue le langage de la science, appliquée d’abord aux
domaines de la physique, puis dès le XIXe siècle, à l’homme lui‑même. En psychologie,
« l’idée, qui apparaît vers 1880, c’est l’idée que l’accès à la connaissance au sens strict,
c’est‑à‑dire au sens scientifique, est la possibilité d’établir une échelle numérique sur
laquelle pourront être positionnés les phénomènes observés afin de les appréhender de
manière rationnelle » (p. 24). Le postulat était alors que tout attribut humain, à l’instar des
caractéristiques physiques, pouvait être objet de mesure (Dauvisis, 2006). En éducation,
l’usage de la mesure a émergé au début du XXe siècle avec la préoccupation de devoir
assurer une qualité à la notation scolaire, dans le cadre plus spécialement des examens.
En lien avec les buts de massification et de démocratisation de l’accès à la formation, la
note, par laquelle l’école a la responsabilité de signifier les réussites ou échecs scolaires,
se doit d’être juste et objective 1. De nombreuses recherches, tant aux États‑Unis qu’en
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)
1. L’idéologie sous‑jacente, bien connue sous le principe de l’égalité des chances, est que la distribu-
tion du travail et le « tri social » doivent résulter des mérites de chacun et non plus de l’origine sociale.
2. Le terme de docimologie puise sa racine dans le grec (examiner, épreuve).
et, donc, d’équité sociale. Ils ont pour intérêt d’attirer l’attention sur les multiples facteurs
qui influencent la notation. Grâce à la docimologie, il est apparu qu’un « art de bien éva-
luer » était tout aussi important que de savoir bien enseigner.
Dans le prolongement de cette préoccupation, les docimologues ont poursuivi les
travaux en développant une science de la mesure plus spécialement en éducation, appe-
lée édumétrie. Celle‑ci se donne pour objectif de mesurer le mieux possible des progrès
intra‑individuels qui « reflètent des changements dans ce que les individus ont appris »
(Mc Clelland, 1973, p. 8). La théorie de la généralisabilité est représentative de ce mou-
vement, qui s’oppose à une vision trop restrictive de la psychométrie, afin d’envisager
quatre types de différenciation : (1) des élèves et de leurs traits distinctifs ; (2) des objec-
tifs et des domaines d’enseignement ; (3) des conditions d’apprentissage et des facteurs
d’enseignement ; (4) des niveaux successifs d’un apprentissage. Pourtant, malgré cet
élargissement apporté par l’édumétrie visant à prendre en considération la spécificité de
la mesure en éducation (par rapport à la psychologie), un ensemble de critiques se font
entendre dès les années 1980, remettant en question la pertinence de la mesure comme
(unique) paradigme pour penser l’évaluation scolaire (Dauvisis, 2006).
Pour étayer ce point de vue, à savoir que mesurer n’est pas le synonyme d’évaluer,
Amigues et Zerbato‑Poudou (1996) prennent l’exemple bien connu de la mesure du quo-
tient intellectuel (QI). La mesure correspond au résultat : par exemple 120. L’évaluation
consiste à interpréter cette mesure, autrement dit à lui attribuer une valeur qui lui confère
une signification sociale : un QI de 120 indique une intelligence considérée comme
étant au‑dessus de la moyenne, par rapport à une norme arbitraire qui a été construite
à partir d’un grand nombre de mesures sur une population de référence. En fonction de
cette interprétation du résultat, communiquée à la personne qui a effectué le test ou à ses
proches, une certaine compréhension des situations vécues peut être envisagée et des
décisions sont susceptibles d’être prises (si évidemment, on accorde de l’importance à
ce type d’indicateur). Dans les années 1980, Cardinet, précurseur, établissait déjà cette
distinction entre mesure et évaluation. Cet expert de la mesure, formé par Cronbach
aux techniques de la généralisabilité, insistait sur la nécessaire prise en considération
de la nature foncièrement située et socio‑historique de l’évaluation en tant que pratique
3. Cardinet, il faut le souligner, n’utilisait pas directement ces termes issus de la littérature actuelle.
qui font la complexité du réel, […] ceux qui sont de l’ordre de l’inédit, du singulier, par
définition non communs, non récurrents ». Or, comme le rappelle cet auteur, la mesure
renvoie à des moyennes de groupes 4 « alors que les interventions situées touchent des
individus tous uniques, singuliers, par‑delà les parentés et les similitudes ».
Force est de constater que la mesure et ses « produits » suscitent souvent d’impor-
tantes résistances auprès des acteurs concernés, car ils apparaissant hors de leurs réalités
et de leurs expériences quotidiennes, et peut‑être aussi parce qu’ils entretiennent une cer-
taine confusion entre des résultats qui concernent des actions collectives et la perception
d’une évaluation qui, de fait, interpelle aussi l’individu.
Ces différents arguments, mais également l’émergence dans les années 1970 et sui-
vantes d’une évaluation formative au service des apprentissages des élèves s’appuyant
sur des cadres théoriques éloignés de la mesure (voir Allal & Mottier Lopez, 2005, pour
une synthèse des travaux sur l’évaluation formative), contribuent à un élargissement des
modèles pour penser l’évaluation scolaire. Peu à peu, l’évaluation est théorisée comme
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)
5. Que nous qualifierions aujourd’hui aussi de pratique épistémique, au sens de Paavola et al. (2012),
qui insiste sur les objets de connaissance en jeu dans la pratique sociale.
6. Le référentiel désigne l’ensemble des référents choisis par l’évaluateur pour interpréter les obser-
vables (Figari, 2006).
7. Et non pas un « jugement de valeur » comme on peut souvent le lire dans la littérature.
8. Le terme de « contrôle écrit » désigne un instrument d’évaluation composé d’items écrits (questions,
consignes, énoncés de problème, etc.) auxquels l’élève doit répondre par écrit.
9. Voir Allal et Mottier Lopez (2009) pour une revue détaillée de cette littérature.
strict. Un enjeu, selon nous, est d’étudier également la nature « située » du jugement,
afin de mieux comprendre la relation de couplage entre le contexte socio‑institutionnel et
l’activité de la personne qui participe à l’évaluation, en tant que pratique sociale et épisté-
mique d’une communauté donnée. Dans Mottier Lopez (2013), nous avons alors accordé
une attention toute particulière à la notion de « culture de l’évaluation », aujourd’hui
constamment citée par les politiques et décideurs (surtout en tant que « rhétorique »,
constate Pons, 2008) mais également de plus en plus présente dans les écrits scientifiques
– bien que souvent insuffisamment définie. Après un travail définitoire systématique,
nous avons mis en évidence l’existence de cultures de l’évaluation différentes en fonction
des catégories socioprofessionnelles des acteurs impliqués : celle des « gestionnaires »,
désignant l’ensemble des professionnels qui ont une responsabilité dans le pilotage des
systèmes éducatifs, et celle des « pédagogues » qui ont une responsabilité d’enseigne-
ment et de formation. 10 Les pratiques, les normes, les valeurs, les discours attribués à
l’évaluation diffèrent, par exemple par rapport au sens des mesures et indicateurs chif-
frés produits par les épreuves externes (par exemple les évaluations nationales). Pour les
gestionnaires, la culture de l’évaluation est alors associée à une culture du contrôle et de
la performance, participant à l’évaluation du système éducatif qui doit répondre à l’exi-
gence de « rendre des comptes » (accountability) par rapport à des objectifs d’efficacité
et d’efficience (Thélot, 1993). Cette culture entre en tension, voire en conflit direct, avec
les valeurs, les normes, les pratiques, les langages du monde des pédagogues qui ont leur
propre culture en évaluation, leur propre rationalité, leurs propres références, dont on a
vu notamment les résistances face aux pratiques de contrôle et de mesure sous couvert de
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)
10. Nous utilisons ces deux expressions, « gestionnaire » et « pédagogue », à titre métaphorique, sachant
par ailleurs que des variations de cultures existeraient également entre les différentes catégories professionnelles
appartenant à chacune de ces deux grands ensembles.
Références bibliographiques
Akrich, Madeleine ; Callon, Michel et Latour, Bruno (dir.) (2006), Sociologie de la traduction :
textes fondateurs, Paris, Presses des mines de Paris.
Allal, Linda et Mottier Lopez, Lucie (2005), « Formative assessment of learning : A review of
publications in French », in Formative Assessment – Improving Learning in Secondary
Classrooms, Paris, OECD‑CERI Publication, p. 241‑264.
Allal, Linda et Mottier Lopez, Lucie (2009), « Au cœur du jugement professionnel en évaluation :
des démarches de triangulation », Les dossiers des sciences de l’éducation, 22, p. 25‑40.
Amigues, René et Zerbato‑Poudou, Marie‑Thérèse (1996), Les pratiques scolaires d’apprentissage
et d’évaluation, Paris, Dunod.
Bacher, Françoise (1973), « La docimologie », in Reuchlin, Maurice (dir.) (1973), Traité de psycho‑
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)
Weber, Max (1919), Le savant et le politique, Version numérique dans la collection « Les clas-
siques des sciences sociales », http://classiques.uqac.ca/classiques/Weber/savant_politique/
Le_savant.pdf.
Wenger, Etienne (1998), Communities of practice: Learning, meaning, and identity, New York,
Cambridge University Press.
Wyatt‑Smith, Claire ; Klenowski, Val and Gunn, Stephanie (2010), « The centrality of teachers’jud-
gement practice in assessment : a study of standards in moderation », Assessment in
Education : Principles, Policy & Practice, 17 (1), p. 59‑75.
Zay, Danielle (2012), « Michel Lecointe, une pensée de sortie de crise. Actualité et pertinence d’une
redéfinition de l’évaluation », in Odry, Dominique (dir.) (2012), Évaluer pour accompagner
les établissements d’éducation et de formation, Chasseneuil du Poitou, ESEN, p. 97‑103.
© École nationale d'administration | Téléchargé le 22/02/2021 sur www.cairn.info (IP: 41.200.221.170)