Vous êtes sur la page 1sur 12

Cours n° 4

Qu’est-ce que l’évaluation ? (partie 1)

Il existe une forte demande d’évaluations, personnelles ou institutionnelles, destinées soit à


réguler les apprentissages, soit à sélectionner l’excellence, toutes motivées par les besoins
d’une société où la mobilité des échanges s’accentue, souvent soutenue par des volontés
politiques affirmées. Si l’éducation pour tous est devenue un droit, la gouvernance des États
comme celle des institutions impliquent une remise à plat de certains fonctionnements, au
risque de renforcer les inégalités et les injustices ou de voir des dispositifs extérieurs venir
supplanter les dispositifs nationaux. Dans cette optique, il nous faut préciser certains concepts.

Evaluation et mesure

L’évaluation peut-elle être considérée comme une mesure du fait que, dans la plupart des cas,
on évalue en attribuant une note chiffrée ?
« La mesure est l’opération qui permet de passer de l’espace continu du Réel à l’espace
discret du Connu » (Perdijon, 2004). Une mesure n’a de sens que si elle est acceptée de
manière consensuelle. « Il ne saurait exister de vie sociale sans consensus sur une commune
mesure » (Perdijon, op ibid).
Lorsque nous utilisons une règle graduée pour mesurer la longueur d’un segment de droite, le
résultat de cette opération s’exprime par un nombre accepté par tous ; cela signifie que l’unité
de mesure et l’outil choisis sont consensuels et que le résultat obtenu est discriminant. C’est
donc une opération valide, mais aussi fiable puisqu’elle peut être répétée autant de fois qu’on
le souhaite par autant de personnes possibles, et que l’on obtiendra toujours le même résultat.
Ce sont ces deux qualités, validité et fiabilité, qui confèrent à la mesure sa valeur sociale.
Cette mesure n’a rien d’universel. On peut mesurer un segment donné en mètres, en pouces,
en pieds ou en heures, et il faut aussi que les individus aient été formés pour parvenir à cette
mesure. L’application du système décimal ne se répandit réellement en France qu’à partir de
la deuxième moitié du XIXème siècle, « avec les progrès de l’enseignement primaire, car les
illettrés arrivaient à diviser par deux, par quatre ou huit (en pliant, une, deux ou trois fois une
ficelle ou un mouchoir), mais non par dix » (Perdijon, op ibid). L’acte de mesurer est donc un
acte technique, culturel et social. Si l’évaluation est une mesure, nous poserons donc le
postulat que l’acte d’évaluer l’est aussi.
Mais si nous savons dire clairement à quoi correspond un segment de droit de 15 cm, en est-il
de même lorsque nous disons que telle copie « vaut 15/20 » ?
Mesurer une performance en langue est bien entendu autrement plus complexe que mesurer
un segment de droite. Si l’évaluation de la mesure de la longueur d’un segment ne fait guère
question, il n’en est pas de même dès que l’on tente de mesurer une aptitude humaine : des
attributs physiques peuvent être observés directement (taille, poids), mais il n’en est pas de
même pour des caractéristiques telles que l’intelligence, la motivation ou encore la fluidité
dans le parler. Devant cette difficulté, l’institution éducative dans son ensemble a contourné le
problème, en établissant la mesure dans le rapport qui existe entre un état présent et un état
attendu, et l’évaluation est donc devenu l’expression de la mesure d’un écart. Cette
approche, pour exacte qu’elle soit, a eu une conséquence considérable dans le rôle de
l’évaluation en éducation. En observant en effet l’écart entre l’état présent et l’état attendu, on
s’intéresse davantage à la distance restant à parcourir plutôt qu’au chemin réalisé, et cette
louable vision pédagogique de l’effort restant n’a pas toujours le même potentiel
motivationnel pour l’évalué qui aimerait aussi parfois se voir féliciter pour le chemin
parcouru. Or, cette approche de l’irréalisé incite peu à valoriser ce qui a été fait et l’évaluateur
est souvent amené à considérer tous les éléments négatifs pour établir sa mesure. L’évaluation
revient donc alors à faire le bilan de tout ce qui n’est pas (ou mal) maîtrisé (le modèle dit
« vertical-descendant », de Puren, 2006) en lieu et place de l’observation de ce qui est bien
(les modèles « vertical-ascendant » et « horizontal » du même auteur dont nous reparlerons
plus loin).
Mais si nous avons vu que les hommes sont finalement convenus que l’évaluation métrique
ferait référence à un étalon (de même d’ailleurs que celle d’un volume ou d’une quantité de
chaleur), quelle est donc l’unité de valeur qui motive l’attribution d’une note dans une
performance en langue ? Pour apporter une réponse simple et consensuelle à cette question, il
aurait fallu parvenir à une conceptualisation simple de l’acte de communiquer, sécable en
unité de mesure, ce qui n’est évidemment pas le cas. Faute de pouvoir répondre à cette
question, nous considérerons donc, pour notre part et en l’état actuel de choses, parce que cela
nous semble rentable en termes didactiques, que l’attribution d’une note, d’une lettre ou de
toute autre quantification de la valeur évaluée constitue bien souvent plus un message plutôt
qu’une mesure.
Doit-on pour autant renoncer à la notion de mesure ? Quand on veut suivre les variations
d’une grandeur, chaque mesure est nécessairement séparée de la précédente et constitue un
échantillon. Toutefois, si l’on veut rendre une mesure absolue qui pourra servir de référence,
il faut procéder à un étalonnage de la chaîne, c'est-à-dire une normalisation. Cette phase est
indispensable pour donner des indications qui ne soient pas entachées d’erreurs. Nous verrons
que les certificateurs n’ont pas renoncé à cette recherche de la validation empirique, car elle
pourrait constituer la garantie d’une évaluation fidèle et fiable.
Mais leur raisonnement connaît des limites et il n’est pas exempt de risques pour l’évaluation.
Nous le constaterons, les procédures statistiques qu’ils ont établies visent selon nous surtout à
expliciter un certain nombre de dimensions observables qu’ils considèrent prioritaires, afin de
garantir un consensus autour de « plus petits dénominateurs communs ». Il s’agira donc de la
recherche « a minima » de concepts ayant trait à la validité ou à la fiabilité des épreuves, et
cette démarche peut réduire le fait évaluatif à quelques typologies bien définies. Nous devons
cependant reconnaître qu´elle met également l’accent de façon détaillée sur les dimensions
choisies, et qu’elle apporte un argumentaire non négligeable pour savoir comment s’assurer
que telle épreuve d’un niveau donné est bien de ce niveau, ou encore pour savoir si telle
épreuve d’un niveau donné n’est pas plus difficile/facile qu’une autre prétendument du même
niveau, ou encore pour vérifier que les variations de notation entre évaluateurs sont minimes.
Sur le plan qualitatif, elle n’est donc pas dénuée de mérites, ce qui en explique le succès en
particulier Outre-manche et Outre-Atlantique.
Sur ces questions, les méthodes françaises traditionnelles n’apportent généralement que peu
de réponses, et l’on aurait donc tort de rejeter en bloc l’analyse psychométrique, comme
semble vouloir le faire certain courant universitaire aujourd’hui en France. Nous
considérerons donc pour notre part que l’évaluation est, dans la plupart des cas, un message,
mais que dans certaines circonstances et moyennant le recours à certaines techniques, elle
peut être considérée aussi comme une mesure. Nous tenterons d’illustrer par la suite cette
approche que nous illustrerons.

Les différents types d’évaluation

Dans une approche didactique centrée sur le quoi et le comment évaluer, le Cadre européen
commun de référence pour les langues (2001) recense 26 typologies différentes d’évaluations
qu’il classe en 13 sous-groupes de paires, tout en ajoutant avec juste raison que cette liste
n’est pas exhaustive (pour plus de détails nous renvoyons le lecteur au chapitre 9 du Cadre).
1 Évaluation du savoir Évaluation de la capacité
2 Évaluation normative Évaluation critériée
3 Maîtrise Continuum ou suivi
4 Évaluation continue Évaluation ponctuelle
5 Évaluation formative Évaluation sommative
6 Évaluation directe Évaluation indirecte
7 Évaluation de la performance Évaluation des connaissances
8 Évaluation subjective Évaluation objective
9 Évaluation sur une échelle Évaluation sur une liste de
contrôle
10 Jugement fondé sur l'impression Jugement guidé
11 Évaluation holistique ou globale Évaluation analytique
12 Évaluation par série Évaluation par catégorie
13 Évaluation mutuelle Auto-évaluation
Cadre européen commun de référence pour les langues (2001)
Dans une optique plus sociologique centrée sur le pour quoi évaluer, ces typologies nous
semblent pouvoir se répartir de part et d’autre d’un axe qui rappelle la vision évoquée au
chapitre précédent. Sous quelque forme que ce soit, l’évaluation sert d’une part à apprendre et
à enseigner, nous dirons alors qu’elle régule l’apprentissage, et elle sert d’autre part à valider
l’apprentissage, et donc l’enseignement, à récompenser et/ou à sélectionner l’excellence.
En ce sens, on peut affirmer qu’il existe finalement deux grands types d’évaluation :
l’évaluation formative et l’évaluation sommative, déclinables en de multiples typologies. Ces
deux types d’évaluation, en contexte d’apprentissage/enseignement, sont souvent
indissociables, l’un n’excluant pas l’autre. Les enseignants de langues étrangères ont recours
aux deux et ils répondent en cela à des objectifs différents. L’évaluation sommative est
traditionnellement rattachée à l’examen de fin de session ou de fin d’année qui permet de
vérifier si un ensemble de connaissances et/ou de compétences a été acquis par l’apprenant.
L’évaluation formative, quant à elle, repose sur l’échange d’informations entre l’enseignant et
l’apprenant ou sur une auto centration de l’apprenant sur lui-même, et permet ainsi d’obtenir
des renseignements sur les compétences acquises par l’apprenant tant sur les plans notionnel
que fonctionnel.
L’évaluation formative se définit par une prise d’informations au début ou au cours de
l’apprentissage. Cette prise d’information peut se faire de façon formelle ou informelle. De
façon informelle, l’enseignant peut estimer, au cours d’une unité d’apprentissage, le niveau de
compétence d’un apprenant ou les progrès qu’il a réalisés sans nécessairement faire appel à
des outils plus spécifiques comme les grilles d’évaluation, les barèmes ou les questionnaires.
Il exprime un jugement d’expert sur la base de son expérience, de sa connaissance du public
et de la matière enseignée. Il va, par exemple, estimer le niveau de compétences ou les
progrès d’un apprenant à partir d’éléments non quantifiables : fréquence de prise de parole,
délai pour réaliser un exercice, complexité des réponses apportées à des questions de niveaux
de difficulté différents, degré d’interaction avec les autres apprenants, degré de réactivité,
capacité à mémoriser, etc. De façon formelle, l’enseignant peut, dans une autre optique,
proposer des exercices de type structural ou des activités de communication contextualisées,
sous forme de tâches, afin d’inférer un niveau de compétence. Ces exercices ou ces tâches
peuvent être, ou non, accompagnés d’un barème et de critères d’évaluation, éventuellement
pondérés. D’une façon générale, l’évaluation formative permet au formateur de réajuster son
enseignement, d’envisager l’atteinte de nouveaux objectifs, d’accélérer ou de ralentir son
rythme d’enseignement, de s’adapter aux besoins et aux intérêts des apprenants, de
réorganiser son plan de cours, d’identifier des apprenants ayant des difficultés ou des facilités
par rapport au reste du groupe.
À la suite de J.M. de Ketele (1986), nous retiendrons qu’une typologie particulière s’impose
souvent dans l’apprentissage/enseignement, et avec d’autres conséquences aussi dans
l’évaluation sélection, qu’il va nommer herméneutique et qui pourrait correspondre, en raison
de cette démarche intuitive ou interprétative du jugement évaluatif, à ce que l’on a décrit
comme une évaluation informelle. Ce type d’évaluation doit correspondre à un raisonnement
d’expert qui va permettre de donner un sens à l’action d’évaluer grâce à la prise en compte de
paramètres et d’indices quantitatifs et quantitatifs aussi diversifiés que l’observation du travail
réalisé en classe ou des résultats obtenus antérieurement.
L’évaluation sommative, quant à elle, est associée le plus souvent au contrôle qui permet,
avant tout, de vérifier si des connaissances ont été acquises et/ou des compétences maîtrisées.
En langue étrangère, le contrôle ne doit pas nécessairement être limité de manière exclusive à
la vérification de l’acquisition partielle ou totale des connaissances. Il est en effet important
de définir au préalable les finalités de l’enseignement proposé, ainsi que les objectifs de
l’évaluation sommative. Ainsi, si l’évaluation exclusive des connaissances ou des
compétences isolées peut correspondre à une évaluation ponctuelle à visée formative, elle ne
peut être associée, en langue étrangère et dans une perspective actionnelle de
l’enseignement/apprentissage, à une évaluation sommative si l’évaluateur est chargé d’inférer
une compétence communicative. En effet, en évaluation formative, évaluer les connaissances
des apprenants, par exemple des verbes d’usage fréquent du 3ème groupe ou de l’utilisation du
passé composé, n’a de sens que si l’enseignant cherche à mesurer le degré de connaissance de
telle ou telle composante linguistique afin de conduire l’apprenant vers des compétences
communicatives complètes, c’est-à-dire vers l’accomplissement d’une tâche. Toutefois, si
l’on souhaite rattacher l’évaluation à la notion d’enseignement et d’apprentissage dans une
perspective actionnelle, l’évaluation sommative doit au minimum et nécessairement inclure
les trois composantes définies par le Cadre, à savoir les composantes linguistique,
sociolinguistique et pragmatique. Cela pose, il est vrai, le problème du rapport
multidimensionnel de ces composantes, car c’est par leur observation séparée que l’on
suggérera un bilan global, or la maîtrise de l’une de ces composantes ne compense pas
toujours des lacunes dans une autre Établir un bilan est alors un processus complexe comme
vous le découvrirez dans l’étude de cas pratique que nous allons proposer dans la troisième
partie de cet ouvrage.
Bloom, Madaus et Hastings avaient proposé en 1971 une typologie qui va perdurer pendant
longtemps, distinguant l’évaluation diagnostique, l’évaluation formative et l’évaluation
sommative. En complément du Cadre et de ce que C. Tagliante a pu définir de façon très
claire (2007), nous pouvons aussi retenir les définitions apportées par J.M. de Ketele (2006) :

Régulation

Pronostic (Tagliante) / Orientation (de Ketele) ► il s’agit d’évaluer les performances ou


les connaissances d’un apprenant pour l’orienter vers un contexte d’apprentissage qui
correspond à son niveau de compétence, c’est-à-dire un niveau où il sera en mesure de
poursuivre son apprentissage (adéquation du niveau visé avec la performance de l’apprenant).
D’une façon générale, le pronostic correspond, en langue étrangère, à ce qu’on appelle
communément un « test de niveau ». Le pronostic renseigne l’apprenant et la structure
d’accueil sur ses capacités réelles. Il facilite la constitution de groupes d’apprenants de niveau
plus homogène, et pour J. M. de Ketele, la fonction d’orientation s’apparente à la préparation
d’une nouvelle action (attribuer une note à un test de prérequis, orienter un étudiant sur la
base d’un dossier …).
Diagnostic (Tagliante) / Régulation (de Ketele) ► La régulation, pour de Ketele, doit
permettre d’améliorer une action en cours. Pour C. Tagliante, la fonction diagnostique permet
de réguler l’apprentissage et l’enseignement. Il s’agit d’une évaluation qui est réalisée tout au
long de la formation et qui permet de mesurer, par étapes, les progrès réalisés d’un ou des
apprenants. L’apprenant doit être en mesure de prendre conscience de ses progrès, de ses
forces, de ses difficultés par rapport au reste du groupe ou par rapport à ses propres
performances en fonction de la durée de sa formation. Ces informations, accessibles à
l’apprenant, doivent rythmer, recentrer son apprentissage et lui donner la possibilité de mettre
en place les stratégies nécessaires pour poursuivre l’atteinte des objectifs. Le diagnostic, par
ailleurs, permet à l’enseignant de redéfinir ou d’ajuster ses techniques d’enseignement, son
plan de cours, son rythme ou son syllabus pour permettre une meilleure adéquation des
objectifs pédagogiques avec les performances réelles (car évaluées tout au long de la
formation) des apprenants, de certains ou d’un seul apprenant.
Sélection
Inventaire (Tagliante) / Certification (de Ketele) ► La fonction inventaire correspond à
une évaluation souvent critériée et pondérée qui permet de mesurer les performances d’un
apprenant généralement à l’issue d’une formation. Il s’agit d’un bilan des compétences qui
conduit, dans la plupart des cas, à une certification. Se présenter, par exemple, à un examen
du DELF ou du DALF à la fin d’une formation de préparation à l’un de ces diplômes entre
dans le cadre d’une évaluation inventaire. Pour de Ketele, cette dernière fonction, doit
obligatoirement conduire à la délivrance d’un document ou d’une note qui certifie une action
d’évaluation (bulletin de notes, diplôme, portfolio…).
Enfin, et pour compléter ces définitions, reprenons ce que Hadji ajoute (1989) :
- « Si l’objectif dominant est de certifier (faire le point sur les acquis et octroyer
éventuellement un diplôme), l’observation portera sur les comportements globaux,
socialement significatifs.
- Si l’objectif est de réguler (guider constamment le processus d’apprentissage),
l’évaluateur s’efforcera d’obtenir des informations portant sur les stratégies
d’approche des problèmes et sur les difficultés rencontrées.
- Si l’objectif est d’orienter (choisir les voies et modalités d’étude les plus
appropriées), l’évaluation portera principalement sur les aptitudes, les intérêts et
les capacités et compétences considérées comme des pre-requis pour de futures
acquisitions. »

L’évaluation au service de la régulation

Evaluations formative, formatrice et pédagogie de l’erreur, ou comment rompre avec l’indifférence


aux différences (Perrenoud,1994)

Scallon (2000), qui attribue à Cronbach (Cronbach, 1963) l’idée d’une évaluation pour
améliorer, définit l’évaluation formative (Scallon, 2000) comme un « processus d’évaluation
continue ayant pour objectif d’assurer la progression des individus engagés dans une
démarche d’apprentissage ou de formation, selon deux voies possibles : soit par des
modifications de la situation ou du contexte pédagogique, soit en offrant à chaque individu
l’aide dont il a besoin pour progresser, et ce, dans chacun des cas, pour apporter, s’il y a
lieu, des améliorations ou des correctifs appropriés. La décision action, c’est-à-dire la
régulation, a pour objet soit la situation d’apprentissage, soit l’individu lui-même ».
Sur le plan de l’individu, nous pratiquons tous l’évaluation formative dans notre vie
quotidienne ; lorsque nous installons une étagère, lorsque nous apprenons une partition de
guitare, nous recourrons systématiquement à une introspection sur la performance réalisée par
rapport aux attendus initiaux, et nous tentons avec plus ou moins de succès de mettre en place
des actions de remédiation. Cette autorégulation relève d’une composante cognitive
fondamentale dans tout processus d’apprentissage que les spécialistes désignent par le terme
de métacognition. C’est parce que nous sommes conscients du processus d’apprentissage, du
parcours et des stratégies utilisées que nous pouvons engager des actions correctives. Le
retour réflexif et la mise en perspective sont des éléments majeurs de l’évaluation formative.
Sur le plan de la situation d’apprentissage, l’évaluation formative a donc une fonction de
régulation, c’est-à-dire de « réglage du fonctionnement ou du mode de fonctionnement de la
mesure, notamment pour l’adapter aux conditions extérieures ou au résultat à obtenir »
(Scallon, 2000). Elle permet à l’enseignant de procéder à un feed-back (une rétroaction), qui
selon Black et William caractérise l’évaluation formative (Black, P, William, D, 1997).
En évaluation formative, « l'attribution d'une note n'est pas un acte de mesurage, ni même
une tentative, presque constamment vouée à l'échec, nous dit-on, de parvenir à une telle
mesure. Elle participe d'une transaction, et constitue un moment particulier, mais essentiel
d'un processus beaucoup plus large, celui de la négociation didactique. » (Chevallard, 1986).
Dans ce contexte théorique, le feed-back n’est sans doute qu’une composante parmi d’autres
des effets de formation de l’évaluation formative. Un message en soi ne garantit, en effet,
aucune action formative, sauf s’il s’intègre dans une dynamique constructiviste de
l’apprentissage. La proposition de Grégoire (Grégoire, 1999) est à ce titre intéressante. Selon
ce spécialiste, la psychologie cognitive peut se révéler indispensable lorsque l’évaluation ne
se borne pas à faire le point sur un niveau de maîtrise pour informer l’apprenant au sujet du
chemin à parcourir. Elle peut apporter un éclairage permettant de saisir le sens des blocages
ou des erreurs identifiés. Se met alors en place une pédagogie de l’erreur, telle qu’Astolfi la
définit (Astolfi, 2000).
Dans la phrase « les chiens aboies » un apprenant a un jour justifié avoir mis un « s » à
« aboies »parce que plusieurs chiens aboient. Cette erreur démontre bien une véritable
réflexion métalinguistique et le souci de marquer sur l’axe syntagmatique une valeur
paradigmatique, en l’occurrence un sujet pluriel. Produite au niveau C2 du Cadre, cette erreur
pourrait surprendre, et dans certains écrits sociaux elle serait rédhibitoire (concours de
recrutement de professeurs de français par exemple). En revanche, au niveau A1 il s’agirait
d’un indicateur tout à fait encourageant. Elle est du même ordre que la phrase « si j’aurais
su », chère à nos jeunes locuteurs natifs. L’emploi d’un conditionnel présent ici démontre que
le locuteur a identifié une phrase à structure conditionnelle et qu’il a su convoquer une forme
verbale de la condition, qui plus est utilisée dans une forme composée complexe d’antériorité.
Astolfi (2001) établit ainsi une typologie des erreurs des élèves que nous résumerons ici :
 l’erreur relevant de la compréhension des consignes.
 L’erreur relevant d’habitudes scolaires.
 L’erreur relevant d’un mauvais décodage des attentes.
 L’erreur relevant d’opérations intellectuelles inadaptées.
 L’erreur relevant de la surcharge cognitive.
 L’erreur relevant d’une référence à une autre discipline.
 L’erreur relevant de la complexité du contenu.
 L’erreur relevant d’une démarche inattendue.

On pourrait naturellement y ajouter l’erreur relevant de l’angoisse, celle relevant de


l’interférence avec la langue maternelle ou une autre langue étrangère apprise ou, encore,
celle relevant de la violence ou de la peur. L’erreur masque donc parfois de véritables progrès
que l’enseignant doit, dans une démarche d’évaluation formative, identifier et comprendre.
Lorsqu’un étudiant bloque devant la consigne « cochez la bonne réponse », qu’il raye les
réponses fausses ou qu’il n’entoure pas la bonne réponse dans un questionnaire à choix
multiples (QCM), certains enseignants se plaignent à dire que les étudiants « ne savent pas
lire », « ne lisent jamais » ou « ne réfléchissent pas ». C’est souvent faire abstraction de la
surcharge cognitive de certaines tâches. Astolfi propose une démarche de remédiation simple
en 6 temps:
 Entendre par une écoute positive les erreurs.
 Les comprendre.
 Les faire identifier.
 Les faire comparer.
 Les faire discuter.
 Les suivre.
Cela suppose que l’enseignant sait observer chacun de ses apprenants et qu’il se met en
position d’écoute. Comme le souligne Grégoire (op cite), la théorie du Contrôle adaptatif de la
pensée, ACT (Adaptative Control of Thought), élaborée par Anderson (Anderson, 1983 et
Anderson in Grégoire, 1999) propose une théorie de la représentation des connaissances dans
notre mémoire et de la manière dont ces connaissances nous permettent de produire des
comportements adaptés à la structure de notre environnement. Cette théorie distingue les
connaissances déclaratives (savoirs) et les connaissances procédurales (savoir-faire).
Anderson propose ainsi trois étapes dans l’apprentissage des habiletés, c’est-à-dire des règles
de production spécifiques et stéréotypées, demandant peu de conscience de la part du sujet et
pouvant être déclenchées de manière quasi automatiques :
- le stade cognitif, lorsque l’on ne possède pas les règles automatisées pour réaliser
sans effort la tâche ;
- le stade associatif où la performance se transforme progressivement en une
séquence d’actions procédurale (les indices conscients sont peu à peu éliminés) ;
- le stade autonome, aboutissement du précédent, quasiment sans contrôle conscient
et où l’habileté est automatique.

Retenons enfin que dans le cadre d’une évaluation formative, on ne rencontre que des erreurs,
à traiter in situ. Dans le cadre de l’évaluation sommative, par contre, là où la remédiation n’est
plus possible, on distinguera la faute de l’erreur en se fondant sur des listes pré établies
d’attendus, des référentiels, comme l’illustre fort bien Luscher (Luscher, 2006) : soit l’écart
par rapport à la norme (un « s » à *« les chiens aboies ») correspondait au programme étudié,
et l’écart sera alors considéré comme une faute, soit la règle d’accord des verbes au pluriel à
l’écrit n’a pas encore été enseignée, et l’enseignant la considèrera alors comme une erreur.

Contenu programmatique

erreur

faute

A1 A2 B1 B2 C1 C2 Niveau de
l’étudiant
Plusieurs biais peuvent donc altérer la validité de l’évaluation formative. Le premier, nous
l’avons vu, relève de la planification des tâches. On n’évalue pas l’acquisition de nouvelles
données dans une phase d’introduction, on n’évalue pas pour les mêmes raisons ni de la
même façon en phase d’expérimentation ou en phase d’appropriation. L’enseignant évaluateur
veillera donc à ne pas confondre ces phases.
Le deuxième biais relève de ce que nous appellerons le droit à l’erreur, valeur fondamentale
de tout processus d’enseignement apprentissage.
Certains enseignants, mais aussi de nombreuses institutions, considèrent que la mise en place
d’évaluations régulières constitue un dispositif formatif en soi. Ils confondent peut-être
évaluation continue et évaluation formative, la première étant une condition minimale mais
non suffisante de la seconde.
En effet, dans un contexte formatif, toute évaluation doit pouvoir donner lieu à une (ou
plusieurs) action(s) de remédiation à la suite de laquelle (desquelles) l’apprenant a à nouveau
le droit d’être évalué. Sans cela, l’évaluation est continue mais pas formative.
Mais si l’enseignant reporte l’ensemble des notes obtenues avant et après remédiation, les
notes obtenues avant remédiation impactent la note finale. Dès lors, les difficultés rencontrées
lors de la première phase revêtent, à tort, le statut de fautes. La validité s’en trouve donc
remise en question. Mais ce n’est pas le seul grief que nous pouvons faire à la sacro-sainte
moyenne !
Le calcul de la moyenne peut pervertir un dispositif évaluatif dans la mesure où :
- il tente d’homogénéiser des compétences spécifiques différentes. En ajoutant des
notes de compréhension orale avec des notes de production écrite évalue-t-on
vraiment une compétence langagière ? Si un apprenant possède un niveau B2 en
compréhension et A2 en production, peut-on vraiment en conclure qu’il est
« globalement » de niveau B1 ? On peut en douter. Nous privilégions quant à nous
une approche évaluative par compétence spécifique qui puisse donner un profil
plus précis de chaque apprenant, sur la base par exemple de ce que propose un test
de langue standardisé, comme le TCF, le TOEFL ou encore le IELTS.
- Il rend plus difficile le relevé des informations permettant de mesurer les progrès
de l’apprenant.
- Il renvoie à une évaluation holistique au détriment des autres évaluations (critériée,
différenciée…).
- De par sa nature équivoque ; il pervertit la fonction première de l’évaluation
formative dont l’objectif est la régulation des apprentissages.
Par ailleurs, l’évaluation formative est constitutive de tout cours de qualité, mais elle
décourage pourtant souvent les enseignants qui se plaignent, à juste raison, de deux problèmes
systémiques. C’est une évaluation chronophage (toute phase d’apprentissage enseignement
devant donc inclure, a priori, deux phases d’évaluation), et elle implique en remédiation la
mise en place d’un enseignement différencié sans lequel elle perd sa raison d’être.
Or, l’enseignant en charge de nombreux apprenants voit souvent mal comment gérer le
parcours individuel de chacun d’entre eux. Sans un appui institutionnel clair, sans une
véritable ingénierie de la démultiplication, l’évaluation formative n’a donc guère de sens.
L’institution doit donc donner à l’enseignant et à l’apprenant les moyens d’un apprentissage
en autonomie (laboratoires de langue, médiathèques), doté de structures de soutien ou de
tutorat, voire l’accès à des parcours complémentaires – ateliers, cours de renforcement…-.
De plus, l’enseignant est souvent soumis à une forte demande externe de notes, et la facilité
veut alors qu’il donne celles recueillies en classe ; la standardisation des évaluations
formatives, tout comme la surcharge de tests critériés, peuvent nuire à la pertinence du
jugement, et tendent à convertir rapidement l’évaluation formative en une somme fastidieuse
d’évaluations sommatives. Un rapport clair doit donc s’établir entre l’enseignant et son
institution afin d’éviter toute bureaucratisation inutile de la note.
Enfin, parce qu’elle est corrective, l’évaluation formative présente moins de risques de biais
que l’évaluation sommative si la remédiation se fait dans un délai aussi court que possible,
non qu’elle soit plus facile à mettre en place, mais bien parce qu’elle permet une rétroaction
interactive constante. C’est donc aussi une gageure pour l’enseignant que de pouvoir
rapidement donner à l’apprenant un retour sur son travail. L’évaluation formative exige
confiance et coopération ; elle doit se faire avec pertinence et bon sens, dans l’optique du
concept anglo-saxon de l’assessment (cf. glossaire), loin des ornières technicistes. Ainsi, les
évaluations formative et sommative « ne s'opposent pas par les objets sur lesquels elles
fonctionnent, ni par la nature des critères qu'elles utilisent. Elles se distinguent par leur
modalités, du fait que leur fonction est différente » (Bonniol, 1998).
Voici donc une autre idée que nous souhaitions mettre en évidence : l’évaluation formative est
au cœur de tout processus d’enseignement apprentissage. Toutefois, en contexte formel, elle
ne peut se mettre en place efficacement que grâce au soutien concret de l’institution. Nous
estimons que cette idée forte est aujourd’hui sans doute au cœur de la réforme de nombreux
dispositifs éducatifs, et qu’elle en conditionnera en partie l’heureux développement.

Vous aimerez peut-être aussi