Vous êtes sur la page 1sur 30

Guide pratique de lvaluation (littrale)

Jean Vaucher
Professeur titulaire Groupe Incognito Dpartement dinformatique et de recherche oprationnelle Universit de Montral octobre 1990 (rvis septembre 1991)

Avant-propos
Ce guide a t crit dans le but d'aider mes collgues attribuer des notes correctes avec facilit et confiance. Tout d'abord, je devrais souligner que je nai aucune qualification ou diplme particulier qui me permette d'imposer quoi que ce soit en matire dvaluation. Par contre, cette anne,1 comme tous mes collgues, jai vcu lintroduction de la notation littrale - sans mode demploi- et jai d rviser mes techniques dvaluation, inventer un sens aux lettres de la notation, trouver des trucs pour calculer mes notes et refaire mes programmes dordinateur. Bref, passer beaucoup de temps faire marcher la technique. Avec le guide, j'espre vous viter mon travail de rinvention de roue. Suite des discussions sur le sujet, jai aussi remarqu que je ntais pas le seul avoir eu des problmes appliquer et interprter la mthode littrale. En particulier, il ne semble pas y avoir consensus sur le sens des lettres. Ceci est grave car si nous devons changer de systme afin de nous normaliser, il faudrait sentendre sur cette norme afin de pouvoir sy conformer. De la situation actuelle, o chacun est forc dinventer sa mthode, se dgage une impression de flou et darbitraire qui pourrait facilement mener la contestation de la lgitimit des notes. Pour claircir la situation, jai contact des sources officielles lUniversit et jai pos la question suivante: quelle devrait tre la moyenne dune classe moyenne au premier cycle? Dans mon esprit, a aurait pu tre C avec 2 niveaux plus haut (A et B) et 2 niveaux plus bas (D et chec)... Dans une deuxime tape de rflexion, constatant quun tudiant doit maintenir une moyenne de C pour russir un programme de premier cycle, jai dduit que si chaque professeur fixait sa moyenne C, la moiti de nos tudiants chouerait sur la moyenne gnrale. Quelle moyenne donc faudrait-il viser afin que le systme marche: C+, B-, B...? La rponse officielle ne ma pas aid. Il n'y a pas de norme, ma-t-on dit, a dpend des dpartements et des titulaires. Suite cette exprience, jai dcid quil serait utile de passer quelque temps mettre sur papier ce que mes collgues et moi avions appris, conclu ou labor cette anne en matire dvaluation. Je dois avouer que je nai pas fait de recherche bibliographique en bonne et due forme. Jai bien ouvert Bloom2 au dpart, mais je lai vite referm et ce nest qu la toute fin du travail que je suis tomb sur les monographies de notre Service Pdagogique. Deux volumes sont pertinents et jen recommande la lecture. Le premier3 souligne trs bien les problmes de lvaluation; le second4 donne de bons conseils sur la composition dexamens choix multiple. Cependant, ni l'un ni l'autre ne traite vraiment des problmes tudis ici. De plus, ces documents ont le
11989-1990 2Bloom, Benjamin, Taxonomy of educational objectives, 1956. 3Dossier sur lvaluation, prsent par France Lafontaine, Service Pdagogique, Universit

de Montral, 1979 (9,00$ ). 4Bernard, Huguette et F. Fontaine, Les questions choix multiples, Service Pdagogique, Universit de Montral, 1979 (11,00$ ). -2-

dsavantage dtre des documents institutionnels. En quelque sorte, ils engagent lUniversit et la rputation acadmique des auteurs. Le style se doit d'tre tempr afin de ne pas susciter la contestation. Le prsent guide est un document personnel qui nengage pas lUniversit. Si jamais des contestations taient bases sur mon texte, il serait facile de dsavouer lamateur que je suis. Je peux donc tre aussi catgorique et pragmatique que je juge ncessaire et le lecteur sera libre de ne retenir que ce qui lui est utile.

Par rapport la version prcdente d'octobre 1990, ce texte comporte quelques retouches la section sur l'chelle "B" (p. 19) et la section sur la normalisation des notes (pp. 21-22).

Remerciements
Par leurs commentaires, suggestions et corrections, plusieurs personnes ont contribu amliorer ce guide. Je tiens remercier D.B., F.B., G.B., P.B., C.C., G. L. , L.L., B.L., U.M., C. S-V. et P.M.

-3-

Introduction
Les pdagogues distinguent entre la mesure et lvaluation.5 La mesure, cest un score obtenu dans un test quelconque (p.e. 15 sur 20); lvaluation, cest linterprtation de ce score (p.e. moyen ou excellent). Notre ancien systme de notation, bas sur les pourcentages, est ax sur les tests et il sapparente la mesure, tandis que la notation littrale soriente plus vers lvaluation. Lavantage de la notation littrale dans les bulletins est de pouvoir faire ressortir le message essentiel dune valuation: est-ce que ltudiant a russi ou chou, est-il suprieur la moyenne, mrite-t-il une bourse, etc... Pour que le processus dvaluation fonctionne correctement, il faut quil y ait entente gnrale sur les diffrents jugements quil est possible dmettre et sur la manire dont on peut les exprimer par le biais dune seule lettre. De plus, il faut trouver un systme facile appliquer et justifier afin de limiter larbitraire (ou limpression darbitraire) pour que tous les intervenants, cest--dire les professeurs, les tudiants et les lecteurs des bulletins, aient confiance dans lexactitude du processus. Le simple fait dutiliser la notation littrale dans les bulletins officiels ne rsout pas le problme fondamental de lvaluation: comment combiner et traduire des rsultats de tests en valuation. Et ceci, avec cohrence, facilit et certitude. Dans ce qui suit, je prsenterai dabord les extraits du rglement pdagogique qui dcrivent la notation littrale ainsi que lchelle de conversion de la Commission des tudes. Ensuite, je dcrirai certains problmes typiques rencontrs avec le nouveau systme, puis je proposerai un schma dvaluation qui procde en deux tapes: distinguant en premier lieu, la russite de lchec, pour ensuite attribuer des mentions (lettres) appropries. Finalement, jexposerai certaines techniques que j'ai trouv utiles et je montrerai comment elles sappliquent dans des cas concrets tirs de mon exprience.

5F. Fontaine, Evaluer? Mesurer? dans Dossier sur lvaluation, Service Pdagogique, Universit de Montral, 1979.

-4-

Dfinition du systme de notation littrale6


Le rglement pdagogique de la Facult des Arts et Sciences (section 7.1) dcrit le systme de notation littrale par la table suivante: Lettres A+ A AB+ B BC+ C CD+ D E F Points 4,3 4 3,7 3,3 3 2,7 2,3 2 1,7 1,3 1,0 0,5 0 Mention Excellent Trs bien Bien Passable Echec (faible) Echec (nul)

Certains seuils ajoutent un sens ces lettres. Au premier cycle, la note de passage pour un cours est D ou mieux. De plus, on exige une moyenne gnrale de 2,0 (C) ou mieux pour la russite dun programme. Ces deux seuils correspondent des moyennes de 50% et 60% selon lancien systme. Il y a un troisime point de repre dans nos rglements, cest la moyenne minimale requise pour tre admissible la matrise: 2,7 ou B- dans un systme et 70 % dans l'autre. Aux tudes suprieures, les exigences sont plus leves. La note de passage pour un cours est "C" (article 33 du rglement pdagogique de la FES) et la moyenne gnrale maintenir est "B-" ou 2.7 (articles 42 et 56). Finalement, il existe une table de conversion entre pourcentages et lettres qui a t adopte par la Commission des tudes. Cette table a t largement diffuse par les tudiants, et on la retrouve dans certains agendas. Nous la reproduisons cidessous. Laspect dtaill de cette table suggre que son emploi est une garantie de lobjectivit de lvaluation. Cest loin dtre le cas! et je critiquerai plus loin l'emploi abusif qui peut en tre fait! Effectivement, cette table a t adopte uniquement pour fins de conversion, au 31 aot 1989, de la moyenne cumulative antrieure des bulletins.

6Un tableau des systmes de notation en vigueur au Qubec est donn l'annexe 3.

-5-

A+ A AB+ B BC+ C CD+ D E F

90-100 85-89 80-84 77-79 73-76 70-72 65-69 60-64 57-59 54-56 50-53 35-49 0-34

Excellent (80-100)

Trs bien (70-79)

Bien (57-69)

Passable (50-56) chec (faible) chec (nul)

Table de conversion pour la moyenne cumulative des bulletins

Problmes de la notation littrale


Un premier problme vient de labsence de normalisation des termes (et lettres). Pour que la notation littrale puisse faire ressortir le message essentiel dune valuation, il faut savoir quelle lettre dnote quel message. Selon notre rglement, voici les messages associs lvaluation. A B C D E F Excellent Trs bon Bon Passable chec (faible) chec (nul)

Cest bien davoir une liste de mots; cest mieux de sentendre sur le sens de ces mots. Sur des dossiers franais, on peut trouver des mentions diffrentes: assez bien, bien et trs bien. Une universit amricaine utilise les termes: conditional pass, satisfactory, good et very good. Comment comparer notre trs bon avec un assez bien ou un good. De mme, est-ce que le A est attribu 5% des tudiants, 10%, ...? Il est illusoire de penser obtenir un standard absolu, mais il serait souhaitable que certains critres soient noncs tout haut afin de rduire les divergences dinterprtation. Un deuxime problme dcoule de lapplication aveugle de lchelle de la Commission des tudes pour convertir en lettres des rsultats dexamens exprims en pourcentages. Comme nous l'avons dj dit, un pourcentage dnote une mesure tandis qu'une lettre implique une valuation. L'application d'une chelle prsuppose des rsultats normaliss; on ne devrait pas s'en servir directement

-6-

avec des notes brutes.7 Par contre, une chelle peut servir dtalon pour vrifier (a posteriori) la cohrence dun barme de correction. Je mexplique par un exemple. Disons que dans un examen donn, mes deux meilleurs tudiants obtiennent 67% et 69% respectivement. Si japplique sans rflchir lchelle de conversion, je dois leur attribuer la note C+. En fait le raisonnement devrait se faire linverse: typiquement, les meilleurs tudiants dans une classe normale dcrochent des A (entre 80 et 100% selon lchelle). A dfaut d'autres informations qui expliquent ce rsultat, je dois conclure qu'il y a un problme: soit dans mon examen, soit dans ma correction et la raction doit tre de corriger le problme, (par exemple, en redressant les notes).8 On na pas toujours besoin de convertir de pourcentage lettre. Certaines formes de travaux se prtent naturellement lattribution directe de mentions: examens oraux, dissertations, projets et travaux pratiques. Dans ces cas, on peut procder avec le modle de piles. Initialement on fait une premire distinction entre les bons, les moyens et les checs (les piles). Puis, on procde un classement de chaque pile en sous-piles par comparaison. On peut associer les lettres directement aux piles, utilisant les variantes + et - s'il y a vraiment des diffrences remarquables entre sous-groupes. Avec ces formes de travaux, la pertinence et lutilit de la notation littrale sautent aux yeux. Cependant, on na pas contourn pour autant le problme de conversion de notes car, il faut souvent combiner et pondrer les rsultats de plusieurs preuves pour obtenir une note globale. Comment faire? Ceci nous amne un troisime problme car lutilisation des points associs aux lettres (A=4, B=3, etc...) sest avre spcialement non-recommandable pour la combinaison de notes littrales. Un exemple illustre le problme. Prenons un cours comportant 4 preuves avec pondrations gales. Il est clair quaprs avoir bien russi la premire preuve avec A (4 points), ltudiant peut sabstenir de se prsenter aux autres preuves, car un calcul de la moyenne selon les points: (4+0+0+0)/4 donne 1.0 ou D et il est assur de la note de passage. Un peu de rflexion montre lerreur dans ce raisonnement. Lusage des points par l'Universit pour le calcul de la moyenne cumulative va de pair avec la rgle que chacun des cours doit tre russi (avec D [1.0] ou mieux). Un cours chou ne contribue pas la moyenne; mais il doit tre repris ou remplac. Appliquant cette philosophie aux preuves l'intrieur d'un cours, on conclut que lchec une preuve entrane l'chec au cours. Donc, loin de russir, notre tudiant coule misrablement! Si lexigence de russite de chaque preuve nest pas ce que vous cherchez, il faut faire autre chose. Cest l quune chelle de conversion comme celle de la Commission peut tre utile. Soit A=86% et 0% pour labsence, nous avons

7Lusage institutionnel qui a t fait de lchelle de conversion se justifie, dans le cas de

moyennes cumulatives, parce que la loi des grands nombres attnue les diffrences individuelles de notation entre preuves et normalise les rsultats. 8Je ne prtend pas qu'on doit toujours ajuster les notes afin que les meilleurs obtiennent des "A". Le niveau des tudiants admis varie d'anne en anne et le hasard fait que certaines classes sont exeptionnellement faibles. Le sujet sera trait plus en dtails dans une section sur la "normalisation" des notes. -7-

une moyenne de (86+0+0+0)/4 = 21,5% (ou F) qui traduit bien la situation.9 Facile... qui sait comment sy prendre! COROLLAIRE: ne pas laisser d'autres (votre secrtariat, la Facult, le centre de calcul ou le bureau du Registraire) le soin de combiner des valuations littrales d'preuves partielles; il est probable qu'ils utiliseraient la "mthode des points" avec les aberrations qui en dcoulent. Il est recommand10 de faire vos propres calculs et de soumettre une seule note littrale globale. Une chelle de conversion est donc utile pour la combinaison de notes littrales, mais toutes les chelles ne sont pas aussi bonnes les unes que les autres. En particulier, une chelle non-linaire comme celle de la Commission peut donner des surprises . Par non-linaire, jentends que l intervalle en pourcentiles nest pas gal pour chaque mention. Par exemple, A+ recouvre un intervalle de 10% tandis que B- recouvre un intervalle de 3%. Selon lordre dans lequel on combine les notes, il peut y avoir des diffrences marques. Par exemple, prenons deux notes avec pondrations gales: 100% (A+) et 72%(B-). Quelle est la mention globale? Premire technique: moyenne de 86%, ce qui donne A. Deuxime technique, passage par les points: (4.3+2.7)/2 = 3.5, livrant A- ou B+ selon larrondi. De telles anomalies ne peuvent quentraner un sentiment darbitraire et dinjustice.11 Il faudra faire attention nos chelles!

Les grandes lignes de lvaluation


Le premier objectif dune valuation est de diffrencier la russite de lchec. Cette dcision est importante. Si on dcrte la russite, on se porte garant de la comptence du candidat et on engage sa rputation. Dun autre ct, le constat dchec a des rpercussions importantes. Ltudiant doit reprendre le cours. Il peut perdre un semestre, une anne, ou pire. Cest aussi un gaspillage pour lUniversit, car ltudiant a monopolis des ressources qui auraient mieux servi dautres fins. Comment trancher dans les cas limites? Dilemme! En ralit, la situation nest pas si difficile traiter, car le systme prvoit une zone grise entre la russite et lchec. Voici les trois niveaux quil faut dpartager: - Niveau de comptence12 exprim par les mentions A, B ou C.13 --- seuil 60% --- Niveau dincertitude (russite conditionnelle, passable), mention D. --- seuil 50% --- Constat d`chec, mentions E ou F.
9L'utilisation de poids ngatifs ( E= -1 et F= -2 ) aurait aussi le mme effet. 10Mme obligatoire me souligne un collgue. 11Le paragraphe est inspir dun incident vcu au Certificat en Droit: une tudiante avec 29,5

sur 30 lintra et 47 sur 70 au final (pour une moyenne pondre de 76.5%) pensait se voir attribuer au moins un B ou un B+ selon lchelle; elle reut B-. Justification: conversion de chaque preuve en lettre et utilisation des points pour la moyenne. 12Le terme comptence nest pas consacr; mais il semble singulirement bien appropri la situation. 13A moins davis contraire, la mention dune lettre comme C comprend aussi ses sous catgories (C+,C et C-). -8-

Les seuils de lancien rglement pdagogique expriment assez bien ces trois notions: chec, passage minimal et comptence. Le seuil de 50% traduit le fait que ltudiant devrait connatre au moins la moiti de la matire de chaque cours et se trouver plus prs de la connaissance parfaite que de lignorance totale. Le 60% reflte le fait quun diplme doit attester dun niveau de matrise additionnelle. La notion de comptence recouvre toute une gamme d'habilets. On sait que dans tout domaine, certains praticiens sont meilleurs que dautres et que la majorit sont moyens (voire trs moyens); mais chaque praticien comptent doit pouvoir fonctionner utilement et il doit pouvoir se dmarquer des personnes qui nont pas reu sa formation. Par analogie, prenons des mtiers: il y toutes sortes de plombiers, mais on sattend ce que chacun puisse installer un robinet, souder des tuyaux et dboucher une toilette. De mme, tout journaliste doit pouvoir crire un texte lisible. De manire pratique et mesurable dans le contexte universitaire, lattestation de comptence dans un domaine (mentions A,B ou C) signifie que ltudiant est prt aborder dautres activits (emplois ou cours) qui dcoulent du domaine en question. Si votre valuation ne vous permet pas dattester ce degr de comptence, il faut lindiquer avec D, E ou F. La mention D ( passable) dnote une situation o ltudiant a dmontr une connaissance minimale des notions importantes du cours sans faire preuve de matrise ni de facilit avec la matire. On ne voit pas lutilit faire reprendre le cours, mais ltudiant nest pas mr pour aller plus loin. A l'UdeM, un D reprsente une faiblesse qui peut tre rachete par des rsultats suprieurs ailleurs afin de maintenir une moyenne de C. A McGill, le sens du D est lgrement diffrent, plus proche des critres oprationnels noncs plus haut: Mme si le D est une note de passage, il ne donne pas accs aux cours dont il constitue une des conditions pralables, ni nest reconnu si le cours est obligatoire dans le programme de ltudiant. 14 Traitons maintenant de lchec (mentions E ou F). Dans chaque matire, il y a un niveau minimal de connaissances que tout tudiant devrait acqurir. Si un niveau minimal de connaissances nest pas atteint, nous devons constater lchec. Comme lchec a des consquences srieuses sur le droulement des tudes dun tudiant, il faut tre absolument sr de ce jugement. Un examen bien conu peut aider la dcision. Imaginons un examen avec des sections faciles, dautres moyennes et difficiles. Vous pourrez conclure lchec, non seulement parce quun seuil (comme 50%) na pas t acquis mais aussi par la nature des erreurs... Par exemple, question X reprsente le B-A-BA du cours et le candidat na mme pas pu y rpondre!!! De faon pratique, ceci veut dire quun collgue pourrait facilement corroborer votre conclusion. Si vous ntes pas sr de votre jugement dchec.... Utilisez la zone grise, le D.

14Explication des barmes, Bureau du Registraire, McGill.

-9-

Autre conseil: avec un seuil 50%, laisser des notes entre 49 et 50% invite la contestation.... Je les augmenterais 50% (D). Par contre, je nirais pas plus loin dans cette voie. Dj, 49% ltudiant est loin de la comptence quon souhaite. Noublions pas le rle des jurys de fin de session pour les cas limites. Cest au jury examiner globalement le dossier de ltudiant et tenir compte de circonstances particulires afin de redresser des anomalies grossires.

Complments sur lchec


Pourquoi est-ce que les tudiants chouent? Est-ce parce qu'ils sont fondamentalement mauvais et ne devraient pas tre l'universit? Pas ncessairement. Il est vrai que certains nont pas les aptitudes requises pour certains cours. Dautres travaillent temps partiel et nont pas investi l'effort requis pour russir. Des trangers ont le mal du pays. Les uns naiment pas le prof ou la matire, les autres sont dprims. Etc... etc... Ce ne sont pas les rsultats dexamens qui vont nous donner la bonne rponse! J'ai dit que lchec indique quun niveau minimal de connaissances na pas t atteint; j'ajoute ici que cest tout ce que a indique. Un chec ne permet pas de conclure quun tudiant est vou lchec ternel dans une matire donne et encore moins de conclure quun tudiant est mauvais globalement. Cette faon objective d'envisager la chose devrait permettre ltudiant (comme au professeur) de voir l'chec de faon moins pjorative et plus constructive. Doit-on prvoir un certain taux dchec dans un cours ? Question tratre! Faites trs attention au sens que vous attribuez au mot prvoir. Doit-on faire couler du monde? Est-ce quun taux dchec lev est la garantie dun cours srieux... ou la marque dun mauvais enseignant? Lidal serait de ne pas avoir dchecs. Mais, on ne planifie pas lchec; on le constate. Cest dire quon ne peut pas fixer, a priori, un taux dchec. Cependant quiconque a enseign -surtout en premire anne- sait quil y a un nombre impressionnant de candidats qui ne russissent pas. Mon modle personnel de la situation est que certains tudiants sont fascins par le mystre des disciplines pour lesquelles ils ont le moins de talent. Dans ce cas, le meilleur service quon peut leur rendre, cest de leur faire prendre conscience quils sont dans la mauvaise voie. Et a le plus vite possible. En quelque sorte, je vois les examens de premire anne comme des sances dorientation. Dans mes cours de premire anne, je constate une perte15 dtudiants de lordre de 20 30% et jestime que la premire anne fait partie des tests d'admission. Par contre, si ce triage est ncessaire en premire anne, il na plus sa place aprs.16 Ceux qui pensent assurer la qualit par lchec devraient consulter Bernard17 et les
15Jutilise le mot perte car il est difficile de distinguer entre chec et abandon volontaire. Par perte, jentends des tudiants dont on a eu trace car ils ont crit un examen ou soumis un travail mais qui nont pas russi le cours. 16Ds des circonstances fortuites ou personnelles, l'chec reste possible; mais un taux d'checs plus lev que 5% devrait tre considr anormal. 17Huguette Bernard, Les systmes de notation, dans Dossier sur lvaluation, Service Pdagogique, Universit de Montral, 1979, pp. 101-103.

- 10

rfrences quelle cite sur le manque de corrlation entre les notes et le succs professionnel.

Classification de la russite
Une fois que l pineux problme des checs a t rgl, le reste est plus facile. La population des tudiants qui ont russi est relativement homogne et on peut attribuer des mentions selon la proportion des tudiants quon sattend avoir chaque niveau. A mon avis, les meilleurs 50% devraient recevoir des A et B tandis que les autres 50% se verraient attribuer les mentions C et D. Jai maintenant rpondu la question que javais pose aux instances officielles: quelle doit tre la moyenne dune classe moyenne? On peut dduire que la note mdiane pour les tudiants qui ont russi doit se situer mi-chemin entre C et B. En plus de dtails, voici une rpartition qui semble raisonnable avec des mentions descriptives: A B C D 20% - mrite une bourse (magna cum laude et peut-tre admissible au PhD???) 30% - admissible la matrise (cum laude ) 40% - comptent 10% - passable

Il y a deux points importants souligner. Premirement, la rpartition ne touche que ceux qui ont russi et les proportions suggres ne sont pas influences par le taux d'checs. L'chec est dcrt par un mcanisme diffrent (comptence minimale) o les proportions n'interviennent pas. Deuximement, les proportions visent le long terme; il est clair que la proportion exacte des "A" va varier d'une anne l'autre selon la force des promotions. Pour terminer, voyons A+, les summa cum laude. Devrais-je suggrer un quota comme 1% de la population? Pas ncessaire daller si loin. Chaque anne on trouve des tudiants qui nous rendent heureux dtre professeurs. Non seulement ils obtiennent les meilleures notes, leurs questions en classe dmontrent quils anticipent ce quon va dire. Dans leurs examens, on trouve des lments de rponse qui dpassent ce quon a enseign. Souvent, ils ont quelque chose nous apprendre et on aimerait quils poussent les tudes jusqu'au doctorat afin quils puissent un jour prendre notre place. Ce sont eux les A+.

laboration dune chelle de conversion


Une chelle de conversion donne l'quivalence entre des notes exprimes en pourcentage et des mentions littrales. Par exemple, l'chelle de la Commission indique que la mention "trs bien" ou B correspond une note entre 70 et 79%. D'une certaine faon, une chelle associe un jugement de valeur une mesure du degr de connaissance d'une matire. Par exemple, selon l'chelle de la Commission, la russite d'un cours exige la connaissance d'au moins la moiti de la
- 11

matire (D=50% ou mieux); de mme, la connaissance de 80% (ou plus) de la matire reprsente un rsultat excellent. Le premier rle d'une chelle de conversion est de servir de modle explicatif et opratoire de l'valuation. Pour les tudiants, une chelle est un gage dobjectivit. Elle permet de juger le degr de russite et de prvoir la note finale. Deuximement, une chelle peut servir la combinaison d'valuations littrales car l'chelle traduit les valuations en "degrs de connaissance" qui eux se combinent trs bien mathmatiquement. Troisimement, dans la mesure o une note en pourcentage est le reflet exact du degr de connaissance d'une matire, une chelle peut servir la conversion de pourcentages en lettres. Mais, attention! Si un examen est mal conu, ce n'est pas l'emploi aveugle d'une chelle de conversion qui produira une valuation correcte ou objective.18 En fait, la philosophie de la notation littrale prconise la normalisation des rsultats numriques avant l'application d'une chelle de conversion - j'en reparlerai plus loin. Malgr ma critique de lutilisation irrflchie des chelles dquivalences, je reste convaincu quil est essentiel pour chaque professeur davoir son chelle de conversion et de la communiquer aux tudiants. Par contre, cette chelle se doit d'tre diffrente de celle de la Commission des tudes. Dans ce qui suit, nous traitons dabord les contraintes que les chelles doivent respecter, puis les problmes que ces contraintes entranent. Ensuite, nous regardons des chelles utilises ailleurs et nous examinons des distributions de notes obtenues l'Universit de Montral pour tablir l'applicabilit de diverses propositions. Finalement, je proposerai deux chelles pratiques. Prenons dabord les contraintes. Le rglement pdagogique dfinit trois seuils de russite et ceci dtermine implicitement des quivalences. Premirement, les mentions E et F dnotent lchec, tandis que D (ou mieux) indique la russite dans un cours; ceci correspond l'ancien seuil de 50%. Ensuite, une moyenne de 2,0 (C) est ncessaire pour la russite dun programme (ancien palier 60%) et 2,7 (ou mieux) est ncessaire pour ladmission aux cycles suprieurs (70% selon l'ancien rglement). Quand on veut aller plus loin, il y a des problmes. Premirement, la notation dcimale nous a habitu situer nos seuils et nos notes des multiples de 5% ou 10%, mais le nombre de mentions quil faut accommoder (soit 4 ou 11 selon notre rglement pdagogique19) ne divise pas lgamment les 50% qui reprsentent la plage de russite. Avec ce nombre de mentions, doit-on accepter des intervalles bizarres (p.e. 3.57%) ? Avoir des intervalles de tailles variables? Changer le nombre de mentions utilises? Autre considration dans le choix des intervalles: les intervalles choisis devraient rpartir les tudiants en groupes de manire utile et significative.
18Pour viter le cumul des problmes de conversion, on peut tout noter numriquement, comme avant, et ne convertir en lettre que la note globale. 19 Les 4 mentions principales (A,B,C et D) ou 11 mentions si on compte les sous-divisions: A+,A,A-,B+,B,B-,C+,C,C-,D+ et D....(sans D- ).

- 12

Pour avoir une ide dalternatives possibles, je vais prsenter la succession des chelles en usage gnral McGill depuis 1937, - pas ncessairement parce que McGill fait mieux les choses que dautres mais parce que McGill utilise la notation littrale depuis assez longtemps et parce que ces chelles sont disponibles (publies par le Registraire). Un tableau des autres systmes de notation en vigueur au Qubec est donn l'annexe 3. McGill (1937 - 1971) % 80 - 100 65 - 79 50 - 64 0 - 49 McGill (1971 - 1980) % 80 - 100 65 - 79 55 - 64 45 - 54 0 - 44 McGill (1980 - ... prsent) % 85 - 100 80 - 84 75 - 79 70 - 74 65 - 69 60 - 64 55 - 59 50 - 54 0 - 49 1 cycle A AB+ B BC+ C D F 2/3 cycles Pondration A AB+ B BF 4,0 3,7 3,3 3,0 2,7 2,3 2,0 1,0 0,0 1 cycle A B C D F 2/3 cycles A B F Pondration 4.0 3.0 2.0 1.0 0.0 Mention A (1 classe) B (2 classe) C (3 classe) F chec

On remarque certaines constantes dans ces chelles. Dans chacune, les mentions A et B correspondent aux mmes intervalles de notes: 80-100 et 65-79 respectivement. Il y a moins de paliers que prvus dans notre rglement mais les intervalles sont plus rguliers (multiples de 5%). Il y a deux diffrences principales avec lchelle de la Commission: dabord, la limite entre les C et les B se situe 65% et pas 70% comme chez nous. Ensuite, le nombre de mentions entre B et F est trs rduit McGill: la zone grise, notre D,D+ et C-, est reprsente par une seule lettre, le D. Finalement, exception faite du A+ qui n'existe pas McGill, notons que les pondrations associes aux lettres (A=4.0, A-=3,7, etc...) sont identiques chez eux comme chez nous.
- 13

Les chelles ci-dessus ont lavantage dtre plus simples que celle de la Commission; mais, est-ce quelles refltent nos habitudes en matire dvaluation? En particulier, pour fixer le seuil entre B et C (65% McGill), il faudrait savoir quelle est la note mdiane de nos tudiants. Je cherchais aussi un seuil raisonnable pour dpartager les A des B. Pour rpondre ces questions, jai fait une analyse rapide des bulletins des tudiants dans mon Dpartement.

- 14

Regard sur les moyennes cumulatives


Plus prcisment , jai fait lanalyse des moyennes cumulatives en date de mai 1989 (avant la conversion au systme littral) pour divers programmes du Dpartement dinformatique et RO. Le premier graphique montre la rpartition des moyennes de 100 tudiants choisis au hasard dans nos programmes spcialis, majeur et mineur. Ces tudiants avaient russis entre 10 et 84 crdits. Les chiffres sont biaiss par le fait que les checs nentrent pas dans le calcul de moyenne et que les tudiants avec moyennes infrieures 60% sont limins; les moyennes rapportes ici sont donc plus leves que les moyennes obtenues. Nanmoins, ceci nous donne une ide de la rpartition des notes des tudiants qui russissent.

moyenne: mdiane:

72.9 71.3 18% 9% 3%

rsultats > 80%: rsultats > 85%: rsultats > 90%: maximum: 91.8

Selon ces donnes, un seuil 70% entre C et B et un seuil 80% entre B et A correspondraient peu prs nos objectifs: d'accorder des A et B environ 50% des nos tudiants et des A 20%.

- 15

Rsultats d'tudiants "avancs": Si on limite lchantillon aux 56 tudiants "avancs" qui ont russi 45 crdits ou plus, nous avons des moyennes encore plus centres autour de 70%:

moyenne: mdiane:

70.8 69.0 (5 tudiants) (3 tudiants) (1 tudiant )

rsultats > 80%: 9% rsultats > 85%: 5% rsultats > 90%: 2% maximum: 91.8

Ici aussi, 70% correspond bien une mesure de milieu.

- 16

Rsultats du programme MATH-INFO: Voici les rsultats pour tous les tudiants du programme (33 personnes y compris 2 checs):

moyenne: mdiane:

68.6 68.3 (8 tudiants) (2 tudiants)

rsultats > 80%: 24% rsultats > 85%: 6% rsultats > 90%: 0% maximum: 87.4

De l'ensemble de ces rsultats, je conclus que 70% semble tre un palier raisonnable (en informatique et RO) pour dpartager la moiti des tudiants en dessus de la moyenne (A et B) de ceux en dessous de la moyenne (C et D). De mme, utiliser 80% pour dlimiter les B des A semble utile. Environ 10 20% de nos diplms obtiendraient un A pour le BSc.

- 17

Attribution de notes: chelle A


Bas sur toutes ces donnes, je propose une premire chelle qui est linaire, simple comprendre et appliquer et qui rcompense nos meilleurs tudiants (les A+). Mention A+: A: B: C: D: E: F: Plage 90 - 100% 80 - 90 % 70 - 80 % 60 - 70 % 50 - 60 % 40 - 50 % 0 - 40 % Note reprsentative20 95% 85% 75% 65% 55% 45% 0%

Je recommande cette chelle pour lattribution directe de notes littrales.

Il y a quelques annes, un de mes collgues, le professeur Paul Bratley, proposait un barme de correction pour nos projets de fin dtudes (le cours IFT3051). Ce barme est presque identique lchelle pratique A. La description du niveau de comptence associ chaque catgorie est excellente et le barme a souvent t repris comme modle. Je le reproduis ci-dessous en ajoutant entre parenthse la mention pertinente (A+,A, etc...).

20La borne infrieure exacte devrait tre choisie telle que les rsultats (arrondis) affichs par des programmes de spreadsheet ou tableurs correspondent aux plages. Cest dire que la borne infrieure exacte pour A+ serait 89.5%, pour A 79.5%, etc...

- 18

IFT3051 - Projets de fin d'anne en informatique Barme d'valuation A titre indicatif, je vous suggre le barme suivant pour vos projets. Vous tes bien sur libre de l'ignorer ou de le changer: c'est vous qui accordez des notes vos tudiants, pas moi. Je vous demande cependant de ne pas pousser votre gnrosit au point de manquer de toute discrimination. 90-100 La perfection (A+): le projet devrait normalement inclure une contribution originale de l'tudiant sur le plan des ides ou des mthodes. Un simple travail de programmation- mme trs bien excut- ne devrait pas normalement mriter un 100%. 80-90 Un excellent travail (A): bien test, bien document, et bien conserv pour une utilisation subsquente. Si l'tudiant n'a pas combin des ides originales, ou au moins il a accompli le travail avec flair et lgance. 70-80 Un bon travail comptent (B): Peut-tre le projet n'a pas avanc autant que prvu, mais ce qui est fait est bien test et bien document; peut-tre le travail accompli est excellent, mais la documentation n'est pas tout fait satisfaisante (elle devrait cependant tre adquate pour quelqu'un qui voudrait continuer le projet plus tard). 60-70 On commence manifester un certain mcontentement (C). Peut-tre un programme existe, mais il n'a pas t test srieusement; peut-tre le travail n'est pas document de faon adquate. Le projet pourrait difficilement tre repris et continu par une autre personne. 50-60 La dception (D): L'tudiant a accompli assez de bon travail pour qu'on lui accorde ses crdits, mais le projet n'est pas utilisable: il y a trop d'erreurs ou de lacunes, ou tout simplement le projet n'est pas termin la date voulue. < 50 L'chec (E et F): A votre avis, le travail de l'tudiant n'est pas suffisant, en quantit ou en qualit, pour qu'on lui accorde des crdits. Je vous suggre aussi d'utiliser la note 49 pour des cas douteux: si l'ensemble du dossier le justifie, le jury pourra monter la note 50. Si vous voulez que l'chec soit dfinitif, mettez une note en bas de 45. Pour des projets "presque" termins, je vous suggre d'accorder une note base sur l'tat rel du projet, quitte changer avant les runions du jury (mi-mai), plutt que d'accorder une note plus gnreuse base sur des promesses. Paul Bratley (1984)

- 19

Combinaison de notes: chelle B


Pour combiner les rsultats de plusieurs valuations littrales, il est utile d'avoir une chelle de conversion avec des gradations plus fines. On cherche aussi avoir une chelle linaire afin d'viter les anomalies que nous avons relev plus tt21. Aprs plusieurs essais, voici une proposition qui couvre toutes les mentions de notre rglement (sauf D+) avec des notes reprsentatives (milieu dintervalles) centres sur des multiples de 5%. Mention A+ A AB+ B BC+ C CD E F quivalence 100% 90% 85% 80% 75% 70% 65% 60% 55% 50% 40% 0% Plage 92.5 - 100 87.5 - 92.5 etc ...

47.5 - ... 29.5 - ... 0 - 29.5

Avec cette chelle, les notes quivalentes pour C et D correspondent exactement aux seuils de 50% et 60% de lancien rglement. En contre-partie les bornes infrieures des intervalles ne tombent plus sur des dciles. Notez quon a tendu lgrement D vers le bas (de 50% 47.5%) et que la limite entre B et A est passe de 80% 82.5%.

Je recommande cette chelle pour combiner des rsultats exprims en notes littrales22.

21 En particulier, on vitera l'emploi des points (A=4,...D=1) ou de l'chelle non-linaire de la commission des tudes 22 Ne pas utiliser cette chelle pour convertir directement un score numrique en lettre avant d'avoir lu la section suivante sur la normalisation des notes.

- 20

La normalisation des notes


Il est trs difficile de concevoir un bon examen: un examen qui mesure correctement les connaissances de ltudiant selon les objectifs pdagogiques du cours et qui exprime cette mesure avec des notes qui cadrent avec nos chelles. Dans une situation statique (matire fige et titulaire long terme), on peut amliorer les examens danne en anne en vrifiant le degr de pertinence et de discrimination de diverses questions. Mais qui de nous se trouve dans une telle situation! En ralit, la matire volue danne en anne et les professeurs changent de cours tous les trois ans. Plus un professeur tient son enseignement coeur, plus il aura tendance innover... et plus il lui sera difficile de concevoir de bons examens ! Il est donc certain que les notes seront biaises: trop hautes, trop basses ou trop peu rparties! Que faire? Une solution, cest la normalisation des notes (le tripotage diront certains). Par normalisation, j'entends l'ajustement des notes brutes obtenues dans un examen suite la dtection de dfectuosits dans cet examen23. Ceci dans le but de rendre les notes plus reprsentatives de la comptence relle des tudiants. Mais, ATTENTION ! Toute manipulation rduit la crdibilit dune valuation et il faut que les notes restent perues comme un rsultat direct du travail de ltudiant et non pas comme le rsultat de manipulations obscures du titulaire. Il faut donc assortir le processus de certaines garanties pour les tudiants. Voici deux principes que j'ai pu dgager. Principe 1: ne jamais rduire une note! Donc, si jamais je donnais un examen trop facile o tous auraient entre 95 et 100%, les notes resteraient telles quelles. Pas question de rduire les notes pour avoir une moyenne plus raisonnable . [ Corollaire: il vaut mieux concevoir un examen trop difficile que trop facile... vous pourrez toujours corriger ensuite . ] Principe 2: utiliser une formule dajustement simple. Entre nous, je pense qu'il est illusoire d'essayer d'obtenir la fameuse "cloche" par une transformation quelconque. La "cloche" reprsente les grands nombres, long terme. Nos examens, c'est plutt les petits nombres court terme. De plus, l'valuation parfaite est une chimre; toute mesure comporte une marge d'erreur et il en est de mme avec nos examens. Ayant admis que les notes ne pourront jamais tre exactes, l'objectif premier de la normalisation transparat: c'est d'viter les erreurs systmatiques ou grossires. Revenons la pratique de la normalisation. La premire tape, c'est la dtection d'un problme; la deuxime (si ncessaire), c'est l'ajustement des notes.
23 Dans un premier temps, je traite la normalisation traditionnelle de rsultats numriques. Comme nous le verrons plus tard, la notation littrale permet de normaliser sans donner l'impression de tripotage.

- 21

Je prends pour acquis deux choses: 1) bas sur votre exprience, vous avez compos le meilleur examen possible et 2) vous avez une ide pralable de la distribution attendue des notes. Une diffrence marque entre les rsultats attendus et les rsultats obtenus sera un indice de dfectuosit dans l'examen. Remarquez que c'est vous qui devez dcider de ce qui est normal et de ce qui ne l'est pas pour une situation donne. Comme exemple de normalisation - et sans prtention que ma mthode soit ni la meilleure ni mme la bonne - je vais dcrire comment je procde, faisant l'hypothse d'une promotion moyenne avec sa part de bons tudiants. Je commence avec une liste trie des notes ou un histogramme. Avec un examen valable, je mattends trouver 10% (ou plus) des notes en dessus de 80% et au moins une dans les 90%. Si cest exact et si il ny a pas un nombre exorbitant dchecs (daprs mon exprience du cours), je juge l'examen valable et le processus ne va pas plus loin. Si les notes semblent trop fortes, je les laisse tel quelles et je prvois augmenter la difficult de la prochaine preuve. Mais, si les notes me semblent trop faibles, je vais chercher un facteur multiplicatif appliquer ( chaque note) pour que mes meilleurs tudiants obtiennent des "A". Pour appliquer ces corrections la main sans calculatrice, j'utilise une variante simplifie de la multiplication: pour chaque intervalle de 5 ou 10 % je calcule et j'applique une correction fixe. Prenons un exemple. Disons que la meilleure note obtenue est 82% et que je considre que ceci reprsente un A+. Une faon simple et rapide pour normaliser, serait dajouter 9 points toutes les notes entre 80 et 90% ( le 82% deviendra un 91%), 8 points celles entre 70 et 80,... et 1 point celles entre 10 et 20%. Il reste le cas o lexamen est trop discriminatoire. Les bons tudiants sont bien nots mais, pour une raison ou une autre, on a limpression quil y a trop dchecs. Ce cas est rare, mais je lai rencontr en premire anne pour des examens objectifs avec correction stricte. Si on peut dcider dun seuil de russite, on peut toujours diviser les notes de passage en intervalles gaux correspondant aux mentions de lchelle A ou B et attribuer soit les mentions soit les notes quivalentes. Certains professeurs sont rebelles l'ide d'ajuster les notes. Ils disent si notre meilleur tudiant n'a rpondu correctement qu' 5 questions sur 10, son score est 5 sur 10 ou 50% et il est malhonnte de prtendre autrement. Comment donc justifier de remonter sa note 80 ou 90%. C'est ici qu'il est utile de distinguer entre score et valuation car mme si le score est 5 sur 10, il est possible que ceci reprsente un excellent rsultat qui devrait tre not 80 ou 90% selon nos barmes types. C'est ici que la notation littrale devient utile car on peut faire la normalisation dans le passage des scores aux lettres (en tablissant un seuil de russite et en divisant les notes de passages en intervalles gaux). La distinction est maintenant claire: le score est un nombre (objectif et immuable), tandis que l'valuation est une lettre (obtenue du score avec les corrections qui s'imposent). Cependant, les principes noncs plus haut restent valables. Les examens devraient tre conus afin que les scores correspondent le plus possible aux valuations normales (chelles A ou B). Un autre schma de conversion ne sera

- 22

utilis que pour viter des erreurs systmatiques ou grossires et cet autre schma ne devra pas entrainer une rduction de note.

Exemples concrets
Prenons quelques exemples (camoufls pour protger les innocents) pour voir comment les principes prcdents pourraient sappliquer. CAS 1: examen intra de premire anne

Rsultat typique de premire anne. Lexamen semble valide: bonne rpartition de notes, moyenne de 62% et mdiane de 63% et 23% dchecs. Pas dajustement ncessaire.

- 23

CAS 2: examen final de premire anne

Ici, lexamen semble nettement trop dur et discriminatoire: moyenne de 44%, mdiane de 42%, une majorit dchecs et juste 5 tudiants en dessus de 80%. De plus, c'est le mme groupe que pour le cas 1 exception faite d'abandons (des plus faibles). On voit que les rsultats ne concordent pas avec ceux de lintra. Solution: ajustement global. On fixe la note de russite 30% et on rpartit les 10 paliers de l'chelle B (D,C-,C,C+,B-,B...A+) sur la plage de 30% 100%. ... On essayera de faire un meilleur examen la prochaine fois ! CAS 3: examen final de dernire anne

Examen discriminatoire. Rsultats semblent valable. Aucune correction. CAS 4: notes globales en dernire anne

- 24

Ici on a un cours option avec des tudiants motivs. Les bons rsultats ne sont pas surprenants. Lcart est assez restreint. Ceci reflte lhomognit de la classe; et le fait que la note est le rsultat combin de 5 preuves.

Autres techniques
Dans ce guide, j'ai abord les principes et la pratique de l'valuation dans un cadre assez gnral. Reste que certains types d'preuves amnent des problmes particuliers. L'annexe 1 traite un tel cas: l'emploi de la notation littrale pour des examens objectifs avec un nombre limit de questions. Il y a aussi des pratiques locales qui mritent d'tre plus largement connues. L'annexe 2 dcrit les barmes avec seuils employs au Dpartement d'informatique et recherche oprationnelle.

- 25

CONCLUSIONS
Au dbut, j'envisageais ce guide sous forme d'un feuillet explicatif de 4 ou 5 pages; mais, aprs rflexion, j'ai t amen traiter le problme de faon plus globale et le texte s'est allong. Pour rsumer: Le guide souligne la diffrence entre la mesure et lvaluation. Notre ancien systme de notation, avec des pourcentages, sapparentait la mesure, tandis que la notation littrale veut afficher le message essentiel de l'valuation. On note plusieurs problmes avec notre pratique actuelle de la notation littrale: l'absence de normalisation, l'abus des chelles de conversion et l'emploi de techniques vicies pour la combinaison de notes. Je vous propose de faire l'valuation en deux tapes: - d'abord, en vous basant sur le critre de comptence, dcidez s'il y a russite (note par A, B ou C) ou chec (not avec E ou F) - la mention D (passable) indique que vous n'avez pas pu trancher. - en second lieu, pour les tudiants qui ont russi, octroyez les mentions selon le succs relatif de telle sorte, qu' long terme, la moiti reoivent des A et des B - et l'autre moiti, des C et des D. Suite l'examen de la pratique l'Universit de Montral et ailleurs, le guide propose deux chelles oprationnelles: l'chelle "A" pour lattribution directe de notes littrales et l'chelle "B" pour toute combinaison de lettres ou pour conversion entre lettre et pourcentage (normalis). Un principe est clair: l'valuation littrale implique la normalisation des rsultats. Cependant, il faut que les notes restent perues comme un rsultat direct du travail de ltudiant. Je dgage deux recommandations: utiliser une formule dajustement simple et ne jamais rduire une note! Je ne m'attends pas ce que vous soyez d'accord avec tout ce qui a t expos ici. Toutefois, j'ose esprer que le guide contribuera normaliser le processus d'valuation et vous aidera attribuer des notes justes avec facilit et avec confiance.

- 26

Annexe 1: La correction des tests objectifs


Dans les sections prcdentes, nous avons vu comment convertir en notation littrale des notes exprimes en pourcentage. Cest dire comment passer dun systme avec un trs grand nombre de rsultats possibles ( 100 et plus avec des dcimales) un autre qui a un nombre plus restreint de possibilits: 7 mentions avec lchelle A, 12 avec lchelle B ou 13 selon le rglement pdagogique. Ici je veux traiter un problme diffrent: comment tablir la bonne mention partir dun systme avec un nombre limit de rsultats, par exemple: un test compos dune seule question objective avec deux rsultats possibles: bon ou mauvais (PASS / FAIL). Sil semble appropri de mettre F pour un mauvais rsultat, que donner pour la bonne rponse? C? A? A+? Initialement, le problme ma t rapport par collgue sous une forme assez diffrente: Je veux employer la notation littrale pour mes tests, me disait-il, mais je nai pas assez de questions ! Aprs explications, jai compris ce quil voulait dire. Dans son cours, il donnait assez souvent des tests objectifs avec 5, 10 ou 15 questions. Maintenant, pour tenir compte de toutes les mentions, il lui faudrait au moins 22 questions pour distinguer tous les niveaux: 11 (A+, A, A-, jusqu D) pour couvrir les mentions de la plage de russite (50 100%) et un nombre gal pour la plage des checs (0 50%). Comment faire avec moins de questions? Premire rponse: ne pas utiliser la notation littrale! Continuer avec le vieux systme de pourcentages pour les preuves intermdiaires et ne faire la conversion en notation littrale qu la toute fin du cours pour la note globale. Mais, si on voulait vraiment employer les lettres, que faire? Le principe fondamental qui va nous guider, c'est que la prcision de la notation doit correspondre la prcision de la mesure. En physique, on parle des chiffres significatifs; on ne doit pas exprimer la longueur d'un bout de bois comme tant 12,042 cm si l'erreur estime est 0,1 cm, on dira plutt 12,0 cm. Donc, pour une question VRAI/FAUX, les rsultats sont parfait ou mauvais, 100% ou 0%, A+ ou F. Comme avec la correction numrique, cest par le cumul de ces valuations binaires quon obtient une valuation plus raffine . Exemple: Dans une suite de 15 questions VRAI/FAUX, un tudiant obtient 11 bonnes rponses. Quelle est sa note globale? On convertit en pourcentage avec 100% pour une BONNE rponse et 0% pour une MAUVAISE. Ltudiant a donc une moyenne de 11*100% divis par 15, soit 73%: un B selon lchelle A ou lchelle B .

- 27

Avec une bonne rponse en moins (dix), on obtiendrait, 100% * 10 / 15 = 66%: un C selon lchelle A ou un C+ selon lchelle B. Notez que, selon ce calcul, il est impossible d'avoir B-. Mieux vaut se limiter aux mentions A,B,C,D et F de l'chelle "A" et ne pas essayer d'attribuer des "+" et des "-". Ma conclusion gnrale sur les tests objectifs est quil est inutile de donner des mentions plus fines que A,B,C,etc... tant quil y a moins de 25 points distincts dans le schma de correction. On utilisera plutt un barme de correction bas approximativement sur l'chelle "A". Le barme exact pourra tre fix a posteriori pour permettre la normalisation (revoir section pertinente). Voici quelques exemples de barmes pour des tests objectifs avec divers nombres de questions. Dans chaque cas, on associe D la russite de 50% (au moins) des questions et on suit (approximativement) lchelle A. Rsultats obtenus 7 quest. 8 quest. 9 quest. 10 quest. 0,1,2 3 4 5 6 7 0-2 3 4 5 6 7,8 0-3 4 5 6 7 8,9 0-3 4 5 6,7 8 9,10

Note littrale F E D C B A

6 questions 0,1 2 3 4 5 6

Avec moins de 6 rsultats possibles, on utilisera encore moins de mentions. Par exemple, dans un de mes cours je donne une suite d'exercices raliser en laboratoire. Pour chaque exercice, il y a trois rsultats possibles: Ralis dans les temps, correct mais en retard (1 semaine maximum) et chec. Prsentement, je donne 0,1 ou 2 points; si j'utilisais la notation littrale, je donnerais F,D ou A. En conclusion, pour des preuves avec un nombre limit de rsultats possibles, notez en points ou utilisez un petit nombre de lettres bas sur les quivalences de l'chelle "A".

- 28

Annexe 2: Les barmes avec seuils


Je traite ici d'une technique utile qui semble particulire au Dpartement dinformatique et RO. Typiquement, beaucoup de cours comprennent des travaux pratiques et des exercices qui servent lassimilation de la matire. Dans lvaluation du cours, doit-on tenir compte de ces travaux ou est-ce que lvaluation doit se faire surtout sur la base dexamens? Le problme avec les travaux pratiques, cest quils sont peu discriminatoires. Le but dun travail pratique, cest de faire apprendre; les travaux se font en quipe, il ny a pas de limite de temps stricte, ils sont conus pour tre russis: il est donc difficile dy chouer. Dun certain cot, on voudrait donner une forte pondration ces travaux pour reflter leffort investi; mais, souvent on constate que les examens nont plus grand effet sur la note finale.... Il devient quasiment impossible de couler un cours! Pour les cours avancs ceci nest pas trop grave, mais en premire anne, cest un problme srieux car il faut pouvoir discriminer afin de rorienter le plus rapidement possible (par l'chec) les tudiants mal placs. La solution en vigueur au Dpartement, cest le barme avec seuil. Par ceci, on entend que les travaux pratiques sont contributoires seulement si les examens sont russis. Les seuils habituels taient 50% ou 40%; en littral, a pourrait tre D ou E. Si le seuil nest pas atteint, la note de travaux pratiques est limite la note dexamen (ou au seuil). Voici un exemple avec des pourcentages. Soit un barme avec 40% pour les examens et 60% pour les TPs et seuil 50%. Disons que ltudiant a 80% dans les TPs et 45% lexamen (seuil non franchi). Sans seuil, le calcul pondr donnerait (80 x 0.6 + 45 X 0.4) = 66% ou russite comme rsultat final. Avec le seuil, la note finale reste 45% (chec).

- 29

Annexe 3: Tableau comparatif des systmes de notation

- 30