Académique Documents
Professionnel Documents
Culture Documents
Jean Vaucher
Professeur titulaire Groupe Incognito Dpartement dinformatique et de recherche oprationnelle Universit de Montral octobre 1990 (rvis septembre 1991)
Avant-propos
Ce guide a t crit dans le but d'aider mes collgues attribuer des notes correctes avec facilit et confiance. Tout d'abord, je devrais souligner que je nai aucune qualification ou diplme particulier qui me permette d'imposer quoi que ce soit en matire dvaluation. Par contre, cette anne,1 comme tous mes collgues, jai vcu lintroduction de la notation littrale - sans mode demploi- et jai d rviser mes techniques dvaluation, inventer un sens aux lettres de la notation, trouver des trucs pour calculer mes notes et refaire mes programmes dordinateur. Bref, passer beaucoup de temps faire marcher la technique. Avec le guide, j'espre vous viter mon travail de rinvention de roue. Suite des discussions sur le sujet, jai aussi remarqu que je ntais pas le seul avoir eu des problmes appliquer et interprter la mthode littrale. En particulier, il ne semble pas y avoir consensus sur le sens des lettres. Ceci est grave car si nous devons changer de systme afin de nous normaliser, il faudrait sentendre sur cette norme afin de pouvoir sy conformer. De la situation actuelle, o chacun est forc dinventer sa mthode, se dgage une impression de flou et darbitraire qui pourrait facilement mener la contestation de la lgitimit des notes. Pour claircir la situation, jai contact des sources officielles lUniversit et jai pos la question suivante: quelle devrait tre la moyenne dune classe moyenne au premier cycle? Dans mon esprit, a aurait pu tre C avec 2 niveaux plus haut (A et B) et 2 niveaux plus bas (D et chec)... Dans une deuxime tape de rflexion, constatant quun tudiant doit maintenir une moyenne de C pour russir un programme de premier cycle, jai dduit que si chaque professeur fixait sa moyenne C, la moiti de nos tudiants chouerait sur la moyenne gnrale. Quelle moyenne donc faudrait-il viser afin que le systme marche: C+, B-, B...? La rponse officielle ne ma pas aid. Il n'y a pas de norme, ma-t-on dit, a dpend des dpartements et des titulaires. Suite cette exprience, jai dcid quil serait utile de passer quelque temps mettre sur papier ce que mes collgues et moi avions appris, conclu ou labor cette anne en matire dvaluation. Je dois avouer que je nai pas fait de recherche bibliographique en bonne et due forme. Jai bien ouvert Bloom2 au dpart, mais je lai vite referm et ce nest qu la toute fin du travail que je suis tomb sur les monographies de notre Service Pdagogique. Deux volumes sont pertinents et jen recommande la lecture. Le premier3 souligne trs bien les problmes de lvaluation; le second4 donne de bons conseils sur la composition dexamens choix multiple. Cependant, ni l'un ni l'autre ne traite vraiment des problmes tudis ici. De plus, ces documents ont le
11989-1990 2Bloom, Benjamin, Taxonomy of educational objectives, 1956. 3Dossier sur lvaluation, prsent par France Lafontaine, Service Pdagogique, Universit
de Montral, 1979 (9,00$ ). 4Bernard, Huguette et F. Fontaine, Les questions choix multiples, Service Pdagogique, Universit de Montral, 1979 (11,00$ ). -2-
dsavantage dtre des documents institutionnels. En quelque sorte, ils engagent lUniversit et la rputation acadmique des auteurs. Le style se doit d'tre tempr afin de ne pas susciter la contestation. Le prsent guide est un document personnel qui nengage pas lUniversit. Si jamais des contestations taient bases sur mon texte, il serait facile de dsavouer lamateur que je suis. Je peux donc tre aussi catgorique et pragmatique que je juge ncessaire et le lecteur sera libre de ne retenir que ce qui lui est utile.
Par rapport la version prcdente d'octobre 1990, ce texte comporte quelques retouches la section sur l'chelle "B" (p. 19) et la section sur la normalisation des notes (pp. 21-22).
Remerciements
Par leurs commentaires, suggestions et corrections, plusieurs personnes ont contribu amliorer ce guide. Je tiens remercier D.B., F.B., G.B., P.B., C.C., G. L. , L.L., B.L., U.M., C. S-V. et P.M.
-3-
Introduction
Les pdagogues distinguent entre la mesure et lvaluation.5 La mesure, cest un score obtenu dans un test quelconque (p.e. 15 sur 20); lvaluation, cest linterprtation de ce score (p.e. moyen ou excellent). Notre ancien systme de notation, bas sur les pourcentages, est ax sur les tests et il sapparente la mesure, tandis que la notation littrale soriente plus vers lvaluation. Lavantage de la notation littrale dans les bulletins est de pouvoir faire ressortir le message essentiel dune valuation: est-ce que ltudiant a russi ou chou, est-il suprieur la moyenne, mrite-t-il une bourse, etc... Pour que le processus dvaluation fonctionne correctement, il faut quil y ait entente gnrale sur les diffrents jugements quil est possible dmettre et sur la manire dont on peut les exprimer par le biais dune seule lettre. De plus, il faut trouver un systme facile appliquer et justifier afin de limiter larbitraire (ou limpression darbitraire) pour que tous les intervenants, cest--dire les professeurs, les tudiants et les lecteurs des bulletins, aient confiance dans lexactitude du processus. Le simple fait dutiliser la notation littrale dans les bulletins officiels ne rsout pas le problme fondamental de lvaluation: comment combiner et traduire des rsultats de tests en valuation. Et ceci, avec cohrence, facilit et certitude. Dans ce qui suit, je prsenterai dabord les extraits du rglement pdagogique qui dcrivent la notation littrale ainsi que lchelle de conversion de la Commission des tudes. Ensuite, je dcrirai certains problmes typiques rencontrs avec le nouveau systme, puis je proposerai un schma dvaluation qui procde en deux tapes: distinguant en premier lieu, la russite de lchec, pour ensuite attribuer des mentions (lettres) appropries. Finalement, jexposerai certaines techniques que j'ai trouv utiles et je montrerai comment elles sappliquent dans des cas concrets tirs de mon exprience.
5F. Fontaine, Evaluer? Mesurer? dans Dossier sur lvaluation, Service Pdagogique, Universit de Montral, 1979.
-4-
Certains seuils ajoutent un sens ces lettres. Au premier cycle, la note de passage pour un cours est D ou mieux. De plus, on exige une moyenne gnrale de 2,0 (C) ou mieux pour la russite dun programme. Ces deux seuils correspondent des moyennes de 50% et 60% selon lancien systme. Il y a un troisime point de repre dans nos rglements, cest la moyenne minimale requise pour tre admissible la matrise: 2,7 ou B- dans un systme et 70 % dans l'autre. Aux tudes suprieures, les exigences sont plus leves. La note de passage pour un cours est "C" (article 33 du rglement pdagogique de la FES) et la moyenne gnrale maintenir est "B-" ou 2.7 (articles 42 et 56). Finalement, il existe une table de conversion entre pourcentages et lettres qui a t adopte par la Commission des tudes. Cette table a t largement diffuse par les tudiants, et on la retrouve dans certains agendas. Nous la reproduisons cidessous. Laspect dtaill de cette table suggre que son emploi est une garantie de lobjectivit de lvaluation. Cest loin dtre le cas! et je critiquerai plus loin l'emploi abusif qui peut en tre fait! Effectivement, cette table a t adopte uniquement pour fins de conversion, au 31 aot 1989, de la moyenne cumulative antrieure des bulletins.
6Un tableau des systmes de notation en vigueur au Qubec est donn l'annexe 3.
-5-
90-100 85-89 80-84 77-79 73-76 70-72 65-69 60-64 57-59 54-56 50-53 35-49 0-34
Excellent (80-100)
Bien (57-69)
Cest bien davoir une liste de mots; cest mieux de sentendre sur le sens de ces mots. Sur des dossiers franais, on peut trouver des mentions diffrentes: assez bien, bien et trs bien. Une universit amricaine utilise les termes: conditional pass, satisfactory, good et very good. Comment comparer notre trs bon avec un assez bien ou un good. De mme, est-ce que le A est attribu 5% des tudiants, 10%, ...? Il est illusoire de penser obtenir un standard absolu, mais il serait souhaitable que certains critres soient noncs tout haut afin de rduire les divergences dinterprtation. Un deuxime problme dcoule de lapplication aveugle de lchelle de la Commission des tudes pour convertir en lettres des rsultats dexamens exprims en pourcentages. Comme nous l'avons dj dit, un pourcentage dnote une mesure tandis qu'une lettre implique une valuation. L'application d'une chelle prsuppose des rsultats normaliss; on ne devrait pas s'en servir directement
-6-
avec des notes brutes.7 Par contre, une chelle peut servir dtalon pour vrifier (a posteriori) la cohrence dun barme de correction. Je mexplique par un exemple. Disons que dans un examen donn, mes deux meilleurs tudiants obtiennent 67% et 69% respectivement. Si japplique sans rflchir lchelle de conversion, je dois leur attribuer la note C+. En fait le raisonnement devrait se faire linverse: typiquement, les meilleurs tudiants dans une classe normale dcrochent des A (entre 80 et 100% selon lchelle). A dfaut d'autres informations qui expliquent ce rsultat, je dois conclure qu'il y a un problme: soit dans mon examen, soit dans ma correction et la raction doit tre de corriger le problme, (par exemple, en redressant les notes).8 On na pas toujours besoin de convertir de pourcentage lettre. Certaines formes de travaux se prtent naturellement lattribution directe de mentions: examens oraux, dissertations, projets et travaux pratiques. Dans ces cas, on peut procder avec le modle de piles. Initialement on fait une premire distinction entre les bons, les moyens et les checs (les piles). Puis, on procde un classement de chaque pile en sous-piles par comparaison. On peut associer les lettres directement aux piles, utilisant les variantes + et - s'il y a vraiment des diffrences remarquables entre sous-groupes. Avec ces formes de travaux, la pertinence et lutilit de la notation littrale sautent aux yeux. Cependant, on na pas contourn pour autant le problme de conversion de notes car, il faut souvent combiner et pondrer les rsultats de plusieurs preuves pour obtenir une note globale. Comment faire? Ceci nous amne un troisime problme car lutilisation des points associs aux lettres (A=4, B=3, etc...) sest avre spcialement non-recommandable pour la combinaison de notes littrales. Un exemple illustre le problme. Prenons un cours comportant 4 preuves avec pondrations gales. Il est clair quaprs avoir bien russi la premire preuve avec A (4 points), ltudiant peut sabstenir de se prsenter aux autres preuves, car un calcul de la moyenne selon les points: (4+0+0+0)/4 donne 1.0 ou D et il est assur de la note de passage. Un peu de rflexion montre lerreur dans ce raisonnement. Lusage des points par l'Universit pour le calcul de la moyenne cumulative va de pair avec la rgle que chacun des cours doit tre russi (avec D [1.0] ou mieux). Un cours chou ne contribue pas la moyenne; mais il doit tre repris ou remplac. Appliquant cette philosophie aux preuves l'intrieur d'un cours, on conclut que lchec une preuve entrane l'chec au cours. Donc, loin de russir, notre tudiant coule misrablement! Si lexigence de russite de chaque preuve nest pas ce que vous cherchez, il faut faire autre chose. Cest l quune chelle de conversion comme celle de la Commission peut tre utile. Soit A=86% et 0% pour labsence, nous avons
moyennes cumulatives, parce que la loi des grands nombres attnue les diffrences individuelles de notation entre preuves et normalise les rsultats. 8Je ne prtend pas qu'on doit toujours ajuster les notes afin que les meilleurs obtiennent des "A". Le niveau des tudiants admis varie d'anne en anne et le hasard fait que certaines classes sont exeptionnellement faibles. Le sujet sera trait plus en dtails dans une section sur la "normalisation" des notes. -7-
une moyenne de (86+0+0+0)/4 = 21,5% (ou F) qui traduit bien la situation.9 Facile... qui sait comment sy prendre! COROLLAIRE: ne pas laisser d'autres (votre secrtariat, la Facult, le centre de calcul ou le bureau du Registraire) le soin de combiner des valuations littrales d'preuves partielles; il est probable qu'ils utiliseraient la "mthode des points" avec les aberrations qui en dcoulent. Il est recommand10 de faire vos propres calculs et de soumettre une seule note littrale globale. Une chelle de conversion est donc utile pour la combinaison de notes littrales, mais toutes les chelles ne sont pas aussi bonnes les unes que les autres. En particulier, une chelle non-linaire comme celle de la Commission peut donner des surprises . Par non-linaire, jentends que l intervalle en pourcentiles nest pas gal pour chaque mention. Par exemple, A+ recouvre un intervalle de 10% tandis que B- recouvre un intervalle de 3%. Selon lordre dans lequel on combine les notes, il peut y avoir des diffrences marques. Par exemple, prenons deux notes avec pondrations gales: 100% (A+) et 72%(B-). Quelle est la mention globale? Premire technique: moyenne de 86%, ce qui donne A. Deuxime technique, passage par les points: (4.3+2.7)/2 = 3.5, livrant A- ou B+ selon larrondi. De telles anomalies ne peuvent quentraner un sentiment darbitraire et dinjustice.11 Il faudra faire attention nos chelles!
sur 30 lintra et 47 sur 70 au final (pour une moyenne pondre de 76.5%) pensait se voir attribuer au moins un B ou un B+ selon lchelle; elle reut B-. Justification: conversion de chaque preuve en lettre et utilisation des points pour la moyenne. 12Le terme comptence nest pas consacr; mais il semble singulirement bien appropri la situation. 13A moins davis contraire, la mention dune lettre comme C comprend aussi ses sous catgories (C+,C et C-). -8-
Les seuils de lancien rglement pdagogique expriment assez bien ces trois notions: chec, passage minimal et comptence. Le seuil de 50% traduit le fait que ltudiant devrait connatre au moins la moiti de la matire de chaque cours et se trouver plus prs de la connaissance parfaite que de lignorance totale. Le 60% reflte le fait quun diplme doit attester dun niveau de matrise additionnelle. La notion de comptence recouvre toute une gamme d'habilets. On sait que dans tout domaine, certains praticiens sont meilleurs que dautres et que la majorit sont moyens (voire trs moyens); mais chaque praticien comptent doit pouvoir fonctionner utilement et il doit pouvoir se dmarquer des personnes qui nont pas reu sa formation. Par analogie, prenons des mtiers: il y toutes sortes de plombiers, mais on sattend ce que chacun puisse installer un robinet, souder des tuyaux et dboucher une toilette. De mme, tout journaliste doit pouvoir crire un texte lisible. De manire pratique et mesurable dans le contexte universitaire, lattestation de comptence dans un domaine (mentions A,B ou C) signifie que ltudiant est prt aborder dautres activits (emplois ou cours) qui dcoulent du domaine en question. Si votre valuation ne vous permet pas dattester ce degr de comptence, il faut lindiquer avec D, E ou F. La mention D ( passable) dnote une situation o ltudiant a dmontr une connaissance minimale des notions importantes du cours sans faire preuve de matrise ni de facilit avec la matire. On ne voit pas lutilit faire reprendre le cours, mais ltudiant nest pas mr pour aller plus loin. A l'UdeM, un D reprsente une faiblesse qui peut tre rachete par des rsultats suprieurs ailleurs afin de maintenir une moyenne de C. A McGill, le sens du D est lgrement diffrent, plus proche des critres oprationnels noncs plus haut: Mme si le D est une note de passage, il ne donne pas accs aux cours dont il constitue une des conditions pralables, ni nest reconnu si le cours est obligatoire dans le programme de ltudiant. 14 Traitons maintenant de lchec (mentions E ou F). Dans chaque matire, il y a un niveau minimal de connaissances que tout tudiant devrait acqurir. Si un niveau minimal de connaissances nest pas atteint, nous devons constater lchec. Comme lchec a des consquences srieuses sur le droulement des tudes dun tudiant, il faut tre absolument sr de ce jugement. Un examen bien conu peut aider la dcision. Imaginons un examen avec des sections faciles, dautres moyennes et difficiles. Vous pourrez conclure lchec, non seulement parce quun seuil (comme 50%) na pas t acquis mais aussi par la nature des erreurs... Par exemple, question X reprsente le B-A-BA du cours et le candidat na mme pas pu y rpondre!!! De faon pratique, ceci veut dire quun collgue pourrait facilement corroborer votre conclusion. Si vous ntes pas sr de votre jugement dchec.... Utilisez la zone grise, le D.
-9-
Autre conseil: avec un seuil 50%, laisser des notes entre 49 et 50% invite la contestation.... Je les augmenterais 50% (D). Par contre, je nirais pas plus loin dans cette voie. Dj, 49% ltudiant est loin de la comptence quon souhaite. Noublions pas le rle des jurys de fin de session pour les cas limites. Cest au jury examiner globalement le dossier de ltudiant et tenir compte de circonstances particulires afin de redresser des anomalies grossires.
- 10
rfrences quelle cite sur le manque de corrlation entre les notes et le succs professionnel.
Classification de la russite
Une fois que l pineux problme des checs a t rgl, le reste est plus facile. La population des tudiants qui ont russi est relativement homogne et on peut attribuer des mentions selon la proportion des tudiants quon sattend avoir chaque niveau. A mon avis, les meilleurs 50% devraient recevoir des A et B tandis que les autres 50% se verraient attribuer les mentions C et D. Jai maintenant rpondu la question que javais pose aux instances officielles: quelle doit tre la moyenne dune classe moyenne? On peut dduire que la note mdiane pour les tudiants qui ont russi doit se situer mi-chemin entre C et B. En plus de dtails, voici une rpartition qui semble raisonnable avec des mentions descriptives: A B C D 20% - mrite une bourse (magna cum laude et peut-tre admissible au PhD???) 30% - admissible la matrise (cum laude ) 40% - comptent 10% - passable
Il y a deux points importants souligner. Premirement, la rpartition ne touche que ceux qui ont russi et les proportions suggres ne sont pas influences par le taux d'checs. L'chec est dcrt par un mcanisme diffrent (comptence minimale) o les proportions n'interviennent pas. Deuximement, les proportions visent le long terme; il est clair que la proportion exacte des "A" va varier d'une anne l'autre selon la force des promotions. Pour terminer, voyons A+, les summa cum laude. Devrais-je suggrer un quota comme 1% de la population? Pas ncessaire daller si loin. Chaque anne on trouve des tudiants qui nous rendent heureux dtre professeurs. Non seulement ils obtiennent les meilleures notes, leurs questions en classe dmontrent quils anticipent ce quon va dire. Dans leurs examens, on trouve des lments de rponse qui dpassent ce quon a enseign. Souvent, ils ont quelque chose nous apprendre et on aimerait quils poussent les tudes jusqu'au doctorat afin quils puissent un jour prendre notre place. Ce sont eux les A+.
matire (D=50% ou mieux); de mme, la connaissance de 80% (ou plus) de la matire reprsente un rsultat excellent. Le premier rle d'une chelle de conversion est de servir de modle explicatif et opratoire de l'valuation. Pour les tudiants, une chelle est un gage dobjectivit. Elle permet de juger le degr de russite et de prvoir la note finale. Deuximement, une chelle peut servir la combinaison d'valuations littrales car l'chelle traduit les valuations en "degrs de connaissance" qui eux se combinent trs bien mathmatiquement. Troisimement, dans la mesure o une note en pourcentage est le reflet exact du degr de connaissance d'une matire, une chelle peut servir la conversion de pourcentages en lettres. Mais, attention! Si un examen est mal conu, ce n'est pas l'emploi aveugle d'une chelle de conversion qui produira une valuation correcte ou objective.18 En fait, la philosophie de la notation littrale prconise la normalisation des rsultats numriques avant l'application d'une chelle de conversion - j'en reparlerai plus loin. Malgr ma critique de lutilisation irrflchie des chelles dquivalences, je reste convaincu quil est essentiel pour chaque professeur davoir son chelle de conversion et de la communiquer aux tudiants. Par contre, cette chelle se doit d'tre diffrente de celle de la Commission des tudes. Dans ce qui suit, nous traitons dabord les contraintes que les chelles doivent respecter, puis les problmes que ces contraintes entranent. Ensuite, nous regardons des chelles utilises ailleurs et nous examinons des distributions de notes obtenues l'Universit de Montral pour tablir l'applicabilit de diverses propositions. Finalement, je proposerai deux chelles pratiques. Prenons dabord les contraintes. Le rglement pdagogique dfinit trois seuils de russite et ceci dtermine implicitement des quivalences. Premirement, les mentions E et F dnotent lchec, tandis que D (ou mieux) indique la russite dans un cours; ceci correspond l'ancien seuil de 50%. Ensuite, une moyenne de 2,0 (C) est ncessaire pour la russite dun programme (ancien palier 60%) et 2,7 (ou mieux) est ncessaire pour ladmission aux cycles suprieurs (70% selon l'ancien rglement). Quand on veut aller plus loin, il y a des problmes. Premirement, la notation dcimale nous a habitu situer nos seuils et nos notes des multiples de 5% ou 10%, mais le nombre de mentions quil faut accommoder (soit 4 ou 11 selon notre rglement pdagogique19) ne divise pas lgamment les 50% qui reprsentent la plage de russite. Avec ce nombre de mentions, doit-on accepter des intervalles bizarres (p.e. 3.57%) ? Avoir des intervalles de tailles variables? Changer le nombre de mentions utilises? Autre considration dans le choix des intervalles: les intervalles choisis devraient rpartir les tudiants en groupes de manire utile et significative.
18Pour viter le cumul des problmes de conversion, on peut tout noter numriquement, comme avant, et ne convertir en lettre que la note globale. 19 Les 4 mentions principales (A,B,C et D) ou 11 mentions si on compte les sous-divisions: A+,A,A-,B+,B,B-,C+,C,C-,D+ et D....(sans D- ).
- 12
Pour avoir une ide dalternatives possibles, je vais prsenter la succession des chelles en usage gnral McGill depuis 1937, - pas ncessairement parce que McGill fait mieux les choses que dautres mais parce que McGill utilise la notation littrale depuis assez longtemps et parce que ces chelles sont disponibles (publies par le Registraire). Un tableau des autres systmes de notation en vigueur au Qubec est donn l'annexe 3. McGill (1937 - 1971) % 80 - 100 65 - 79 50 - 64 0 - 49 McGill (1971 - 1980) % 80 - 100 65 - 79 55 - 64 45 - 54 0 - 44 McGill (1980 - ... prsent) % 85 - 100 80 - 84 75 - 79 70 - 74 65 - 69 60 - 64 55 - 59 50 - 54 0 - 49 1 cycle A AB+ B BC+ C D F 2/3 cycles Pondration A AB+ B BF 4,0 3,7 3,3 3,0 2,7 2,3 2,0 1,0 0,0 1 cycle A B C D F 2/3 cycles A B F Pondration 4.0 3.0 2.0 1.0 0.0 Mention A (1 classe) B (2 classe) C (3 classe) F chec
On remarque certaines constantes dans ces chelles. Dans chacune, les mentions A et B correspondent aux mmes intervalles de notes: 80-100 et 65-79 respectivement. Il y a moins de paliers que prvus dans notre rglement mais les intervalles sont plus rguliers (multiples de 5%). Il y a deux diffrences principales avec lchelle de la Commission: dabord, la limite entre les C et les B se situe 65% et pas 70% comme chez nous. Ensuite, le nombre de mentions entre B et F est trs rduit McGill: la zone grise, notre D,D+ et C-, est reprsente par une seule lettre, le D. Finalement, exception faite du A+ qui n'existe pas McGill, notons que les pondrations associes aux lettres (A=4.0, A-=3,7, etc...) sont identiques chez eux comme chez nous.
- 13
Les chelles ci-dessus ont lavantage dtre plus simples que celle de la Commission; mais, est-ce quelles refltent nos habitudes en matire dvaluation? En particulier, pour fixer le seuil entre B et C (65% McGill), il faudrait savoir quelle est la note mdiane de nos tudiants. Je cherchais aussi un seuil raisonnable pour dpartager les A des B. Pour rpondre ces questions, jai fait une analyse rapide des bulletins des tudiants dans mon Dpartement.
- 14
moyenne: mdiane:
rsultats > 80%: rsultats > 85%: rsultats > 90%: maximum: 91.8
Selon ces donnes, un seuil 70% entre C et B et un seuil 80% entre B et A correspondraient peu prs nos objectifs: d'accorder des A et B environ 50% des nos tudiants et des A 20%.
- 15
Rsultats d'tudiants "avancs": Si on limite lchantillon aux 56 tudiants "avancs" qui ont russi 45 crdits ou plus, nous avons des moyennes encore plus centres autour de 70%:
moyenne: mdiane:
rsultats > 80%: 9% rsultats > 85%: 5% rsultats > 90%: 2% maximum: 91.8
- 16
Rsultats du programme MATH-INFO: Voici les rsultats pour tous les tudiants du programme (33 personnes y compris 2 checs):
moyenne: mdiane:
rsultats > 80%: 24% rsultats > 85%: 6% rsultats > 90%: 0% maximum: 87.4
De l'ensemble de ces rsultats, je conclus que 70% semble tre un palier raisonnable (en informatique et RO) pour dpartager la moiti des tudiants en dessus de la moyenne (A et B) de ceux en dessous de la moyenne (C et D). De mme, utiliser 80% pour dlimiter les B des A semble utile. Environ 10 20% de nos diplms obtiendraient un A pour le BSc.
- 17
Il y a quelques annes, un de mes collgues, le professeur Paul Bratley, proposait un barme de correction pour nos projets de fin dtudes (le cours IFT3051). Ce barme est presque identique lchelle pratique A. La description du niveau de comptence associ chaque catgorie est excellente et le barme a souvent t repris comme modle. Je le reproduis ci-dessous en ajoutant entre parenthse la mention pertinente (A+,A, etc...).
20La borne infrieure exacte devrait tre choisie telle que les rsultats (arrondis) affichs par des programmes de spreadsheet ou tableurs correspondent aux plages. Cest dire que la borne infrieure exacte pour A+ serait 89.5%, pour A 79.5%, etc...
- 18
IFT3051 - Projets de fin d'anne en informatique Barme d'valuation A titre indicatif, je vous suggre le barme suivant pour vos projets. Vous tes bien sur libre de l'ignorer ou de le changer: c'est vous qui accordez des notes vos tudiants, pas moi. Je vous demande cependant de ne pas pousser votre gnrosit au point de manquer de toute discrimination. 90-100 La perfection (A+): le projet devrait normalement inclure une contribution originale de l'tudiant sur le plan des ides ou des mthodes. Un simple travail de programmation- mme trs bien excut- ne devrait pas normalement mriter un 100%. 80-90 Un excellent travail (A): bien test, bien document, et bien conserv pour une utilisation subsquente. Si l'tudiant n'a pas combin des ides originales, ou au moins il a accompli le travail avec flair et lgance. 70-80 Un bon travail comptent (B): Peut-tre le projet n'a pas avanc autant que prvu, mais ce qui est fait est bien test et bien document; peut-tre le travail accompli est excellent, mais la documentation n'est pas tout fait satisfaisante (elle devrait cependant tre adquate pour quelqu'un qui voudrait continuer le projet plus tard). 60-70 On commence manifester un certain mcontentement (C). Peut-tre un programme existe, mais il n'a pas t test srieusement; peut-tre le travail n'est pas document de faon adquate. Le projet pourrait difficilement tre repris et continu par une autre personne. 50-60 La dception (D): L'tudiant a accompli assez de bon travail pour qu'on lui accorde ses crdits, mais le projet n'est pas utilisable: il y a trop d'erreurs ou de lacunes, ou tout simplement le projet n'est pas termin la date voulue. < 50 L'chec (E et F): A votre avis, le travail de l'tudiant n'est pas suffisant, en quantit ou en qualit, pour qu'on lui accorde des crdits. Je vous suggre aussi d'utiliser la note 49 pour des cas douteux: si l'ensemble du dossier le justifie, le jury pourra monter la note 50. Si vous voulez que l'chec soit dfinitif, mettez une note en bas de 45. Pour des projets "presque" termins, je vous suggre d'accorder une note base sur l'tat rel du projet, quitte changer avant les runions du jury (mi-mai), plutt que d'accorder une note plus gnreuse base sur des promesses. Paul Bratley (1984)
- 19
Avec cette chelle, les notes quivalentes pour C et D correspondent exactement aux seuils de 50% et 60% de lancien rglement. En contre-partie les bornes infrieures des intervalles ne tombent plus sur des dciles. Notez quon a tendu lgrement D vers le bas (de 50% 47.5%) et que la limite entre B et A est passe de 80% 82.5%.
Je recommande cette chelle pour combiner des rsultats exprims en notes littrales22.
21 En particulier, on vitera l'emploi des points (A=4,...D=1) ou de l'chelle non-linaire de la commission des tudes 22 Ne pas utiliser cette chelle pour convertir directement un score numrique en lettre avant d'avoir lu la section suivante sur la normalisation des notes.
- 20
- 21
Je prends pour acquis deux choses: 1) bas sur votre exprience, vous avez compos le meilleur examen possible et 2) vous avez une ide pralable de la distribution attendue des notes. Une diffrence marque entre les rsultats attendus et les rsultats obtenus sera un indice de dfectuosit dans l'examen. Remarquez que c'est vous qui devez dcider de ce qui est normal et de ce qui ne l'est pas pour une situation donne. Comme exemple de normalisation - et sans prtention que ma mthode soit ni la meilleure ni mme la bonne - je vais dcrire comment je procde, faisant l'hypothse d'une promotion moyenne avec sa part de bons tudiants. Je commence avec une liste trie des notes ou un histogramme. Avec un examen valable, je mattends trouver 10% (ou plus) des notes en dessus de 80% et au moins une dans les 90%. Si cest exact et si il ny a pas un nombre exorbitant dchecs (daprs mon exprience du cours), je juge l'examen valable et le processus ne va pas plus loin. Si les notes semblent trop fortes, je les laisse tel quelles et je prvois augmenter la difficult de la prochaine preuve. Mais, si les notes me semblent trop faibles, je vais chercher un facteur multiplicatif appliquer ( chaque note) pour que mes meilleurs tudiants obtiennent des "A". Pour appliquer ces corrections la main sans calculatrice, j'utilise une variante simplifie de la multiplication: pour chaque intervalle de 5 ou 10 % je calcule et j'applique une correction fixe. Prenons un exemple. Disons que la meilleure note obtenue est 82% et que je considre que ceci reprsente un A+. Une faon simple et rapide pour normaliser, serait dajouter 9 points toutes les notes entre 80 et 90% ( le 82% deviendra un 91%), 8 points celles entre 70 et 80,... et 1 point celles entre 10 et 20%. Il reste le cas o lexamen est trop discriminatoire. Les bons tudiants sont bien nots mais, pour une raison ou une autre, on a limpression quil y a trop dchecs. Ce cas est rare, mais je lai rencontr en premire anne pour des examens objectifs avec correction stricte. Si on peut dcider dun seuil de russite, on peut toujours diviser les notes de passage en intervalles gaux correspondant aux mentions de lchelle A ou B et attribuer soit les mentions soit les notes quivalentes. Certains professeurs sont rebelles l'ide d'ajuster les notes. Ils disent si notre meilleur tudiant n'a rpondu correctement qu' 5 questions sur 10, son score est 5 sur 10 ou 50% et il est malhonnte de prtendre autrement. Comment donc justifier de remonter sa note 80 ou 90%. C'est ici qu'il est utile de distinguer entre score et valuation car mme si le score est 5 sur 10, il est possible que ceci reprsente un excellent rsultat qui devrait tre not 80 ou 90% selon nos barmes types. C'est ici que la notation littrale devient utile car on peut faire la normalisation dans le passage des scores aux lettres (en tablissant un seuil de russite et en divisant les notes de passages en intervalles gaux). La distinction est maintenant claire: le score est un nombre (objectif et immuable), tandis que l'valuation est une lettre (obtenue du score avec les corrections qui s'imposent). Cependant, les principes noncs plus haut restent valables. Les examens devraient tre conus afin que les scores correspondent le plus possible aux valuations normales (chelles A ou B). Un autre schma de conversion ne sera
- 22
utilis que pour viter des erreurs systmatiques ou grossires et cet autre schma ne devra pas entrainer une rduction de note.
Exemples concrets
Prenons quelques exemples (camoufls pour protger les innocents) pour voir comment les principes prcdents pourraient sappliquer. CAS 1: examen intra de premire anne
Rsultat typique de premire anne. Lexamen semble valide: bonne rpartition de notes, moyenne de 62% et mdiane de 63% et 23% dchecs. Pas dajustement ncessaire.
- 23
Ici, lexamen semble nettement trop dur et discriminatoire: moyenne de 44%, mdiane de 42%, une majorit dchecs et juste 5 tudiants en dessus de 80%. De plus, c'est le mme groupe que pour le cas 1 exception faite d'abandons (des plus faibles). On voit que les rsultats ne concordent pas avec ceux de lintra. Solution: ajustement global. On fixe la note de russite 30% et on rpartit les 10 paliers de l'chelle B (D,C-,C,C+,B-,B...A+) sur la plage de 30% 100%. ... On essayera de faire un meilleur examen la prochaine fois ! CAS 3: examen final de dernire anne
Examen discriminatoire. Rsultats semblent valable. Aucune correction. CAS 4: notes globales en dernire anne
- 24
Ici on a un cours option avec des tudiants motivs. Les bons rsultats ne sont pas surprenants. Lcart est assez restreint. Ceci reflte lhomognit de la classe; et le fait que la note est le rsultat combin de 5 preuves.
Autres techniques
Dans ce guide, j'ai abord les principes et la pratique de l'valuation dans un cadre assez gnral. Reste que certains types d'preuves amnent des problmes particuliers. L'annexe 1 traite un tel cas: l'emploi de la notation littrale pour des examens objectifs avec un nombre limit de questions. Il y a aussi des pratiques locales qui mritent d'tre plus largement connues. L'annexe 2 dcrit les barmes avec seuils employs au Dpartement d'informatique et recherche oprationnelle.
- 25
CONCLUSIONS
Au dbut, j'envisageais ce guide sous forme d'un feuillet explicatif de 4 ou 5 pages; mais, aprs rflexion, j'ai t amen traiter le problme de faon plus globale et le texte s'est allong. Pour rsumer: Le guide souligne la diffrence entre la mesure et lvaluation. Notre ancien systme de notation, avec des pourcentages, sapparentait la mesure, tandis que la notation littrale veut afficher le message essentiel de l'valuation. On note plusieurs problmes avec notre pratique actuelle de la notation littrale: l'absence de normalisation, l'abus des chelles de conversion et l'emploi de techniques vicies pour la combinaison de notes. Je vous propose de faire l'valuation en deux tapes: - d'abord, en vous basant sur le critre de comptence, dcidez s'il y a russite (note par A, B ou C) ou chec (not avec E ou F) - la mention D (passable) indique que vous n'avez pas pu trancher. - en second lieu, pour les tudiants qui ont russi, octroyez les mentions selon le succs relatif de telle sorte, qu' long terme, la moiti reoivent des A et des B - et l'autre moiti, des C et des D. Suite l'examen de la pratique l'Universit de Montral et ailleurs, le guide propose deux chelles oprationnelles: l'chelle "A" pour lattribution directe de notes littrales et l'chelle "B" pour toute combinaison de lettres ou pour conversion entre lettre et pourcentage (normalis). Un principe est clair: l'valuation littrale implique la normalisation des rsultats. Cependant, il faut que les notes restent perues comme un rsultat direct du travail de ltudiant. Je dgage deux recommandations: utiliser une formule dajustement simple et ne jamais rduire une note! Je ne m'attends pas ce que vous soyez d'accord avec tout ce qui a t expos ici. Toutefois, j'ose esprer que le guide contribuera normaliser le processus d'valuation et vous aidera attribuer des notes justes avec facilit et avec confiance.
- 26
- 27
Avec une bonne rponse en moins (dix), on obtiendrait, 100% * 10 / 15 = 66%: un C selon lchelle A ou un C+ selon lchelle B. Notez que, selon ce calcul, il est impossible d'avoir B-. Mieux vaut se limiter aux mentions A,B,C,D et F de l'chelle "A" et ne pas essayer d'attribuer des "+" et des "-". Ma conclusion gnrale sur les tests objectifs est quil est inutile de donner des mentions plus fines que A,B,C,etc... tant quil y a moins de 25 points distincts dans le schma de correction. On utilisera plutt un barme de correction bas approximativement sur l'chelle "A". Le barme exact pourra tre fix a posteriori pour permettre la normalisation (revoir section pertinente). Voici quelques exemples de barmes pour des tests objectifs avec divers nombres de questions. Dans chaque cas, on associe D la russite de 50% (au moins) des questions et on suit (approximativement) lchelle A. Rsultats obtenus 7 quest. 8 quest. 9 quest. 10 quest. 0,1,2 3 4 5 6 7 0-2 3 4 5 6 7,8 0-3 4 5 6 7 8,9 0-3 4 5 6,7 8 9,10
Note littrale F E D C B A
6 questions 0,1 2 3 4 5 6
Avec moins de 6 rsultats possibles, on utilisera encore moins de mentions. Par exemple, dans un de mes cours je donne une suite d'exercices raliser en laboratoire. Pour chaque exercice, il y a trois rsultats possibles: Ralis dans les temps, correct mais en retard (1 semaine maximum) et chec. Prsentement, je donne 0,1 ou 2 points; si j'utilisais la notation littrale, je donnerais F,D ou A. En conclusion, pour des preuves avec un nombre limit de rsultats possibles, notez en points ou utilisez un petit nombre de lettres bas sur les quivalences de l'chelle "A".
- 28
- 29
- 30