Vous êtes sur la page 1sur 18

Cheminement du dvelopement de la comptence

Connaissances
dclaratives
Connaissances procdurales et
conditionnelles

Connatre et
comprendre
Choisir Planifier laborer Utiliser

Notions et vocabulaire

x

Objectifs dvaluation et taxonomies



Planification de lvaluation
certificative



Modalits et instruments dvaluation



Activit intgratrice, preuve synthse
et intgration des apprentissages



tablissement dun seuil de matrise



tablissement dun standard de
comptences



Politiques et rglements sur lvaluation
des apprentissages



Contrle de la qualit



Formation lvaluation des
comptences


2. Dimensions de lvaluation des apprentissges
N otions Vocabulaire

2.1 Introduction

Ce chapitre vise, dans un premier temps, prsenter les notions utilises dans le domaine
de lvaluation des apprentissages. En ce sens, il cible ladoption dune terminologie
commune et une comprhension minimale des enjeux associs lvaluation des
apprentissages, que ce soit dans un contexte dvaluation des comptences ou non, que ce
soit dans le contexte de lenseignement suprieur ou non. Par ailleurs, ce chapitre a
comme second objectif de proposer ladoption dun vocabulaire et une comprhension
partage de notions en lien avec lvaluation de comptences et avec lvaluation
lenseignement suprieur.


2.2 Quest-ce que lvaluation et lvaluation des apprentissages?

Au sens restreint, valuer un apprentissage consiste dterminer la valeur, limportance
dun apprentissage. Cette action, soit lvaluation, implique deux dimensions. La
premire dimension refre lacte lui-mme, soit de porter un jugement sur, faire une
apprciation de limportance de lapprentissage ralis par une tudiante ou un tudiant.
La deuxime dimension refre la procdure, la dmarche (Legendre, 1993), utilise
pour permettre de porter un jugement. Il est alors autant question des modalits
dvaluation que des rsultats dvaluation. La dfinition de Linn et Gronlund (1995) va
dans ce sens : lvaluation est un terme gnral qui inclut un ensemble complet de
procdures utilises pour obtenir de linformation propos de lapprentissage dun
tudiant et porter un jugement de valeur concernant la progression de celui-ci
1
.

Il nous semble important de souligner que dans la documentation anglophone, et
quelques fois dans la documentation francophone, on utilise de plus en plus le terme
assessment, comme lon fait Linn et Gronlund dans la dfinition prcdente, plutt que le

1
Assessment is a general term that includes the full range of procedures used to gain information about
student learning (observations, rating of performances or projects, paper-and-pencil tests) and the
formation of value concerning learning progress (Linn et Gronlund, 1995, p. 5).
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 14.

terme valuation. Par exemple, du ct francophone, Scallon (2004) semble tre tent de
priviligier le terme assessment celui dvaluation. Pour le moment, nous ne succombons
pas cette tentation. Premirement, dans un texte crit en franais, le terme assessment
est un anglicisme. Deuximement, selon nous, les dfinitions qui lui sont associes ne
semblent pas assez diffrentes de celles du terme valuation pour en privilgier lusage
en franais. En anglais la situation est diffrente et la distinction entre les termes
assessment et evaluation est toutefois plus justifie. Par exemple, en anglais dans le
domaine mathmatique on value une fonction en un point donn (evaluate a function at
a fixed point), mais il serait absurde de parler dassesser une fonction (assess a fuction at
a fixed point). On notera aussi que lutilisation du terme assessment en langue franaise
pose des problmes dassociation et de traduction de ncessaires termes parallles :
assessable, assess, assessed, assessor. Nous nutiliserons donc pas le terme assessment
et, sauf exceptions bien identifies, nous le considrerons synonyme du terme valuation.

En lien avec la seconde dimension de lvaluation, on a souvent associ outrance lacte
dvaluer avec lacte de mesurer, qui rfre plus, en fait, une procdure implique dans
lvaluation dun apprentissage. On retrouve dailleurs dans la dfinition du terme
valuable issue du Petit Robert (1996) une rfrence aux synonymes suivants :
calculable, chiffrable et mesurable. La pratique, partiellement en utilisation actuellement,
de parler du domaine de la mesure et de lvaluation, appellation qui a remplac celle de
docimologie, contribue aussi renforcer cette association. Mme si, pour un spcialiste
de lvaluation, il est important de bien matriser les notions de mesure, celles-ci sont
distinctes de celles formellement associs lvaluation. preuve, nous nutilisons pas
toujours des mesures, soit des informations quantifies, pour porter un jugement sur
lapprentissage ralis par une tudiante ou un tudiant. Ainsi, malgr limpossibilit
dobtenir des mesures dans certains cas, il est cependant ncessaire dvaluer
lapprentissage ralis par une tudiante ou un tudiant.


2.3 Regard sur lhistorique de lvaluation des apprentissages

Les documents crits sur lhistoire de lvaluation des apprentissages sont, notre avis,
actuellement trs rares. notre connaissance, un seul volume spcifique au sujet est
disponible en franais, soit celui dAuger (2000). Celui-ci couvre autant le domaine de
lvaluation des apprentissages que celui de la psychomtrie et de la psychophysique,
tandis que quelques rares volumes en anglais tracent plutt lhistoire de la psychomtrie,
des tests et de la psychophysique (Traub, 1997; Ward, Howard et Murray-Ward, 1996).
Beaucoup de travail reste donc faire en ce domaine; un travail qui pourrait savrer fort
utile et intressant pour comprendre le dveloppement de lvaluation au fil des sicles.

Trois textes importants sont aussi souligner. Premirement, notons celui de Webber
(1989) qui traite de lemprunt au systme chinois de concours pour accder la dignit
de mandarin dans notre culture occidentale. Webber monte bien limpact de ce systme
de slection effectuer les charges sociales sur nos pratiques actuelles dadmission dans
les tablissements denseignement suprieur et sur certains aspects de la certification.
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 15.


Les second et troisime textes sont ceux de Messick (1989b) et dAngoff (1988). Ces
auteurs sintressent au dveloppement du concept de validit partir des premires
applications de testing dans larme amricaine au dbut du 20
e
sicle. Messick introduit
alors, entre autres, la ncessit de tenir compte des consquences de lvaluation : cette
ide, reprise plus en dtail ailleurs (Messick, 1989a), va bien au-del de la simple
proccupation de la validit des interprtations des rsultats de lvaluation.

Il serait utile de pouvoir remonter le cours de lhistoire et dcouvrir les vnements qui
ont prsid au dveloppement de lvaluation des apprentissages. On dbuterait
laventure lAntiquit, naviguerait chez les Grecs et les Romains, aborderait le Moyen-
ge, dcouvrirait la Renaissance, pour en arriver notre univers contemporain, au 21
e

sicle. Cette escapade nous permettrait de mieux comprendre o nous en sommes quant
lvaluation des apprentissages et o nous risquons daller.

Dans une version ultrieure de ce manuel, nous esprons dbuter ce priple. Pour le
moment, nous nous contentons den faire lannonce et de prparer le voyage.

En terminant cette section, nous suggrons quune mthodologie pertinente ltude de
lhistoire de lvolution de lvaluation des apprentissages soit dveloppe. Cette
mthodologie pourrait ventuellement reposer sur une dmarche similaire celle de
llaboration dun outil dvaluation, tel que ce sujet sera abord au chapitre sur la
planification de lvaluation. Premirement, il sagit de dterminer les objectifs
dapprentissage. Deuximement, il faut identifier le domaine. Troisimement, on identifie
ce qui sera enseign. Quatrimement, on identifie ce qui sera valu. Cinquimement, on
prend une dcision quant lutilisation qui sera faite des rsultats dvaluation (validit
de consquence). Enfin, il faut identifier ou infrer comment sest fait lvaluation et
comment est communiqu son rsultat. En fait, il est un peu surprenant que tant de choses
soient crites sur lhistoire de lducation, mais si peu quant aux modalits dvaluation
et la communication des rsultats qui sont, notre avis, les aspects qui devraient
confrer les bases sur lesquelles repose notre jugement quant aux apprentissages raliss
par les apprenantes et apprenants.


2.4 Objets dvaluation

La dfinition des objectifs dapprentissage joue un rle important en ducation, dont lors
de la planification des situations dvaluation de ceux-ci. Ces objectifs servent de guides
pour lenseignement, lvaluation et la communication des rsultats de cette dernire.
Mais quest-ce quun objectif dapprentissage? Premirement, un objectif est tout
simplement une vise, une cible atteindre. Un objectif dapprentissage est tout
simplement un objectif dont le but en est un dapprentissage.

La notion dobjectif dapprentissage est, on sen doutera, troitement associe celle
dobjectif denseignement. Selon Legendre (1993, p. 911), un objectif dapprentissage est
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 16.

un objectif qui prcise les changements durables qui doivent soprer chez un sujet,
pendant ou suite une situation pdagogique. Paralllement, un objectif denseignement
est dfini comme un objectif qui nonce les intentions pdagogiques en regard des
contenus prsenter et des habilets dvelopper ainsi que de la stratgie pdagogique
adopter. Selon cette perspective, ce qui diffrentie ces deux dfinitions est quun objectif
dapprentissage est dfini en fonction dun sujet, gnralement ltudiant, tandis quun
objectif denseignement est dfini en fonction dun agent, gnralement le professeur.
Pour demeurer cohrent avec le propos de ce manuel et viter une ventuelle confusion,
nous nutiliserons que la notion spcifique dobjectif dapprentissage.

Au fil des ans, les chercheurs et les praticiens de lvaluation ont dvelopp un
vocabulaire, sinon des vocabulaires, utiles la description de diverses formes dobjectifs
dvaluation des apprentissages. Il faut souligner que la notion dobjectif est au service de
lenseignement et de lvaluation et non pas linverse. Cest pourquoi, lutilisation dune
forme ou dune autre dobjectifs doit tre utile et avoir un sens dans le contexte
spcifique de lenseignement et de lvaluation qui est effectue. Il ny a donc pas une
forme ou une autre qui est meilleure en soi, mais plutt une forme qui est meilleure dans
une contexte donn.

Ainsi, certains auteurs ont subdivis la notion dobjectif selon trois formes schelonnant
du trs gnral au trs spcifique. : il sagit des finalits, des objectifs gnraux et des
objectifs spcifiques. Legendre, pour sa part, distingue quatre niveaux : finalits, buts,
objectifs gnraux et objectifs spcifiques. Il y a gnralement entrecroisement entre
plusieurs buts et plusieurs objectifs gnraux.

Les premiers, soit les finalits du systme ducatif correspondent aux grandes valeurs et
grandes orientations des systmes dducation et transcendent la ralit de nos classes. Ils
sont usuellement formuls par les gouvernements ou les organismes responsables des
systmes ducatifs. Morissette (1984, p. 117) utilise plutt le terme buts globaux. Nous
lui prfrons celui de finalits.

Par exemple, au cours du dveloppement de lhumanit, on retrouve peu prs toujours
une constante dans les finalits des systmes ducatifs de nos socits. Selon Power
(1962), ces finalits consistent prparer la personne 1) obtenir de la nourriture, des
vtements, un abri, se protger ainsi que ses dpendants; 2) vivre avec les autres; 3) se
sentir chez elle et en paix avec elle-mme : attitudes religieuses, pratiques et croyances 4)
et dvelopper des habilets de cration et dapprciation du beau. Il est intressant de
faire le lien entre ces finalits et les besoins constituants la pyramide de Maslow (1970,
p. 35-47) reprsente la figure 2.1 : 1) besoins physiologiques, 2) besoin de scurit, 3)
besoin dappartenance et damour, 4) besoin destime et 5) besoin dactualisation de soi.
On retrouve, selon notre comprhension, peu prs les mmes catgories, la diffrence
que la pyramide des besoins de Maslow scinde en deux catgories la finalit 3 associe
sentir chez elle et en paix avec les autres. Le tableau 2.1 prsente cette comparaison.



valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 17.









Figure 2.1 Pyramide des besoins de Maslow (1970, p. 35-47)






Tableau 2.1 Comparaison entre les finalits ducatives de Power (1962) et la pyramide
des besoins de Maslow (1970)

Finalits ducatives de Power Pyramide des besoins de Maslow
4) Dvelopper des habilets de cration et
dapprciation du beau
5) Actualisation de soi
3) Vivre avec les autres 4) Estime de soi
3) Appartenance et amour
2) Se sentir chez elle et en paix avec elle-mme 2) Scurit
1) Obtenir de la nourriture, des vtements, un abri, se
protger, ainsi que ses dpendants
1) Besoins physiologiques





Besoins physiologiques
Scurit
Appartenance et amour
Estime
Actualisation
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 18.


Dans les programmes dfinis par comptences dans le rseau collgial, on retrouve les
termes de finalit et de buts du programme, suivis des noncs de comptences, qualifis
de plus par des lments de la comptence. Nous reviendrons sur les deux derniers
concepts plus loin dans ce manuel. Quil suffise de mentionner deux exemples de
finalits tirs des programmes de Sciences humaines et de Technologie du gnie civil :

Rendre ltudiant apte poursuivre des tudes universitaires dans les
grands domaines des sciences humaines, du droit, des sciences de
lducation et des sciences de ladministration, par une formation
scientifique base sur lacquisition et lintgration des connaissances et
des mthodes de diverses disciplines de sciences humaines.

Former des personnes aptes exercer la profession de techniciennes et
techniciens en gnie civil

Quant au terme de buts, il dsigne dans les programmes les grandes vises quun ou
plusieurs cours visent faire acqurir. On en trouve neuf dans le programme de Sciences
humaines, Nous les avons rsum ainsi :

1. Distinguer les principaux faits, notions et concepts relis au
phnomne humain
2. Expliquer des thories, lois, modles, coles
3. Situer divers enjeux relatifs la citoyennet
4. Dmontrer les qualits dun esprit scientifique
5. Utiliser de mthodes de travail et de recherche
6. Utiliser les TIC appropries
7. Communiquer clairement sa pense dans sa langue
8. Lire et comprendre des documents en langue seconde
9. Intgrer ses acquis

Comme indiqu plus haut, en plus des finalits, catgorie la plus gnrale, on retrouve
des objectifs gnraux et des objectifs spcifiques. Les objectifs gnraux sont relis
des habilets non observables directement chez ltudiante ou ltudiant. Par exemple,
dans la taxonomie de Bloom, que nous aborderons au chapitre suivant, ces objectifs
gnraux sont : connatre, comprendre, appliquer, analyser, synthtiser et valuer. Ceux-
ci ne sont pas observables directement et doivent tre infrs partir dobjectifs
spcifiques. En fait, je mimagine mal comment on peut voir les connaissances que
possde un tudiant. On ne peut que les infrer qu partir de tches observables
directement. Les objectifs spcifiques correspondent des comportements observables
dfinis en termes communicables et mesurables. On peut les observer directement. Par
exemple, dans un cours dvaluation des apprentissages lenseignement suprieur, le
professeur peut avoir pour objectif spcifique, entre autres, de faire en sorte que les
tudiantes et les tudiants ralisent la confection dun examen. Il sagirait l dun objectif
spcifique. Lobjectif gnral auquel serait rattach cet objectif spcifique serait de
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 19.

rendre les tudiantes et les tudiants capables de produire des instruments dvaluation
des apprentissages.
Certains auteurs ont prfr aborder la notion dobjectif sous langle des objectifs
intermdiares et terminaux. Un objectif intermdiaire est un objectif spcifique ou
gnral conduisant un rsultat ultime dapprentissage, soit lobjectif terminal. Cette
catgoriastion est commode dans des situations o la planification de lenseignement et
de lvaluation est faite de manire volutive de faon ce que les apprentissages raliss
un premier moment soient rutiliss lors de lacquisition des apprentissages ultrieurs.
Cette catgorisation des objectifs traduit les proccupations cognitivistes en ducation o
les connaissances se construisent partir des connaissances antrieures. Il sagit aussi
srement dune transition vers des proccupations plus contemporaines, telle que celle de
lacquisition de comptences.

Enfin, aujourdhui, comme nous lavons soulign dans notre introduction, nous sommes
intresss valuer des apprentissages plus complexes, signifiants et le plus possible
authentiques. Les objectifs dapprentissage sont alors nomms comptences. Landry
(1987 : voir legendre, 1993, p. 223) donne la dfinition suivante du terme comptences :
une comptence est une habilet acquise, grce lassimilation de connaissances
pertinentes et lexprience, et qui consiste circonscrire et rsoudre des problmes
spcifiques. Tandis que pour dHainaut (1977) une comptence est un ensemble de
savoirs, savoirs-faire et savoirs-tre qui permettent dexercer convenablement et
efficacement un rle, une fonction, une activit.

Lvaluation de comptences exige beaucoup plus de planification de lvaluation des
apprentissages. Elle exige surtout la mise en pratique dune interprtation absolue en
rfrence des standards de performance. Nous verrons cette notion un peu plus loin
dans ce chapitre la section traitant de linterprtation des rsultats dvaluation.

Au-del de ces diverses formes dobjectifs que nous venons daborder, on a propos des
taxonomies dobjectifs dapprentissage, qui sont des types de classification dobjectifs
trs utiles la planification de lenseignement et de lvaluation. Il en existe dans les
domaines cognitif, affectif et psychomoteur. Ces diverses taxonomies seront dcrites au
prochain chapitre, le chapitre 3.

En ce qui a trait aux objectifs dapprentissage envisags sous langle de comptences, il
ne semble pas vraiment y avoir de taxonomie qui ait t dveloppe spcifiquement, sauf
si on considre comme rfrant taxonomique le continuum novice expert propos dans
la littrature rcente (par exemple, voir Snow et Peterson, 1985, p. 160) ou la conception
de la rsolution de problmes de dHainaut (1985).







valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 20.



2.5 Fonctions et consquences de lvaluation

Avant de porter un jugement quant aux apprentissages dune tudiante ou dun tudiant,
il faut savoir pourquoi on le fait. Ainsi, il faut savoir quelle fonction aura ce jugement.
Mme si la pratique dans le domaine de lvaluation est de sintresser aux fonctions de
lvaluation, certains auteurs prfrent aborder lvaluation sous langle de ses
consquences. Cest Messick qui sest intress cet aspect en premier, dsirant tenir
compte que les consquences de lvaluation des apprentissages dpassent la fonction
quont lui a dvolue dans un contexte particulier. Par exemple, lorsque les rsultats
dvaluation certificative deviennent public, les journalistes peuvent les utiliser, pour ne
pas dire sen emparer, pour comparer les institutions entre elles. Cette utilisation des
rsultats dvaluation aura ventuellement des consquences sur la perception quaura le
public quant la qualit de la formation offerte dans cette institution. Bien sr, cette
utilisation tait non prvue par lenseignant ou linstitution. On voit donc que la notion de
consquences va bien plus loin que celle de fonctions. Nous nous limiterons ici, toutefois,
cette dernire notion, soit celle de fonctions.

Traditionnellement, on retrouve principalement les fonctions suivantes de lvaluation :
sommative ou certificative, formative, diagnostique et de placement ou de classement. La
fonction sommative de lvaluation consiste sanctionner les apprentissages raliss par
une tudiante ou un tudiant. Le terme sommatif provient du fait que ce type dvaluation
consistait additionner (sommer) les rsultats obtenus aux diverses constituantes de
lvaluation. Par exemple, on additionne le nombre de bonnes rponses un examen.
Plusieurs auteurs lui prfrent, raison, lappellation certificative, appellation que nous
adopterons.

valuer ne sert pas uniquement sanctionner. On peut aussi valuer pour donner une
rtroaction une tudiante ou un tudiant sur ses apprentissages. Il sagit alors de la
fonction formative de lvaluation, fonction qua fort bien popularis Grard Scallon
(1988a, 1988b) et qui est largement favorise aujourdhui dans nos systmes ducatifs.
valuer peut aussi tre utilis pour permettre deffectuer un diagnostic sur les
connaissances dclaratives, procdurales et conditionnelles dun tudiant. De cette faon
il est possible de dtecter les sources derreur dans les apprentissages et dajuster
lenseignement en consquence. Cest une fonction importante de lvaluation dont on a
encore peu fait la promotion dans notre systme ducatif. Elle devrait pourtant tre aussi
importante que la fonction formative. Enfin, sans avoir la prtention davoir puis les
diverses fonctions de lvaluation, notons la fonction de placement ou de classement qui
est utilise, par exemple, lors du classement des tudiantes et des tudiants dans des cours
adapts leur niveau de connaissances. Les cours danglais, langue seconde, offerts dans
le rseau collgial qubcois utilisent cette fonction de lvaluation pour leur permettre
de dispenser des cours adapts leur clientle tudiante. Le tableau 2.2 rsume les
informations abordes quant aux fonctions traditionnelles de lvaluation.

valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 21.



Tableau 2.2 Fonctions de lvaluation

Fonction Description
Sommative Vise la certification, la sanction des apprentissages
Formative Vise la rtroaction auprs des tudiantes et des tudiants
Diagnostic Vise le diagnostic de problmes dapprentissage et lajustement de
lenseignement
Classement Vise diriger ltudiante ou ltudiant vers un apprentissage adapt ses
connaissances et comptences



Nous tenons souligner que ces fonctions ne sont pas toujours exclusives, comme le
laisse souvent croire les textes sur le sujet : il y a des zones dintersection entre ces
fonctions. Par exemple, lorsque le professeur donne une rtroaction sur les rsultats
obtenus un examen, il fait jouer un rle secondaire formatif lexamen, mme si ce
dernier conserve sa fonction principale qui est certificative.



2.6 Interprtations des rsultats dvaluation

Les rsultats dvaluation obtenus doivent tre interprts. Aussi simple que cela puisse
paratre prime abord, toutefois, plusieurs choix soffre quant linterprtation de ces
rsultats. Traditionnellement, les auteurs et les praticiens ont distingu deux types
dinterprtation : normative et critrie. Ces deux catgories, selon nous, sont peu
discriminantes et posent des problmes de polysmie srieux. Premirement, le terme
normatif peut facilement tre associ au terme standard ou critre, sens qui nest pas du
tout conforme celui qui est en ralit attribu lvaluation normative. Cest dailleurs
ce que font Bain et Pini (1996, p. 33) lorsquil introduisent la notion de mesure absolue
que nous utiliserons un peu plus loin en remplacement de celle de mesure critrie.
Quand lvaluation interprtation critrie, elle fait face aux multiples usages qui ont
t faits des termes critri et critre au sein mme du domaine de la mesure et de
lvaluation.

En raction ce problme de polysmie qui peut sexpliquer par une terminologie qui
tait fort probablement non approprie, nous suggrons une approche alternative pour
catgoriser les types dinterprtation. Nous ferons aussi le lien avec les types
traditionnellement utiliss. Cette approche est inspire directement par les travaux
effectus en mesure partir de la thorie de la gnralisabilit (Brennan, 1992; Cronbach,
Gleser, Nanda et Rajaratnam, 1972; Shavelson et Webb,1991).

valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 22.

Dans la thorie de la gnralisabilit, deux types derreurs sont reconnues : lerreur
absolue et lerreur relative. Il ny a quun pas pour tendre cette conception
linterprtation de la mesure : absolue et relative. Cest ce que nous faisons ici. En
premier lieu, quest-ce quune interprtation de type absolue? Comme le soulignent
Cardinet et Tourneur (1985, p. 129-130), une mesure est absolue lorsquon dcide de
situer un score par rapport une chelle clairement dfinie a priori. Le fait de fixer le
seuil de passage dans un cours 60 %, par exemple, correspond une interprtation
absolue de ce rsultat dvaluation. Quand on admet une tudiante ou un tudiant dans un
programme dtudes sur la base de ses pralables et de son dossier dadmission,
linterprtation est encore de type absolue.

Linterprtation absolue se divise en deux catgories. La premire est celle o
linterprtation est faite en fonction de la reprsentativit un domaine. Cest ce qui a t
le plus frquemment appel valuation interprtation critrie. Le fait de fixer un seuil
de passage dans un cours 60 % correspond une interprtation en rfrence un
domaine lorsque cela suppose quune tudiante ou un tudiant a russi 60 % des tches
relatives ce domaine. Ce type dinterprtation absolue est srement celle qui est le plus
utilise lintrieur de nos salles de cours. Les approches par comptences, cependant, ne
visent pas seulement la reprsentativit dun domaine de connaissances, mais aussi la
dmonstration de ces comptences. ce moment, lvaluation doit tre en rfrence un
standard de performance. Les rsultats dvaluation doivent alors permettre de sassurer
quune tudiante ou un tudiant peut raliser des tches spcifiques et non pas
uniquement un pourcentage de celles-ci. Cest cette proccupation, sans y parvenir de
faon satisfaisante cependant, qui a motiv la rvision des programmes dtudes
lintrieur du rseau collgial, comme dans plusieurs autres programmes rattachs
dautres ordres denseignement. Il nous reste russir mettre en application cette
proccupation. Cest le dfi qui est pos aux thoriciens et praticiens dans le domaine de
lvaluation des apprentissages au cours des prochaines annes.

En opposition une interprtation absolue des rsultats dvaluation on retrouve
linterprtation relative. Comme le terme le suggre, on sintresse ici la position
relative du rsultat dvaluation par rapport un groupe. On sintresse alors plus au
classement ou au rang des rsultats dvaluation qu leur signification pratique. Cest
dailleurs pourquoi on a attribu la qualification de normative ce type dinterprtation,
soit en rfrence une norme lintrieur dun groupe spcifique. On voit bien ici le
danger de polysmie associ au terme normative et pourquoi nous lui prfrons le terme
relative. Un concours dadmission dans un collge priv o seulement les 400 dossiers les
plus mritants sont retenus correspond une interprtation de type relative. Le mme
type dinterprtation est fait lorsque des athltes saffrontent dans une comption sportive
aux J eux olympiques. Mme si les athltes affichaient tous les rsultats les plus
mdiocres de toute lhistoire des J eux, les trois meilleurs obtiendraient tout de mme les
mdailles dor, dargent et de bronze.

Pour nous permette de mieux comprendre la diffrence qui existe entre une interprtation
relative et une interprtation absolue, prenons un exemple suggr par Laveault et
Grgoire (1997, p. 171), qui, dans leur cas, a t labor pour illustrer plus
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 23.

spcifiquement les concepts derreur absolue et derreur relative de la thorie de la
gnralisablit. Supposons quune personne subisse un examen de certification dans le
but dobtenir son permis de conduire un vhicule automobile. Dans le contexte dune
interprtation absolue, plus spcifiquement en rfrence un standard de performance,
seule la personne qui satisfait aux critres prtablis obtiendra son permis. Toutefois, si
une interprtation relative est considre, seulement les moins mauvais conducteurs
obtiendront leur permis. Selon vous, dans cette situation quelle interprtation est la plus
approprie? Relative ou absolue?

Le tableau 2.3 rsume les explications prcdentes et offre quelques exemples.



Tableau 2.3 Interprtation des rsultats dvaluation

Fonction Description Exemples
Relative Normative En rfrence un groupe
Admission dans un programme contingent
Comptition sportive
Prix dexcellence
Attribution de bourse
Absolue En rfrence un domaine Seuil de russite de 60 % des objectifs dun
cours
En rfrence un standard de
performance
Russite de critres spcifiques
Obtention dun permis de conduire
Admission dans un programme dtudes non
contingent




2.7 Corrections objective et subjective

La correction des rsultats dvaluation peut prendre deux formes. La premire,
favoriser selon nous, est objective. Elle repose sur une dcision qui ne peut tre discute.
Par exemple, les questions choix multiples dun examen sont associes ce type de
correction. Il ne peut y avoir quune seule bonne rponse, moins que la question ait t
mal labore. Les listes de vrification et les chelles descriptives de vrification que
nous verrons dans un chapitre ultrieur sont aussi correction objective.

La correction est subjective quand elle repose sur une apprciation de la part du
correcteur. Les chelles dapprciation utilises pour valuer des travaux longs, des
prsentations orales en classe ou des stages en milieu de pratique sont de ce type. Selon
nous, il est prfrable dviter la correction subjective. Elle porte controverse et rend
difficile la transparence de la communication des rsultats dvaluation. Dans certains
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 24.

cas, si cest impossible, il faut se demander si les objectifs dvaluation sont en ralit
appropris. Par exemple, on value frquemment la participation aux travaux en quipe.
Pourtant il est peu frquent que cette participation soit prsente dans les objectifs
dapprentissage associs aux cours. Si on ne dsire pas en tenir compte pour valuer
ladmissibilit du travail de ltudiante ou de ltudiant ou encore lui donner une pnalit,
il est prfrable de ne pas valuer la participation lquipe.


2.8 Modalits dvaluation

Les modalits dvaluation des apprentissages correspondent aux diverses formes que
peut prendre lvaluation de ces derniers. Les modalits comprennent tout autant loutil
utilis pour valuer que la nature de la trace qui prouve, avec le moins de doutes possible,
que le comportement ou la rponse de ltudiante ou de ltudiant a bien eu lieu. Ces
diverses formes peuvent alors tre examines de diffrentes faons.

Ainsi, on peut les regarder sous langle de la trace qui est laisse. Sera-t-elle matrielle ou
par tmoin? On peut considrer les modalits selon le type de rponse : choisie ou
construite. Par exemple, la rponse est choisie lorsque ltudiante ou ltudiant rpond
une question choix multiples, tandis quelle est construite lorsquil rdige un rapprt de
laboratoire.

Enfin, les modalits correspondent aussi aux instruments traditionnellement rpertoris
en ducation : examen, production, performance, port folio, activits intgratrices,
examen synthse de programme, etc.

Les modalits dvaluation des apprentissages seront couvertes en dtail lintrieur des
prochains chapitres. Leur nature sera aborde ainsi que les principes de leur laboration.



2.9 Critres de qualit : fidlit, validit et biais

Quelle crdibilit peut-on donner aux interprtations issues de lvaluation des
apprentissages? Pour rpondre cette question, il faut, au dpart, tablir ce que nous
entendons par celle-ci. En fait, partir de quels critres allons nous tablir cette
crdibilit? Ce qui nous amne directement dfinir des critres de qualit.

Le premier de ces critres est la prcision du rsultat dvaluation obtenu. Est-ce que ce
rsultat sera le mme lorsquune autre personne rptera lvaluation de la mme
tudiante ou du mme tudiant? Est-ce que le mme rsultat sera obtenu si le mme
professeur rpte la mme valuation avec le mme instrument ou avec un instrument
quil juge quivalent? Si la rponse une de ces questions est ngative, le rsultat
dvaluation ne satisfait pas au critre de prcision. On voit ici pourquoi lutilisation de la
correction objective plutt que la correction subjective est privilgie : la correction
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 25.

objective offre plus de potentiel dobjectivit. Dans le language des spcialistes de la
mesure, on utilise le terme fidlit la place du terme prcision.

Le rsultat dune valuation peut tre trs prcis, mais sil ne mesure pas ce quil doit
mesurer il est peu utile. Cest ce quon appelle la validit dune mesure. Par exemple, un
examen de mathmatiques portant sur les drives qui prsente des problmes dans un
language difficile comprendre par une tudiante ou un tudiant moyen risque dtre peu
valide pour mesurer la comptence dans la manipulation des concepts relatifs aux
drives. Cet examen risque de mesurer beaucoup plus les comptences linguistiques que
mathmatiques.

Dans certains cas les rsultats dvaluation peuvent tre affects par certaines
caractristiques propres une tudiant ou un tudiant. Par exemple, il peut plagier le
travail effectu par une autre tudiante ou un autre tudiant quelques annes auparavant.
Les rsultats dvaluation peuvent tre aussi affects par des caractristiques du
professeur qui value le travail ralis par ltudiante ou ltudiant. Cest le cas
lorsquune prsentation orale est value selon une correction subjective partir dune
grille dapprciation. ce moment, il nest pas du tout certain que lapprciation de ce
professeur sera la mme que celle dun autre professeur : il peut y avoir de la variabilit
dans la svrit des correcteurs. Enfin, le rsultat dvaluation peut tre affect par les
caractristiques des questions ou des critres utiliss. Un exemple de cette situation
correspondrait au cas dun tudiant en provenance dun autre pays qui on administrerait
un examen de philosophie o certaines questions seraient rattaches des valeurs propres
notre culture. ce moment, ltudiant risquerait dtre dsavantag par ces questions.

Les trois situations que nous venons de prsenter correspondent respectivement des
problmes de biais de personnes (ltudiant), dvaluateur (la svrit du professeur) et
ditem (les questions dexamen).

Un chapitre complet sera consacr plus loin ces divers critres de qualit.


2.10 Critre et standard

La notion de critre suscite beaucoup de confusion dans le domaine de lvaluation en
gnral. Nous lavons dailleurs not plus haut lorsque nous avons trait de
linterprtation des rsultats dvaluation, principalement de lvaluation absolue. Aussi
trange que cela puisse paratre, nous ne croyons pas que, dans la situation o nous nous
retrouvons, il soit utile dadopter une dfinition univoque du terme critre. Nous croyons
plus utile de prsenter diverses dfinitions en usage par les chercheurs et praticiens en
valuation.

Une premire dfinition dun critre correspond une valeur atteindre, fixe au dpart,
ou un comportement prcis atteindre, lui aussi fix au dpart. Cest ce que les auteurs
voulaient signifier au dpart par interprtation critrie. On se retrouve alors dans un
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 26.

contexte dvaluation interprtation absolue. La valeur ou le comportement atteindre
sont frquemmnent appels des standards. Dans la redfinition des programmes
lintrieur du rseau collgial, suite la rforme de 1993, cest dailleurs le sens donn au
terme standard.

Une seconde dfinition du terme critre correspond lobjectif dapprentissage dont on
dsire valuer lacquisition ou latteinte. Par exemple, dans la production dune uvre
dart, la crativit et la rigueur seraient considres comme des critres dvaluation.
Cest ce que plusieurs appellent une valuation critrie. Cette dfinition nest pas du tout
en concordance avec la prcdente. Dailleurs, selon nous, elle a quelque peu discrdit
lutilisation du terme critre en valuation. Elle a sem la confusion, faisant fi du fait que
pour valuer on utilise toujours des critres, au sens de la dfinition donne dans ce
paragraphe. Alors, logiquement, pourquoi parler dune valuation critrie si toutes les
formes dvaluation sont critries de toute faon.


2.11 Conclusion

Lvaluation des apprentissages est un domaine actuellement en volution, sinon en
bullition. Nous navons abord que quelques aspects de celle-ci dans ce chapitre dans le
dessein de nous permettre dadopter un language commun et de partager certaines
valeurs. partir du prochain chapitre, le chapitre 3, le souci de mettre en application les
sujets qui seront couverts deviendra de plus en plus clair.


2.12 Pistes de recherche

Comme nous lavons soulign la section 2.3, ltude de lhistoire de lvaluation des
apprentissages devient maintenant imprieuse pour que nous puissions nous situer quant
son dveloppement pass et nous permettre ainsi de tracer des parcelles de son
dveloppement futur.

Un autre aspect dvelopper consisterait mettre de lordre dans la terminologie utilise
en valuation des apprentissages. Certains termes datent et sont alors plus ou moins
appropris au contexte actuel. Dautres sont encore dactualit et gagneraient tre
mieux connus des intervenants en valuation. cette fin, un travail similaire celui de
Legendre dans son dictionnaire en ducation pourrait mener ventuellement un
dictionnaire en valuation des apprentissages.

Plusieurs autres aspects seraient tudier. Ils seront plus spcifiquement abords aux
chapitres subsquents.


2.13 Exercices et questions

valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 27.



2.14 Lectures complmentaires

Angoff, W. H. (1989). Validity: an evolving concept. Dans H. Wainer et H. I. Braun
(ds) : Test validity. Hillsdale, NJ : Lawrence Erlbaum Associates.

Bain, D. et Pini, G. (1996). Pour valuer vos valuations. La gnralisabilit : mode
demploi. Genve, SUISSE : Centre de recherches psychopdagogiques.

Brennan, R. L. (1992). Elements of generalizability theory. Iowa City, IOWA : American
College Testing.

Cardinet, J . et Tourneur, Y. (1985). Assurer la mesure. Berne, SUISSE : Peter Lang.

Cronbach, L. J ., Gleser, G. C., Nanda, H. et Rajaratnam, N. (1972). The dependability of
behavioral measurements : theory of generalizability of scores and profiles. New York,
NJ : Wiley.

dHainaut, L. (1985). Des fins aux objectifs de lducation : des conceptions des
apprenants aux concepts scientifiques. Neufchtel : Delachaux et Niesl.

Laveault, D. et Grgoire, J . (1997). Introduction aux thories des tests en sciences
humaines. Paris, FRANCE : de Boeck.

Legendre, R. (1993). Dictionnaire actuel de lducation. Montral, QUBEC : Gurin, 2
e

dition.

Linn, R. L. et Gronlund, N. E. (1995). Measurement and assessment in teaching. Upper
Saddle River, NJ : Prentice-Hall.

Messick, S. G. (1989a). The once and future issues of validity assessing the meaning and
consequences of measurement. Dans H. Wainer et H. I. Braun (ds) : Test validity.
Hillsdale, NJ : Lawrence Erlbaum Associates.

Messick, S. G. (1989b). Validity. Dans R. L. Linn (Ed.) : Educational measurement.
London, ENGLAND : Macmillan.

Morissette, D. (1984). La mesure et lvaluation en enseignement. Sainte-Foy,
QUBEC : Presses de lUniversit Laval.

Scallon, G. (1988a). Lvaluation formative des apprentissages. Tome 1 : la rflexion.
Sainte-Foy, QUBEC : Presses de lUniversit Laval.

valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 28.

Scallon, G. (1988b). Lvaluation formative des apprentissages. Tome 2 :
linstrumentation. Sainte-Foy, QUBEC : Presses de lUniversit Laval.

Shavelson, R. J . et Webb, N. M. (1991). Generalizability theory : a primer. Newbury
Park, CA : Sage.

Snow, R. E. et Peterson, P. L. (1985). Cognitive analyses of tests: implications for
redesign. Dans S. E. Embretson (d.) : Test design. Developments in psychology and
psychometrics. Orlando, FLORIDA : Academic Press.

Traub, R. E. (1997). Classical test theory in historical perspective. Educational
Measurement : Issues and Practice, 16, 8-14.

Ward, A. W., Howard, W. S. et Murray-Ward, M. (1996). Educational measurement :
Origines, theories and explications. Vol. 1. University Press of America.

Webber, C. (1989). The mandarin mentality : civil service and university admissions
testing in Europia and Asia. Dans B. R. Gifford (d.): Test policy and the politics of
opportunity allocation - The workplace and the law. Boston : Kluwer.
valuation des comptences
lenseignement suprieur (ch. 02)



Gilles Rache 29.






DIM ENSION S DE L'VALUATION DES APPRENTISSAGES
DFIN ITION DE L'VALUATION
HISTOIRE
OBJET D'VALUATION
FONCTION DE L'VALUATION
OBJECTIVE
SUBJECTIVE
INTERPRTATION DES RSULTATS
CORRECTION
M ODALITS
CRITERES DE QUALIT
PRCISION
VALIDIT
BIAIS
CRITERES ET STANDARDS
dbutent par une
contextualise par une
ces dim ensions consistent en un
qui se m anifeste par des
qui ncessitent une
selon la
ou
qui est
soutenue par une
dont les
assurent
des

Vous aimerez peut-être aussi