Vous êtes sur la page 1sur 14

REPERES - IREM.

N 48 - juillet 2002

MOYENNE,
MEDIANE,
ECART-TYPE
Quelques regards sur lhistoire
pour clairer lenseignement
des statistiques
Anne BOY
Marie-Cline COMAIRAS
Irem des Pays de la Loire

Introduction
Si lon mesure limportance dun enseignement au nombre de pages quil occupe
dans les programmes et commentaires, les statistiques occupent une place de choix dans ceux
qui se mettent en place dans nos lyces, trop
envahissante, penseront certains. Mais en
examinant les choses avec un peu de recul, il
apparat que cette importance est relativiser. Ce nest sans doute pas lapparition des
statistiques dans les programmes qui va bouleverser lenseignement des mathmatiques
dans nos collges et lyces, mais peut-tre
plutt la sollicitation quotidienne lusage des
outils informatiques, dans tous les domaines,
et pas seulement dans celui qui nous proccupe ici.
Ces questions, essentielles, ne seront pas
lobjet de nos rflexions. Cependant, tout ce

qui entoure lintroduction des statistiques


contribue faire merger des questions de fond :
lenseignement des statistiques est-il vraiment laffaire des mathmaticiens ? Si cest
le cas, sest-on suffisamment pench sur les
difficults des lves apprhender ces nouveaux concepts ? Comment passer des statistiques au modle mathmatique, cest--dire
quels sont les liens entre statistiques et probabilits ?
Nous avons pens que lhistoire, une fois
de plus, pouvait apporter quelques rponses
et permettre dapprofondir la rflexion. Nous
avons fait le choix, ici, de nous pencher sur lhistoire de quelques mots : quand, pourquoi et
comment les mathmaticiens ont t amens privilgier certains paramtres comme
moyenne, mdiane, cart-type ; ces choix

27

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

furent-ils vraiment justifis par les mathmatiques ? Lhistoire donne du sens, permet
de comprendre certains obstacles, et de ne pas
se contenter dapprendre bien utiliser des
formules.
Lhistoire des mots mathmatiques est
souvent clairante, elle lest trs particulirement dans le domaine des statistiques.
Elle permettra de mettre en lumire quil
nest pas tout fait quivalent dvaluer statistiquement la distance entre deux toiles,
qui fera intervenir un certain nombre de
mesures dune mme grandeur, ou de vouloir connatre la taille moyenne dun enfant
de quatre ans, qui fait intervenir des donnes sur plusieurs individus. Le premier problme a fait natre la thorie des erreurs,
qui fut un moteur essentiel dans le dveloppement des statistiques.
Nous avons choisi de rester dans le cadre
des programmes de lyce, et nous aborderons trs peu lhistoire des lois, elles seront
cependant voques, puisque ce sont les lois
des erreurs qui ont fait merger les mots que
nous utilisons.
Aprs avoir rappel les dfinitions
actuelles et officielles des diffrentes
notions voques (et nous verrons que ce nest
pas toujours limpide), nous montrerons
pourquoi la moyenne, la mdiane et lcarttype ont sans doute t privilgis pour
rsumer une srie statistique.

Les dfinitions :
Voici quelques dfinitions des mots que
nous avons retenus, trouves au fil de manuels,
ou dans les programmes et commentaires
officiels 1 .

28

Mode : Ce mot nest dfini ni dans les programmes de seconde, ni dans les commentaires
Il semble que lon attache peu dimportance
ce paramtre, en dpit, ou cause de sa simplicit, et qui, pour cela, est un des plus
anciens. On peut trouver cependant des dfinitions dans les manuels, comme, par exemple,
celles qui suivent :
Le mode, pour un caractre discret, not
M0 , est la valeur qui correspond au plus grand
effectif.
(Fractale 2, 2000, Bordas)
On appelle mode toute valeur du caractre
dont la frquence est la plus grande. Une population na pas toujours un mode unique.
(Point math 2, 2000, Hatier).
Moyenne arithmtique : ce mot nest pas non
plus prcis dans les programmes et commentaires. Il peut sembler bien sr quil va
de soi. Lhistoire nous apprendra quil nest ni
si vident, ni si simple. La difficult provient
essentiellement de lusage qui en sera fait. Cest
videmment le problme essentiel. Notons
cependant quil nest plus fait mention dans
nos classes dune certaine sorte de moyenne,
le midrange , moyenne arithmtique des
valeurs extrmes, alors mme que cest elle
qui vient souvent le plus naturellement
lesprit de nos lves.
La moyenne arithmtique pondre, note
x , est dfinie par :

x=

n1 x1 + n2 x2 + n3 x3 + ... + nk xk ,
n

1 Sauf mentions contraires, les textes officiels auxquels nous


nous rfrerons sont les programmes applicables en seconde la rentre 2000, en premires S et ES la rentre
2001, et en terminales S et ES la rentre 2002, ainsi que
les commentaires de ces programmes. Ces textes sont disponibles sur le site eduscol, et celui du cndp.

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

ce qui scrit :

x=

i=k

1
ni xi
n i =1

(Fractale 2, 2000, Bordas)


La moyenne arithmtique dune srie statistique, dans une population de N individus, est le nombre rel quotient de la somme
des N valeurs observes du caractre par le
nombre dindividus de la population.
Si on note x1 , x2 , x3 , , xN les valeurs observes du caractre pour les N individus de la
srie, la moyenne arithmtique de la srie est
le nombre not X dfini par lgalit :

X=

x1 + x2 + x3 + ... + x N
N

(Point math 2, 2000, Hatier)


Les termes suivants sont dfinis dans
les commentaires des programmes. Il semble
que lon veuille les prciser, mme si la difficult de lentreprise apparat assez vite, en ce
qui concerne la mdiane. Le sens de certains
termes peut tre modul lgrement, pour
marquer de faon appuye la diffrence entre
le contexte probabiliste, celui du modle
mathmatique, et le contexte statistique,
celui de lexprience.
Nous trouverons ainsi la dfinition de
la mdiane empirique, de la variance empirique Peut-tre, paradoxalement, voulant rapprocher les mathmatiques du rel,
sommes nous en train dassister llaboration dune statistique scolaire , comme
ce fut le cas pour dautres domaines des
mathmatiques. Nous ne discuterons pas ici
du bien fond de cette volution, mais cela
nous conforte dans notre entreprise dclairer lenseignement par lhistoire, ses ttonnements, ses incertitudes.

Mdiane : ce paramtre nest pas des plus


simples, et lambigut des commentaires son
sujet souligne cette difficult. Son apparition
plus tardive et lusage ou le non usage qui en
auront t faits au XIXme sicle, comme
nous le verrons dans la suite, offrent un intrt trs particulier pour le pdagogue, donc
pour llve.
Mdiane (empirique) : on ordonne la srie
des observations par ordre croissant ; si la
srie est de taille 2n + 1, la mdiane est la
valeur du terme de rang n + 1 dans cette srie
ordonne ; si la srie est de taille 2n, la
mdiane est la demi-somme des valeurs des
termes de rang n et n + 1 dans cette srie ordonne.
La dfinition de la mdiane nest pas fige :
certains logiciels et certains ouvrages dfinissent la mdiane comme tant le deuxime quartile ou le cinquime dcile ; dans la
pratique de la statistique, les diffrences
entre ces deux dfinitions sont sans importance. Au lyce, on vitera tout dveloppement
ce sujet qui ne serait pas une rponse individuelle une question dun lve.
(Commentaires des programmes de premires).
Chacun apprciera la dernire partie de
ce commentaire.
Pour illustrer les difficults devant lesquelles se trouveront coup sr les enseignants,
voici quelques extraits (cf. encadr de la page
suivante) du livre de la collection Dimathme 1S 2 . Donnant lexemple dun calcul avec
tableur, les auteurs font remarquer que la valeur
obtenue pour la mdiane est le deuxime
quartile (la dfinition officielle des quar-

2 Mathmatiques, 1S, collection Dimathme, 2001, Didier

29

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Mdiane :
Dfinition : on appelle mdiane dune srie
statistique tout nombre m tel que
Au moins la moiti des valeurs du caractre sont infrieures ou gales m
Au moins la moiti des valeurs du caractre sont suprieures ou gales m
Exemple et convention de calcul :
Pour calculer la mdiane dune srie de n
valeurs, on range ces n valeurs dans lordre
croissant. Quand n est impair, la valeur
centrale est la mdiane. Quand il est pair,
tout nombre compris entre les deux valeurs
centrales est une mdiane. La convention
est de prendre la demi-somme des deux
valeurs centrales 3.
Remarque
Les calculatrices et les ordinateurs nutilisent pas forcment les conventions de calcul
faites dans le cours, et peuvent donc donner
des rsultats lgrement diffrents.

tiles est donne ci-dessous), et proposent de


comparer cette valeur celle que la dfinition
du cours aurait donne.

Troisime quartile (empirique) : cest le plus


petit lment q des valeurs des termes de la
srie, tel quau moins 75% des donnes soient
infrieures ou gales q.
(Commentaires des programmes de premires.)
La dfinition du deuxime quartile napparat pas dans le lexique des commentaires.
Variance, cart-type : lhistoire de ces mots
est presque lhistoire des statistiques mathmatiques, et ils sont de ceux que lon comprend
difficilement si lon mconnat les liens essentiels entre statistiques mathmatiques et
thorie des erreurs.
Variance empirique : moyenne des carrs des
carts la moyenne ; cest aussi la diffrence
entre la moyenne des carrs et le carr
de la moyenne .
(Commentaires des programmes de premires.)
Nous trouverons dans le mme lexique la
dfinition de la variance dune loi de probabilit, donc non empirique.
Ecart type : racine carre de la variance ; lunit
de lcart- type est celle des donnes.

Cest un des seuls manuels parmi ceux que


nous avons parcourus qui pointe bien le problme.

Les rdacteurs de ces commentaires ont


ajout, avec pertinence, cette remarque dunit.
Il est en effet trs courant de calculer ces
paramtres, de faon mcanique, en oubliant
rapidement le sens que lon peut leur donner.

Premier quartile (empirique) : cest le plus


petit lment q des valeurs des termes de la
srie, tel quau moins 25% des donnes soient
infrieures ou gales q.

Donner un peu de sens, cest lobjet de


notre rflexion. Lhistoire, ainsi que nous
lavons annonc, va nous aider dans cette
entreprise.

3 Cest nous qui soulignons.

30

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Moyenne, mdiane, cart-type


A lorigine on trouve lastronomie. Plaons-nous au milieu du XVIIIme sicle ; cette
poque Copernic, Kepler et surtout Newton
en ont fait une science taye par une thorie mathmatique. Mais le travail de lastronome sappuie sur des mesures et si celles-ci
sont entaches derreurs, mme si la thorie
est bonne, le rsultat ne sera pas bon : ainsi
Clairaut et Lalande se trompent dun mois sur
la prvision du passage au prihlie de la
comte de Halley en 1759. Or les enjeux de
lastronomie dpassent largement le fait de prvoir le passage de telle ou telle comte ; ce sont
des enjeux la fois scientifiques, politiques
et commerciaux : meilleure connaissance des
toiles et des plantes mais aussi meilleure
connaissance de la Terre (dresser des cartes
prcises, permettre aux marins en mer de
calculer correctement les longitudes, etc.).
Do viennent ces erreurs ? Il y a bien sr des
erreurs humaines mais aussi des erreurs provenant des instruments de mesure eux-mmes.
Or malgr lamlioration de ceux-ci, et donc
la prcision accrue des mesures, des erreurs
subsistent.
Les scientifiques vont donc tre amens
sintresser aux erreurs. Il faut trouver des
moyens de combiner de nombreuses mesures
dun mme phnomne qui rduisent le plus
possible lerreur finale sur la vraie valeur du
phnomne. Citons larticle Milieu du Supplment lEncyclopdie de Diderot, rdig par
Jean III Bernoulli vers 1770 :
Quand on a fait plusieurs observations
dun mme phnomne, et que les rsultats
ne sont pas tout fait daccord entreux,
on est sr que ces observations sont toutes,
ou au moins en partie peu exactes, de
quelque source que lerreur puisse prove-

nir ; on a coutume de prendre le milieu


entre tous les rsultats, parce que de cette
manire les diffrentes erreurs se rpartissant galement dans toutes les observations, lerreur qui peut se trouver dans
le rsultat moyen devient aussi moyenne
entre toutes les erreurs. Il nest pas douteux que cette pratique ne soit trs utile pour
dterminer lincertitude qui nat de limperfection des instruments et des erreurs
invitables des observations ; mais il est
ais de sapercevoir quelle ne la diminue
pas autant quon le dsirerait, et quelle est
susceptible plus dun gard dtre perfectionne, parce quen prenant simplement le milieu arithmtique, on ne tient
pas compte du plus ou moins de probabilit
de lexactitude des observations, des diffrents degrs dhabilet des observateurs,
etc. Diffrents grands gomtres ont entrepris cette utile recherche, ils lont considre
sous diffrents points de vue, et lont traite plus ou moins en dtail ; il est fort
souhaiter que les astronomes, les physiciens
et gnralement tous les observateurs profitent des rsultats de ces recherches dans
la discussion de leurs observations.
Nous attirons lattention du lecteur sur
le mot milieu utilis par J.Bernoulli : il ne
dit pas moyenne , ni mdiane , cest-dire quil ne donne pas a priori de forme
mathmatique ce milieu ; il pose le problme de la recherche dune valeur optimale,
appele milieu , et commence y apporter
un dbut de rponse en signalant quil faut tenir
compte du plus ou moins de probabilit de
lexactitude des observations .
On va donc chercher un modle pour la
distribution des erreurs qui devra tenir compte des contraintes naturelles suivantes
signales par Galile :

31

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Les observations sont distribues de faon


symtrique autour de la vraie valeur ; cest
dire, les erreurs sont distribues de faon
symtrique autour de zro.
Les petites erreurs arrivent plus frquemment
que les grandes erreurs.
Ceci sera exprim par Gauss sous la forme
suivante dans Mthode des moindres carrs
(1821) :
[] Les erreurs qui, dans des observations de mme espce, proviennent dune
cause simple et dtermine se trouvent renfermes entre certaines limites [].
Dsignons par F(x) la facilit relative dune
erreur x : on doit entendre par l, cause
de la continuit des erreurs, que F(x)dx est
la probabilit que lerreur soit comprise
entre les limites x et x + dx. Il nest pas possible, en gnral, dassigner la forme de la
fonction F, et lon peut mme affirmer que
cette fonction ne sera jamais connue dans la
pratique. On peut nanmoins tablir plusieurs
caractres gnraux quelle doit ncessairement prsenter : [] elle sannule pour toutes
les valeurs de x non comprises entre les
valeurs extrmes. Pour toute valeur comprise entre ces limites, la fonction est positive. [] dans la plupart des cas, les erreurs
gales et de signes contraires seront galement probables []. Enfin, comme les petites
erreurs sont plus facilement commises que
les grandes, F(x) sera en gnral maximum
pour x = 0 et diminuera sans cesse lorsque
x crotra.
Plusieurs modles ont t envisags.
Citons quelques exemples. Daniel Bernoulli
en a propos trois : en arc de cercle, dellipse
ou de parabole ; Laplace propose deux modles
de courbes derreurs (en 1774 et 1777) : une

32

en e

k x

sur ] ; + [ (cest la premire loi

des erreurs de Laplace) et lautre en log

a
sur
x

] a ; + a [ ; Lagrange envisage une distribution


cosinusodale.
Effectivement, si lon cherche dans le
catalogue des courbes connues, il savre
quun arc de cercle, dellipse, ou de parabole,
une courbe dquation

y = log

y = e k x , ou

a
(voir leur reprsentation schx

matique dans lencadr ci-contre) ont toutes


les caractristiques demandes par Gauss.
Le problme du choix du milieu optimal est donc, aux environs de 1770, li deux
autres problmes : choix dun modle de distribution des erreurs et estimation de la
vraie valeur.
Le meilleur milieu est celui qui minimise les erreurs. Or si on minimise la somme
des carts (entre la valeur mesure et la
vraie valeur) on obtient la mdiane (dans
le modle de Laplace en exponentielle le
milieu est la mdiane) ; et si on minimise
la somme des carrs de ces mmes carts on
obtient la moyenne 4 . Do deux raisons de
choisir cette dernire solution : dune part il
est plus facile 5 de calculer la somme des carrs que la somme des valeurs absolues et
dautre part on retombe sur la moyenne arithmtique utilise de faon empirique depuis des
annes.
4 voir les commentaires dans la partie statistique des programmes de 1re S et 1re ES.
5 il tait plus facile lpoque de calculer la somme des carrs que la somme des valeurs absolues mais ceci est remis
en question actuellement par lusage des ordinateurs.

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

distribution semi-circulaire

distribution semi-elliptique

distribution parabolique

distribution en e

k x

distribution en log

a
x

33

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Citons Legendre (Nouvelles mthodes


pour la dtermination des orbites des comtes,
1805) :
De tous les principes que lon peut proposer pour cet objet, je pense quil nen est pas
de plus gnral, de plus exact, ni dune
application plus facile que celui dont nous
avons fait usage dans les recherches prcdentes, et qui consiste rendre minimum la
somme des carrs des erreurs. Par ce moyen,
il stablit entre les erreurs une sorte dquilibre qui empchant les extrmes de prvaloir, est trs propre faire connotre ltat
du systme le plus proche de la vrit.
La rgle par laquelle on prend le milieu
entre les rsultats de diffrentes observations, nest quune consquence trs simple
de notre mthode gnrale, que nous appellerons mthode des moindres carrs.

Cest ainsi que va simposer la loi de


Gauss (ou loi de Laplace-Gauss) comme tant
la loi de distribution des erreurs : Gauss
prend pour hypothse que [] si une quantit a t dtermine par plusieurs observations
directes, faites dans les mmes circonstances
et avec le mme soin, la moyenne arithmtique des valeurs observes donne la valeur la
plus probable, si ce nest exactement du moins
approximativement, si bien quil est toujours
plus sr dy recourir et obtient ainsi la loi
des erreurs ( x ) =

1
e
h

x2
h2

34

Citons pour terminer une boutade, au


sujet de la loi de Gauss, rapporte par Poincar :
Tout le monde y croit cependant, me
disait un jour M.Lippmann, car les exprimentateurs simaginent que cest un thorme
de mathmatique, et les mathmaticiens
que cest un fait exprimental .
Aprs ce petit aperu des problmatiques
qui ont prsid lmergence des thories en
statistiques, nous sommes mme de resituer
et comprendre lorigine et lhistoire des mots
que nous avons dfinis au dbut, ce qui terminera ce petit tour dhorizon des statistiques
dans les programmes scolaires.

o h est un

coefficient proportionnel un nombre m, que


Gauss appelle lerreur moyenne craindre 6 et
qui nest aujourdhui rien dautre que lcarttype.
6 voir tableau pages suivantes.

Finalement tout se tient : la moyenne


est lorigine de la loi de Gauss et elle trouve sa justification dans la mthode des moindres
carrs ! Quant la variance, elle est directement lie la moyenne, aux moindres carrs
et la loi de Gauss puisque cest la moyenne
des carrs des carts la moyenne et que sa
racine carre, lcart-type, intervient dans le
coefficient h de la loi de Gauss cite plus
haut. Mais, comme on la vu, on aurait trs
bien pu construire une thorie des erreurs liant
la mdiane, les moindres valeurs absolues
et une autre loi de distribution des erreurs,
par exemple celle de Laplace ; Gauss insiste
effectivement sur larbitraire des choix faits :
on pourra le constater de manire vidente dans
le texte mis en annexe.

Repres historiques sur les mots


moyenne, mdiane, cart-type
Nous vous proposons ici un essai de
tableau rcapitulatif. Lentreprise est videmment difficile et hasardeuse pour plu-

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

moyenne

La coutume de prendre le milieu voque par J. Bernoulli vers 1770 est


alors assez rcente.
Contexte de la thorie des erreurs :
Tycho Brah(1546-1601) a recours la moyenne arithmtique pour
liminer des erreurs dobservation.
1722 Roger Cotes (Harmonia mensurarum) propose dutiliser une
moyenne pondre.
1756 Thomas Simpson (Philosophical Transactions) est le premier
dfendre lusage de la moyenne arithmtique dans le cas de n mesures
dune mme grandeur.
Apparition des Statistiques morales :
1846 Qutelet fait la diffrence entre
la moyenne , moyenne objective des mesures dun objet unique.
(traduit par Hershell par le mot anglais mean ) (exemple : la mesure
de la distance entre deux toiles)
et la moyenne arithmtique , moyenne subjective, concernant
les mesures de plusieurs individus dune population si possible homogne (traduit par Hershell par le mot anglais average ) (exemple : la taille
moyenne dun enfant de quatre ans).
1874, William Stanley Jevons introduira lusage de la moyenne gomtrique et de la moyenne harmonique.

mdiane

Le terme mdiane est introduit par Cournot en 1843.(Exposition de la thorie des chances et des probabilits).
Laplace parlait de milieu de probabilit .
1757 Roger Joseph Boscovitch est un des premiers souligner lintrt de
cette valeur centrale.
1885 Galton, dans le cadre des statistiques morales , propose de substituer lusage de la mdiane celui de la moyenne, susceptible de trop grande variabilit.

variance,
cart-type

Cette notion apparat avec la thorie des moindres carrs.


Gauss a choisi de privilgier, pour mesurer les erreurs, la moyenne des carrs des carts la moyenne, quil note m 2.
Il appelle le nombre m, lerreur moyenne craindre, soulignant quil
ne faut pas confondre m avec la moyenne arithmtique des erreurs.
1893, Karl Pearson nommera ce nombre standard deviation , et le notera .

carts entre
les quartiles

Introduit par Qutelet en 1846


Repris par Galton en 1875. 7

7 Cf. annexe 2.

35

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

sieurs raisons. Il est toujours dlicat, voire impossible dtablir avec certitude lapparition dun
mot, qui nest souvent que laboutissement dune
longue recherche sur un problme. En particulier le vocabulaire des statistiques a t
unifi et standardis relativement tard. En France, par exemple, les connaissances accumules par lcole anglaise de statistiques ne
seront pas vraiment diffuses avant les annes
1925-1930.
Le premier mot, peut-tre, quil faudrait
tudier serait justement celui de statistiques . Mais il peut recouvrir tellement de
sens diffrents que nous avons choisi de lviter.
Les proccupations diffrent assez largement entre ce que certains appelrent les
statistiques administratives, la thorie des
erreurs, que lon peut considrer comme la source des statistiques mathmatiques et les statistiques morales de Qutelet, que lon peut
considrer comme point de dpart des statistiques infrentielles .
Lobjet de la thorie des erreurs est dvaluer la vraie valeur dune grandeur
laquelle on sintresse. Lobjet des statistiques morales est de donner une valeur fictive, thorique, qui pourrait tre le rfrent
unique, partir des mesures de plusieurs
objets ou individus diffrents.
Ces diffrences ont des retentissements
profonds dans lhistoire des mots.

notre recul nest pas suffisant pour proposer


des applications vraiment testes en classe.
Cependant il nous semble important de mettre
en vidence les deux notions que recouvre la
moyenne : moyenne objective et moyenne
subjective.
Pour les lves, leur entre en seconde,
la notion de moyenne est souvent rattache
la moyenne des notes, des tailles Cest-dire, plutt la moyenne subjective des statistiques morales, celle laquelle il semble le
plus difficile de donner du sens, donc la plus
difficile apprhender.
Lon devrait dabord sattacher la moyenne objective , dans le contexte du calcul
derreurs ; dans ce cadre le calcul de la moyenne se situe dans une problmatique naturelle : dterminer la vraie valeur dune distance ou de tout autre chose.
Il peut tre tout fait intressant, par
exemple, de proposer aux lves de mesurer la longueur de la salle de classe, en utilisant divers types de mtres (de couturire, en bois articul, ruban, ) : ils
trouveront srement des valeurs assez diffrentes (nous lavons expriment !) ; il
semblera alors assez naturel de les amener
valuer les erreurs, de leur demander si
la moyenne arithmtique des mesures est
la valeur quils retiendraient comme la plus
proche de la vrit . Certains discuteront
peut-tre de la plus ou moins grande confiance apporter certaines mesures, se rapprochant ainsi de la facilit relative dune
erreur introduite par Gauss.

En guise de conclusion
Nous en sommes au dbut de nos rflexions,
et les nouveaux programmes viennent tout juste
datteindre les classes de premire ; aussi,

36

Nous insistons encore sur le fait que ceci


na pas encore t mis en pratique avec nos
lves, et que ce ne sont que des pistes issues
de notre tude historique.

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Il est par ailleurs possible de rapporter cela


des expriences de mesures en physique
ou en SVT.
Dans un deuxime temps, on reviendra
la moyenne subjective, la moyenne des notes
par exemple ; et peut-tre apparatra-t-il que
si les calculs sont les mmes, la problmatique
est totalement diffrente : recherche-t-on une
vraie note, une vraie taille ? Nest-ce pas
plutt une rfrence pratique (et peut-tre
contestable) ? Dans ce genre denqute, la
mdiane naurait-elle pas plus de sens ? Et
dans le cas dune enqute sur les salaires ?
Cette fois, cest peut-tre lconomie,
la gographie qui pourront servir de point
dappui.
En premire, la recherche de la variance (puis de lcart-type) prendra aussi du
sens, dans le cas du calcul derreurs. Comment
savoir si la moyenne dune srie de mesures
est la meilleure approximation de la vraie
valeur ?
Les lves penseront peut-tre dabord
utiliser la moyenne des carts la vraie
valeur . Il nest pas interdit de leur faire lire
quelques textes de Gauss ou Legendre, parmi
ceux que nous avons cits, pour quils comprennent quil y avait un choix faire, et que
ce choix fut fait de faon plus ou moins arbitraire. Que le problme est que ce choix doit
tre fait alors que justement on ne connat pas

la vraie valeur. Ils auront peut-tre alors


envie de faire des calculs de minimum pour
dcouvrir o se trouve la valeur qui minimise les erreurs.
Voil qui sans doute donnera un peu de
sens lenseignement des statistiques et permettra aux lves dexercer leur esprit critique, travers des questions mathmatiques.
Cela permettra aussi douvrir la voie de
faon assez simple lenseignement qui suivra sur les lois normales ou autres , et
dclairer comment les lois des erreurs
ont pu faire natre lide de la statistique morale pour aboutir lusage contemporain que lon
fait de ces lois, dans tous les domaines. De
mme la recherche des lois en physique ou en
biologie, celle de modles mathmatiques
dans toutes sortes de domaines pourra prendre
du sens, et lon comprendra pourquoi, il y a
des modles mathmatiques et non pas un ,
et quil y a beaucoup darbitraire dans les
choix que lon fait, un arbitraire dont on peut
esprer quil est raisonn.
Chacun aura compris, ds lors, que lenseignement des statistiques ne se rsumera pas
apprendre des formules et les appliquer, mais
quil pourra tre riche de rflexions, qui sont
peut-tre assez diffrentes de celles induites
par les commentaires des programmes, et
qui trouveront totalement leur pace dans le
cours de mathmatiques.

37

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

ANNEXE 1
(extrait de Mthode des moindres carrs - 1821)
La question qui nous occupe a, dans sa nature mme, quelque chose de vague et ne
peut tre bien prcise que par un principe jusqu un certain point arbitraire 8. La
dtermination dune grandeur par lobservation peut se comparer, avec quelque justesse,
un jeu dans lequel il y aurait une perte craindre et aucun gain esprer : chaque erreur
commise tant assimile une perte que lon fait, la crainte relative un pareil jeu doit
sexprimer par la perte probable, cest--dire par la somme des produits des diverses pertes
possibles par leurs probabilits respectives. Mais quelle perte doit-on assimiler une
erreur dtermine ? Cest ce qui nest pas clair en soi ; cette dtermination dpend en
partie de notre volont 9. Il est vident, dabord, que la perte ne doit pas tre regarde
comme proportionnelle lerreur commise ; car, dans cette hypothse, une erreur positive
reprsentant une perte, lerreur ngative devrait tre regarde comme un gain : la grandeur de la perte doit, au contraire, svaluer par une fonction de lerreur dont la valeur
soit toujours positive. Parmi le nombre infini de fonctions qui remplissent cette condition,
il semble naturel de choisir la plus simple, qui est, sans contredit, le carr de lerreur, et,
de cette manire, nous sommes conduits au principe propos plus haut.
Laplace a considr la question dune manire analogue, mais en adoptant, pour mesure de la perte, lerreur elle-mme prise positivement. Cette hypothse, si nous ne nous
faisons pas dillusion, nest pas moins arbitraire que la ntre 10 : faut-il, en effet,
regarder une erreur double comme plus ou moins regrettable quune erreur simple rpte deux fois, et faut-il, par suite, lui assigner une importance double ou plus que double ?
Cest une question qui nest pas claire, et sur laquelle les arguments mathmatiques nont aucune prise ; chacun doit la rsoudre son gr 11. On ne peut nier pourtant que lhypothse de Laplace ne scarte de la loi de continuit et ne soit, par consquent,
moins propre une tude analytique ; la ntre, au contraire, se recommande par la gnralit et la simplicit de ses consquences.

8 cest nous qui soulignons.


9 idem
10 idem
11 idem

38

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

ANNEXE 2
Lambert-Adolphe-Jacques Qutelet (1796-1874) est n Gand, en Belgique. Devenu mathmaticien un peu par hasard, il a lide, en 1823, de fonder un observatoire ; afin
de sinitier lastronomie il rencontre Fourier, Laplace, Poisson lObservatoire de Paris
et dcouvre cette occasion les statistiques. En 1832 il sinstalle lObservatoire de Bruxelles
o il restera jusquen 1856. Paralllement ses travaux en astronomie et climatologie il
sintresse de plus en plus la statistique. Il est linitiateur du premier Congrs international de Statistique Bruxelles en 1853.
Qutelet utilise les statistiques pour tudier lhomme aussi bien dun point de vue physique (taille, poids, force) que dun point de vue intellectuel et moral (penchant au crime,
au mariage,).
Voici ce quil crit dans Recherches sur le penchant au crime dans les diffrents ges
(1832) :
Aprs avoir vu la marche quont suivie les sciences lgard des mondes, ne pouvonsnous essayer de la suivre lgard des hommes ; ne serait-il pas absurde de croire que
pendant que tout se fait daprs des lois si admirables, lespce humaine seule reste abandonne aveuglment elle-mme et quelle ne possde aucun principe de conservation ?
Nous ne craignons pas de dire quune pareille supposition serait plus injurieuse la divinit que la recherche mme que nous nous proposions de faire.
Il dfend le principe dune statistique scientifique sappuyant sur le calcul des probabilits.
La thorie des probabilits devrait servir de base toutes les sciences dobservation,
prcise Qutelet.
Il donne une place prpondrante la moyenne ; il fait la diffrence entre la moyenne
objective , qui correspond quelque chose de rel, et la moyenne arithmtique.
Ainsi, avec lui, les statistiques se sont orientes dans une voie nouvelle : les statistiques
morales, dont la postrit retiendra particulirement linvention de lhomme moyen .
Citons de nouveau Qutelet ( Physique sociale ou Essai sur le dveloppement des facults de lhomme -1869-)
En runissant les individus dun mme ge et dun mme sexe et en prenant la moyenne de leurs constantes particulires, on obtient des constantes que jattribue un tre
fictif que je nomme lhomme moyen chez ce peuple.[]
Lhomme moyen, en effet, est dans une nation ce que le centre de gravit est dans un corps ;
cest sa considration que se ramne lapprciation de tous les phnomnes de lquilibre et du mouvement.
Cette thorie de lhomme moyen, qui annonce par exemple la normalisation des qualits, de mme que lutilisation outrance des mathmatiques pour justifier des prises de
dcision sociales , ont provoqu un dferlement de critiques. On doit cependant reconnatre que Qutelet a su donner la statistique du 19 s. une impulsion dont linfluence
ultrieure est indniable.

39

REPERES - IREM. N 48 - jullet 2002


MOYENNE, MEDIANE,
ECART-TYPE

Francis Galton (1822-1911), n Birmingham en Angleterre, est le cousin de Charles


Darwin. Touche--tout gnial et polyvalent, il est avant tout gographe et explorateur.
La lecture de Lorigine des espces que son cousin a fait paratre en 1859 marque un
tournant dans sa vie et il commence sintresser aux mthodes statistiques et leurs
applications toutes sortes de domaines : gntique, anthropomtrie, ducation, psychologie.
Il est considr comme le pre de la biomtrie et le fondateur de leugnisme.
Il invente le concept de corrlation et sa mesure par le coefficient de corrlation (ce
serait un autre mot et un autre concept tudier dans un autre article ; signalons seulement que ce coefficient sert dans la recherche dune relation de rgression, do sa notation par la lettre r).
Dans le domaine qui nous intresse, nous avons not quil a jou un rle important dans
le dveloppement de la mdiane (et des fractiles ), en relation avec les thories de leugnisme qui visent amliorer la race humaine . Il soutient, en effet, que lutilisation de
la moyenne est adapte aux situations symtriques , ce qui est rarement le cas dans
les domaines quil tudie. Dans ltude des tailles, par exemple, il faudrait admettre
ct de lexistence de gants , lexistence de personnes dont la taille serait zro.
Le nom de ce gnie polyvalent et parfois inquitant dans sa recherche de la slection de
llite, est attach le plus souvent, dans les lyces et collges, ce que lon nomme la machine de Galton , qui permet de visualiser la distribution normale.

Quelques lments de bibliographie :


Nous avons choisi quelques rfrences bibliographiques facilement accessibles, outre
la traduction par J. Bertrand des textes de Gauss sur la mthode des moindres carrs.
DACUNHA-CASTELLE, D., Chemins de lalatoire, coll. Champs, Flammarion,
1996
EWALD, F., Moyenne et perfection - Ltat providence, in, Actes du colloque inter-IREM,
Les mathmatiques dans la culture dune poque, Universit Louis Pasteur, Strasbourg, 1987.
DROESBEKE,J. J. TASSI, P., Histoire de la statistique, Que sais-je ? n 2527,
P.U.F., 1997, Paris
FELDMAN, J., LAGNEAU, G., MATALAN, B. (sous la direction de), Moyenne,
milieu, centre, histoires et usages, Ecole des Hautes Etudes en Sciences Sociales, 1991,
Paris.
GAUSS, K. F., Mthodes des moindres carrs, traduit par J. Bertrand, Mallet-Bachelier, 1855, Paris. Rd. IREM, Universit Paris VII, 1996, Paris.
STEWART, I., Dieu joue-t-il aux ds ? coll. Champs, Flammarion, 1994

40

Vous aimerez peut-être aussi